一个软件,微软通常需要经历四、五代,才会搞对
这是前几天在一个 podcast 中听到美国几个 IT 前辈的观点。我当下脑中立刻发出“一针见血”的反射动作,这两天更是遇上一个活生生的例子,始作俑者的现行犯是 Windows Media Player。
一位同事最近买了 Macbook,故需要将一些 MP3 从 XP 迁移到 Mac OS 10.5 上的 iTune,其中包括一些过去用 Media Player 从原始 Audio CD 剥下来的中文和日文歌。当这些 MP3 被导入 Mac 上的 iTune 时,他发现里面出现了大量的乱码,而大部分都集中在中、日文歌曲。于是找我求助。

我们知道,MP3 等多媒体文档的元数据(如歌名、演唱者、专辑名等),是存放在 ID3 标签里面的。可能是因为我不爱用 Media Player(觉得界面很不直觉),自己过去对处理这个问题还真的没经验。替他诊断了一下后,发现这些 MP3 的 ID3 标签中的文字,都是以简体中文 CP936, GB2312 的编码形式存在,而未采用多语言支持更好的 Unicode (UTF-8)。这就有趣了。在 ID3 文字编码的处理上,Windows Media Player 的做法,不同于其他 MP3 音乐播放器,如 iTune 或 Linux 上的各播放器。人家都是选择用 Unicode,但微软则独排众议地选择用本地的语言,所以在不同语言的 OS 下做,会出来不同的结果 — 简体中文会是 CP936,繁体中文则 CP937…。微软早在 NT 和 Office 2000 时代便已支持 Unicode,为何 Media Player 不采用真是匪夷所思。
more »
Web 2.0 早已不是什么新话题。过去的几年内,知名度高如 Google、Yahoo、MySpace、PayPal 等大站,也都无法完全免疫,而陆续爆发过各种攻击事件(钓鱼、虫…)。Web 2.0 网站不管是选择用 AJAX 、Flash,还有逐渐风行的离线解决方案,如 Dojo Offline、Google Gears 、Adobe AIR 等,来提供互动性更高的 UI,只要一不小心,这些 Web 应用出现安全漏洞、被坏人占便宜的机率,其实是很高的。有时候不仅是自己的 code,而问题也可能出现在第三方提供的现成工具箱、API。
要如何防范?对网站开发人员而言,在过去,对这个主题的探讨,往往比较零散,要不就偏学术,要求较高的门槛(例如 OWASP 发表的文献),一直缺乏系统化,全面性,且深入浅出的探讨。不久前终于出了一本好书 — AJAX Security,作者为 Billy Hoffman 和 Bryan Sullivan 这两位 Web 2.0 安全的专家(过去在零星的安全相关报道中,也常出现他们两位的影子)。在此强烈推荐这本书,给所有从事与 Web 2.0 开发相关的网友。尽管书名选择叫 "AJAX" Security,但事实上,除了 AJAX 之外,Flash 安全,甚至于如何将 CSS 这种看似无害、展现层的东西,拿来攻击的方法,在书中都有深入探讨(第十二章)。尽管这样的书,早该出现,但出版时间晚,反而也做出一些额外的贡献 — 比较新的科技,如上述的 Google Gears 和 Dojo 离线工具箱的安全弱点,在书中都涵盖了。希望它尽快能被翻译成中文,以造福更多大众。
more »
无巧不成 blog。
大约在半年前写过关于 PaaS (Platform as a Service) 和亚马逊的 AWS (可谓 PaaS 鼻祖)。上周有位记者朋友向我询问相关信息,打算做个深入报道。同样在上周,看到有篇 blog,谈到一个马路消息,说 Google 很快就要开始“抢亚马逊” 的午餐了。当时看了以后,只觉得这个可能性的确存在,但不知何时才会发生。没想到来得这么快 – 几个小时前,华尔街日报报道,Google 也将开始做基础设施租赁的生意。
亚马逊最早开发 AWS 的念头来自于 — 既然我自己能把基础设施玩得这么好,为什么不干脆把它松耦合化,当成一门生意 outsource 出去?Google 玩基础设施、计算机中心这方面的效率是出了名的(之前也写过),这是他们的核心竞争实力,对公司财务报表的 bottom-line,带来很大的贡献,放眼 Web 的世界,可说无人能敌。所以本着同样的论点,Google 可说非常有资格做 PaaS 这门生意。
more »
过去两年因著书《长尾》而巨红的作者克里斯安德森,最近开始推销他的下一本书《免费》(英文书名目前定为:“Free: the Economics of Giving Stuff Away”),预计明年出版。一如过去对《长尾》的行销,这次要阐述 “免费经济” 的现象和模式,安德森的首选渠道,自然是充分利用他任职总编的《Wired》杂志。前两天他在 Wired 网站发表了这篇专文。除此之外,还配合三月号“订杂志、免费附赠别册” 的行销活动(老掉牙的把戏了,但好歹还是得营造出一点气势来)。而他在稍早,半年前的一个 O’Reilly 的演讲场子上,已开始谈 “免费”。这场演说在一个月前被整理成播客发行。
这篇文章将近几年在互联网经济和摩尔定律推波助澜下产生的种种免费现象和经济模式,做了一个比较完整的整理。因此,个人认为还是蛮值得看的(不过目前在网上还没见到中译版)。至于那场演说,除了基本上把文章中的重点都快速地涵盖之外,还多谈了一个主题 — 为什么书不能走免费路线?《长尾》大卖后,安德森接下来要出的书,还是要收钱的;深知这个问题一定会被人拿出来检讨,故决定将此问题,主动提出来探讨。很多网友知道,我在8年前便实验过免费电子书的模式,故对此一课题,特别感兴趣。在针对安德森在那场演讲中,就他在免费书议题的表述上,讲一些我个人的观点前,我想先来对他在专文中整理出来的六种免费经济的模式,和大家做个扼要的分享。《Wired》杂志另外还整理了一页 “How-to Wiki”,将提供免费商品/服务的手法,做了一个罗列(推荐)。
more »
昨天从 Digg 得知 Google Talk 刚增加一个翻译功能,用法很有创意(大概又是哪位 Google 员工利用每周 20% 的自由时间想出来的),配置方式是必须先将恰当的语言,以联络人的方式加入,格式为 xx2yy@bot.talk.google.com,其中 xx 和 yy 是根据 IANA 制定的双字母语言码,中间加 2,例如英翻中为:en2zh@bot.talk.google.com,其他语言可如法炮制(Google 目前支持二十多种语言间的互转),@后一律相同。如果要利用这个 bot 充当语言不通的 IM 用户间的及时翻译的话,可以用 group chat 的方式,把翻译 bot 同时加入。
用几个口语的句子测了一下它的中英文翻译能力,和对简繁体字的处理,发现它和 Google 的搜索引擎一样,繁体和简体中文同时支持,Google 会自动判别,这点做得不错,至于翻译的准确性,就有点爆笑了 — 相同意思的三句话,分别用英文和中文版本测了一下(如下图),翻译出来的结果,其中甚至连语法都有问题(不过最搞笑的,还是将中文的语助词 “啊” 硬生生地翻成 "ah",让我想起在和香港的朋友 chat,英文句尾夹带 "ma"、"la" 的感觉)。(BTW, ”You never cease to amaze me" 是英文常用的说法,有时候用来讽刺,但这里我们看到 GTalk 的 bot 把意思完全搞反了)。
不过我主要想谈的,不是它的翻译水平,而是其背后的运作机制。这个翻译机器人 (bot) 的运作方式,仰赖的正是 Cloud Computing(云计算) — 无独有偶地,恰好是前几天纽约时报和美国商业周刊封面故事分别报道的主题(尽管二者的侧重点不同)。更巧的是,最早触发商业周刊对 Google 云计算做报道的,正是这个翻译 bot 。在商业周刊幕后故事 podcast中,记者谈到他在两年前,从卡内基梅隆大学那儿听到,曾经有一场自然语言电脑翻译大赛。参赛者中,IBM 自然不能缺席,此外还有来自亚洲、欧洲的团队,当然还有 Google。Google 团队的玩法与众不同,他们不用传统 AI 那套,从分析语句结构、语义模型等入手,而是利用一组超强的分布式计算 cluster(也就是那朵“云”),然后喂给它海量的联合国翻译稿件,让它根据字的关联性,做出统计分析,作为翻译的基础。结果 Google 队赢了。自此之后,美国许多大学的研究机构,都渴望能有一套像 Google 一样的计算怪兽,用来加速对海量信息的科学分析。两年后,他们终于如愿以偿。这篇报道讲的正是背后的故事 — 一名 Google 员工如何将公司核心竞争力平台的缩小版,带入校园,教导大学生如何善用并行计算资源。这项利用 20% 自由时间的项目,稍后还带动了和 IBM 的研发合作。同样巧合的是,纽约时报这周也对并行计算和它对编程带来的新挑战,做了一个报道(中译)。
纽约时报对 Cloud Computing 的报道,则着重于和微软的竞争,和潮流的变迁。简单的讲,Google 玩的是改变游戏规则的玩法,顺着时势潮流,用云来遮蔽桌面。
这几篇报道的相关链接:
回到 Google Talk 翻译机器人的翻译水平问题,由于听了上述翻译大赛的故事,还有之前对 Google 超级电脑的粗浅了解,我的猜测是 1) Google 的翻译引擎的翻译能力是可以调整的,而他们大概没有分给 Gtalk 翻译 bot 太多的脑细胞/计算能力(使用比较简化的计算过程),目前的目的只在实验这个新的应用模式,以致翻译品质仍处在搞笑阶段;2) 我用来考它的生活口语太难了,它比较擅长的,应该还是正经八百的官样文章,这或许是为什么喂食海量联合国资料和网页的 Google 云能够赢得冠军的原因吧!


今早上班途中,在一个 podcast 中听到一个很酷的概念。这个 podcast 谈的是 Centric CRM 这家公司所提供的服务和产品,它是利用 open source 堆栈所建立的一套本身也是 open-source 的 CRM 应用,除了和 Salesforce.com 一样,以 SaaS 模式提供客户直接从网络远程租用之外,它和 Salesforce 这类 closed-source 服务商在商业模式上的一大区别,在于除了可以通过网络租用外,也可让客户选择把整套应用部署在客户自己的机器上,像传统的 CRM, ERP 一样,让企业自行运维(有趣附带一提的是,Salesforce 本身也大量采用 open-source 软件,例如它后台的数据库用的是 MySQL,但在 open-source 基础上建立的 CRM 应用则是 closed-source 的。这种 “在 open-source 平台上搭建 closed-source 应用服务” 的现象在 Web 2.0 领域里比比皆是,Yahoo!, Google, …)。
同样强调 open-source 、并采用相同商业模式的 SugarCRM (以前也听过一个他们介绍自己产品的 podcast),是 Centric CRM 主要的竞争对手。Centric 强调自己的平台建立在 Java 之上,效能和 scalability 上都远比建立在 PHP 上的 Sugar 更适合规模和用户数较大的企业。
今天在 podcast 里听到一个比较酷的比喻,是他们用“租用大自然” — Rent Mother Nature 这家公司的商业模式来比喻。
more »
在七月底 iPhone 即将推出时,曾经看过一个报导(想不起来是在美国商业周刊还是哪了?),其中便引述某分析师的看法,认为当时有许多对 iPhone 在功能方面不完善等等的批评(例如不支持 3G),其实是见树不见林,没从远处、大处来看 - 其实 iPhone 最重大的意义,在于一个全新的迷你平台,可以让苹果在它的基础上,不断快速孕育出徒子徒孙,大幅增强它在多媒体 smart phone 这个新战场的竞争优势。果然,iPhone 甫上市不到两个月,相信大多数网友也已经看到了,Apple 在近两周前宣布的一系列新 iPod 中,出现了一只 iPhone Touch。
more »
REST 的最大价值,在于它的简约;只要遵循上回帖子中提到的几个基本原则,便可直接充分利用 HTTP 和 Web 服务器先天具备的架构优势,包括 GET 的请求会被 Web 服务器有效地缓存,和因不需要维系各别的会话状态,而达到非常高的伸缩性。Google 和 Amazon 等所提供的 Web services,是最好的明证。这是 REST 的拥护者津津乐道的论点。
但如果照目前的气氛继续发展下去,过分炒作“REST 是比 SOAP 更适合于 SOA 的技术实现手段”、“SOA 未来的希望在 REST”这类危险的观念(上回谈的主题),其最终的结果,可能是既伤害了 REST,又对 SOA 没好处的双输局面。
more »
我和胭脂虎的老朋友阿杜伯 (Adobe) 前几天刚宣布 Adobe Media Player。简单地讲,其实就是一个类似 Apple iTune 的应用。看起阿杜伯也开始参与争食数碼音乐、Internet TV/IPTV、影/音 podcast 等多媒体的分销渠道这块大饼,尽管竞争者众。
Adobe Media Player 比较特别的地方,并非在于和 iTune 或 Windows Media Player 等一样,也有引人争议 DRM(以满足许多思路仍停留在上一世纪的各大内容商);而在于它是建筑在 Adobe 年初刚发表、在业界颇引人注目的 Apollo runtime 的基础上。Apollo 虽然目前仍是 alpha,而正式版得等到下半年、甚至年底才会准备好,但它 1) 同时支持 Flash 和 AJAX/DHTML 的特性(后者目前尚未 ready),加上 2) 跨 Windows、Mac、Linux 三大 OS,还有 3) 对离线应用的支持,是瞩目焦点所在。阿杜伯喜欢用 RIA (Rich Internet Application) 来称呼开发在 Apollo 上的应用,以强调 browser 达不到的一些特性,如可让设计人员尽情发挥「美」学创意的定制 UI 组件外观,和离线支持(这点即将改变,下述)。行销上一定得强调它的「丰富性」,才能对用户 justify 在 browser 外,再加装一个 runtime 的必要性。
more »
今天的大消息当然是微软终于推出 Windows Vista 的家用版。
“So?” 或许会是很多人的反应。而这种态度,正是所有科技公司最惧怕的十八层地狱 — irrelevance — 害怕产品在用户心目中无关痛痒。
工商时报今天刊载了一篇标题为「鲍玛狂爱微软 绝不怀疑未来」的人物特写,其实这篇报导绝大半的篇幅,都直接「借用」自纽约时报前几天的一个长篇幅报导,多少有点赶在 Vista 上市前应景的味道。
微软 CEO Steve Ballmer 对公司的热情,可以从这个 YouTube 影片中看出。这篇报导除了对他个人生平做了些侧写外,微软目前面临的挑战,尤其是该如何有效开拓新市场,自然还是该报导的主要焦点。这句话一针见血:
Competitors once feared and respected Microsoft. Now they simply respect it 微软的竞争对手们过去曾对微软既惧怕又尊敬,现在只剩下尊敬。
more »