
自從一年多前,從 Wired 雜誌著名的 “Long Tail” 文章中(先前也曾 blog 過)得知 Touching the Void(觸及巔峰)這部電影後,就一直惦記著想看,一方面也是因為自己愛爬山(僅止於 hiking,尚未達 mountaineering 的程度),更別說這是個真人真事的登山界傳奇故事。

自從一年多前,從 Wired 雜誌著名的 “Long Tail” 文章中(先前也曾 blog 過)得知 Touching the Void(觸及巔峰)這部電影後,就一直惦記著想看,一方面也是因為自己愛爬山(僅止於 hiking,尚未達 mountaineering 的程度),更別說這是個真人真事的登山界傳奇故事。
英文中的介詞,本來就是需要多放些注意力才能充分掌握的部分。對學英文的人,一直是個麻煩的領域。在台灣的 IT 界,常聽到大家用「come out 一個…」,來表達「想出、規劃出一個…」。但事實上,這個句子中的「想出」,英文的說法應為 “come up with”。那什麼時候用 “come out” 呢?
昨天有篇美國商業週刊的報導,剛好為我們做了最佳的示範。這篇報導提到,Apple CEO Steve Jobs 和各大好萊塢電影公司,就 iTune 作為影片租售通路一事,相互間仍存在諸多歧見。在文章的最後一節 (THE LIVING ROOM WAITS) 中,”come up with” 被用了兩次:
從今天開始,這裡會增加一個大項 — 虎人英文。我想利用這個園地,和網友們分享一些英文片語、特殊的表達方式、俚語、甚至發音技巧。也算是讓過去在學校主修的專長,派上用場。我會從網路上讀到、電影中聽到,或腦中不經意浮現的一些英文用法中,選擇對大家比較有幫助的,把它們寫下來。也歡迎大家提供建議。
Yahoo!奇摩知識+ 一直是台灣 Yahoo! 在被記者問到 Web 2.0 服務時所搬出的擋箭牌。它更是台灣網際網路業者的驕傲象徵,科技甚至輸出回美國 Yahoo! 總部;靈感來自於韓國,將傳統BBS 加以改良;獲得多項大獎…blah, blah, blah,相信大家已經聽得很多了。昨天 CNet 報導,最近 PCHome 和番薯藤紛紛打 Web 2.0 牌,推出新服務,而 Yahoo!奇摩呢?依舊是知識+。
耐人尋味的是,美國 Yahoo! 在去年底以奇摩知識+ 為基礎,稍加修改、上線後,用的名稱竟不是 “Knowledge”,而是 Yahoo! Answers。同類型的網站中,有 Google 在四年前推出的 Google Answsers。它的做法比較特殊,採取收費的方式,由五百位各行各業的專家來負責回答問題。此外,善於模仿、再力拼後來居上的微軟,也不甘寂寞地在上個月宣布 Windows Live QnA。尚未正式營運,但看起來八成是以抄襲 Yahoo! Answers 為主。
之前我在 “Windows Live — Web 2.0 Not Yet” 這篇 post 的最後提到 Windows Live 的搜尋引擎,和搜尋中文遇到的問題。進一步探究,發現幾個有趣的現象,暴露出它目前在中文搜尋方面,仍落後 Google 的地方。
我透過 Amazon.com 的 A9 和 Alexa 搜尋服務,來測試微軟的新搜尋引擎。上次提到,Amazon.com 最近從 Google 轉到 Windows Live Search,作為 A9 和 Alexa 的搜尋後台。我從 A9 的搜尋歷史紀錄中,發現之前所下的搜尋字串「雅魯藏布江」,用的是繁體輸入法輸入,而這串字中,「魯」字是繁體(其他幾個字在 Unicode 中剛好被簡繁體所共用)。如果用簡體輸入,則「魯」字會是「鲁」,其他則沒有差別(因為支援多國語言的搜尋引擎網頁,都用 UTF-8 編碼的 Unicode 來接受用戶的輸入)。這次我特別用繁/簡體字個別試了一試…
雅魯藏布江 墨脫(繁): 得到三百多個結果。這些結果看來大都來自提供繁體中文內容的大陸網站。
雅鲁藏布江 墨脱(簡): 得到一萬七千多個。不意外,這個西藏東部、世界第一深的峽谷的相關資訊,絕大多數都位於大陸的網站。
真正有趣的是,從這裡我們可以看出,Windows Live 搜尋引擎仍不具備像 Google 那樣,能夠自動處理編碼轉換,並將簡繁體的搜尋結果合併呈現。
另外又發現一個有趣的現象,如果把「江」字從搜尋字串中省略,那麼不管是以繁體或簡體字輸入;也就是: “雅魯藏布 墨脫” 和 “雅鲁藏布 墨脱“,Windows Live 就掛了 — 不是什麼都找不到,說抱歉,就是找到韓文頁(就像我之前在 A9 遇到的)。
反觀 Google,在同樣艱困的搜尋條件下,仍然能找出兩萬七千筆。可見 Google 不但搜尋能力強,爬蟲也又勤又快。
這暴露出 Windows Live 搜尋引擎對中文的索引處理,似乎仍仰賴詞彙。如果碰到它的辭庫中沒有的,就不知所措了。換句話說,至少就中文而言,Windows Live Search 仍做不到真正的全文檢索,也就是能處理任意中文字串,典型的例子,像是一個人的姓名,辭典中沒有,但不表示文章中不會出現。我用「勞虎」試了一下,竟然一筆也沒有!真的很沮喪
。不過看到像吳宗憲和李登輝這樣的當代名人,也不過幾百筆結果(Google 找到百萬筆),也就釋懷了
。
紐約時報昨天有篇文章,對 Wikipedia 做了一個很好的綜觀。
根據尼爾森/NetRatings 調查公司的數據, Wikipedia 已經超越 CNN 和 Yahoo! News,成為訪客量排名第三的新聞與資訊類網站。盛名加上「任何人都可以編輯」的基本精神,可想而知,自然也衍生一些問題,包括無聊人士蓄意破壞;幼稚小孩添加胡言亂語的條目;政治性、宗教性條目引發不同立場的人互相刪改對方的言論等。為了應付這樣的問題,Wikipedia 仰賴一群志工編輯,每天不斷審核過濾新增和被修改的內容。目前大約有 82 個條目被標示為 “protected”,另外有 179 個條目是 “semi-protected”。這些爭議性大、或常受到竄改的條目,是 Wikipedia 一百多萬條目中的例外,無法讓任何人自由編輯或修改。
Wikipedia 創辦人 Jimmy Wales 在報導中說,很多人以為 Wikipedia 的內容是由千百萬人,一人貢獻一小段而來。但事實上,大多數的內容都來自於一千多位核心志工,許多志工還身兼編審委員的職責。編審委員是由志工之間推舉。
前些時候,blog 到十二點、一點、甚至更晚,臥床後往往還有靈感不斷浮現;要不就是架站相關的瑣事。多次下來,搞得生物時鐘整整向後拉了兩個鐘頭。本來幾乎每天運動的習慣,很快蕩然無存。
這個星期六一大早要加班,身負一項重要的任務,萎靡不得。於是便下定決心,從星期一開始,不管睡足時數與否,強迫自己一定要恢復過去早起運動的習慣。值得慶幸的是,已經持續了三天,有點驚訝,荒廢了一兩個月的老朋友,竟這麼快又回來了!
該就寢了,晚安!