去週提要:IBM 創造了 Watson,一部懂得猜謎的電腦,贏了《Jeopardy!》這個北美知名的電視問答遊戲。輸給電腦的兩位人類參賽者絕非泛泛之輩,Ken Jennings 保持最長勝紀錄,曾經連贏七十四仗;Brad Rutter 累積獎金最多,超過三百二十萬美元;二人可說是世上最優秀的《Jeopardy!》玩家。
Watson 運用 IBM 研發的 Deep Question Answering 系統,從謎面抽出關鍵字,憑 15 TB 容量的資料庫抽絲剝繭,得出一列可能答案,用上百種方法測試每個答案的可信性,某答案可信性夠高,便嘗試作答。《Jeopardy!》是搶答遊戲,Watson 不僅要夠準,還要夠快,最大的挑戰是理解語言(natural language processing)和把各類知識連繫起來(knowledge representation)。IBM 創造 Watson,當然不是玩《Jeopardy!》咁簡單,研發所得的經驗和技術,將來肯定用於某些產品和服務。如今 Watson 贏了《Jeopardy!》,電腦的知識是不是已經超越人類?很多所謂 knowledge worker 的人士,不久將來可會職位不保?Watson 今天的勝利,會不會是你失業的前奏?
我上 YouTube 觀看了它和他們的對決,發現 Watson 有強項亦有弱點;我的結論,簡言之,Watson 像一位患上偶發性讀寫障礙的專業人士,專門知識十分了得,但間中英語失靈,答非所問。
每局《Jeopardy!》有三十個謎語,分屬六個類別(每類五題),參賽者憑類別和謎面鬥快估謎底。賽事共四局(一百二十個謎語),錄影後分三天播出,我選了一些具代表性的謎語撮要如下,一方面讓大家親身感受 Watson 的強項弱點,另一方面幫助瞭解遊戲性質。播影時,無論 Watson 作答與否,電視畫面都會顯示它心目中的頭三個答案及其可信性,我會集中於第一答案,方括號內是信心百分比。
類別:Alternate Meanings
謎面:4-letter word for a vantage point or a belief
Watson 最有信心的答案:View [70%]
這是第一個謎語,揭開機器與人類決戰的序幕。類別「Alternate Meanings」提示找出同義詞,Watson 找對了答案,可是 Brad 搶先撳掣,捷足先登。
類別:Alternate Meanings
謎面:4-letter word for the iron fitting on the hoof of a horse or a card-dealing box in a casino
Watson:Shoe [68%]
這是第二個謎語,Watson 首次搶答成功,儘管只有 68% 肯定。
類別:Beatles People
謎面:"And anytime you feel the pain, hey" this guy "refrain, don't carry the world upon your shoulders"
Watson:Jude [98%]
類別「Beatles People」問披頭四歌詞裡的人物,對其歌曲沒有印象的話,對不起,放棄算了。Watson 原來是披頭四的超級粉絲,此類別五題中成功搶答四題,而且每題都是非常肯定。在範疇明確的專門領域,Watson 通常表現出色。
類別:Literary Character APB
謎面:Wanted for general evil-ness; last seen at the tower of Barad-dur; it's a giant eye, folks. Kinda hard to miss.
Watson:Sauron [74%]
《Lord of the Rings》的讀者不會陌生。「APB」指「All-Points Bulletin」,大概可譯作「通緝令」,此類別的謎語像通緝小說裡某些人物,要求參賽者博覽群書。此等高深的領域再次成為 Watson 的表演舞台,五問四中。
類別:Olympic Oddities
謎面:In the 2004 opening ceremonies a sole member of this team opened the parade of nations; the rest of his team closed it.
Watson:Olympic Games [20%]
正確答案「Greece」。Watson 有點不知所措,謎語顯然在問某國代表隊,怎麼出了「Olympic Games」?它英語失靈不是個別事件,例子陸續有來。
類別:Don't Worry about It
謎面:It's just acne! You don't have this skin infection also known as Hansen's Disease.
Watson:Leprosy [87%]
醫學問題,專門類別,人類不是機器的對手,此類別 Watson 再次五問四中。
類別:Hedgehog-Podge
謎面:Hedgehogs are covered with quills or spines, which are hollow hairs made stiff by this protein.
Watson:Keratin [99%]
Watson 變身箭豬專家,如入無人之境,五問五中。
類別:U.S. Cities
謎面:Its largest airport is named for a World War II hero; its second largest for a World War II battle.
Watson:Toronto [30%]
多倫多是美國城市?英語再次失靈,這是最受廣泛報導的失誤。正確答案「Chicago」,機場是 O'Hare 及 Midway。
類別:Also on Your Computer Keys
謎面:An additional section placed within the folds of a newspaper
Watson:Broadsheet [16%]
謎底應是鍵盤的一個鍵,正確答案「Insert」。Watson 顯然不明白類別的意思,此類別無一答中。
類別:Actors Who Direct
謎面:"Million Dollar Baby" & "Unforgiven"
Watson:Clint Eastwood [96%]
這類別的特色是謎面簡短,Watson 雖然找對了答案,但反應不及人類,五題全給人類答中。看來,謎面愈短,線索愈少,對人類愈有利。
類別:Nonfiction
謎面:The New Yorker's 1959 review of this said in its brevity and clarity it is "unlike most such manuals, a book as well as a tool."
Watson:Dorothy Parker [14%]
又再英語失靈,謎面顯然在問一本書,它卻答了一個人。正確答案「The Elements of Style」,一本教人寫作的經典。
大家看見了吧,在範疇明確的專門領域,Watson 非常了得,可是英語間中失靈,「貽笑大方」。IBM 現正研究把 Watson 的科技應用於輔助醫生診斷病人,很明顯,這正中 Watson 的強項。我敢說,愈多專有名詞的環境,Watson 愈喜愛。
Knowledge workers 會不會失業?在 IBM 解決英語失靈之前,應該不會。
(2011 年 3 月 9 日 信報副刊)
其他賽後報導:New Scientist, Scientific American, Technology Review
賽事重播
第一日:Part 1,Part 2
第二日:Part 1,Part 2
第三日:Part 1,Part 2
沒有留言:
張貼留言