顯示具有 research-it-myself 標籤的文章。 顯示所有文章
顯示具有 research-it-myself 標籤的文章。 顯示所有文章

2013年8月21日 星期三

汗的重量(續)

廷續汗的重量系列,焗桑拿流幾多汗呢?

我再焗多三次,下表列出全部五次:

 桑拿前體重(磅)桑拿後體重(磅)
2013-08-21137.2137.00.2
2013-08-20138.0137.60.4
2013-08-16136.4136.00.4
2013-08-09137.6137.00.6
2013-08-08138.2137.80.4

同樣,局限是那個磅只能顯示 .0, .2, .4, .6, .8。

那個磅可信的話,每次焗桑拿流汗約 0.4 磅。

0.4 磅是多少?這個洋蔥重 0.43 磅……


洋蔥密度與水相約(我 check 過,它僅僅浮水;這很合理,因為它大部分都是水,生物多是這樣),所以我流的汗該與這個洋蔥差不多體積,比我想像中多。

亦即是說,焗完桑拿吃番個洋蔥,就可補充失去的水分,這是今次實驗最大的得着。

2013年8月11日 星期日

汗的重量

每次游完水,我會焗桑拿。

焗桑拿出汗,身體少了水分,會不會輕咗?

我決定做吓實驗,桑拿之前磅一磅,桑拿之後磅一磅,就知道流汗的重量。

暫時,收集了兩日的數據:

 桑拿前體重(磅)桑拿後體重(磅)
2013-08-09137.6137.00.6
2013-08-08138.2137.80.4

局限是,那個磅只能顯示 .0, .2, .4, .6, .8;換句話說,如顯示 138.2,實際重量可以是 138.1 - 138.3。

所以,對待數據不須太認真,只是一個非常 un-controlled 的實驗。我會做多幾日,下星期再報告。

P.S. 飲番幾杯水,就會回復先前的重量,水真是有重量的。

2012年8月18日 星期六

奧運獎牌算算賬

兩星期前看過奧運獎牌預測,今天回顧一下。

那些預測其實頗準確,以獎牌總數排名,前十位國家估中的。有別於一般看法,我認為排名應以獎牌數目而非金牌數目,前者應是一國體育水平更佳指標,樣本較大,統計上更有意思吧。

下圖把實際獎牌與預測重疊,觀察如下:

• 美國金牌超乎預期。
• 中國表現算是中規中矩吧。
• 俄國和英國近乎預測的上限,應該滿意了。
• 澳洲比較失望,金牌和獎牌俱低於預期的下限。
• 單看金牌,有人以為那是日本國力日衰的寫照,但看總獎牌呢,日本沒有衰落的跡象;以總獎牌計,它排第六,僅次於德國。

哪個預測系統最準確?需要計數,無時間做了。


(信報暫停科學版,我頓失容身之所。沒有稿費的支持和交稿的壓力,很難每星期下筆,偶爾遇到重大科學新聞,寫一寫還是可能的,要看緣份了。)

2012年8月4日 星期六

誰的預測最啱聽?

奧運會過了一半,獎牌榜開始成形,不如帶大家重溫一些「賽前預測」。林行止曾經提過,經濟學家利用一些如人均收入、人口等宏觀數據便能大概預測某國所得獎牌數目,老實說,原理並不高深,結果也不令人意外,愈富有的國家愈多獎牌,愈多人的國家愈多獎牌,俱是顯淺易見的現象,經濟學家把之量化而已。

今次我從網上找來三份最易找的報告或報導,分別代表三種預測系統,比較它們的異同。第一個系統屬於 Colorado College 的 Dan Johnson,第二個系統屬於 Tuck School of Business at Dartmouth 的 Andrew Bernard,第三個系統屬於投資銀行 Goldman Sachs,各系統的考慮因素撮要在下表。

 








(1)




(2)




(3)




(4)
Dan Johnson    
Andrew Bernard    
Goldman Sachs      

人均收入、人口、主場皆是「例牌」項目,其餘的簡介如下。

(1) Dan Johnson 認為主辦國周邊的國家免卻舟車勞頓之苦,是一種優勢。

(2) 前蘇聯及其東歐衛星國、今日的中國、北韓、古巴,刻意培育頂尖運動員眾所周知,這是計劃經濟的優勢。

(3) Andrew Bernard 說,頂尖運動員好像「durable capital goods」,「壽命」橫跨幾屆奧運會,故去屆獎牌數目應對今屆有所啟示。我認為這是十分聰明的設計,使系統能夠與時俱進。

(4) Goldman Sachs 當然順便推銷一下自己的產品,他們編製了一個 Growth Environment Scores 的指數,考慮當地政治穩定性、人力資本、經濟環境等,歸納出一個反映「長遠增長潛力」的指標。不用說,國家的增長潛力與奪金能力成正比。

下圖顯示三個系統給出的預測。不難發覺,Dan Johnson 的預測比較「突出」,跟其餘二者相距較遠,中宣部看了應該很不歡喜,中國的獎牌總數竟然輸給俄羅斯?噢,不打緊,中國的金牌仍然多過俄羅斯,全部預測一致這樣說,新聞只准報導金牌數目就是了。

篇幅所限,不說太多,該圖大家慢慢咀嚼。


(2012 年 8 月 4 日 信報副刋)

2012年6月23日 星期六

希臘真的很「累贅」

我不是足球迷,幾星期前無線直播歐國盃開幕戰,是我罕有地觀看足球賽。賽前,旁述照例宣讀正選名單,波蘭陣容讀過,說笑地補了一句:「波蘭隊好多『斯基』呀」,然後是希臘陣容,旁述沒說,但我發現希臘隊球員的名字有一更顯著特徵,無一例外全是「斯」字尾!柏柏杜普路斯、托路斯迪斯、馬尼亞迪斯、森馬拉斯、沙賓基迪斯……相信你明白我的意思。

這本來沒有什麼奇怪,希臘人姓氏全是「s」字尾,是其文化特徵。如果我是旁述,我會覺得好煩,既然每個姓名都是「什麼什麼斯」,那為什麼還要說「斯」?刪去「斯」字無損名字的獨特性。如果我是旁述,我劈頭第一句便說:「由於希臘球員的名字全部『斯』字尾,我將會省去『斯』字,以減少無謂的旁述。」有此聲明,宣讀希臘陣容時,我只需說:柏柏杜普路、托路斯迪、馬尼亞迪、森馬拉、沙賓基迪……相信你明白我的意(思)。

至於波蘭隊,其隊員很多「斯基」,但並非全部。如果我是旁述,能夠如何簡化呢?我會說:「由於波蘭隊『斯基』眾多,每遇『斯基』,我會以『哈』取代,以減少無謂的旁述。」有此聲明,波蘭陣容變成:華斯利哈、巴拉斯塞高哈、比薛哈、羅拔利雲度夫哈……相信你明白我的意思,哈哈!

你可能覺得我非常無聊,以上情形無可能在現實裏出現,不過那些減省用字的技巧其實每天都在用,不是給人用,是給電腦用。旁述員目的在「慳口水」,電腦目的在節省頻寬或儲存空間;旁述員「慳口水」的技倆,與電腦壓縮檔案的技倆如出一轍;首先分析即將出現的訊息,找出一些常見的「片言隻語」,在開端發出「聲明」,說明那些「片言隻語」將如何簡化,若簡化得宜,整條訊息便能縮短。

手機裏的照片歌曲、Skype 傳送的視像通話、YouTube 的短片、甚至 MS Word 的檔案,差不多所有數碼資訊都是經過壓縮的。壓縮其實無處不在,只不過從來不會用來壓縮球員名字而已。

§

談到翻譯外國人名字,我認為最「經典」莫過於把 Freud 譯作「弗洛伊德」,不得不驚嘆譯者巨細無遺的語音想像力;五個字母譯出四個音,那是 4÷5 = 80% 的「音對字母比率」。另一個「音對字母比率」奇高的是美國前國防部長 Rumsfeld,港譯「拉姆斯菲爾德」,那是 6÷8 = 75% 的「音對字母比率」。如果用同一思維翻譯國名,England 不會是「英格蘭」,應是「英格蘭特」;Denmark 不會是「丹麥」,應是「丹麥克」,甚至「丹尼麥克」,甚至「丹尼麥爾克」,不得不驚嘆我那巨細無遺的語音想像力。

歐國盃決賽週球隊之中,哪國球員譯名的「音對字母比率」最高?不同語系有否其獨特的比率?我到 NOW Sports 網站隨意找來各國某場正選球員的中文譯名,對照 ESPN 網站的英文原名,得出下表。由於每隊正選只有十一人,樣本不大,一拼列出標準差以供參考。(有時中文譯名包括 first name,在此情況下,計算也把英文 first name 包括在內。)

音對字母比率
 平均值標準差
荷蘭0.3659580.036251
丹麥0.4119930.102576
愛爾蘭0.4125610.059869
英格蘭0.4168620.054426
瑞典0.4309490.094911
意大利0.4408890.059979
克羅地亞0.4577920.047029
烏克蘭0.4625840.099969
捷克0.4703710.081726
葡萄牙0.4775640.057313
德國0.4801310.108078
波蘭0.4840150.062275
西班牙0.4873930.062218
俄羅斯0.5167910.097224
法國0.5294370.076452
希臘0.5339430.066474


想不到差別可以這樣大。一點很有趣,最「精簡」譯名的國家(荷蘭、丹麥、愛爾蘭、英格蘭、瑞典)集中在北歐及英倫三島,全屬日耳曼語系。德國也是日耳曼,但其譯名「精簡度」遠遠落後,不知是否德文自成一格,還是其國民夾雜了其他語系的後裔有關。歐洲其他主要語系包括拉丁語系(意大利、法國、西班牙、葡萄牙)、斯拉夫語系(俄羅斯、烏克蘭、波蘭、捷克、克羅地亞)及自成一家的希臘語系。

為什麼日耳曼語系譯名最「精簡」,為什麼希臘譯名最「累贅」,需要更深入硏究,非我力所能及了。

§

從來不明白 Greece 怎會譯成「希臘」,寫文時發現 Hellenic 是希臘文的別稱,相信這是譯名的來源。Hellenic 似「希臘」,怎也多過 Greece/Greek 似「希臘」。

(2012 年 6 月 23 日 信報副刋)

2012年4月6日 星期五

「薄熙来」的疑惑


幾星期前《經濟學人》中國版登了一幅薄熙來沒精打彩出席人大會議的照片,我對薄熙來毫無興趣,唯那桌上的名字牌吸引了我的注意。「薄熙来」三字,最難寫的二字沒有簡筆,反而最不需要簡化的「來」字則由八劃似有若無地減至七劃,設計簡體字的人是否有些本末倒置?

簡體字並非為薄熙來而設,為的是簡化廣大群眾的日常用字。「來」字比較常用,簡化得益較為顯著;「薄」和「熙」不常見,不簡化也損失無多;或許就是簡體字設計者的原意。三個字的樣本太小,要看更多的字才能揣摩設計者的心思。

首先略述簡體字的歷史。文字一向都是約定俗成;到了清朝末年,國家長期積弱,一些知識分子興起變法圖強之念,為了普及教育開啟民智,遂有把漢字簡化甚至拼音化的念頭,播下近代「中央主導」推行文字改革的種子。1935 年,國民政府教育部選定了民間流傳最廣的 324 個俗體字,公佈了《第一批簡體字表》,將之編入小學課本,可是遭到一些元老大力反對,改革建議終得收回。二次大戰之後,中共建國,1952 年成立中國文字改革研究委員會,負責簡化漢字。1956 年 1 月,國務院正式公佈《漢字簡化方案》,簡體化分批進行。1964 年再公佈《簡化字總表》,就是今天內地通行的簡體字。

圖一、二顯示了漢字簡化前後的筆劃分佈。沒可能包括所有漢字,這裏是最常見的一千個,紅色表示最常見,愈趨淺藍的愈是少見。

我採用了中文大學人文電算硏究中心的現代漢語常用字頻率統計資料庫。由於簡化工作在五、六十年代內地進行,簡化前後的變化亦應以當時的用字模式作準,故二圖及本文餘下的調查都是根據六十年代大陸的一千個最常用字。為什麼一千個?這是方便的齊頭數,恰好涵蓋了九成的用字頻率;時間所限,未能作更廣泛調查。

圖一、二所見,漢字的筆劃範圍給「壓縮」了,這並不意外。簡化前,八至十二劃最多;簡化後,六至十劃最多,而且更集中。

我一向懷疑,即使不用刻意簡化,較常用的漢字應該都是傾向較淺的,因為愈淺的字愈容易寫,愈常寫的字愈有動機去簡化(我指的是民眾自行簡化,不必「中央主導」),官方推行的簡化運動只是人為加速了這一過程而已。圖一可見,紅色是偏向左邊的,表示繁體字已有「愈常用愈易寫」的傾向,證實了我的懷疑。

看圖不夠準確,可參考下表,繁體總筆劃由上而下不斷增多,證明愈常用的字筆劃愈少,未簡化已有這種傾向。

常用字排序繁體總筆劃簡體字數目簡體字滲透率筆劃簡化率
1-1007943124.90%82.98%
101-2008892928.98%78.35%
201-3009443534.69%75.41%
301-4009713736.60%74.73%
401-50011074342.17%74.38%
501-60010863939.37%75.13%
601-70011373939.30%76.25%
701-80010893636.04%78.76%
801-90011103635.98%79.68%
901-100011893636.51%78.68%
  累積數目累積滲透率累積簡化率
  36130.12%79.12%

簡化「力度」最大在哪裏?上表列出數據,讓我解釋「簡體字滲透率」及「筆劃簡化率」之後,大家可以自行咀嚼。拿第一橫行作例,最常見的一百字之中,有簡體的 31 個,但簡體字滲透率不是 31%,因為它把字的出現頻率計算在內,高頻率的簡體字能夠拉高簡體滲透率,低頻率的簡體字影響較小;首一百字的簡體滲透率 24.90%,即是說,如果只用最流行的一百字作一篇文章,裏面大概 25% 是簡體字。用最流行的一千字作一篇文章,裏面大概三成是簡體(見「累積滲透率」)。

簡體字省去多少筆劃?這就是「筆劃簡化率」的意思,已將字頻計算在內。再拿第一橫行作例,首一百字的筆劃簡化率 82.98%,即是說,如果只用最流行的一百字作一篇文章,用繁體字寫需要一萬個筆劃,用簡體字寫同一文章大概需要 8,298 個筆劃。用最流行的一千字作一篇文章,用繁體字需要一萬個筆劃,用簡體字大概需要 7,912 個筆劃(見「累積簡化率」),省去大約二成「筆墨」。

上表所見,簡化效用最顯著集中在第 301 至 600 位(灰色部分),為什麼不是更高?最流行的字不是最應該着力簡化的嗎?依我看,簡體字設計者當然明白這道理,只不過很多最常用字筆劃已經不多,既然「簡無可簡」,也無謂「畫蛇添足」了。

(2012 年 4 月 6 日 信報副刋)

2012年1月28日 星期六

生命裏幾多%是廣告?

今年 1 月 16 日星期一黃昏五時許,香港中央圖書館出現一個奇怪境象。某人桌上疊着許多報紙,逐版攤開,拿着膠尺來回量度,巡館人員無不投以奇異的目光,可是此人並無製造滋擾,拿他沒法。究竟讀報紙為什麼要用尺?

那人是我,我正在量度報紙廣告的面積。

平日翻開報紙,碰口碰面都是全版廣告;近年盛行的免費報章更甚,廣告多過內容。不禁要問,今日的報紙,多少版面用來賣廣告?讀者能夠容忍多少廣告呢?

這問題在腦中縈繞了一段日子,近日終於一鼓作氣,拿起家中 1 月 9 日及 12 日兩份舊《信報》量一量。只量《信報》無甚意思,當然要找其他收費報章比較比較,於是到中央圖書館找來同日期的《蘋果》、《東方》、《星島》、《明報》及《經濟日報》,花了逾三小時量度共十份報紙的廣告面積,你猜哪份廣告最多?

廣告佔版面百分比
 2012 年 1 月 9 日2012 年 1 月 12 日
1經濟 59.6%東方 51.4%
2東方 54.8%經濟 47.5%
3蘋果 43.2%蘋果 46.4%
4明報 38.6%明報 36.9%
5星島 26.4%星島 34.1%
6信報 24.4%信報 30.9%

(註:《星島》、《經濟》及《信報》付送小報,以上數字已把小報計算在內,唯《星島》例外。圖書館保留的《星島》不包括小報,計算已把其面積剔除。)

與你的印象或觀感相符嗎?有想過付錢買報紙,動輒四成是「水份」?

對我來說,最意外是《經濟》和《信報》印象中屬於同一「類型」,非大眾化,讀者群較窄,但廣告份量竟有天壤之別,兩份報紙顯然採取兩種不同的經營手段。以廣告份量觀之,《經濟》似《蘋果》和《東方》多過似《信報》。

免費報紙不收分文,純靠賣廣告為生,廣告版面會否更多?我沒時間翻看所有免費報,唯有以自稱「全港 No.1 最多人睇嘅」《頭條日報》為代表,找來 1 月 16 日及 17 日兩份,其廣告佔版面分別是 62.6% 和 65.9%,果然比收費報章高,但不算高出很多。

除了滿足好奇心,留意報紙廣告面積還有什麼實際用途?記得一位廣告界朋友說,生意不景時,企業最先削減的就是廣告開支。那豈不表示,廣告多寡可作經濟或股市的「領先指標」?如果我有足夠的人力物力,或可編製「全港報章廣告指數」,追溯回七十年代,其「預測力」便可驗證一下。可惜我只是一名潦倒的專欄作者,人微言輕,此一「革命性」提議多會湮沒在歷史的洪流之中。

想到自己懷才不遇,不禁望窗長嘆。窗外的景色,活像一張報紙;大廈外牆是廣告,巴士車身是廣告,小巴車身是廣告,的士車頂是廣告,派傳單的人舉着廣告,商場入口的地面也好像貼着廣告。報紙動輒四成是廣告,窗外視線的廣告不比報紙的少。

呢個地方點解咁多廣告?我想,這是物質豐裕的結果。當服裝店只有幾款襯衣,鞋店只有幾款皮鞋,文具店只有幾款原子筆,根本沒有賣廣告的必要;反觀今天,超級市場連啤酒、朱古力、香口膠都有十幾種,宣傳便顯得非常重要。競爭愈激烈,宣傳愈重要。

在富裕的社會,廣告蔓延似乎是不能逆轉的趨勢,我們能夠容忍多少廣告呢?收費報章把廣告推至什麼密度,我們才不願意買?免費報章把廣告推至什麼密度,我們才不願意拿?或許沒有固定的答案,一切都是習慣。有報章賣五成半廣告,便有報章嘗試六成,然後六成半、七成……不斷試探讀者的底線。我們到底有沒有底線?

想一想,平時觀看電視劇,不轉台,顯然覺得廣告長度還「可以接受」,你猜一小時的黃金時段包含多少廣告?八分鐘?十分鐘?十幾分鐘?

今晚年初二,我計過無線電視九時至十時的總廣告時間,是 13 分 35 秒;如果連新聞簡報計算在內,更達 14 分 45 秒。如果我問你,一小時的劇集,中斷了差不多十五分鐘,你認為「可以接受」嗎?我接受唔到囉,不過我仍然在看。

(2012 年 1 月 28 日 信報副刋)

2011年11月16日 星期三

區議會選舉有舞弊的跡象嗎?

2009 年伊朗總統大選,艾哈邁迪內賈德擊敗三位對手成功連任。遠在波蘭,一位學者看着伊朗內政部公佈的點票結果,發覺有點異樣;排名第三的候選人卡魯比在某些選區的得票有點「不尋常」,那些選區恰好正是艾哈邁迪內賈德大勝的區域。「不尋常」之處,關乎卡魯比得票的第一位數字;你沒看錯,只看頭一個數字,便可窺見選舉有沒有「造馬」。

記得中學數學課,高中之前不准用計算機,那時計算 log(對數)需要查表的;有了計算機之後,至今二十多年未碰過對數表了。在沒有計算機的年代,對數表是理科不可或缺的工具;1881 年,美國天文及數學家 Simon Newcomb 發現一個有趣現象,圖書館的對數表「1」字頭那頁永遠是最骯髒和最殘舊的,往後一頁比一頁清潔,人們好像遇到「1」和「2」字頭的數字特別多,遇到「8」和「9」字頭的數字特別少;他更提出一條方程式,說「d」字頭的出現概率為 log(1+1/d),把「1」至「9」代入「d」的位置,便得出「1」字頭的出現概率約為 30%,「2」字頭約為 17%,逐個減少,「9」字頭只有 4.5%。換句話說,日常遇到的數字,大約每三個便有一個是「1」字頭,為什麼「1」字頭這麼普遍?

Newcomb 沒有解釋,只說該條規律「顯而易見」("evident"),我等凡人不得不驚嘆數學家對數字的「直覺」。可能就是過於「顯而易見」的關係,Newcomb 沒有找來更多事例,這話題也就此沉寂,不了了之。

五十七年過去,來到 1938 年。通用電氣公司物理學家 Frank Benford 在不知情的情況下重複同一發現,但他更進一步,從現實世界找來多種數據,包括讀者文擇出現的數字、門牌號碼、各國人口、河流長度、棒球聯賽統計數字、原子量(atomic weight)、物理常數等,範疇包羅萬有,總共超過二萬個數字,其字頭分佈與 log(1+1/d) 不謀而合!此現象從此稱為 Benford's Law,班福特定律。可是,Benford 依然沒有解釋為什麼,Benford's Law 雖有實證作根據,卻無甚理論基礎。

又過五十七年(世事多麼巧合!),1995 年美國數學家 Theodore Hill 終有突破,他以嚴謹的數學方法證明,從多種數據來源隨機抽樣得出的數字,其字頭一定符合 log(1+1/d) 分佈,即「1」字頭出現大約 30%,「2」字頭約 17% ……「8」字頭約 5.1%,「9」字頭約 4.5%。這裡不能公式化談數學,我姑且用日常文字嘗試解釋一下。想一想,恒生指數由 1,000 點升至 2,000 點較難,還是 2,000 點升至 3,000 點較難?前者升幅 100%,後者升幅 50%,顯然前者較難。由 2,000 點跌至 1,000 點較難,還是 3,000 點跌至 2,000 點較難?前者跌幅 50%,後者跌幅 33%,也是前者較難。換句話說,恒生指數「1」字頭的時間(1,000-1,999 點)應比「2」字頭的時間(2,000-2,999 點)為長,以此類推,逗留於「3」、「4」……「8」、「9」字頭應該漸次縮短,直至到達 10,000 點,重回「1」字頭,開始另一循環。假設恒生指數長遠而言維持若干每年平均升幅,它逗留在各字頭的時段應該合符 Benford's Law 的比例。

這是一個籠統的解說,粗略點出「1」字頭常見性的來源,道理如何擴展至人口、河流長度、物理常數等風馬牛不相及的領域,在避談公式化數學的前提下無法說得清,我們只有相信 Hill 的數學論證。


那究竟什麼種類的數字合符 Benford's Law?籠統地說,「自然產生」的數字通常符合。地震的深度、地球磁場逆轉的時距、放射性物質的半衰期、脈衝星的轉速等,全部符合 Benford's Law(自然界給我們的數據,這是「自然產生」的第一個含意)。各國人口、原油蘊藏量、溫室氣體排放、傳染病例數目、報稅表的賬目、選舉所得票數等,也符合 Benford's Law(真實的、未經竄改的統計數字,這是「自然產生」的第二個含意)。留意第二類,這提供一個偵測虛報或作弊的途徑,假如某公司長期提供一些不夠「Benford」的稅務資料,那可能是逃稅的跡象;假如點票結果不夠「Benford」,那可能是舞弊的線索。文首提到伊朗總統候選人卡魯比在某些選區得票「不尋常」,所指的就是違背 Benford's Law。

大家要小心,哪些數據合符 Benford's Law 沒有絕對的標準,完全公正的選舉未必符合,舞弊的選舉未必不符,Benford's Law 只可視為一種跡象或線索,絕不應視為確鑿證據。

區議會選舉剛過,不如「就地取材」,拿全部候選人得票第一位數字作個統計,看結果有多「Benford」。下圖所見,「1」和「2」字頭特多,但形態大致上合符 Benford's Law。這算是舞弊的跡象嗎?很難說,每選區人口二萬人左右,可能選區人口加上投票率加上候選人之間的典型差距造就「1」和「2」字頭特別容易出現,又或者其他想得出的原因。上面說過,公正的選舉未必合符 Benford's Law,舞弊的選舉未必不符,現在冒出多一個問題,偏離多遠才算「事有蹺蹊」呢?作為偵測舞弊的工具,Benford's Law 實在太多局限。


香港的選舉大致上都是公開公正的,大家都有信心,即使點票結果與 Benford's Law 不盡相符,我們傾向把「疑點利益」歸於建全的制度,忙替現實與理論的差距找「藉口」,而非動輒懷疑選舉舞弊,也許我們應該慶幸活在這樣一個廉潔的地方。

學術參考:
M. Sambridge, H. Tkalčić, A. Jackson (2010), “Benford’s Law in the Natural Sciences,” Geophysical Research Letters 37, L22301. doi:10.1029/2010GL044830

Boudewijn F. Roukema (2009), “Benford’s Law Anomalies in the 2009 Iranian Presidential Election,” arXiv:0906.2789

R. M. Fewster (2009), “A Simple Explanation of Benford’s Law,” The American Statistician 63, 26-32. doi:10.1198/tast.2009.0005

Theodore P. Hill (1998), “The First Digit Phenomenon,” American Scientist 86, 358.

Theodore P. Hill (1995), “A Statistical Derivation of the Significant-Digit Law,” Statistical Science 10, 354-363.

2011年10月29日 星期六

跟兩年前的我算一算賬

(本文寫於數星期前,由於信報整理版面,今日才登,現在讀來有點過時……)

記得 2009 年高錕以 76 歲高齡獲頒諾貝爾物理學獎,他是三位得獎者中年紀最輕的,其餘二人當時分別是 79 及 85 歲,三人平均年齡是物理學獎有史以來最高的。當時翻查資料,發現近半個世紀物理學獎、化學獎及醫學獎得獎年齡有着明顯的上升趨勢,為什麼?第一個想法是「後繼無人」,創見和重大發現愈來愈少,諾獎委員會「被逼」找「舊」的發明或發現來頒獎,但我很快便打消這個想法,因為三門學科同時「後繼無人」是不甚可能的,得獎年齡老化應該反映着一些跨學科的「結構性」轉變。

是不是知識累積需要更長時間?聽來合情合理,可是細看下圖便發覺站不住腳。我兩年前談論諾貝爾獎繪過此圖,是物理、化學、醫學、經濟學和文學獎得獎年齡的十年移動平均線,經濟學獎 1969 年才第一屆,故其平均線 1978 年才開始。有沒有發覺這五條線大致可分成兩組?物理、化學和醫學一組,經濟學和文學一組,九十年代中期之前兩組分野是十分明顯的,前者的得獎年齡長期處於後者之下。如果把得獎年齡老化歸因於知識積累需時,那豈不暗示經濟學比三門理科都要「博大精深」?(文學獎性質不同,不把它拖落水)除了經濟學家之外,相信沒有人會同意。知識累積作為得獎年齡老化的解釋站不住腳,還能如何解釋呢?


兩年前提出一個理論,今天依然適用,大家不妨參考一下。文學,眾所周知是「各花入各眼」,沒有公認的優劣標準,對於誰人應該得獎,很難達致廣泛認同;即使諾獎委員會找到共識,也必須顧及公眾的觀感,因為他們深知文學這回事,根本優劣難分。在這種共識難求的情況下,選擇年紀較大的得獎者是自然不過的;舉例,兩位作家,一位年過七十,一位初出茅廬,除非理由極度充分,否則一定不會選擇後者。然而,評審文學成就何時會有「極度充分」的理由?故此,文學獎得獎年齡長期處於三門理科之上。

經濟學也好不了多少,面對同一社會同一境況,經濟學家都會意見紛紜,誰的說法較為「正確」更無定論。與文學一樣,評審經濟學成就很難意見一致,得獎者年齡較大也就「理所當然」。

由此路進,三門理科的得獎年齡老化也就不難解釋;從前得獎年紀輕,顯然成就判斷較為一致,近年為何分歧多了,是否科目分得太過細緻,學問太過專門?抑或是教育普及、百花齊放的自然後果?近年少有重大突破,難有舉世認同的貢獻?還是突破太多,獎項不知頒給誰?又是另一研究的課題。

兩年前我曾說過「2000 年後,五條平均線纏在一起,若果我的想法正確,物理、化學、醫學三科的得獎年齡應該自此漸趨橫行,因為我不認為任何學科可以比文學和經濟學更加自說自話」;兩年下來,五條平均線沒有絲毫分開的跡象,我依然認為三門理科的得獎年齡繼續老化的空間有限,有什麼比文學和經濟學更加莫衷一是?

(2011 年 10 月 29 日 信報副刊)

2011年10月22日 星期六

跟路透社算一算賬

(本文幾星期前寫,由於信報整理版面,今週才刊出,已經有點過時……)

路透社真厲害,諾貝爾得獎名單早在他們意料之內。今年物理學獎、化學獎、醫學獎、經濟學獎得主都給路透社「貼中」,究竟是什麼回事?

事情追溯至 1989 年。當年,路透社開出一張二十人名單,說是最有機會贏取諾貝爾醫學獎的人士,其中二人即年應驗,其後還有四人分別在 1992、1994、2000 及 2002 年獲獎。至今經歷二十多屆,那張名單才二十中六,成績不算優異。

1990 年,路透社再接再勵,開出十二人物理學獎名單和十人化學獎名單;至今,物理學名單有三人得獎(其中一位獲頒化學獎,即是猜對了人但猜錯了獎,無謂太嚴苛,算猜中吧),化學名單有四人得獎,預測也不算準繩。

同是 1990 年,有人發表論文〈Who Will Win the Nobel Prize in Economics? Here's a Forecast Based on Citation Indicators〉,列出五十位被引用最多的經濟學家,其中十五人當時已經是諾獎得主,另外七人在往後年份陸續獲獎。該篇論文之外,很多研究亦指出,同行引述的多寡與獲頒諾貝爾獎是有關連的。事實上,路透社的預測名單也是用類似方法,根據學術文獻的引述次數來決定諾貝爾獎的熱門人選。

寫學術論文不似我寫專欄,每一組數據、每一項事實、每一個說法都要列明出處的,拾人牙慧固然可以,但牙慧的來源必須列明,就是因為這種嚴格的要求,誰人的著作被引用得多,是數得出來的。學術期刊有聲譽高低之分,聲譽高的期刊引述一次當然來得更有「份量」,點算引述次數時,期刊聲譽也會計算在內。簡而言之,這種計分法把學術成就與著作被引述的次數掛鈎,支持者說是客觀,反對者說是過於機械化,無論如何,它已成為學術市場的一部分,成為評核學者的一種標準,高等學府以此作為教職員聘用和升遷的考慮之一,路透社則以此作為預測諾貝爾獎的工具。

然而,路透社深知引述次數不是故事的全部,漸漸加入其他較難量化的判斷,例如哪些貢獻最被重視,哪些發現值得特別表揚等;優化其預測系統後,路透社自 2006 年起每年都開出物理、化學、醫學和經濟學獎的預測名單(以前只是偶然為之),每科名單少則四人,多則八人,至今六屆,成績如何?

路透社對自己的要求不太嚴苛,每屆落空的預測順延至下屆,「預測有效期」無限(直至某人逝世,諾貝爾獎不會死後頒發的),人選年年累積,「貼中」機會理應逐年提高,情況是不是這樣?下圖顯示六年來的預測成績,今年真是「戰績彪炳」,四獎全中共九人:三位發現宇宙加速膨脹的,在路透社 2010 年物理學名單之內;三位研究免疫系統的,二人在 2008 年名單,一人在 2010 年名單;那位發現準晶體的化學獎得主及兩位經濟學獎得主,均在 2008 年名單之內。


隨着人選不斷擴大,路透社要在來年維持「彪炳」的預測成果,我看不是太難。如果成功率反降,他們的預測系統才真有檢討的必要。

(2011 年 10 月 22 日 信報副刊)

2011年8月4日 星期四

特區區旗惹的禍

匯豐銀行一百元新鈔錯印特區區旗,洋紫荊圖案左右不分,幸得細心市民提點,及時改正。很多人視此為貽笑國際的大笑話,我則認為情有可原,若非這次事件,相信九成以上的市民(包括我)對洋紫荊圖案的方向不甚了了。鈔票設計人及把關人士固有失職,但「罪魁禍首」應是特區區旗這種「好似對稱又其實唔對稱」的設計,「災難」總有一天發生,只看哪位設計者「稍一不慎」。

香港會犯這種錯誤,其他地方也可以。世上哪些國旗屬於「好似對稱又其實唔對稱」,容易犯上左右不分的錯誤呢?

我上英文維基瀏覽現今所有國旗,共 204 面,首先撇除左右對稱的,這些國旗正反面相等,無可能犯錯。餘下不對稱的,如何定義惹人犯錯的「好似對稱」?這裡牽涉主觀判斷,容我簡述篩選過程,然後揭曉我的答案。

首先撇除一些「明顯不對稱」的國旗,中國便是一例,五顆星「瑟縮」一角,永遠靠着旗桿,稍為留神必察覺。主要特徵明顯偏向一方的國旗,明顯不對稱,很難犯錯。美國和澳洲皆屬此類。


丹麥(右圖)、芬蘭等北歐國家愛用「北歐十字」(Scandinavian Cross),垂直那一棟偏向旗桿,此標誌不算罕見,其不對稱亦頗為明顯,不易犯錯。


另一些國家用對角線,如汶萊、不丹、千里達(右圖),在我眼中,此類也屬「明顯不對稱」,剔除。


法國國旗是三根垂直粗條,從旗桿起為藍、白、紅,容不容易左右不分?很難說,但怎也比我們的洋紫荊圖案易分,我認為法國國旗未至於惹人犯錯的「好似對稱」。比利時和意大利皆屬此類。


巴西國旗,如圖所示,「大致」對稱,除了中間那條白帶、白帶上的字和那堆仿照 1889 年 11 月 15 日里約熱內盧天空的星星。根據國旗圖像的慣例,旗桿在左;如匯豐新鈔般把旗桿放在右邊的話,國旗圖案理應左右對調,可是巴西國旗左右對調會衍生一些問題,白帶上的字豈不調轉來寫,看上去太不自然?星星反轉來看,再也不是里約熱內盧的天空,豈不違背了設計的原意?一輪調查後,原來都是杞人憂天,巴西法律早已洞悉這些問題,明文規定「國旗的兩面必須一模一樣,白條左高右低,禁止兩面互為鏡像(forbidden to make one side as a mirror-image of the other)」,即是說,無論從哪一面看,巴西國旗都是一樣,沒有左右對調這回事,匯豐新鈔的錯誤不會在巴西發生。(除非設計師自作聰明把圖案左右對調,那是另一種錯誤了。)

巴西國旗給我兩個啟示。一,文字不應調轉;二,任何調轉看不合理的東西都不應調轉。很多國旗都有盾徽(coat of arms),即是那些左有一隻獨角獸,右有一隻獅子,下有幾根稻草,簇擁着中間一個盾牌的標誌,盾徽就是一種不應調轉看的圖案(右為黑山國旗,盾徽在正中)。我沒法在有限時間內翻查所有不對稱國旗的法例,未能肯定個別國家有否效法巴西清晰闡明國旗正反兩面的處理,因此我作了一個假設:任何有文字或盾徽的國旗正反兩面應該相等,不應互為鏡像,亦即沒有左右對調這回事,匯豐新鈔的錯誤不能發生。此假設未必正確,就此撇除包含文字或盾徽的國旗也許流於武斷,但我還有另一理據。很多盾徽包含文字,反轉的文字極為礙眼,容許文字或盾徽調轉的國旗是為「明顯不對稱」,早應喚起設計師的注意,錯誤也不會發生。

基於以上兩點,包含文字或盾徽的國旗也給剔除。(右為沙地阿拉伯國旗)


伊斯蘭國旗愛用新月標誌,新月的開口向左還是向右?向右。伊斯蘭教徒斷無不知之理,包含新月的國旗也給剔除。(右為馬爾代夫國旗)


還有一些個別情況未能盡錄,運用自己的判斷就是了。餘下五面國旗,我認為與特區區旗那種「好似對稱又其實唔對稱」不相伯仲的,簡直惹人犯錯,鈔票設計師不可不察,將來的國旗設計者最好也避免這種設計。五國分別是:

摩洛哥

埃塞俄比亞

南韓

英國

吉爾吉斯


一圖勝千言,我不多說了,大家咀嚼咀嚼這些左右難分的國旗吧。

P.S.
(一)嚴格來說,埃塞俄比亞國旗那顆星是盾徽,應該被篩掉,再次證明原則不可盲從,判斷力最重要。
(二)差點給英國國旗「跣一鑊」,我由始至終以為它是對稱的,幸好交稿前瞥見案頭舊報紙一幀新聞照,方才驚覺。特區區旗真是承襲了「前朝遺風」。

(2011 年 8 月 4 日 信報副刊)

2011年7月21日 星期四

哪位高官「信唔過」?

某高官某天收到一封神秘信件,內含一枚骰子及指示如下:

請擲骰一次,把點數寄回 XXX 地址,你將會收到一筆獎金:
  • 一點 = 一萬大元
  • 二點 = 二萬大元
  • 三點 = 三萬大元
  • 四點 = 四萬大元
  • 五點 = 五萬大元
  • 六點 = 六萬大元
獎金有限,欲玩從速。

高官心想一玩無妨,骰子一擲,三點。房間只有高官一人,貪念遂起,何不虛報六點,騙取最高獎金?思索片刻,他猛然醒覺,可能這是報人設下的陷阱,測試高官的誠信,骰子或信封是否藏着什麼高科技感應器,早把擲骰結果傳回報館?他仔細檢視信封及來函,乃正常紙張,並無不妥;安全起見,扔入碎紙機,一了百了。他從抽屜取出鐵鎚,砸爛骰子,乃普通塑膠,並無任何特別裝置。環顧四周,房門緊閉,窗簾緊鎖,外人欲窺無從。

剩下只得一個可能,房內有否什麼針孔攝錄機,監視他的一舉一動?可能性不大,辦公室保安森嚴,房間需要密碼及指紋認證方可進入,他曾在這裡談過幹過多少機密勾當,虛報點數騙取獎金這樁小事,報館才不會大費周章偷進來安裝什麼攝錄機,看來他是過慮了。

可是,不怕一萬,只怕萬一。值得為了幾萬元冒險嗎?實報三點算吧。不過,沒人知道實情,即使實報三點,有人質疑起來,也難以自辯;報一點最安全,沒可能被指責「報大數」了。一點?三點?六點?

高官苦思了一會,作了決定,正想動筆回郵,赫然發覺回郵地址已經與信函一起碎掉,石沉大海。無論獎金是一萬,三萬,還是六萬,見財化水了。

§

高官的懷疑對了一半,這是一個誠信測試,但不是「陷阱」,沒有高科技感應器,沒有針孔攝錄機,沒人偷窺,他可填報任何點數,沒人知道其誠實與否,收不收到獎金是另一回事。那何來測試誠信呢?哈哈,玄妙就在此處,雖然無法判斷個別人士的誠信,但從多人的回應可以猜到其整體誠信。假設全體高官都是老實人,其填報的平均點數該是 3.5,正如一枚骰子擲出的長遠平均值。假如收到回覆的平均點數是 5.0 呢?那表示很多高官「報大數」了,不知道誰人「報大數」,但肯定很多人「報大數」,政府高層的誠信可見一斑。

這麼聰明的測試,當然不是我發明,是心理學家研究誠信的工具,例如什麼環境因素令人說謊,或擁有某些特徵的人較愛說謊等等。最近便有研究發現,「大話精」原來「有樣睇」的,面孔愈「闊」愈愛說謊。「闊」,不純指面孔闊度,而是面孔闊度與長度之比,比例愈大即面孔愈闊。面孔闊度不難量度,但長度怎算呢?髮線後移令面孔變長,披着假髮令面孔變短?這裡的面孔長度定義為眼眉下緣至上唇上緣,即不包括額頭、嘴唇和下巴。這樣算出來的闊長比例,數值愈高,表示此人愈「信唔過」。噢,說漏了一個重點,這關係只適用於男性,不適用於女性。

舉些例子,美國甘迺迪總統的闊長比例為 2.15,尼克遜總統 2.02,皆屬「闊面一族」;約翰連儂 1.63,莎士比亞 1.44,是「窄面之人」。四位之中,誰最「信唔過」,我相信讀者眼睛是雪亮的。

香港官場,誰最面闊?為了準確量度,我嘗試在網上尋找符合以下條件的照片:(一)正面;(二)無表情(neutral expression,這是學術研究常用的標準);(三)嘴巴閉合(撇除明顯在說話的情況)。完全符合的照片非常難找,退而求其次,接受微微側面或微笑等,政府網頁的官員個人照算是最合適的了,假如那裡的照片太大「瑕疵」(如不夠正面,笑得太燦爛等),則從芸芸新聞照片中揀選,過程頗費時,我只能處理特首、三位司長及九位男局長共十三人的照片。

闊面排先,括號內為闊長比例:
邱騰華(2.22)
陳家強(2.17)
曾俊華(2.09)
黃仁龍(1.97)
張建宗(1.96)
孫明揚(1.96)
曾蔭權(1.91)
曾德成(1.88)
*他面孔實在太窄,很難完全正面,因此我取兩張平均
李少光(1.87)
林瑞麟(1.85)
蘇錦樑(1.82)
唐英年(1.68)
周一嶽(1.63)

愈面闊,愈「信唔過」?邱騰華是環保大話精?傻強陳家強一啲都唔傻?黃仁龍欺騙了全港師奶?林瑞麟衷心相信自己的謊言?唐英年面對鏡頭的戰兢和尷尬,是老實的表現?周一嶽怪不得一星期補一隻鑊,他實在太太太老實了!

曾蔭權真懂「知人善任」,一半司局長比自己面闊,另一半比自己面窄,自己恰好位於「權力中心」,如此無懈可擊的「權力制衡」,難怪議而不決,決而不行了!

對於以上排名也不必太認真,心理實驗的結論與現實世界是兩碼子事,虛報骰子點數與張開眼睛說瞎話也是兩碼子事,儘管兩者都是缺乏誠信,但兩者有着本質的差異;虛報點數是鬼祟行徑,有點鼠竊狗偷之流;張開眼睛說瞎話多少要點自信、勇氣、面皮厚,對一眾保皇派而言,可能還有忠心耿耿的高尚意義。實驗室的結論有多少能夠照搬至現實世界,面孔闊長會不會改變市民對個別官員的觀感,又是那一句:我相信市民眼睛是雪亮的。

P.S. 下筆時,我的心情非常沉重,因為發覺我的闊長比例為 1.85,竟與林瑞麟相等!

(2011 年 7 月 21 日 信報副刊)

學術參考:
Michael P. Haselhuhn, Elaine M. Wong (2011), “Bad to the bone: facial structure predicts unethical behaviour,” Proc. R. Soc. B. doi:10.1098/rspb.2011.1193