2012年3月3日 星期六

數字不說謊,我便要信嗎?

統計,令人又愛又恨。用它的時候,會說「Numbers don't lie」,人會說謊,數字不會。討厭一些人用它來砌詞狡辯,我們又會說「Lies, damned lies, and statistics」。跟着一位統計學專家又會走出來提醒我們,統計未必代表真相,但沒有統計便一定沒有真相。

最近看見幾件事,令我對統計的局限性有些體會。

魔球》電影講述畢比特飾演的棒球隊經理如何運用統計數據在球員市場覓得「滄海遺珠」,令窮球隊創造歷史,掀起一次數據革命。故事沒說的是,窮球隊的成功惹來其他球隊仿效,結果不是隊隊緊縮開支,而是人人爭相發掘數據,秘密武器不再秘密,窮球隊優勢漸失。故事所在的 2002 年正是窮球隊的頂峰,當季贏得 103 場,此後九季分別是 96、91、88、93、76、75、75、81、74 場,戰績「一浪低於一浪」。如股票市場一樣,當某項指標獲得廣泛青睞,其效用便會降低。

統計不能助你長勝,除非別人沒有。要 stay ahead of the game,便要不斷發掘別人未發掘的數據。

另一邊廂的 NBA,林書豪旋風由美國捲至亞洲。該名曾遭幾支球隊棄用的黃種人到達紐約後忽然「開竅」,令人大跌眼鏡不在話下,即使「馬後炮」地翻查數據也是無跡可尋。統計在 NBA 不若棒球般普及,但數據派大不乏人,若林書豪的潛質有在某些數據上反映,紐約人根本沒有冷手執個熱煎堆的可能。或者我們應該慶幸,數據不能包羅所有潛能,否則便沒有林書豪這種一舉成名的故事,少了一個鍥而不捨追逐夢想的理由。

未成名的球員不希望數據萬能,這樣他們才有希望;球隊經理和教練不希望數據萬能,這樣才有「眼光」可言;NBA 不希望數據萬能,這樣賽事才有看頭,不時冒出一些峰迴路轉、拍案叫絕的情節,引人入勝。

一場籃球比賽,某人四射四中,現在第五次投射,你猜他中不中?

中文叫做「手風順」,英文叫做「on fire」,籃球戰術有所謂「feed the hot hand」,即是傳球給手風順的隊友,讓他得分。籃球員、評述員、教練、觀眾都相信手風順時命中率較高,實情是不是這樣?手風順是否真有其事,還是我們總愛替偶然的隨機事件冠上非偶然的解釋?

一枚硬幣擲二十次,出現連續四次「公」的機會多大?多數人說,不大。連續三次「公」,我們開始「提高警覺」;連續四次「公」,我們開始說「咁邪?」,有點出乎意料,開始懷疑有些外力干擾。事實上,擲幣二十次,連續四次「公」是頗為常見的,不必大驚小怪。本來一些司空見慣的隨機事件,感覺上並不隨機,這是直覺與事實的差距,因此我們需要統計,以補直覺的誤差。

手風順在統計上站得住腳嗎?如果真有其事,連中幾元之後命中率應該提高;相反,手風欠順,連續射失之後命中率應該下跌。曾有學者找來 NBA 某年某隊的統計數據,列出每位球員射失三次、二次、一次和射入一次、二次、三次之後的命中率,發現情況與手風之說剛剛相反,射中後非但沒有命中率提升,反而些微下降,射失後命中率反而些微提升。為什麼?硏究沒有解釋,我想正正可能是球員誤信手風之說,射入後「信心爆棚」自有濫射的傾向,相反,射失後「步步為營」等待最佳時機再投籃,命中率提升是必然的。無論什麼原因,手風之說經不起命中率的分析。

另一種分析法,用「run」的概念。連續射中或射失就是一個 run,例如「失中中中失失中」包含四個 run:射失一次,連中三次,連失二次,射中一次。如果手風之說真有其事,射中和射失應該結集在一起,run 的次數應比隨機為少,實情是否如此?哈,又是剛剛相反,run 的次數多於隨機,手風之說經不起 run 的分析。

還有其他分析法,這裏不詳說了。過去二十多年,學者嘗試從籃球、棒球、高爾夫球等找尋手風順逆的蹤跡,發現根本沒有這回事,球員表現跟擲毫沒有分別。換句話說,一名命中率 48% 的籃球員,其射中射失的過程跟一枚 48% 擲出「公」的硬幣沒有分別(假設「公」代表入球),即使連擲九次「公」,也不過是隨機的偶然,不值得大驚小怪。

手風這回事,統計上毫無根據,告訴別人,人們又信不信?一位學者曾這樣說:「I’ve been in a thousand arguments over this topic, won them all, but convinced no one.」我也打過籃球,當我手風大順的時候,你告訴我手風是錯覺,我懷疑你根本未打過籃球。

(2012 年 3 月 3 日 信報副刋)

學術參考:
Michael Bar-Eli, Simcha Avugos, Markus Raab (2006), “Twenty years of ‘‘hot hand’’ research: Review and critique,” Psychology of Sport and Exercise 7, 525–553. doi:10.1016/j.psychsport.2006.03.001

T. Gilovich, R. Vallone, A. Tversky (1985), “The hot hand in basketball: On the misperception of random sequences,” Cognitive Psychology 17, 295–314.

沒有留言:

張貼留言