SENSE隨筆131017《精準預測》中:您的配偶有否不忠?

SENSE隨筆131017
《精準預測》中:您的配偶有否不忠?
執筆人:蟬

冷靜,先別嚷分手。

想象以下純屬假設的情景:SoChun與伴侶同居多年,忽一日出國公幹後回家,竟在衣櫃內發現一件來歷不明,穿著過的男性衣物,當即傷心欲絕,要生要死。好友們均悲觀地認為事不離實,勸他逆來順受,並指伴侶會因內疚而對他更好云云…..

那到底SoChun的伴侶出軌的機率有多少? 阿蟬心裡雖亦明白 “天理循環,報應不爽” 的道理, 但作為一名sense派,任何問題均 “應而且只應” 以sense解拆,便拋出「貝氏定理Bayes’ Princple」證明So伴侶出軌的可能性其實甚低。

貝氏定理針對的問題原型為: 某些事件發生之後,某個理論或假設為真的機率有多少? ***

要找出So伴出軌的機率,先要把問題設定好:

  1. 假設一個機率,代表So伴真的出軌,出於大意而把情人衣物留在衣櫃內。在此我們假設此機率為50%,是為A
    i.e. So伴偷情而不留下衣物的可能性同樣是50%。
  2. 再假設So伴沒有不忠而衣物卻因其他原因出現在衣櫃裡的機率。將此機率設定為10%,是為B;***
  3. 接下來要定下「先驗機率prior probability」C,即So伴打從一早巳背叛了他的機率。根據SoChun精明審慎的性格,這事態發生的機會微乎其微。 但為營造戲劇張力,即管把這機率定為1%,是為C
    例子:美國一項研究發現,在特定的任何一年,已婚伴侶對配偶不忠的機率同樣為4%。 若以涂爾幹的觀點,出軌似乎是社會事實***,是社會的錯。 J

萬事俱備,我們可以運用貝氏定理來建立So伴在這情形之下出軌的可能性,即「後驗機率posterior possibility」。算式如下:

sochunwife後驗機率 = (0.01 * 0.5)/ [(0.01 * 0.5) + 0.1(1-0.01) ] = 0.048 = 4.8%

貝氏定理證明So伴只有不足5%的可能性出軌!實在是非常貞節,可喜可賀!
然而大家定必認為即使在找到 “污點証物” 的前提下, So伴出軌的可能性只比美國平均值高出那麼少,此點實屬可疑,然則計算是否有錯呢?

機率是甚麼?
貝氏Thomas Bayes是18世紀英國的牧師,英國皇家學會院士。他認為上帝是完美的,人類遇到的不完美是出於人的緣故而非上帝。

舉例:阿蟬初次炒股票輸錢,驚嘆原來股票是可以虧錢的。 接著他每天炒股票都輸錢收場。 慢慢地阿蟬越來越認識到:股票是會讓人虧錢的。透過統計推論,他得出未來每天炒股票極大機會虧損,覺得自己越來越接近真理,內心充滿著喜悅。

阿蟬是以「趨近法」去認識股票的,雖然越來越接近真理,但永遠不會找到真理。***

貝氏認為機率的概念是以人認識世界的方法構成的。 而機率之所以存在是因為人類在測量時的不完全與完美的世界產生落差。*** 科學決定論的支持者Laplace也抱著同樣的信念,他認為機率是無知與知識之間的中途店。**** 是科學進步的必然條件。

貝氏定理要求人們以機率看待世界,要求人採取 “世界本質上是不確定的” 這種立場。貝氏定理要處理的正是認識論上的不確定:「知識是有限制的。」***

大數據的基礎與問題
上世紀初英國統計學家 費雪Ronald Aylmer Fisher貢獻良多, 統計學用詞「Statistical significance統計顯著性」便是他的發明。

費雪是貝氏定理的反對者,他認為貝氏學派提出的先驗機率過於主觀**,在沒有實驗和數據支持下先斷定事件發生的可能性違反科學客觀的概念。 他曾在文章中指出貝氏學派的想法應該完全被揚棄。

與費雪同年代的學者努力發展一套統計方法,希望藉此去除主觀和偏差對結果的影響。 這類統計今日通常稱為「頻率論Frequentism」「費氏學派Fisherian」

費氏學派認為統計問題中的不確定性來自於蒐集資料時只從整體研究對象中抽取一部份,而非對象的整體。*** 頻率論的目的便是透過分析並量化當中產生的抽樣誤差sampling error。***

舉例:2008年美國民主黨內部總統候選人選舉時,在新罕布夏州調查了一萬五千人(當地人口約為一百三十萬人),抽樣比例高令誤差範圍理論上只有0.8%,但實際誤差卻是8%,誤差大到足以錯誤預測希拉莉會大比數輸給奧巴馬,而實際上希拉莉勝出了這個區選。

頻率論的問題是它無法去除人為誤差,它相信抽樣比例越高,資料越豐富,誤差將趨近零。*** 充足的樣本並不保證預測完美,但樣本不足卻保證誤差會被放大。頻率論實質上需要大量假設去確保統計程序的完美,和偏見的排除。

費氏學派尋求客觀結果的方法:將研究者跟現實世界隔離,不單阻礙研究者考量假設的可信度,而且將研究方向推向尋找相關性correlation多於因果,令研究結果的應用性大大減低。

篇幅所限,有關經濟預測的內容將延至下篇,並介紹此等預測工具如何應用到投機事宜之上,敬請留意。
參考:
《精準預測:如何從巨量雜訊中,看出重要的信號。》
《The Signal and the Noise》, 2012, Nate Silver