機率思維 | 大數法則, ⼩數定律, 賭徒謬誤, 墨菲定律
大數法則 (Law of Large Numbers)
大數法則的簡明道理:當事件進行的次數足夠多時,那麼其發生的頻率會隨著次數的增加,而趨向概率,也就是預期概率。若某事件進行的次數趨向無限 (approach infinity),那麼那怕是極少機率的事件也幾乎必然會發生。
例子 1:擲骰子
- 當你擲 100 次,出現 "1" 的次數是 20,那頻率是 20/100 = 0.2 = 1/5。
- 當你擲 10,000 次,出現 "1" 的次數是 1,900,那頻率是 1900/10000 = 0.19。
- 當你擲 1,000,000 次,出現 "1" 的次數是 170,000,那頻率是 180,000/1,000,000 = 0.17。
隨著次數 (N) 的增加,發生的平均頻率會趨向一個穩定期望值 -- 期望概率,這個就是「大數法則」。換句話說,當 N 夠大,大到接近總體 Population 時,其中一次擲出某個數字的概率,與總體的期望概率接近 (As the number of trial increases, the observed proportion will converge on the expected probability)。N 愈大,愈接近。
也就是說,觀察數量 N 愈大,其平均結果會愈接近真實 Population 的平均值,即:預測會愈接近真實。這就是大數法則。
因為骰子有六面、分別六個數點,要擲到 "1" 點的機率,即:在這裡的期望值是期望概率是 1/6 = 0.1667。從上面的模擬實驗結果可見,擲骰子的次數愈多,擲到 "1" 點的頻率愈接近這裡的期望概率(擲 1,000,000 次的頻率是 180,000/1,000,000 = 0.17)。
要注意兩點:
1) 每次的數據是獨立、隨機的事件,即:不是因為上一次擲出什麼數點而對下一次擲有什麼影響。也就是說,這裡毋須用 conditional probability 來計算。
2) 究竟要多大的次數 (N),才會達到:「發生事件的平均頻率趨向一個穩定期望值」?那就沒有人知道,我們只知道 N 愈大,實際發生的機率愈趨近期望概率(期望值)。
這些隨機性的獨立事件,便是我們生活上經常發生且不可知的事件。
Photo by Naser Tamimi on Unsplash
墨菲定律 (Murphy's Law)
墨菲定律 (Murphy's law) 是說,「任何可能出錯的,也一定會出錯。」(Anything can go wrong will go wrong.)。如大數法則,Murphy's law 的條件有兩個:
a) 某事件發生的機率不等於零
b) Sample Size (N) 要足夠大
縱使某事件發生的機率很低,一旦重複次數足夠多,那事件就必定會發生。
黑天鵝效應 (Black Swan Effect)
黑天鵝事件其實是 Murphy's law 描述的事件,但黑天鵝事件的特性是影響巨大的事。
這會在下一篇文章解說:
小數定律 (Law of Small Numbers)
小數定律當然是在小數樣本 (small sample size) 內發生。它是描述,人們會把在大數樣本內得出的結論,在小數樣本內使用。大數樣本會跟隨大數法則,但小數樣本因為是樣本小,所以極端事件的發生機會比大數樣本為高。
你也無法期望可以從一個小數樣本,得出一個準確、貼近真實的推算結果。在我們的日常生活,小數樣本較大數樣本更為常見。所以日常中,在只得數個數據時,我們很容易會以偏蓋全地,為不確定情況下一個以大數樣本所得的結論,為小數樣本作判斷。
例子 2:某分析師會以自己兩星期內,成功預測股市的正確率達 95% 作為招徠。這個只用小樣本得出的結果,錯誤地誘使客戶相信他有預測大市的能力。
例子 3:孕婦生男生女的機率,各自為 1/2。若果比較大產房的醫院和小產房的醫院,哪間醫院誔下男嬰的機率較高呢?
答案是: 小產房的醫院。這就是小數定律。
賭徒謬誤 (Gambler's Fallacy)
賭徒謬誤就是把原本沒有關係的獨立事件,想像成有關連。以為第一次的結果是第二次結果的條件。這種關連可以是:
- 因為某事件發生了太多,未來便不太可能發生。
- 因為某事件發生了太多,未來便很大可能發生。
- 因為某事件太久沒有發生,未來便不太可能發生。
- 因為某事件太久沒有發生,未來便很大可能發生。
其實,每次事件的發生,也是獨立的隨機事件,根本不是某事發生的條件,也沒有關連。
例子 4:擲硬幣(假設兩面對稱)
如果 Head 出現了 4 次,賭徒謬誤會使人想像第 5 次擲也會繼續是 Head。其實,當 HHHH 四次出現 Head 時,第 5 次出現 Head 的機率仍然是 1/2。因為每次擲骰子之間根本沒有關連。
擲第一次與擲第二次時,兩次也是獨立的隨機事件。每次擲出 Head 的機率也是 1/2 (*註 )。
賭徒謬誤也會認為連續輸了多次之後,接著便會嬴。於是,愈輸,便愈要加大注碼,以為最終會贏。但其實,每一次下注,也是獨立的隨機事件。
這個賭徒謬誤存在於預測產業上,人們會用以往的歷史來預測未來。認為某事件發生的頻率,可以用來預測未來。這裡要留心,要預測的事件和歷史事件是否獨立事件?如果是有關連性、因果關係的,那就不是賭徒謬誤。
----------------------------
註:不要混淆連續 5 次 Head 的機率,與已四次出現 Head 時,第 5 次出現 Head 的機率。
連續 5 次 Head 的機率 = 1/2 × 1/2 × 1/2 × 1/2 × 1/2 = 1/32
已四次出現 Head 時,第 5 次出現 Head 的機率 = 1/2
延伸文章:
=======================
免責聲明
本網頁屬個人網誌,一切言論純屬個人意見及經驗分享。本人無法保證在本網誌所提供的資料有關內容的真確性和完整性,包括但不限於任何錯誤、誤差、遺漏、或侵權性質、誹謗性質或虛假性質的信息或任何其他可導致冒犯或在其他方面引致發生任何追索或投訴的資料或遺漏,而導致之任何損失或損害,本人概不承擔任何有關法律責任。
版權聲明
本網誌的所有資料、圖像與相片、文本屬本人所有專屬財產,均受知識產權法例及權利(包括但不限於保護版權的法例)所保障。根據此法例及權利,任何未經授權使用的資料均屬侵權行為。在未經本人明確同意授權下,本網誌資料、圖像與相片、文本之全部或部份均不可被使用、複印、改編、修改、發表、儲存或以其他方式複製分發、發佈或向公眾提供、銷售、傳送該等版權作品作任何用途。
© Copyright 2021 高山雪 Snow Hill. All rights reserved.
留言
發佈留言