我的書架 | 思考的框架 (2b): 機率思考 - 肥尾曲線 (Fat-tailed Distribution)
<思考的框架>,作者:夏恩、派瑞許
肥尾曲線 (Fat-tailed Distribution)
先看 Figure 1 的肥尾曲線 (Fat-tailed Distribution) 跟常態分佈 (Normal Distribution) 的比較圖:
Figure 1. 肥尾曲線 (Fat-tailed Distribution) 跟常態分佈 (Normal Distribution) 的比較圖 (夏恩、派瑞許,思考的框架,天下財經,26/2/2021 出版) 。
肥尾曲線分佈跟常態分佈的比較:
- 最高出現頻率值 (中位數,Median):肥尾曲線分佈比常態分佈更集中在中位數。
- 兩邊尾端:這是肥尾曲線分佈跟常態分佈最不同之處,肥尾曲線分佈在兩邊尾端的下降較慢,造成肥尾。而且兩端值是沒有上限,曲線的尾部愈厚,可能發生的極端事件就愈多。(See Figure 2)
- 相反,常態分佈的兩端值是與平均值的偏差有一定範圍,但肥尾分布則沒有。
- 常態分佈一般是平均值的正負三個標準差 (mean +/- 3 SD) 已覆蓋 99.7% 分布,即是事件在 +/- 3 SD 之外發生只有 0.3% 機率,在 + 8 SD 以外發生幾乎是沒有可能。愈接近兩端,事件發生機率就愈趨向零(即機率極低)。
- 但是,從 Figure 2 看到,肥尾分布兩端並非趨向零,且有一定厚度(即有一定機率,雖然機率並非十分高)。所以在 4 至 5 SD之外,肥尾分布比常態分佈較有可能發生事件。而有 4% 的罕見事件是發生在 8 SD 之外,計算頻率是 25 年內發生一次 (once in every 25 years) (Stephanie, 2017)。
- 肥尾分布是沒有上下限,可以一直伸延。即是說,縱使在尾部機率不高也好,當重覆 100 次、1000 次、10000 次、100 萬次,再罕見的事情也總會發生。
Figure 2. Exaggerated representation of the tail part in Fat-tailed distribution as compared to an exponential decline in Normal distribution.
- 亦即是說,雖然在肥尾曲線分佈上,中位數(或平均值)出現頻率仍然是最高,但可能發生的極端事件的機率較多。而在那眾多的可能發生極端事件中,真的發生其中之一的可能性較高。簡單來說,瘋狂的事一定會發生,問題是我們無法得知何時 (Known the Unknowns)。
- 離群值 (Outlier):常態分佈中的離群值是有相當明確的範圍。例如,你永遠不會看到有一個身高比平均值高出 10 倍的男人出現。可是,在肥尾曲線分佈上,離群值是沒有上下限。例如,財富分佈上,比平均值高出 10 倍、100 倍、1000 倍、10000 倍、.... ...、N 倍的人,非常普遍。亦即說,離群值比極端事件(肥尾曲線的兩邊尾端)更不可測。
例子:
聽說:滑下樓梯破頭的風險比恐怖襲擊更高,所以人們都說不用擔心恐怖襲擊。
運用貝氏思維,先評估先驗機率 Prior Probability!
- 去年,你國家因為滑下樓梯而死亡的人數:1000 人
- 同年,你國家因為恐怖襲擊而死亡的人數:500 人
看上去, 似乎真的滑下樓梯的致死風險比恐怖襲擊較高。這是真的嗎?
問題在於, 恐怖襲擊事件跟財富分佈一樣,較像是肥尾曲線分佈;而滑下樓梯致死的分佈是常態分佈。也就是說,恐怖襲擊是肥尾曲線分佈中的極端事件。
極端事件的發生是不可預測,而未來可能發生多少宗恐怖襲擊的事件,便要看肥尾曲線的兩端有多肥厚(即兩端的高度)。在衡量極端事件的風險時,任何輕微的偏差,都可能導致數量級錯誤 (order of magnitude),i.e. 與真實相差 10 倍、100 倍、1000 倍的錯誤。在肥尾曲線的兩端的所謂「低機率」發生事件,都不代表「零機率」。理論上,每年都有機會發生。
例子 2 就示範了,如何錯誤運用先驗機率,而導致我們低估未來出現不同曲線分佈的可能性。
肥尾曲線最關鍵的訊息在於,肥尾曲線上的兩端較常態分佈上的兩端為高(俗稱:肥尾),而且極端值是沒有上限,即是:極端事件發生的機率,比我們一般想像事件會發生的機率為高。而肥尾曲線上的尾端的發生機率,是不能計算而且影響重大。
壞消息是,股市被證明也是肥尾曲線分佈!
筆者往後會發文,論肥尾風險。
不對稱性 (Asymmetry)
Shane Parrish 用不對稱性 (Asymmetry) 來描述你估計機率的準確性。這亦即是,Metaprobability。這是估計機率的準確機率 (Probability of the estimated probability)。
Parrish 說,人們估計機率是有誤差,會向一邊傾側,這就是不對稱性。例如投資分析師會高估未來股價。這樣的誤差會導致最終評估的錯誤。所以,對假設的估計機率,我們也要小心評估其準確機率。
總結
我們永遠不能準確知悉未來發生的所有事件,所以希望透過「機率」去明白事件,從而評估最有可能發生的情況,來擬定可能有效對應策略。並且,作好不同情況部署,預備「黑天鵝」事件的發生。
在運用「機率思考」這個思考模型時,先確定重要因素、評估機率、再先驗自己的假設,再作決定。
當中要專注於:數據、數字、統計數據及結果、評估機率或結果時的假設是否正確。千萬不要分神看「故事」、資訊、獨立事件等,那些干擾自己思想的因素。
要考慮:
- 曲線分佈:是肥尾曲線還是常態分佈;
- 採用哪些資訊:其來源、準確性;
- 篩走哪些資訊、雜音;要有能力判斷什麼是雜音,及有勇氣篩走它;
- 運用貝氏思維,先評估 Prior Probability:已知的、已有的可能性;
- 你或別人所估計的機率的準確性、對稱性 (Meta-probability):考慮人類的偏誤;
- 評估機率或結果時的假設的正確性、可能性。
More Topics:
思考的框架 (3): 逆向思維 (Inversion Thinking)
機率思維 | 黑天鵝事件及肥尾效應
Reference
夏恩、派瑞許,思考的框架,天下財經,26/2/2021 出版。
Stephanie, Statistics How To, Fat Tail Distribution: Definition, Examples, December 10, 2017, available from: Fat Tail Distribution: Definition, Examples - Statistics How To
=======================
免責聲明
本網頁屬個人網誌,一切言論純屬個人意見及經驗分享。本人無法保證在本網誌所提供的資料有關內容的真確性和完整性,包括但不限於任何錯誤、誤差、遺漏、或侵權性質、誹謗性質或虛假性質的信息或任何其他可導致冒犯或在其他方面引致發生任何追索或投訴的資料或遺漏,而導致之任何損失或損害,本人概不承擔任何有關法律責任。
版權聲明
本網誌的所有資料、圖像與相片、文本屬本人所有專屬財產,均受知識產權法例及權利(包括但不限於保護版權的法例)所保障。根據此法例及權利,任何未經授權使用的資料均屬侵權行為。在未經本人明確同意授權下,本網誌資料、圖像與相片、文本之全部或部份均不可被使用、複印、改編、修改、發表、儲存或以其他方式複製分發、發佈或向公眾提供、銷售、傳送該等版權作品作任何用途。
© Copyright
2021 高山雪 Snow Hill. All rights reserved.
留言
發佈留言