貝氏定理 (2): 應用例子
Bayesian Theorem: Examples
從上一篇貝氏理論 (1)中, 有兩個概念沒有說明,但又十分重要,要分清楚 (figure out) 的:(i) Event 事件;(ii) Condition 條件。
在表達條件機率時,要留意:
- P(Event D | Condition A) ,即代表:在 A 條件下,發生 D 事件的機率是多少;
- 不要混淆 P(Event A | Condition D) 。這代表:在 D 條件下,發生 A 事件的機率是多少。
反向謬誤 (inverse fallacy) 就是指,人們經常把上面兩者混淆,而錯誤地認為它們的機率必然相似甚或等同。
例如:
- P(Breast cancer before 80 yo | BRACA2 genes mutation) 代表:在 BRACA2 基因突變的人當中(條件),在 80 歲前患有乳癌的機率是多少(事件);
- 不要混淆 P(BRACA2 genes mutation | Breast cancer before 80 yo)!這是指:在 80 歲前患有乳癌的病人之中(條件),有 BRACA2 基因突變的機率是多少(事件)。
- 前者比後者的機率高出至少 8 倍! 因為患有乳癌的病人,不一定是有 BRACA2 基因突變。
Photo by Monstera from Pexels.
例子 1:
在某醫生診所內,如果想找出在有吸煙習慣的病人中,有多少人是有心臟病的?
Event:有心臟病 (D)
Condition:有吸煙習慣 (A)
假設:
從以往數據得知,
- 有 10% 的病人是有心臟病的。
P(D) = 0.1
- 而有 5% 的病人是有吸煙習慣的。
P(A) = 0.05
- 而有心臟病的病人中,有 7% 是有吸煙習慣的。這時,有心臟病 (D) 是 Condition,有吸煙習慣 (A) 是 Event。意思是: Among those who have heart disease (D), how many percentage of them are smokers (A)?
P(A | D) = 0.07
運用上一篇貝氏理論規則 (Bayes Rule) 的 Eq. (3):
可以算出:「在有吸煙習慣的病人中,有心臟病的機率」,即是: Among those smokers (A), how many percentage of them have heart disease (D)?:
P(D | A) = P(A | D) × P(D) / P(A)
P(D | A) = 0.07 × 0.1 /0.05 = 0.14 = 14%
答案是 14%。
要留意,在這例子中,我們並沒有考慮到心臟病的診斷測試中的敏感度 (sensitivity),及錯誤診斷率 (False positive rate or False alarm rate) 的機率計算在內。
例子 2:
孕婦生產有唐氏綜合症 (Down’s syndrome)嬰兒的機率是 0.15% (Prevalence)。
- 超聲波檢查的敏感度是 80%:那就是,超聲波檢查出孕婦真的懷有患唐氏綜合症嬰兒的準確率是 80%。
- 但超聲波檢查出的錯誤的機率是 8%:那就是說,超聲波檢查雖然查出孕婦是懷有患此症的嬰兒,但事實卻沒有。這個機率是 8%,這就是 False Positive。
筆者可以跟你說,大多數人看到這裡會說,「當測出是 Positive 時,很大機會是真的患有此症」。甚至,有人會說,「測出 Positive 時,是有 80% 機率患上」,以致驚惶失惜。可是,答案可能嚇你一驚!
答案:
Given (已知資訊):
- Prevalence of Down’s syndrome (唐氏綜合症發病率) = 0.15%;
- Test sensitivity (檢查的敏感度)= 80%;
- False Positive rate (檢查的錯誤正機率)= 8%。
機率整合如下:
當中要小心定義,用日常的普通語言講解:
運用貝氏定理,採用公式 Eq. (8) 來解決這問題:
結果:被超聲波檢查出懷有唐氏綜合症嬰兒,而她的嬰兒確實真的患有此症的機率是 1.48%。
圖象化的思維 (Graphical Representation)
另一個方法,用圖象化的思維去思考這機率關係:
假設:Population N = 10,000 人
做法:用圖象協助思考,再用假設人數算機率
Figure 1. Pictorial representation of Bayesian thinking. (Kurzenhäuse & Hoffrage, 2002).
結果:被超聲波檢查出懷有唐氏綜合症嬰兒,而她的嬰兒確實真的患有此症的機率是 1.48%。
頻率思維 (Frequency Representation)
這個貝氏思維,在 Kurzenhäuse & Hoffrage (2002) 的一個研究結果發現,當教導醫科學生去用人類經常用的「自然頻率 (natural frequency) 思維」去想 Bayesian reasoning 時,過程是比較容易。
那個「自然頻率思維」,就是 Figure 1 所描述的 。這個方法是由 Gigerenzer & Hoffrage (1995) 提出的,他們發現人類的大腦思維 (mental algorithm),是不曉得用 probability 或 percentage 來思考,而是用頻率的來思考。例如,這個朋友是可信,那個朋友是不可信。人們一般不會想,這個朋友有 80% 可信,那個朋友只有 10% 可信。這個就是人類的思考模式。
在普通人 (lay people) 身上,Kurzenhäuse & Hoffrage (2002) 可以觀察到,用頻率去思考貝氏定理的問題較容易,因為自然頻率的思考模式可以包含了 base rate 等較易被人忽略的資料。
意思是說,在心裡想像,用以下的四個步驟來計算 (Kurzenhäuse & Hoffrage, 2002) :
- 首先,假設 population有 10,000 嬰兒,用 Base rate (基本機率 = 0.15%) 來計算有多少嬰兒患有唐氏綜合症?即:10,000 × 0.0015 = 15 個嬰兒。亦即:Prevalence。
- 在患病的 15 個嬰兒,用檢查的敏感度 (80%) 來計算有多少嬰兒被檢出?即:15 × 0.8 = 12 個嬰兒。
- 有多少嬰兒被檢出有病,但實際是沒有病?用剩下的沒有病的嬰兒 (10,000 - 15 = 9985 個嬰兒) 內,用檢查的錯誤正機率 (8%),來計算:9985 × 0.08 = 798.8 ~799 個嬰兒。
- 總共有多少嬰兒被檢出為正:12 + 799 = 811 個嬰兒。在被檢出為正嬰兒中,有多少嬰兒是真的患病的機率? 12 / 811 = 0.0148 ~ 1.48%。
其實,筆者認為多數人覺得較容易的、較少機會出錯的方法,對個別人仕來說,不一定就是最好的方法。就像筆者這個 outlier 來說,probability approach 是較為適合、較為容易。可是,能學懂另一個方法(自然頻率思維)可以 cross check 自己的計算結果,也是值得做的。
Figure 2. Left: Bayesian inference (Probability format); Right: information representation (natural frequency format) (Kurzenhäuse & Hoffrage, 2002).
對筆者來說,這種「自然頻率思維」與圖象化思維 (Figure 1)是同一樣的思維概念。分別在於筆者的 Figure 1 是強調圖象拆解,而 Kurzenhäuse & Hoffrage (2002) 是強調資訊上的直線思考路徑。筆者會把「兩種」方法說成同一種方法。
兩個方法得出的結果都是一樣,被超聲波檢查出懷有唐氏綜合症嬰兒,而她的嬰兒確實真的患有此症的機率是 1.48%。這個結果,比開始時想像的 80% 少了 53 倍。關鍵在於,此病的極低發病率 (low prevalence),即是極低的基本機率 (Base rate)。
當測出是 Positive 時,多數人會覺得「一定患病」的心理,是由於被那「80% 檢測敏感度」的數字蒙弊了腦袋。這是一種認知偏誤 (Cognitive bias):基本機率忽視 (Base Rate Neglect)。我在之前的<我的書架 | 思考的框架 (2a): 機率思考 - 貝氏思維 (Bayesian Thinking)>已簡單說過。
所以,當要做決策時,用貝氏定理拆解箇中真正的發生機率,不要被那些駭人的資訊庶弊。但是,很多情況下,很難直接計算新信念。這個問題,我會容後再談。
貝氏定理的相關文章講述:
我的書架 | 思考的框架 (2a): 機率思考 - 貝氏思維 (Bayesian Thinking)
貝氏定理 (1): 理論 (Bayesian Theorem)
貝氏定理 (3): 貝氏因子 (Bayes Factor): 你的證據夠強嗎?
貝氏定理 (4): 貝氏規則的可能性機率 (Likelihood in Bayes Rule)
貝氏定理 (5): 貝氏更新 (Bayesian Updating)
貝氏定理 (6): 貝氏網絡 (Bayesian Network)
貝氏定理 (7): 事後機率分布最大概似估計法 (Maximum a Posteriori Estimation, MAP)
貝氏定理 (8): 事前資訊質素的影響 (Prior Informativeness)
Reference
Stephanie Kurzenhäuse, Ulrich Hoffrage (2002), Teaching Bayesian Reasoning: An Evaluation of a Classroom Tutorial for Medical Students, Medical Teacher, 24 (5) , 516-521.
Gigerenzer & Hoffrage (1995), How to improve Bayesian Reasoning Without Instruction: Frequency Formats, Psychologyical Review, 102, pp. 687-704.
=======================
免責聲明
本網頁屬個人網誌,一切言論純屬個人意見及經驗分享。本人無法保證在本網誌所提供的資料有關內容的真確性和完整性,包括但不限於任何錯誤、誤差、遺漏、或侵權性質、誹謗性質或虛假性質的信息或任何其他可導致冒犯或在其他方面引致發生任何追索或投訴的資料或遺漏,而導致之任何損失或損害,本人概不承擔任何有關法律責任。
版權聲明
本網誌的所有資料、圖像與相片、文本屬本人所有專屬財產,均受知識產權法例及權利(包括但不限於保護版權的法例)所保障。根據此法例及權利,任何未經授權使用的資料均屬侵權行為。在未經本人明確同意授權下,本網誌資料、圖像與相片、文本之全部或部份均不可被使用、複印、改編、修改、發表、儲存或以其他方式複製分發、發佈或向公眾提供、銷售、傳送該等版權作品作任何用途。
© Copyright 2021 高山雪 Snow Hill. All rights reserved.
留言
發佈留言