貝氏定理 (4): Likelihood in Bayes Rule

作者：Snow Hill 高山雪 9月 18, 2021

筆者認為在貝氏定理的更新過程中發覺，最困難的部份是找出可能性 (Likelihood)！因為 Prior probability 還可以用 Base Rate 來找，但 Likelihood 就不能。所以，本篇文章就用來看看怎樣科學化地，從頻率算成可能性？

其中一個方法是： Likelihood Estimate using Binomial distribution。

Photo by Joey Kyber from Pexels

Binomial Distribution:

用 n 次的獨立實驗總數，和得出的 k 結果的 combinations 組合數目，剩以 p 機率可得 k 的成功結果 (number of successes in a sequence of n)，及 (1-p) 機率不可得 k 的失敗結果，來構成的二項分佈 (Binomial Distribution)。k 是 Binomial Distribution 的隨機數。

Binomial Distribution 是適合在二元結果 (Yes/No) 世界內使用 (dichotomous results) ，例如：結果是 Head: Yes 、No；或結果是有病: Yes 或 No；或成功、失敗。

下面 Eq. (1) 公式的答案 P(K=k | p) ，就是說：在機率 p 下，做 n 次的獨立實驗，有 k 次結果的機率是多少？

例子 1：如果再做拋硬幣實驗，已知出現 Head 的機率 p。我想知道，拋 n 次的獨立實驗，得出 k 次 Head的機率 P(K=k | p) 是多少？這就是 Likelihood 可能性。

下面 Figure 1 展示了 probability function of Binomial distribution。可以看到 Binomial distribution 是 discrete distribution 離散分佈。而那 probability function 便是在 Eq.(1) 左側的 P(K=k) given different p。它是從一個 P(K=k) 的機率分佈 (probability distribution) 內找出相應 k 的一個點，也是 Point estimate。

Figure 1. Probability function in Binomial distributions with different probabilities and number of independent experiment (p = 0.5, n = 20); (p = 0.7, n = 20); (p = 0.5, n = 40).

(Maplesoft, Binomial Distribution, https://fr.maplesoft.com/support/help/maple/view.aspx?path=MathApps/BinomialDistribution&L=F)

例子 2：跟例子 1 同一個硬幣，已知得出 Head 的機率 (e.g. p(H) = 0.3)。我想知道，再拋 10 次的獨立實驗，有幾多次會得出 Tail？

p(T) = 1 - p(H) = 1 - 0.3 = 0.7

Expectation Value of Tails, E(T):

E(T) = (0.7) (10) = 7

答案是：7 次。

情境 1：

假設，一個硬幣拋 100 次，55 次得出 Head。

問題：這個硬幣是一個公平、兩邊均等的硬幣的可能性 (Likelihood) 有多高？

For a Biased Coin 硬幣造假

資訊 1：擲 100 次，55 次得出 Head (H)，k = 55
資訊 2：有意製造它得出 Head 的機率：p = 0.55
假設 H1: 硬幣是兩邊不均等⇒ 硬幣是造假

From Eq. (1):

這個 P(K=55 H | p = 0.55) = 0.07999，這便是 H1 的 Likelihood。即：這個「硬幣是造假」假設的可能性。

For a Fair Coin 公平兩邊均等的硬幣：

資訊：一個公平兩邊均等的硬幣，應該得出 Head 的機率：p = 0.50，
結果：擲 100 次，得出 55 次得出 Head (H) ，k = 55
假設 Ho：硬幣是兩邊均等 ⇒ 硬幣是公平

From Eq. (1):

這個 P(K=55 H | p = 0.50) = 0.04876，便是 H0 的 Likelihood，即：這個「硬幣是兩邊均等」假設的可能性。

計算 Likelihood Ratio (Bayes Factor) ：

判斷：

雖然，證據顯示「H1: 硬幣是兩邊不均等」比「Ho: 硬幣是兩邊均等」大出 1.6 倍。但按 Bayes Factor < or = 3 顯示，證據支持這個「硬幣是造假」假設並不強烈，可能是軼事證據。

情境 2：

改變硬幣的Head出現頻率至 65 次

資訊 1：擲 100 次，65 次得出 Head (H)，k = 65
資訊 2：得出 Head 的機率：p = 0.55
假設 H1: 硬幣是兩邊不均等

For a Biased coin：

For a Fair Coin：

得出 Head 的機率：p = 0.50，
資訊：擲 100 次，得出 65 次得出 Head (H) ，k = 65 H
假設 Ho：硬幣是兩邊均等

Likelihood Ratio (Bayes Factor) ：

判斷：

從 Bayes Factor 12.26 可知：「H1: 硬幣是兩邊不均等」的可能性 (Likelihood) 比「Ho: 硬幣是兩邊均等」的可能性 (Likelihood)高出 12.26 倍。亦即是說，證據強烈顯示硬幣是造假。

結論

硬幣擲 100 次，當 Head 出現 55 次時，這個支持「硬幣是造假」的假設證據並不強烈。但當 Head 出現 65 次時，證據強烈顯示支持「硬幣是造假」的假設。這兩個結果顯示了只需用以上的 Binomial Distribution 簡單計算，便可以計算 Likelihood Ratio (Bayes Factor) 。

如果嫌計算複雜，可用 online Binomial Distribution calculator：https://stattrek.com/online-calculator/binomial.aspx

雖然，我們可以用 Freqentist 的客觀機率來作為 Likelihood，但更多情況，人只是會用主觀機率。

回答上面最初的問題：

這個硬幣是一個公平、兩邊均等的硬幣的可能性 (Likelihood) 有多高？

情境 1：

硬幣是「兩邊均等」比起「兩邊不均等」的可能性 (Likelihood) 是低出 1.6 倍。證據並不強烈，可能是軼事證據。

情境 2：

硬幣是「兩邊均等」比起「兩邊不均等」的可能性是低出 12.26 倍。證據強烈支持「硬幣是兩邊不均等」的假設。

要注意：

這個是可能性 (Likelihood) 不直接等同機率，因它可以大過 1。

貝氏定理 (1): 理論 (Bayesian Theorem)

貝氏定理 (2): 應用例子

貝氏定理 (3): 貝氏因子 (Bayes Factor): 你的證據夠強嗎?

貝氏定理 (5): 貝氏更新 (Bayesian Updating)

貝氏定理 (6): 貝氏網絡 (Bayesian Network)

貝氏定理 (7): 事後機率分布最大概似估計法 (Maximum a Posteriori Estimation, MAP)

貝氏定理 (8): 事前資訊質素的影響 (Prior Informativeness)

離散型機率分布: Bernoulli Distribution、Binomial Distribution、Poisson Distribution

References

Jeremy Orlo & Jonathan Bloom, MIT Open Course note: Maximum Likelihood Estimate, unknown year.

Alex Etz (2015), Understanding Bayes: A Look at the Likelihood, available from: https://alexanderetz.com/2015/04/15/understanding-bayes-a-look-at-the-likelihood/ (Accessed on 14 June 2021).

Maplesoft, Binomial Distribution, available from: https://fr.maplesoft.com/support/help/maple/view.aspx?path=MathApps/BinomialDistribution&L=F (Accessed on 15 Jun 2021).

=======================

免責聲明
本網頁屬個人網誌，一切言論純屬個人意見及經驗分享。本人無法保證在本網誌所提供的資料有關內容的真確性和完整性，包括但不限於任何錯誤、誤差、遺漏、或侵權性質、誹謗性質或虛假性質的信息或任何其他可導致冒犯或在其他方面引致發生任何追索或投訴的資料或遺漏，而導致之任何損失或損害，本人概不承擔任何有關法律責任。

搜尋此網誌

The Price of Wisdom - 高山雪 Snow Hill

貝氏定理 (4): Likelihood in Bayes Rule

Binomial Distribution:

情境 1：

問題：這個硬幣是一個公平、兩邊均等的硬幣的可能性 (Likelihood) 有多高？

For a Biased Coin 硬幣造假

For a Fair Coin 公平兩邊均等的硬幣：

計算 Likelihood Ratio (Bayes Factor) ：

判斷：

情境 2：

改變硬幣的Head出現頻率至 65 次

For a Biased coin：

For a Fair Coin：

Likelihood Ratio (Bayes Factor) ：

判斷：

結論

回答上面最初的問題：

這個硬幣是一個公平、兩邊均等的硬幣的可能性 (Likelihood) 有多高？

情境 1：

情境 2：

References

留言

發佈留言

熱門文章

有一派投資叫「動能投資」

展望理論 Prospect Theory (1): 價值函數 (Value Function)

風險決策的兩個理論: 期望值 & 期望效用

我的書架 | 思考的框架 (2b): 機率思考 - 肥尾曲線 (Fat-tailed Distribution)

展望理論 Prospect Theory (2): 機率加權函數 (Probability Weighting Function)

電影筆記 | First Do No Harm - (1) 故事描述

貝氏定理 (1): 理論 (Bayesian Theorem)

機率思維 | 大數法則, ⼩數定律, 賭徒謬誤, 墨菲定律

期望投資回報: 計算方法

成熟也有指標 (Emotional Maturity)