tags: 2021IT
對事物運動這種不確定性(隨機性)的肚量就是機率論。
假設我的的集合中只有蘋果和梨兩大物件,蘋果有10個,梨也有10個,這次我們僅考驗顏色特徵。蘋果有兩種顏色:紅色跟黃色,其中紅色佔了8個;梨也有兩種顏色:黃色和綠色,其中黃色佔了9個。假如從這堆水果中挑出一個黃色水果,試問這個水果屬於梨的可能性。
機率論的基礎概念如下:
結合上面的例子,我們不去研究黃色的蘋果或黃色的梨有什麼差別,而承認其統計規律:蘋果是紅色的機率是0.8,蘋果是黃色的機率就是1-0.8=0.2,而梨是黃色的機率是0.9,將其作為先驗機率。有了這個先驗機率,就可以利用抽樣,即任取一個水果,前提是抽樣對整體的機率分佈沒有影響,透過他的某個特徵來劃分其所屬的類別。黃色是蘋果和梨共有的特徵,因此,既有可能是蘋果與有可能是梨,機率計算的意義在於獲得這個水果更有可能的那一種。
這個問題求解過程就是著名的貝氏公式:
P(B|A)= P(A|B)P(B)/P(A)
帶入上面的例子就是已知P(蘋果)=10/(10+10),P(梨)=10/(10+10),P(黃色|蘋果)=20%,P(黃色|梨)=90%,求P(梨|黃色):
P(|黃色) = P(黃色,梨)/P(黃色) = P(黃色|梨)P(梨)/P(黃色) = 81.8%