今日大綱
單純貝氏分類器以貝氏定理為基礎,依據機率進行預測。此方法主要用於分類文章、判別垃圾郵件等分類。那什麼是貝氏定理?
貝氏理論是關於隨機事件A和B事件的定理,在一個已知B事件會發生下,計算A事件發生的機率。
P(A│B)為已知B發生後,A的機率,也稱為A的事後機率。P(A)是A事件的事前機率。P(B│A)為已知A事件發生後,B發生的機率,也稱為B的事後機率。P(B)是B事件的事前機率。
單純貝氏對已知類別假設所有屬性互相獨立,因此聯合機率的算法如下:
以鐵達尼號一小部分的資料作解說。
今天有一個新的資料X = {2, 男},請問是否會存活?
根據定理,需計算出下列的機率
首先,計算存活與死亡各別的機率
接著,觀察存活下來的10個人裡有3個人在艙等2,死亡的人裡10個人裡0個在艙等2。
下一步計算死亡與存活的人裡,幾個人是男性。
計算出所有機率後,帶入公式
0.015> 0,因此預測結果為存活。