iT邦幫忙

2023 iThome 鐵人賽

DAY 15
0
AI & Data

進入AI的世界系列 第 15

➤D-15 主要演算法-2(貝式推理統計學派)

  • 分享至 

  • xImage
  •  

貝式推理

貝式推理的基本概念

利用已知相關事件證據,亦即所謂的先驗概率(Priori Probability)來推導出我們對某一事件或假說(即後驗概率(Post Probability))的「相信程度」。


貝氏定理(Bayes's Theorem)

利用一個非常簡單強大(Powerful)、且好用的公式來推理各種事件出現蓋率的高低。
公式:
P(A|B) = P(A)*P(B|A)/P(B)

  • P(A|B)為已知B發生後,A的條件機率,也稱A的事後機率。
  • P(A)為A的事前機率(或邊際機率)。其不考慮B方面的因素。
  • P(B|A)為已知A發生後,B的條件機率。也可稱為B的事後機率。
    又稱其為在特定B時,A的概似性,因為P(B|A) = L(A|B)。
  • P(B)為B的事前機率。
  1. 概率是依據推導的:事情發生概率不能只看發生的頻率,要重視「其他相關事項」的證據來推導。
  2. 概率是假設的驗證:「概率」是一種由許多相關因素的概率共同推理出來的主觀認知或與假說的「相信程度」,不適簡單如丟骰子一樣的出現頻率而已。
  3. 要重視尋找原因(果→因):應該重視由「後果」來推斷「原因」而不是從「原因來估算後果」。

貝氏推理公式有另外三種表示法:

  • P(Cause|Effect) = P(Cause) * P(Effect|Cause) / P(Effect)
  • P(Hypothesis|Data) = P(Hypo) * P(Data|Hypo) / P(Data)
  • P(Output|Feature) = P(Output) * P(Feature|Output) / P(Feature)

由上述所寫「貝氏推理」由已經知道的「資料」來推理「假說」(Hypothesis)的成立與否,或者由不同的資料「特徵」來推理判斷輸出的「類別」。


樸素貝氏推理(Naive Baysian)

因要判斷整個事件的特徵(變數)有許多,而不是只有一個,且各特徵之間不是獨立存在而是會互相影響同時發生,故要用貝氏定理來估算各種特徵「組合存在」的先驗概率高低,用其來推斷事件的「後驗概率」高低時,這些特徵的的組合就有2的n次方之多,可能造成整個計算會發生「組合爆炸」無法所有不同的樣本,因此為了實用可行性,樸素貝式推理把每個變數之間視為獨立而倒出了所謂「樸素貝氏定理」,亦即事件發生概率是分別由每一個特徵的「貝氏定理」相乘總合算出來的。


貝氏推理的主要應用

貝氏推理是一種非常通用、強大的監督式學習理論,主要任務在做物件的「分類」,任何連續數字或類別尺度資料都可透過貝氏推理來進行分類概率演算。
例如:

  1. 洗錢交易判斷。
  2. 信用卡盜刷判斷。
  3. 文章分類。

貝氏推理學派優缺點

優點:

  • 簡單而強大:貝氏推理只有一個公式不需要瞭解成千上萬的法則或者複雜運算的統計數學模式,其只要找出相關的特徵變數即可。
  • 正確程度高:在適用範圍內正確程度相當高。
  • 用途廣:可適用各種問題的分類預測。
  • 彈性大:貝氏推理調整容易,只要增加或減少特徵變數即可。
  • 樣本不苛求:對小樣本的數據仍可以發揮不錯的效能。
  • 可以理解複雜問題:可以處理大量特徵的運算。
  • 解釋力強:邏輯清楚、具說服力。

缺點:

  • 不適用特徵變數有強烈關聯性的問題,例如文字序列。
  • 要先計算所有的先驗概率。
  • 對輸入數據的型式有要求,較難處理非結構資料。
  • 事件發生概率決定於其他已知相關變數發生概率。
  • 概率是假設的驗證與相信程度不只是出現頻率。

參考資料
人工智慧-概念應用與管理 林東清著


上一篇
➤D-14 主要演算法-1(主要分類架構)
下一篇
➤D-16 主要演算法-3(馬可夫鏈與隱藏馬可夫鏈)
系列文
進入AI的世界30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言