Day5 機器學習-Bayes Classification

第 11 屆 iThome 鐵人賽

DAY 5

Google Developers Machine Learning

成為機器學習的王者系列第 5 篇

11th鐵人賽

queenawu

2019-09-20 23:57:56

2930 瀏覽

分享至

昨天介紹完SKlearn中的Feature Engineer，今天要來介紹貝氏分類器(Naive Bayes Classification)，該分類器模型在20世紀60年代初引入文本資料信息檢索中，文本資料分類的做法式將詞語出現的頻率用特徵值表示：
$P(L~|~features) = P(features~|~L)*P(L)/P(feature)$
如果試圖在兩個標籤之間做出決策，可以利用類別1(L1)與類別2(L2)的方式計算出，並且可以計算出每個類別的都可以用此方式計算出比率：
$P(L1~|~features)/P(L2~|~features) = P(features~|~L1)*P(L1)/P(features~|~L2)*P(L2)$

貝氏分類器中的"naive"指的是，我們對每個標籤的生成模型做原是的假設，然後對模型中的每個類別做大約估計，不同類型的數據假設依賴於不同類型的貝氏分類器，首先匯入需要的函式庫和資料集。


Naive Bayes Classification
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

在貝氏分類器中，假設來自每個標籤的數據是從簡單的高斯分佈中提取的。

Day4 機器學習-特徵工程(資料過濾)

Day6 機器學習-Linear-Regression

系列文

成為機器學習的王者共 7 篇

RSS系列文訂閱系列文

17 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

成為機器學習的王者系列 第 5 篇