iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 5
0
Google Developers Machine Learning

成為機器學習的王者系列 第 5

Day5 機器學習-Bayes Classification

昨天介紹完SKlearn中的Feature Engineer,今天要來介紹貝氏分類器(Naive Bayes Classification),該分類器模型在20世紀60年代初引入文本資料信息檢索中,文本資料分類的做法式將詞語出現的頻率用特徵值表示:

如果試圖在兩個標籤之間做出決策,可以利用類別1(L1)與類別2(L2)的方式計算出,並且可以計算出每個類別的都可以用此方式計算出比率:

貝氏分類器中的"naive"指的是,我們對每個標籤的生成模型做原是的假設,然後對模型中的每個類別做大約估計,不同類型的數據假設依賴於不同類型的貝氏分類器,首先匯入需要的函式庫和資料集。


Naive Bayes Classification
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

在貝氏分類器中,假設來自每個標籤的數據是從簡單的高斯分佈中提取的。


上一篇
Day4 機器學習-特徵工程(資料過濾)
下一篇
Day6 機器學習-Linear-Regression
系列文
成為機器學習的王者7
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言