iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 24
0

分類法

分類法(Classification)是資料探勘與機器學習中重要的算法。分類主要是用來將資料做區分,判斷資料是屬於哪一個類別。從原有的已知類別的資料集進行學習,用來判斷新進的未知類別資料。因為是已知類別的資料集進行學習所以也被稱為監督式學習(Supervised Learning)。

分類法可以分為兩種用法:分析與預測。

  • 分析:用來解釋其模型形成的原因,能夠瞭解資料本身的特性及應用。
  • 預測:根據資料的特徵及模型可以幫助預測未來新的資料走向。

分類法用在各式各樣的領域中,像是銀行用來判斷給不給貸款,醫生用來判斷是否有患病,等等。

基本概念

一般會將原本已知類別的資料集稱為訓練資料集(Traing Data),因為我們想從這些資料中學習,訓練出規則。

會進一步再把已知類別的資料分為訓練資料(Traing Data)與測試資料(Testing Data)。先把留一部分做為測試,用來檢驗訓練模型的好壞。

演算法

一般常用的演算法有以下幾種:決策樹、kNN 分類、貝氏分類法、羅吉斯回歸、SVM、類神經網路、類神經網路等等。之後再討論機器學習的時候再把演算法的部分補充。

Reference


上一篇
資料探勘演算法 - 關聯規則
下一篇
資料探勘演算法 - 分群法
系列文
從學生到職場:菜鳥資料科學家的第一個月30

尚未有邦友留言

立即登入留言