本文介紹 LDA、QDA 及 KNN 三種學習器之數學理論,比較學習器在兩群與三群已知群組的常態分配資料下的分群效果。說明學習器在不同資料背景下的表現特點,並分析學習器各自的優勢與劣勢。
機器學習以是否有標籤化,可分作監督式與非監督式兩種;而從另外一個角度,以建立模型的方式可分為決定性或機率性兩種。文本討論 LDA、QDA 與 KNN 模型是以機率性的解度切入,來判斷或預測裕分析的資料所規屬之群組。其中判斷的作法係以資料建立起分群的線,利用線來區分各資料樣本所屬群組;預測的作法係先以已知群組的資料之一部份,建立分群準則,再以該準則對剩下的資料進行訓練。利用套用模型後的分群結果與真實所屬群組比較,計算誤差率,衡量模型配飾與訓練的好壞程度。