非監督演算法的主要演算法
K平均演算法(K-Means)
集群(Cluster):一種精簡資料方法,依據資料間樣本屬性的相似性,由機器自行將各種屬性相似度都高的樣本聚集在一起,形成集群的一種不需人為干涉的非監督式學習法。
K-Means:透過K個集群中心點,不斷更新位置,不斷重新分群的方式,來劃分不同集群的一種非監督式演算法。
優點
缺點
主要應用
K-Means vs. KNN比較
主成分分析法(Principal Component Analysis, PCA)
PCA背景說明
* 變數太多問題:容易過度擬合
* 變數重量問題:變數之間常有很多重疊性或冗餘、不相關、沒有解釋能力的
* 容易瞭解問題:能將多數的原始變數整合成少數又能保留主要訊息且具有更高層次的解釋能力,當然有助於對問題的分析與瞭解。
優點
缺點
參考資料
人工智慧-概念應用與管理 林東清著