iT邦幫忙

2023 iThome 鐵人賽

DAY 15
0
AI & Data

踏上AI的步伐系列 第 15

Day15 AI主要演算法(八)-K-Means

  • 分享至 

  • xImage
  •  

介紹完監督是學習的演算法,接下來要來介紹非監督式學習演算法中的K-Means演算法。


K平均演算法(K-Means)

K-Means演算法是指透過K個集群中心點,不斷更新位置,不斷的重新分群的方式,來劃分不同集群的一種非監督式演算法。其中集群的意思是指由機器將各種屬性相似度都高的樣本聚集在一起,形成一種不需要人為干涉的非監督式學習演算法。

K-Means演算步驟

1.隨機將樣本分為K群,例如K為2。
2.隨機選擇2個中心點(a1,b1)。
3.重新計算兩群質心的正確位置(a2,b2)。
4.各自移動a1->a2,以及b1->b2。
5.重新計算所有樣本與a2,b2的距離並重新分配樣本到所屬的群集。
https://ithelp.ithome.com.tw/upload/images/20230930/20163100UsGJAJGbvU.jpg

K-Mean優點

  • 參數設計只考慮K值並無其他複雜公式。
  • 速度快無收斂。

K-Means缺點

  • 數據型式問題:只適合數據類型資料。
  • 噪音敏感問題:對噪音敏感,例如異常質會對質心計算產生干擾。
  • 樣本不平衡問題:樣本不平衡分類效果會大打折扣。
  • 質心設立問題:不同初始值會有不同集群。
  • K質設立問題:應設立為多少沒有一個最佳解。

K-Means應用

  • 分群:可以對消費者行為產生不同行為的模式,進行分群。
  • 推薦系統:例如Netfilx等等。
  • 異常值偵測:可以發現那些離質心很遠沒有鄰居的異常質。

參考資料
人工智慧-概念運用與管理 林東清 著


上一篇
Day14 AI的主要演算法(七)-集成學習法
下一篇
Day16 AI的主要演算法(九)-PCA
系列文
踏上AI的步伐30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言