iT邦幫忙

2022 iThome 鐵人賽

DAY 15
0

今日大綱

  • 什麼是k-means分群法?
  • 演算法
  • 如何選擇k?

什麼是k-means分群法?

k-means分群法為典型的分群方法之一,方法簡單易懂,適合處理大規模的資料,廣泛地利用於市場分析或電腦視覺等領域。

這個方法主要計算每個資料點到各個中心的距離,找出最適合的中心點,也就是最小化每個中心點到各個類別資料之間的距離。

演算法

k-means分群法的輸入為k,而演算法的步驟如下:

  1. 任選k個點做中心點
  2. 計算資料點到各個中心的距離,將距離最近的中心點視為資料點所屬於的群集
  3. 計算每個群集的中心點,將該點視為新的中心
  4. 重複度驟2與3,直到中心不再改變

如何選擇k?

在k-means分群法中,k為超參數,需要搜尋最佳解,其中一個解決k-means的方法為肘點法 (Elbow method),類似窮舉法,計算k在某個範圍內,各個k值下模型的損失值,而在k-means裡,損失值為群集內平方和之總和,越小越好。


上一篇
【Day 14】線性判別分析 Linear Discriminant Analysis (LDA)
下一篇
【Day 16】深度學習理論基礎 - 線性代數篇
系列文
從機器學習到深度學習 - 30天搞懂常見演算法的基礎理論30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言