今日大綱
k-means分群法為典型的分群方法之一,方法簡單易懂,適合處理大規模的資料,廣泛地利用於市場分析或電腦視覺等領域。
這個方法主要計算每個資料點到各個中心的距離,找出最適合的中心點,也就是最小化每個中心點到各個類別資料之間的距離。
k-means分群法的輸入為k,而演算法的步驟如下:
在k-means分群法中,k為超參數,需要搜尋最佳解,其中一個解決k-means的方法為肘點法 (Elbow method),類似窮舉法,計算k在某個範圍內,各個k值下模型的損失值,而在k-means裡,損失值為群集內平方和之總和,越小越好。