非監督式學習是資料並沒有標籤,讓機器直接從資料中學習出規則。最常見的種類就是分群(Clustering),今天整理一下K-means演算法幾個視覺化的資料,讓我們比較容易感覺他的運作。
K-means會不斷計算並更新群的中心位置,直到收斂為止,而K指的是要分的群數。
視覺化介紹
K-means clustering. K-means++(by Andrey A. Shabalin, Ph.D.)
這個展示的網頁,會分別展示5個狀況的 gif 動畫,分別由左、右、上、下與隨機位置出發,完成把散落的點分成4類。他的網頁是按照順序,展示這5個 gif 動話,所以你看完一個要點一下畫面,他會切換到下一個動劃。雖然以動畫的形式,每次看都是固定結果,不過可以直覺看到群的中心位置是如何移動的。
一開始只是散滿的點。
如果從左邊開始,要分成4群
分好群的樣子
參考
Andrey A. Shabalin, Ph.D./Visuals and Animations