先幫大家快速復習一下,監督與非監督的學習區別:
說到非監督式學習,最典型的應用就是聚類(Clustering)了,它會將數據分為具有相似特徵的群體。而聚類有很多種方法,今天要著重介紹的 K-Means Clustering 就是其中的某一種
聚類方法的五個類別:
是 Partitional clustering approach 中的一種典型方法
它的核心目標是將資料集分成 K 個不同的群體,使得每個資料點都屬於最接近的中心點所代表的群體。這可以幫助我們理解數據的結構,並找到數據中的模式
當算法收斂時,我們就可以得到 K 個群體,每個群體都有一組中心點,這些中心點代表了每個群體的特徵