[2020鐵人賽Day11]邂逅PHP Machine Learning-非監督式分類K-means演算法

第 11 屆 iThome 鐵人賽

DAY 11

AI & Data

學習PHP Machine Learning的冒險歷程系列第 11 篇

11th鐵人賽 php-ml

Old Siao

2019-09-27 23:02:54

1725 瀏覽

分享至

簡介

K-means是一個很古早的演算法，在1950年代左右被很多不同領域的學者提出，比較其他的分類法，如knn不用給定訓練樣本，也就是l有Sample就能預測分類成果，被分成一類的Sample有一個特性就是他們在樣本分布空間非常的近，但是缺點是因為沒有給定樣本本的Label所以需要用其他方式來決定分類的類別。但是常常用於協助人工選取樣本選定或自動化分類。

原理

圖片來自K-Means Clustering in Machine Learning, Simplified

首先，要了解這個K-means分類時候有哪些參數？分類的程序如何？
以及要了解PHP-ML的k-means分類器的參數。

$kmeans = new KMeans(4, KMeans::INIT_RANDOM);

第一個參數數類別數量(ex:4)，第二個參數是分類的中心點初始化位置，有兩種方式DASV和隨機兩種，DASV方法可以筆隨機方法找到更好的初始化中心點。

那什麼是初始化中心呢？在K-means中，每一個類別都有一個位置，這個位置是這個類別的中心點，每個屬於這個類別的點，將對其他中心點來說距離最短。

說到距離，跟KNN一樣，有不同距離的計算方式，其中K-means最常使用直線距離來計算。

哪如何算出中心點位置呢？首先確定每一當本相對中心點的距離，每個樣本歸類於最短距離的中心點，之後計算所有樣本的質心作為中心點，然後重複迭帶到次數限制或移動距離小於某一數值。

[2020鐵人賽Day10]邂逅PHP Machine Learning-用KNearestNeighbors (KNN) 來定位 - 評估準確度(花朵分類)

[2020鐵人賽Day12]邂逅PHP Machine Learning-K-means 鳶尾花分類

系列文

學習PHP Machine Learning的冒險歷程共 30 篇

RSS系列文訂閱系列文

17 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

學習PHP Machine Learning的冒險歷程系列 第 11 篇