iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 7
0
AI & Data

學習PHP Machine Learning的冒險歷程系列 第 7

[2020鐵人賽Day7]邂逅PHP Machine Learning-用KNearestNeighbors (KNN) 來定位 - 資料處理(花朵分類)

用KNearestNeighbors (KNN) 來定位 - 資料處理(花朵分類)

資料集介紹 - Iris Data Set(鳶尾花)

鳶尾花這個數據集共有150筆資料,共有三種類別,每一個類別有50筆資料,共150筆。每一筆資料都有4筆特徵,分別為:
(1) 萼片長度
(2) 萼片寬度
(3) 花瓣長度
(4) 花瓣寬度

資料集來源:https://archive.ics.uci.edu/ml/datasets/iris
整理過的資料集來源:https://drphototw.wixsite.com/wujl/teaching-2019f

資料輸入

接下來要把資料load進PHP,Sample跟Label的形式如下:

Sample = [[萼片長度, 萼片寬度, 花瓣長度, 花瓣寬度], .....]
label = [[ Iris Setosa],......]

標準化

計算各特徵的的最大值與最小值,並且套入標準化公式:
x'= (x-min)/(max - min)

標準化可以讓每一種特徵的權重較為一致,以免有些數值太大,權重太重的問題發生,在使用演算法時都要特別注意標準化這個程序。


上一篇
[2020鐵人賽Day6]邂逅PHP Machine Learning-KNearestNeighbors (KNN) 範例實作
下一篇
[2020鐵人賽Day8]邂逅PHP Machine Learning-How to load data from Excel CSV?
系列文
學習PHP Machine Learning的冒險歷程30

尚未有邦友留言

立即登入留言