iT邦幫忙

2023 iThome 鐵人賽

DAY 20
0

點與點之間的距離

  • K-NN依照點與點之間的距離來計算點之間的相似性
  • 通常使用的距離度量是歐氏距離(Euclidean Distance),但根據實際情況,也可以選擇其他距離公式

K值的選擇

  • K代表了鄰居的數量
  • 在進行預測或分類時,演算法將尋找與待預測資料最接近的K個點

K最近鄰 (K-Nearest Neighbors)

  • 分類
    1. 儲存訓練集中的所有資料及其對應的label
    2. 當要對新的、未標記的資料進行分類時,計算該點與訓練集中所有點的距離
    3. 選擇與待分類資料距離最近的K個點
    4. 統計這K個鄰居中各個類別的出現次數
    5. 將待分類資料分配到具有最多鄰居的類別中,作為其預測的類別
  • 迴歸
    1. 儲存訓練集中的所有資料及其對應的值
    2. 當要對新的、未標記的資料進行預測時,計算該點與訓練集中所有點的距離
    3. 選擇與待預測資料距離最近的K個點
    4. 使用這K個最近鄰居對應的值(通常是平均值或加權平均值)作為迴歸預測的結果

參考資料


上一篇
Day19-層次聚類 (Hierarchical Clustering)
下一篇
Day21-主成分分析 (Principal Component Analysis)
系列文
什麼演算法?一起來學機器學習!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言