iT邦幫忙

2023 iThome 鐵人賽

DAY 21
0

可以用來降維(dimension reduction),利用原有的特徵組合成新的特徵組,以達到降維的目的,同時保留住資料中的重要資訊

  • 基本上它的目標就是將原始資料映射到一個新的坐標系統中,得到這組資料的最大變異量(以保留最多資訊)
    https://ithelp.ithome.com.tw/upload/images/20231006/201632809Ata1nfF3R.png
  • 使用較少的維度,展現較多的資訊

原理

  • 將坐標軸中心移到原始資料的中心,然後旋轉坐標軸,使資料在C1軸上的變異數最大(每一筆資料在該方向上的投影最為分散),這可以讓更多的訊息被保留下來,而C1成為第一主成分
  • 若要尋找第二主成分,需找一個C2,使得C2與C1的共變異數(相關係數)為0,必免與C1訊息重疊,並且使數據在該方向的變異數儘量最大
  • 以此類推可尋找第三、第四主成分等

參考資料


上一篇
Day20-K最近鄰 (K-Nearest Neighbors)
下一篇
Day22-LightGBM(Light Gradient Boosting Machine)
系列文
什麼演算法?一起來學機器學習!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言