iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 13
0
Google Developers Machine Learning

Machine Learning Day30系列 第 14

[Day14] 數據前處理EDA

  • 分享至 

  • twitterImage
  •  

補一下特徵工程前的EDA,
探索式資料分析(EDA)進行數據分析流程,
資料來源機器學習百日馬拉松。

什麼是EDA

https://ithelp.ithome.com.tw/upload/images/20190930/20112568wJw84rB9vd.png

範例

前處理

  1. 資料讀取
  2. 格式調整
  3. 填補缺值
  4. 去離群值
  5. 特徵縮放

https://ithelp.ithome.com.tw/upload/images/20190930/20112568S0nr3Oyx9X.png

https://ithelp.ithome.com.tw/upload/images/20190930/20112568Pm8YTW3IBw.png

https://ithelp.ithome.com.tw/upload/images/20190930/201125687JiBs3Bknt.png

進行EDA

  1. 相關係數
  2. 核密度函數
  3. 離散化
  4. 繪圖排版
  5. 常用圖形
  6. 模型體驗

https://ithelp.ithome.com.tw/upload/images/20190930/20112568mi54INTB9g.png

儲存結果

https://ithelp.ithome.com.tw/upload/images/20190930/20112568xZ4lpURQ6F.png


資料蒐集後,
需要直接進行EDA,
包含對資料的假設、分佈和處理等。


以上,打完收工。


上一篇
[Day13]特徵工程介紹
下一篇
[Day15] 特徵工程-資料類型處理
系列文
Machine Learning Day3026
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言