觀察資料模樣,為之後資料分析做準備
理解資料分析概念,什麼是EDA
資料分析一定會談到探索性分析Exploratory Data Analysis,簡稱EDA,透過敘述性統計、統計繪圖、視覺化等快速簡易的方式,從各種面向先了解資料的狀況,以利後續分析
DatasetsInfo: 利用.info()查看訓練與測試集資訊
.describe(): 顯示數值欄位各項統計數值(count,mean,std...)
describe(include=['O']): 顯示文字欄位各項統計數值,O代表object查看非數值資料
DatasetMissingPercentage: 以百分比顯示各欄位有多少缺值,用isnull()看資料缺值個數
DatasetUniquePercentage: 以百分比顯示各欄位有多少重複值,用unique()看資料是否重複
EDA在資料分析常會用到,可以寫成DatasetsInfo,DatasetMissingPercentage,DatasetUniquePercentage函式,下次丟資料進去就有結果了
https://medium.com/@baubibi/速記ai課程-統計與資料分析-四-3cf14683b98f