iT邦幫忙

2021 iThome 鐵人賽

DAY 12
0
AI & Data

30Day 從一介凡人羽化成資料科學初學者系列 第 12

Day12- pandas(7)DataFrame遺失值處理

  • 分享至 

  • xImage
  •  

當我們拿到一份資料時,往往其中有許多缺失值
以下我會介紹如何檢視及各缺失值處理方式

我先建立各raw及columns都有些缺失值的DataFrame
https://ithelp.ithome.com.tw/upload/images/20210828/20140416ohqdinTeT5.png

isnull與notnull方法:
isnull將資料空值回傳True,不是空值回傳False
https://ithelp.ithome.com.tw/upload/images/20210828/20140416uqanNGapkC.png
notnull則相反,資料空值回傳False,不是空值回傳True
https://ithelp.ithome.com.tw/upload/images/20210828/201404166HaobLFlHK.png

drop:
drop可用來拿掉你指定的raw或column
axis參數預設為0,axis=0時drop掉raw、axis=1時drop掉column

拿掉0、1這兩個raw
https://ithelp.ithome.com.tw/upload/images/20210828/20140416J8AaM79TRA.png
拿掉one,thr這兩個column
https://ithelp.ithome.com.tw/upload/images/20210828/201404168We43XkOGJ.png

dropna:
dropna可拿掉有遺失值的raw
與drop一樣,axis預設為0
axis=0時drop掉有空值的raw、axis=1時drop掉有空值的column

只有index是4的那排raw沒有遺失值,所以只剩下那排
https://ithelp.ithome.com.tw/upload/images/20210828/2014041621csMehdUb.png
因為全部的column都有遺失值,所以輸出結果如此
https://ithelp.ithome.com.tw/upload/images/20210828/20140416J6HYsh2TZM.png

fillna補充缺失值:
方式一:以字典的方式傳入,前面是column名稱,後面是補充缺失值的值
https://ithelp.ithome.com.tw/upload/images/20210828/20140416f5MWVDVva8.png

方式二:單一欄位補充缺失值
https://ithelp.ithome.com.tw/upload/images/20210828/20140416WLFBEuR6oz.png

送上colab連結,可自行在上面多做點練習更加熟悉pandas
https://colab.research.google.com/drive/1xM9yP5PgwyZPdopvrRz62f8M2lwq_S9P?usp=sharing

pandas就先講到這邊,這些東西應該已經夠用了,以後有遇到新的方法再繼續學習吧!


上一篇
Day11- pandas(6)DataFrame有效率的檢視資料方法
下一篇
Day13-seaborn(1)長條圖barplot、countplot
系列文
30Day 從一介凡人羽化成資料科學初學者30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言