今天我們來介紹一些之前沒有講到的函數。
可以用來決定你要刪掉哪一行或那一列。
為了進行示範我創建了一個數據表名為 da (如下圖)。
import pandas as pd
import numpy as np
csv = "test.csv"
da = pd.read_csv(csv)
na = da.drop([0,1])
na
我們使用了 drop 函數來將第0、1列進行刪除,結果如下圖。
也可以用他來刪除行。
import pandas as pd
import numpy as np
csv = "test.csv"
da = pd.read_csv(csv)
na = da.drop(['Age'],axis=1)
na
不過這邊要注意一點,你可以看到我在刪除行時在 drop 函數裡多了 axis=1 這段,這是因為我們要刪除的是行,所以我們用 axis=1 來告訴 drop 要去找行的索引。
有些人可能發現了,我們在刪除列時並沒有加上 axis=0 ,這是因為 drop 裡預設就是從列去找,所以不用特別去定義。
可以用來將具有空值(NaN)的列進行刪除。
import pandas as pd
import numpy as np
csv = "test.csv"
da = pd.read_csv(csv)
na = da.dropna()
na
可以跟最上面的圖片來做比較,你可以發現具有空值(NaN)的那兩列都被刪除了。
也可以讓它不要去檢查所有行,讓它檢查特定的就好。
import pandas as pd
import numpy as np
csv = "test.csv"
da = pd.read_csv(csv)
na = da.dropna(subset=["Age"])
na