分析資料前,我們還是要先了解怎麼去快速概覽數據
DataFrame 最常用的方法之一是 head()
用head()將指定的行數(從頂部開始)寫入head(),將要提取的 "行數" 寫入,就可以提取相對的行數了
import pandas as pd
a = pd.read_csv('data.csv')
print(a.head(10))
上面的head(),是從最頂部開始回傳的!這邊的tail,則是從底部開始回傳指定資料的"行數",跟head()一樣沒有特別指定(_),都是5行
且其他的指令不便,跟head()不一樣的地方,只有print(a.tail())
這樣就能列印最後5行了
昨天有提到,要查看大數據的詳細資料,沒錯,就是用這個info(),他會詳細列出各項的詳細資料
使用方法也簡單,跟head()幾乎一樣,只是將head(),換成info()而已
他會詳細列處下面這些資訊
告訴我們總共有幾行,每列的名稱跟資料類型,也會回傳非空值,這樣就能反推,有多少欄位是沒有東西的~
<類別'pandas.core.frame.DataFrame'>
RangeIndex:169 筆,0 到 168
資料列(共4列):
# 列非空計數 Dtype
--- ------ -------------- -----
0 持續時間 169 非空 int64
1 脈衝 169 非空 int64
2 Maxpulse 169 非空 int64
3 卡路里 164 非空 float64
資料型態:float64(1)、int64(3)
記憶體使用量:5.4 KB
沒有任何