我們之前在介紹資料型態的時候有提到,python 內建的資料型態有 list,dist,set 那麼,有沒有更常見的資料型態呢。有的!如果我們認真看過剛剛上述的資料型態,我們可以發現這些資料型態基本上都不太容易被拿來做統計運用,因為要嘛就是沒有欄位名稱,要嘛就是欄位名稱可以不固定,這樣我們在統計資料的時候就會非常的困擾。
在 R 語言中有個 dataframe 的格式,就可以解決上述的問題。而如果要在 python 中可以使用這個格式,我們需要 pandas 套件的幫忙。
import pandas as pd # 引用套件並縮寫為 pd
col_1 = ["James","Andy","David","Wolf"];
col_2 = ["30","50","23","54"];
data_dist = {
"name":col_1,
"years":col_2
}
data_df = pd.DataFrame(data_dist);
data_df # 印出整理後的 DataFrame
我們可以從下面的執行結果看到各種不同格式印出來的樣子,你就可以知道為什麼我們會說 DataFrame 適合統計資料了。