iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 12
0
AI & Data

30天從嫩嫩的人工智慧奇幻旅程系列 第 12

一個蘿蔔一個坑,整理好的資料集合 python dataframe 格式

我們之前在介紹資料型態的時候有提到,python 內建的資料型態有 list,dist,set 那麼,有沒有更常見的資料型態呢。有的!如果我們認真看過剛剛上述的資料型態,我們可以發現這些資料型態基本上都不太容易被拿來做統計運用,因為要嘛就是沒有欄位名稱,要嘛就是欄位名稱可以不固定,這樣我們在統計資料的時候就會非常的困擾。


在 R 語言中有個 dataframe 的格式,就可以解決上述的問題。而如果要在 python 中可以使用這個格式,我們需要 pandas 套件的幫忙。

import pandas as pd # 引用套件並縮寫為 pd

col_1 = ["James","Andy","David","Wolf"];
col_2 = ["30","50","23","54"];

data_dist = {
    "name":col_1,
    "years":col_2
}

data_df = pd.DataFrame(data_dist);
data_df  # 印出整理後的 DataFrame

我們可以從下面的執行結果看到各種不同格式印出來的樣子,你就可以知道為什麼我們會說 DataFrame 適合統計資料了。
https://ithelp.ithome.com.tw/upload/images/20181023/200413835yr0QktMzg.png


上一篇
經驗值不夠就不好說智慧 python MongoDB
下一篇
python DataFrame 進階技巧
系列文
30天從嫩嫩的人工智慧奇幻旅程25

尚未有邦友留言

立即登入留言