iT邦幫忙

2025 iThome 鐵人賽

DAY 5
0
自我挑戰組

Python × 政府開放資料:30天數據探索與圖表呈現系列 第 5

Day 5 新北人口年齡分配:資料載入與檢視

  • 分享至 

  • xImage
  •  

今天是我們正式進入實作的第一天,目標是把資料集載入Python,並且先做初步檢視。

實作流程很簡單,首先在專案資料夾(/IT_population_age)中放入CSV(將名稱改成IT_population_age)

https://ithelp.ithome.com.tw/upload/images/20250907/201786242IpCAitsrZ.png

然後使用Pandas載入:
import pandas as pd

讀取資料

df = pd.read_csv("IT_population_age/IT_population_age.csv")

接著使用df.head()觀察前幾筆資料,確認欄位名稱是否正確;再用df.info()檢查欄位型態與缺值情況,最後可以用df.describe()觀察統計摘要。

import pandas as pd

#讀取資料
df = pd.read_csv("IT_population_age/IT_population_age.csv")

#檢視前 5 筆資料
print(df.head())

#檢視欄位資訊
print(df.info())

#檢視統計摘要
print(df.describe())

https://ithelp.ithome.com.tw/upload/images/20250907/20178624xiYa28CSJi.png

為了方便後續分析,我建議將欄位重新命名,並存成新檔,例如把itemvalue2改成male_0_14,itemvalue3改成female_0_14,依此類推,這樣閱讀起來更清楚。

欄位重新命名

df = df.rename(columns={
    "field1": "year",
    "itemvalue2": "male_0_14",
    "itemvalue3": "female_0_14",
    "itemvalue4": "male_15_64",
    "itemvalue5": "female_15_64",
    "itemvalue6": "male_65_plus",
    "itemvalue7": "female_65_plus",
    "itemvalue8": "life_expectancy_male",
    "itemvalue9": "life_expectancy_female"
})

檢查修改結果

print(df.head())

存成乾淨版本,方便Day 6、Day 7使用

df.to_csv("1_clean.csv", index=False)
print("已存成 1_clean.csv")

https://ithelp.ithome.com.tw/upload/images/20250907/20178624o1vhI1YdIq.png

今天的目標不在於畫圖,而是確認資料結構是否合理,並確定每個欄位代表的意義。這些準備動作能幫助我們在後續分析過程中更加順利,明天就可以開始進行視覺化,先從最簡單的長條圖著手。


上一篇
Day 4 新北人口年齡分配:資料介紹與分析方向
下一篇
Day 6 新北人口年齡分配:長條圖
系列文
Python × 政府開放資料:30天數據探索與圖表呈現6
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言