本次鐵人賽挑戰 30 天使用 Python 搭配政府公開資料,一步步完成由淺入深的資料分析與視覺化圖表。整個系列將以 macOS + VS Code 為主要開發環境,適合想學 Python 資料分析的新手,或是想利用開放資料做專案練習的朋友。
在這 30 天裡,我會挑選 4–5 個具有代表性的台灣政府開放資料集,規劃上,第一週會先介紹環境安裝與工具準備,讓完全沒有基礎的讀者也能跟上;之後每個資料集會分成「資料介紹、下載方式、實作分析、圖表繪製」幾個階段,難度會逐步提升。
希望透過這個挑戰,讓大家看到資料分析並不遙遠,只要有興趣,就能利用身邊的公開資料,做出有趣又有價值的分析!
這週我們要使用的資料集是「空氣品質指標(AQI)」,這份資料可以從政府資料開放平臺下載,格式為CSV。內容涵蓋全臺各縣市空氣品質監測站每日(甚至每小時)的觀測數...
昨天我們認識了「空氣品質指標AQI」資料集,今天要正式開始讀取資料並挑選出分析所需的欄位。由於原始資料欄位非常多,若全部使用會讓後續分析過於雜亂,因此我們會先挑...
昨天我們已經成功讀取並篩選出核心欄位(縣市、AQI、PM2.5、時間),今天要進一步做縣市之間的比較,看看哪個縣市的AQI整體表現最好,哪個縣市需要特別注意。...
在前一篇我們透過縣市平均值排行,了解到各縣市在整體空氣品質上的差異。不過單看「平均值」仍不足以說明日常生活的真實體驗,因為平均可能會被極端值拉高或拉低。 舉例來...
前幾天我們分析了AQI平均值和 等級分布,但AQI本身是綜合指標,它的背後來源可能差異很大。 今天我們要比較各主要污染物的濃度,找出: 哪些縣市的PM10、O...
一、資料處理首先將原始資料讀入,並將發布時間欄位轉為 日期時間格式,方便後續分析:df["publishtime"] = pd.to_dat...
一、資料處理資料讀取後,針對PM2.5濃度進行分級,定義為三個等級: 低:PM2.5 ≤ 15 中:15 < PM2.5 ≤ 35 高:PM2.5 &g...
空氣品質指標 (AQI, Air Quality Index) 是衡量空氣污染對人體健康影響的重要指標。本週分析重點放在 全台 AQI 與 PM2.5 數據整理...
在本次鐵人賽的第29天,我們回顧了四大公開資料集,透過數據觀察台灣社會的重要議題。 人口結構 分析各縣市人口分布與年齡結構 探討人口老化、少子化趨勢對社會資源...
鐵人賽的最後一天,主要進行了技術學習的回顧與個人心得整理。在技術面上,我熟練了Python資料科學套件的操作,包括pandas的資料整理與matplotlib的...