首先,我們可以在公開資訊網站,下載資料。行政院環保署
接下來可以搜尋你想要的資料集,我今天選的是「新北市」「中和」的觀測點,並下載 9月份的資料。
連續兩天下載 open data 的資料,我發現....... 這些表格設計,都很有挑戰性。大多需要整理一下才能進行分析與繪圖。例如:如果你下載的是「全部觀測站」的資料,那個格式很神奇(如下圖)日期與觀測時間變成一個Matrix,因此,當你想畫折線圖(例如:PM2.5這個月的走勢圖),這個資料就要整理了。
當然,處理這個csv檔也不難,檔案讀進來之後,先將前面字串存成一個變數 X (例如: "1,基隆,1,二氧化硫,SO2,ppb,2020-09-03") 然後把後面的值寫成一個迴圈變成 x, 00, 1.5 ; x, 01, 2.2; ..... 把1筆資料變成24筆資料就對了。
回到今天的主題,我特別只選一個觀測站,這樣就可以省去「轉換」的問題。只不過,網站提供的檔案,是每天一個檔案,還是要把檔案合在一起,才能得到當月的完整資料。
簡單處理完資料,就可以匯入並畫圖囉!
Talbeau自動產生經緯度耶!趕緊試一下..... 真的是,令人難過,竟然是空的 Orz。(如下圖)
解法有兩種,一種就是自己把經緯度 Key 到資料中,另一種就是透過Tableau的地圖功能自建經緯度。試了好幾次都失敗,我再研究研究,研究出來了再放上來。
接下來,我們來畫個折線圖吧!這個流程大家應該都很熟悉了,就不多說明囉!
這個圖....也是怪怪的,今天我們介紹一個功能,直接將那個值「排除」掉。
把 「Item Eng Name」 加入,順便美化一下。看來缺失值不少,NULL的也有150筆,一樣,通通都先排除掉吧!
切成「日」進行觀察,9/12~9/14 的數值是往下走的(如下圖)。我Google了一下,那幾天確實有熱帶性低氣壓通過台灣附近。9月恐4颱來襲 第11號颱風生成時間曝光
最後,我們可以參考,PM2.5的wiki介紹。並用世界衛生組織的定義來解釋一下台灣的數據。(記得要改成「日」和「平均」)
從走勢看來(如下圖),IT-2、 IT-3 與 AQG差不多各占了1/3 ,在環境意識高漲的現在,確實要再多加努力啊!