最近,有事沒事就會逛逛open data的網站,我今天很幸運的看到了兩個資料集:分別是
綜合所得稅所得總額全國各縣市鄉鎮村里統計分析表 和 各鄉鎮市區人口密度 。
為了要實作inner join again,所以,我把兩個資料先整理了一下。
接下來,就是實作聯接(inner join)了。
1. 先匯入「納稅」的excel檔。
2. 透過「新增」,匯入「人口」的excel檔。
3. 開啟「納稅」的功能選單,並將「人口」拉到編輯區。
4. 選擇「納稅」的「縣市鄉鎮合併」 = 「人口」的「區域別」,完成。
今天的主題是:「人口密度高的地區,每一戶繳的所得總額是不是也比較高呢?」話不多說,先拉一個table出來比較。結果都是錯的。哈哈!因為這兩筆資料是透過inner join產生的,所以在欄位的應用上,還需要再調整一下。
把那兩個欄位的資料,從加總改成平均,人口密度正確了,只不過,每一戶的所得平均,應該不是這樣算的.....。
沒關係,我們剛好練習一下,Tableau的LOD函式。
完成後如下圖。
先看看,樹狀圖。「台北市大安區」看來是人口密度高,又會賺錢的一區。不過,新竹縣竹北市,感覺上生活品質應該不錯,人口密度低,所得很高。
快速排序一下。嘿嘿嘿..... 這個結果,有點驚訝,但是卻也不意外。有興趣的人,自己研究研究。(如下圖)
看到這種,有一些相關,可是,又好像不太相關的數據,那就嘗試分群吧!
最後,可以透過「叢集」 -> 「描述叢集」以及「格式」 -> 「檢視資料」, 細細研究一下那些在叢集1的地區哦!
今天實作,成功。完成後如下圖。