「找資料」、「分析資料」真的是一件很傷腦筋的事。
當你有了研究方向、研究目標,80%以上的機會,你會找不到你要的資料。
當你有了資料,80%以上的機會,你會看著資料發呆,毫無頭緒。
想在隨手可得的資料中找出新意,感覺上,比找出研究目標還難。其實,這也就是數據分析有趣的地方,我認為,「梅迪奇效應」一書中提到的「異場域碰撞」,就是鼓勵資料科學家不斷努力的最佳思維。此外,除了「異場域碰撞」之外,大量的產出,也是邁向成功一個不可或缺的重要關鍵哦!
那麼,今晚我們來畫一張「旅遊地圖」。
資料來源,還是從OPEN DATA過來,「休閒旅遊類」排行第二名的下載資料。Go!
Tableau有匯入JSON file的功能,只不過,你可能要很清楚該檔案的資料結構,因為Tableau會問你,該怎麼辦?(如下圖)。所以,我下載了XML檔,再透過Excel處理資料,認識欄位與整理資料一次搞定。哈哈!
資料中有ZIP CODE(郵遞區號),我有點好奇,測試了一下。WOW,Tableau判斷正確耶!只不過,很多景點都對映到同一個ZIP CODE...... 看來,還是要用資料中的經緯度去畫圖。
ZIP CODE應該就是讓顏色更豐富點的資料了,雖然還是有遺漏值..... Orz (如下圖)
將經緯度資料改成維度,畫圖吧!
接下來,上妝吧! 可以快速看到資訊了(如下圖),只不過..... 資料太多,沒有分類的話,真的是霧煞煞的.....
在沒有更多資訊的前提下,我們就先用ZIP CODE 來當作分類的篩選器吧! 把ZIP CODE拉到標記的地方,並打開「醒目提示」。完成(如下圖)。
可是,全台灣這麼多郵遞區號,我又背不起來.....也對,那..... 我們改用縣市/地區來篩選。
實作到這邊,算是完成了。只不過.......
1. 篩選的使用不是那麼方便。
2. 觀光景點的分類,好像也很想像中的不太一樣。
這些問題..... 今晚先留著,我明天早上,想些辦法來改善......
祝大家,連假愉快!