回顧這一個月的29篇文章,我從不熟悉Tableau到現在可以畫出分析圖形,甚至可以進行「探索式數據分析」,不曉得大家是不是也跟我一樣收穫滿滿呢!
最後一篇,就說說Tableau這個故事吧!
在資料分析的過程中,Tableau 究竟扮演了什麼樣的角色呢?
資料來源: 維基百科 Exploratory data analysis (EDA)
我們可以從上面這張圖看出一些端倪。Tableau所扮演的角色,就是「溝通視覺化報告」的這個重要階段。但是,這29天的練習,我發現Tableau應該可以完成「Data Science Process」(資料科學程序)(亦可參考在故事五中提過的資料分析流程),接下來,就讓我們回顧一下這29天的內容吧!
1. Raw Data Colleced (原始資料蒐集)
我們從下面這些網站下載了資料
a. 歐洲疾病預防管制中心下載了COVID-19的資料。
b. 我們也從 台灣 Open data網站,下載了很多資料,像是旅遊資訊、生活資訊等等
c. 行政院環保署 open data 下載了 PM2.5的資料
d. 透過google尋找,像是 R 軟體中 鑽石的dataset
e. 自己創造的資料(颱風路線的實作)
2. Data is Processed (資料儲存處理)
a. 匯入 csv檔、excel檔
b. 多個資料檔的並集、聯集 (join and union)
c. 資料排序
d. tableau內建函式計算新欄位(基本函式、表計算、LOD)
e. 建立參數 (故事二十六)
f. 資料解釋器(故事二十七)
3. Clean Dataset (清理資料)
a. NULL資料的清理(數字、地圖)
b. 地圖經緯度資料的Mapping與清理
c. 地圖經緯度資料的錯誤排除
4. Exploration Data Analysis (探索式資料分析)
a. 符號地圖(一般、熱度)
b. 文字表
c. 線圖 (單軸、雙軸)
d. 面積圖(故事六)
e. 樹狀圖(故事六)
f. 疊條圖(故事六)
g. 醒目提示表
h. 散點圖(XY散佈圖)
i. 盒鬚圖
j. 圓餅圖
5. Models & Algorithms (模型與演算法)
a. 趨勢線(迴歸分析) 與 趨勢預測
b. 叢集(資料分群)
6. Communicate Visualize Report [Make Decisions] (溝通視覺化報告)[做決定]
a. 資料儀錶板 Dashboard (故事七)
b. 資料故事 (故事十一)
c. 資料動畫 (故事十二、十三)
d. 多維度資料繪圖(故事二十一)
e. 資料篩選、醒目提示 (故事二十四)
7. Data Product (資料成果)
a. 成果發佈在Tableau public on-line
其實,Tableau有很多系列產品,可以協助資料儲存、資料清理、即時線上資料更新等。因為時間的關係,我沒有特別去研究那些工具。不過,我有點好奇,我現在的功力如何?
沒問題的,可以到 Tableau認證的網頁看一下,認證分了三級...... 我們可以點考試細節,然後可以在 Exam Prep Guide 的地方看到 sample questions。
Tableau Desktop 專家 --> 看起來像是在考基本操作:很快看了一下,只有一題(日期不連續切換)沒練習過,其他好像都實作過了!
Tableau Desktop 認證夥伴:--> 看起來像是在考進階操作:很快看了一下,只有有兩題(某個函式與直方圖的bin設定)沒練習過,其他好像都實作過了!
Tableau Desktop 認證專業人士:--> 看起來像是在考View、儀錶板與資料故事:很快看了一下,感覺上都畫過、分析過了...... (但是,英文有點不容易理解,所以,不好說..... )
不管怎樣,綜合來看,現在的實力應該是在「中間」,稍微熟悉一下題型,感覺上取得「Tableau Desktop 認證夥伴」這個認證,應該是沒有問題的。開心!開心!
至於,「Tableau Desktop 認證專業人士」這個認證,我覺得了解那些英文題目才是重點,從 sample questions 提供的答案上來看,那些地圖、樹狀圖、折線圖、直方圖、資料儀錶板 Dashboard等等,其實都實作過了呢!