我們前面所練習的資料視覺化在數據領域中比較偏向後段的工作。
一個完整的數據分析專案(數據團隊)包括了以下五個環節:
1.取得原始資料
2.清理原始資料
3.模型訓練/評估
4.資料視覺化
5.決策應用
看起來只有五個環節很容易理解,不過在這當中又包含了以下或更多的所需知識技能:
1.程式語言(Python or R or Excel vba)
2.資料庫(Oracle or MySql…等)
3.網路爬蟲
4.資料ETL(載入、清理、讀取)
5.資料視覺化(Power bi or Tableau…等)
6.機器學習
7.深度學習
8.影像辨識
9.自然語言處理
以上是針對有興趣往資料領域發展的人可以先做功課的建議。
回歸我們這30天的練習,我們所接觸到的資料集(原始資料),幾乎都是整理好的(乾淨的),不過在現實企業中,其實是糾結在一坨,就像是找不到線頭的毛線一樣。
所以我們前面練習的內容可以說是學習製作視覺化報表的那種思維跟感覺,我覺得一個資料分析師必須要有一個客觀的態度,不知道的事情就不要預設立場,而且一個很重要的就是「保持學習,學無止盡」。
很高興今年參與鐵人賽,挑戰成功了。
明年若時間允許還會再報名參賽的,到時候的主題會比較focus在資料的ETL。