iT邦幫忙

DAY 13
0

成為資料工程師最初的 28 堂課系列 第 13

資料工程師第 12/28 課: 資料視覺化

[修讀原因]

這一堂課雖說是分在社會人文研究相關的 Track, 但事實上無論就電腦技術上, 或數學統計上都是成本份相當重的一個科目, 這也是所謂的資料科學家/資料工程師須要的是一個多領域, 跨領域, 甚至是超(越)領域的學習與能力才拿達到的.

但在 Data Mining 的觀念上, 資料探勘的流程是從資料搜集, 資料清理, 資料儲存, 資料處理, 最後才是資料呈現, 而在資料視覺化應該只是資料呈現的其中一環, 甚至是在資料探勘中最後才要做的, 而目前的課程到現在還沒提到資料探勘, 此時會提到資料視覺化是有原因的.

雖然資料視覺化是資料探勘的結果, 但也是因為這結果決定成效, 其中包含讓人去了解, 及對人的影響, 有時甚至須要反向去設計, 資料探勘或許是可以挖掘出原本想不到的結論, 但這結論往往是在一個猜得出來的 "架構" 上面, 這架構在於我們對社會的體驗, 也包含對專業領域的了解, 如商業運作之類.

在十年前, 若是討論到相關的科目, 大概就是統計圖表了, 雖然說現在來看, 統計圖表還是很重要, 但資料視覺化已經遠超過這部份了, 其中包含幾個很重要的因素:

  • 即時性
  • 數值性
  • 互動性
  • 大量性
  • 藝術性

當時要做到上面幾點幾乎是不太可能的, 但由於工具的發展, 很多過程慢慢成熟, 我們能夠透過資料視覺化產出的訊息變成一個很重要溝通的主流, 已經不會輸給任何語言或文字, 所以這一堂課的重要性由此可知.

[基本資訊]

[基本介紹]

資料視覺化本質是種溝通, 雖然說是以數量唯主, 但也包含下面幾種觀點:

  1. 時間序列 (Time Series)
  2. 排名/排序 (Ranking)
  3. 分類/部份到全部 (Part-to-whole)
  4. 變異/不同性 (Deviation)
  5. 比例分佈 (Frequecy Distribution)
  6. 修正 (Correlation)
  7. 共通比較 (Nominal Comparison)
  8. 地理空間 (Geographic or geospatial)

話說用資料視覺化來看資料視覺化, 大概就是這樣:

這包含三部份:

  1. 獲取資料
  2. 尋找資料
  3. 調配資料

最後可以組出這十項, 很有趣吧.

而最近最紅相關的名詞, 大概就是資訊圖表吧, Infographics, 當然資訊視覺化不只是資訊圖表而已, 只是如一開始所說的, 資訊視覺化現在成為一門顯學, 最主要也是工具的發展, 所以若沒有去學使用工具, 大概就很難感受到真正的意涵.

[修習方式]

電子書:

開放課程:

關鍵字:


上一篇
資料工程師第 11/28 課: 演算法
下一篇
資料工程師第 13/28 課: 效能調校
系列文
成為資料工程師最初的 28 堂課30

尚未有邦友留言

立即登入留言