資料視覺化(Data Visualization)無所不在。打開電視、翻開報章雜誌,甚或是商業會議上的簡報內容,都能看到資料視覺化下的圖表身影。尤其在新冠疫情(COVID-19)爆發後,為了讓人們更能追蹤疫情動態,資料視覺化在媒體上大量出現。最經典的案例,莫過於美國約翰‧霍普金斯大學(Johns Hopkins University)在新冠疫情資料中心(Johns Hopkins Coronavirus Resource Center)網頁上,每日不間斷更新疫情地圖儀表板,讓人可以透過圖表了解全球疫情動態。
圖一: 美國約翰‧霍普金斯大學(Johns Hopkins University)在新冠疫情資料中心(Johns Hopkins Coronavirus Resource Center)的全球新冠疫情儀表板
(來源: https://coronavirus.jhu.edu/map.html, 擷取日期: 2022/09/16)
體認到資料視覺化的重要,在本次鐵人賽中,筆者將以一位文科生學習者的身分和角度,參考《精通Python》、《精通資料視覺化》、《資料視覺化之美》(Beautiful Visualization: Looking at Data through the Eyes of Experts)、《社會與政策研究的資料視覺化》(Data Visualization for Social and Policy Research :A Step-by-Step Approach Using R and Python》等書,並輔以網路資料和線上課程內容,完成簡易資料視覺化學習。在內容上,預計有三大面向:
一、何謂資料視覺化: 簡易的書寫資料視覺化的定義、歷史與功用,並說明資料視覺化在當今社會中的重要度。
二、Python與資料視覺化: 從安裝Python出發,到使用Python爬蟲網路Data、清洗資料,進而以Python的Matplotlib、Pandas完成簡易資料視覺化。
三、資料視覺化工具: 以Excel、Datawrapper、Power BI 與Tableau製作資料視覺化圖表,並分析各個資料視覺化工具在使用上的優、缺點。
上述內容可能會因學習狀況與參賽進度有所調整,願自己能順利完成此次30日的鐵人賽。