不管是數據分析的過程還是分析結果的呈現,都推脫離不了「數據可視化」,將數據用圖表呈現。然而我們該用哪些圖表,或是應該用哪些圖表作分析,都是憑直覺或是在EXCEL中隨意套用,因此可以在新聞上或是文章中找到一些使用錯誤的圖表而鬧了不少笑話的案例。
學好如何繪製一張資訊清晰的圖表是分析師非常重要的能力之一。今天!就讓我們一一認識這些基本圖表的特性以及使用的方法吧!
本次要介紹的基本統計圖表包含:長條圖、圓餅圖、直方圖、箱型圖、折線圖。
用來展示不同分類之間的數據變化。
用來展示各類別的數據佔比。
用來展示在連續間隔或者是特定時間段內數據分布的情況。
用來展示一組數據的分散的狀況。
用來展示隨時間或有序類別的波動情況或趨勢變化。
在了解完上述的圖表特性後,我們該如何正確的應用?
在做圖之前必須先了解本次視覺化的目的是什麼。我們依據Andrew Abela大師的建議可簡單分為四類:比較、分布、構成和關係。
比較:類別、變量之間的大小
分布:資料的頻次
構成:類別的占比
關係:兩變項之間的關係
在繪製圖表的時候,千萬不要因為圖表而圖表化,且要注意應該要有明確的圖表標題、X軸和Y軸名稱,讓讀者可以清楚地透過圖表理解你所要傳達的資訊。
知道圖表的作用後,再來就是實際的圖表繪製,這些將在往後的文章中透過 EXCEL 和 Python 的方式帶大家完成,期許我可以堅持到那一天!
參考資料:
https://www.jianshu.com/p/28c4b43c396d
https://zhuanlan.zhihu.com/p/149923917