seaborn資料視覺化的強大套件
能有效率的配合pandas快速地讓我們檢視資料
我會跟Day11時一樣藉由Titanic的資料集來做示範
import seaborn:
通常在import seaborn會命名為sns
import seaborn as sns
載入資料集:
長條圖:
長條圖通常用來觀察不同類別對於相同屬性值的呈現結果
使用seaborn的barplot繪製長條圖
普同的用法:
在參數x、y傳入序列物件
配合pandas:
以Titanic資料集為例
Pclass表示所屬艙等,分為1、2、3,而此時我們把這視為不同的類別
Survive表示有無生存,0表示無、1表示生存,此時我們把這視為想觀察的相同屬性值
x、y此兩參數分別填入x、y軸想表達的數值欄位,data傳入所使用的DataFrame
可在參數heu填入欄位來做更進一步的分類
使用seaborn的countplot也能繪製長條圖
用來觀察各列別的數量
觀察各Pclass(艙等)的數量
觀察各Survived(有無生存)的數量
送上colab連結,可自行在上面多做點練習更加熟悉seaborn
https://colab.research.google.com/drive/1eXIsYsfv3c_xBmRAlxhBm8F0xuCn8Ppu?usp=sharing
Titanic資料下載
https://www.kaggle.com/c/titanic/overview