iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 14
0
Google Developers Machine Learning

透視Google Machine Learning的奧秘系列 第 14

[Day14] 資料視覺化技巧-matplotlib與Seaborn語法應用

前一天我們討論了資料視覺化的技巧,今天我們來看其他matplotlib語法以及Seaborn用法。

在matplotlib當中除了昨天介紹的plt.plot和plt.hist用法之外,還有其他的畫圖方法,讓資料視覺化的呈現方式更多元。

plt.boxplot

matplotlib包中boxplot函數的參數含義及使用方法:

plt.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None)
x:指定要繪製箱線圖的數據;
notch:是否是凹口的形式展現箱線圖,默認非凹口;
sym:指定異常點的形狀,默認為+號顯示;
vert:是否需要將箱線圖垂直擺放,默認垂直擺放;
whis:指定上下須與上下四分位的距離,默認為1.5倍的四分位差;
positions:指定箱線圖的位置,默認為[0,1,2…];
widths:指定箱線圖的寬度,默認為0.5;
patch_artist:是否填充箱體的顏色;
meanline:是否用線的形式表示均值,默認用點來表示;
showmeans:是否顯示均值,默認不顯示;
showcaps:是否顯示箱線圖頂端和末端的兩條線,默認顯示;
showbox:是否顯示箱線圖的箱體,默認顯示;
showfliers:是否顯示異常值,默認顯示;
boxprops:設置箱體的屬性,如邊框色,填充色等;
labels:為箱線圖添加標籤,類似於圖例的作用;
filerprops:設置異常值的屬性,如異常點的形狀、大小、填充色等;
medianprops:設置中位數的屬性,如線的類型、粗細等;
meanprops:設置均值的屬性,如點的大小、顏色等;
capprops:設置箱線圖頂端和末端線條的屬性,如顏色、粗細等;
whiskerprops:設置須的屬性,如顏色、粗細、線的類型等;
#默認patch_artist=False,所以我們需要指定其參數值為True,即可自動填充顏色
plt.show() #在任何環境下都能夠產生圖像

資料視覺化-3

Seaborn

Seaborn是以Matplotlib作為抵成的視覺化套件,補足了一些Matplotlib所沒有的功能其畫圖效果也是非常的強大

import seaborn as sns

vmin, vmax : 顯示的數據值的最大和最小的範圍
cmap : matplotlib顏色表名稱或對象,或顏色列表,可選從數據值到色彩空間的映射。如果沒有提供,默認設置
center :指定色彩的中心值
robust : 如果“Ture”和“ vmin或” vmax不存在,則使用強分位數計算顏色映射範圍,而不是極值
annot :如果為True,則將數據值寫入每個單元格中
fmt :表格里顯示數據的類型
linewidths :劃分每個單元格的線的寬度。
linecolor :劃分每個單元格的線的顏色
cbar :是否繪製顏色條:colorbar,默認繪製
cbar_kws :未知 cbar_ax :顯示xy坐標,而不是節點的編號
square :為'True'時,整個網格為一個正方形
xticklabels, yticklabels :可以以字符串進行命名,也可以調節編號的間隔,也可以不顯示坐標
mask:布爾數組或DataFrame,可選,如果傳遞,則數據不會顯示在mask為True的單元格中。具有缺失值的單元格將自動被屏蔽。
ax: matplotlib Axes,可選,用於繪製圖的軸,否則使用當前活動的Axes。
kwargs:其他關鍵字參數,所有其他關鍵字參數都傳遞給ax.pcolormesh。

資料視覺化-4

plt.style

而plt.style有一個好用的畫圖樣式,可以自定義畫出來的圖要什麼背景,常常看到有些案例有套用這些背景,非常的好用!

print(plt.style.available)
print(type(plt.style.available))
print(len(plt.style.available))
plt.style.use('dark_background') #使用plt.style.use('樣式')來套用方法
>>>['bmh', 'classic', 'dark_background', 'fast', 'fivethirtyeight', 'ggplot', 'grayscale', 'seaborn-bright', 'seaborn-colorblind', 'seaborn-dark-palette', 'seaborn-dark', 'seaborn-darkgrid', 'seaborn-deep', 'seaborn-muted', 'seaborn-notebook', 'seaborn-paper', 'seaborn-pastel', 'seaborn-poster', 'seaborn-talk', 'seaborn-ticks', 'seaborn-white', 'seaborn-whitegrid', 'seaborn', 'Solarize_Light2', 'tableau-colorblind10', '_classic_test']
>>><class 'list'>
>>>len = 26

資料視覺化-5

今天先介紹到這,明天來介紹機器學習的策略與業界應用。

參考資料與圖片來源


上一篇
[Day13] 認識資料視覺化
下一篇
[Day15] 機器學習的策略與業界應用
系列文
透視Google Machine Learning的奧秘30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言