iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 3
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 3

[DAY 3] 章節1-3: 電池大亨的煩惱-盒鬚圖與四分位數(Python)

  • 分享至 

  • xImage
  •  

人物介紹:飛哥

因為個人專業的關係,時常在全球各地出差,為不同的企業提供不同的數據分析,擁有自己的一間小工作室,遇到問題總能設法找出背後的邏輯與規則,但一遇到坐船跟坐飛機就只能乖乖睡覺,以免頭暈影響思考。常常出差的緣故,使得能到各地去品嘗美食,願意為了吃到好吃的東西而花大錢。

1-3 電池大亨的煩惱

「呦! 摳泥機挖,大山社長,我明天就到貴公司啦!」飛哥熱情地透過電話跟遠在日本的客戶寒暄,雖然這已經不是第一次跟社長講話,但對方是禮儀為重的日本人,還是不能少了問候。

社長清了清喉嚨說道:「我們公司是生產全日本電池的大宗,但最近在研發的時候,不知為何總有幾顆壽命特別短,這對我們評估電池的續航能力範圍有很大的影響啊!你上次是不是說有甚麼好方法可以視覺化?」

「是的,社長,我上次說的是『盒鬚圖(box plot)』,它也常被稱作箱型圖。」飛哥繼續說道:「這個圖常用在呈現數據分散情況,是一種常見用來視覺化數值的統計圖表」

「對對對!唉呀!我怎麼又忘記了,我也想比較我們的舊款電池跟新研發的壽命是不是直觀上有差,這有辦法嗎?」雖然電話上看不到社長的表情,但似乎感覺得出來他在抓著頭思考。

飛哥有自信地說出:「沒問題! 社長請您打開我剛才發送的郵件,可以看到就整體數值而言,新電池的壽命比舊電池還要長,雖然一半以上的新電池壽命都有30天以上,但是他的範圍差距明顯比舊電池大,可能還是要穩定一下研發中的品質喔!」
https://ithelp.ithome.com.tw/upload/images/20200917/20130640ZUVA75vG3x.png

「圖中的『第一四分位數(Q1)』指的是數值由小到大排序後位在第25%的數字,而『第三四分位數(Q3)』」是位在第75%的數字,Q3-Q1後就是『四分位距』,可以呈現中間50%的資料分散程度的大小。當然,您應該也有看到一些『離群值』,這就表示這些電池的壽命可能是異常的或是其他款式的電池,與同組電池壽命相比後離可接受的範圍差太多了,因此被判定為離群值,這樣了解嗎?」飛哥仔細地解釋著。

大山社長停頓了一下,說道:「原來是這麼一回事,看來我研發的還不錯,不過穩定性還能再加強下」

「是的,社長,如果您改進後的新電池壽命的最小值比舊電池壽命的最大值大的話,我想您的公司絕對又能大賺一筆啦,社長發大財!」伴隨著咯咯的笑聲,飛哥笑的嘴都合不起來了。

「這個我有信心啊! 你等著啊──!哈-哈哈哈!」在社長爽朗的笑聲中,結束了這次小會談。

小博正整理著明天要帶去的行李與資料,聽到兩人的笑聲也不自覺得會心一笑。


Python程式時間:

battery = {'old': [10,28,29,36,22,8,20,26,26,27,22,24,25,32,39], 'new': [38,23,22,32,19,29,36,42,18,35,26,36,30,39,47]}

fig, ax = plt.subplots(figsize=(8,6))
ax.boxplot(battery.values())
ax.set_xticklabels(battery.keys())
ax.tick_params(axis='x',labelsize=20)
ax.tick_params(axis='y',labelsize=15)

後記: 終於要出國了,在異地的那一端,飛哥跟小博又會遇到甚麼樣的事情呢? 雖然現在因為疫情的關係導致大家不便出國,但想到台灣的疫情狀態維持的很好,不得不感謝大家的努力,明天就跟著飛哥一起出國看看吧!

資料參考:
https://numpy.org/devdocs/reference/generated/numpy.quantile.html


上一篇
[DAY 2] 章節1-2: 意外的雞胸肉-標準差與變異數(Python)
下一篇
[DAY 4] 章節1-4: 出發!前往異之國度!-長條圖與直方圖的誤解(Python)
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言