iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 6
0
自我挑戰組

使用R進行探索式資料分析之初探系列 第 6

ggplot2探討車子油耗表現之二

  • 分享至 

  • xImage
  •  

上一篇我們藉由mpg資料集探討影響油耗的因素,我們使用散佈圖、顏色、構面等函式並將相關變數納入,呈現相關影響的油耗表現的統計圖,但我們都以散佈圖作為呈現,雖輔以其他函式來呈現但就覺得好像還要自行對應圖形,有沒有統計計圖就讓我們直覺看到油耗表現的變化,有的!在ggplot2稱為Geometric objects中文稱為幾何物件。
首先我們將上一篇引擎大小是否會影響油耗的表現,以散布圖呈現

ggplot(data = mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))

https://ithelp.ithome.com.tw/upload/images/20200906/201207568PRTI63hmU.png

我們換另外一種圖形表現

ggplot(data = mpg)+
  geom_smooth(mapping = aes(x=displ,y=hwy))

https://ithelp.ithome.com.tw/upload/images/20200906/20120756rRjF8nbHDi.png

引擎大小在高速公路上每加侖行駛的英里數,從這兩張圖中可清楚比對使用曲線統計圖中能直覺表現油耗是有明確的影響,其中引擎在7000cc下最多在高速公路上每加侖行駛為23英里為極限。

嗯...還不錯!是否可加入三個變數進行呈現,例如引擎大小和驅動方式是否會影響油耗表現

ggplot(data = mpg)+
  geom_smooth(mapping = aes(x=displ,y=hwy,linetype=drv))

https://ithelp.ithome.com.tw/upload/images/20200906/20120756E9FHsSFWpY.png

嗯...此時BMW總裁說話了,在會議上各部門的大官們以及站在筆電小小碼農的我,每個人都正襟危坐聽著總裁的指示了...說這張圖我看不懂!前輪驅動後輪驅動無法分別,所有人都很緊張的看向我,小小碼農的我深呼吸一口氣,執行下列程式碼

ggplot(data = mpg)+
  geom_smooth(mapping = aes(x=displ,y=hwy,linetype=drv,color=drv))

https://ithelp.ithome.com.tw/upload/images/20200906/2012075680DUpBriYp.png

總裁說話了!嗯...比較清楚了,看起來前輪驅動的車子比較省油並且在3000cc5000cc油耗表現每加侖可跑25英里,所有會議上各部門長官頻頻點頭並口沫橫飛的說明,站在遠處投影螢幕的我,心理鬆了一口氣,突然鼻子有點癢忍不住就挖了一下鼻孔,就在此時,總裁又說話了,就憑這三條線就要決定全球500億美金的開發案,而這三條線怎麼跑出來的,似乎........,所有人又看向我,業務部總監有著一頭白髮溫柔的跟我說,小朋友說話啊,總監在問你話....

我內心想,是在問我嗎?我只領35000;我結巴的說...這三條線....是經由公司的資料庫內displ、hwy、drv原始資料,並經由geom_smooth()函式將原始資料擬合後由ggpolt2套件產制出來;此時行銷部一位大姐姐看起來頗有韻味,身上的手飾閃閃發光,大聲的說 說人話 說人話
此時,我深呼吸一口氣,花了15秒在這15秒內一根針掉下都聽的到,寫出下列程式碼

ggplot(data = mpg, mapping = aes(x=displ,y=hwy))+
  geom_point(mapping = aes(color=class)) +
  geom_smooth()

https://ithelp.ithome.com.tw/upload/images/20200906/20120756lEib9kJ6hU.png
解釋到這一張圖引擎的大小和車子種類在高速公上的油耗表現,所以圖上的每個點位都對應引擎的的大小以及可行駛的英里數,這是公司這五年的原始資料,在經由程式的運算(ggplot+geom_smooth)繪製出油秏平滑線,如此的好處可直觀看到油秏表的好與壞。

所以我們回到總裁的問題引擎的大小與車子的驅動方式的統計,在花15秒寫出下列程式

ggplot(data = mpg)+
  geom_point(mapping = aes(x=displ,y=hwy,color=drv))+
  geom_smooth(mapping = aes(x=displ,y=hwy,color=drv,linetype=drv))

https://ithelp.ithome.com.tw/upload/images/20200906/201207569ap8fvhK5k.png

所以這三條平滑線經由原始資料的擬合出來,主要顯示油耗的表現的趨勢,配合原始的資料點位擬合這三條平滑線。

總裁此時對著我說,很好!解釋得很清楚,那超小型房車的油耗表現如何,因都會人口暴增小型房車是有潛力油耗表現如何,我回答報告總裁我了解您的問題,請給我15秒,寫出下列程式碼

ggplot(data = mpg, mapping = aes(x=displ,y=hwy))+
  geom_point(mapping = aes(color=class)) +
  geom_smooth(data = filter(mpg,class=="subcompact"),se=FALSE)

https://ithelp.ithome.com.tw/upload/images/20200906/20120756utkAtRZ97C.png

跟總裁報告,圖中藍色的線是超小型房車的油耗表現,經分析可分為三個部分第一部分1200cc-2000cc油耗表現是最漂亮,第二個部分2500cc-3500cc油耗平均25英里,第三部分3500-5800cc油耗隨著引擎的cc數遞減,所以在業務銷售及行銷規劃如下

  1. 1200cc-2000cc需加入渦輪增壓,以增加動力吸引年輕族群及偶而熱血的族群。
  2. 2500cc-3500cc油耗表現穩定,加強內裝、舒適性、空間為主以吸引中產階級客群。
  3. 3500-5800cc油耗表現隨著引擎的大小有遞減的現象加上稅金因素,建議在此次開發案中剔除。

總裁說,小朋友表現不錯喔...將業務部的銷售規劃和行銷部的族群鎖定都明確地說出,此時,我看到業務部總監頭有點下垂,行銷部的大姐姐狠狠地看著我。

會議結束...行銷部的姊姊跑過跟我的主管撂狠話,你們資訊部每次資料都準備不充足,跟你講的分析也沒做,每次都需要我們行銷部幫你們打圓場,我的主管一直打躬坐儀,走的時候還看我一眼,此時我的主管跟我說你得罪人了,你的話怎麼這麼多,我們部門以後要如何是好。

我心想不是你們叫我說的麼?不說有事!說了也有事!

我未來會如何....行銷部的姊姊會放過我嗎?未完待續...........................


上一篇
ggplot2探討車子油耗表現之一
下一篇
geom_bar()函式的秘密
系列文
使用R進行探索式資料分析之初探30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言