今天上課,接觸到了R的繪圖功能。
今晚,我上網抓找到了Diamond類似的資料,那..... 就來練習看看吧!
資料匯入的部分問題不大,就不特別介紹了。欄位的部分,除了4C之外,還有Table,x,y,z這些資料,我上網查了一下,https://www.diamonds.pro/education/diamond-depth-and-table/ 這一篇介紹了table,還有圖呢!至於x,y,z.....就當作是神秘檔案,先略過好了,哈哈哈!
第一件事,就是先來一張散佈圖(散點圖),把Carat當成欄位資料、Price當成列的資料。再把Tableau自動加總的功能拿掉,完成。一開始都是醜醜的,來上個妝吧!
化妝,順便畫上趨勢線。重量Carat與價格Price呈現正相關,讚。
比較不同顏色等級,在分級上,字母越前面的價格應該越高,但是顏色E的線條低於顏色D與顏色F,可能要進一步分析去是因為「資料量」的關係?還是,其他因素造成的?
既然這樣,我們來一張不同視角的。把盒鬚圖(BOX)跟點狀圖合在一起。從這個視角以及回歸分析的線圖來看,顏色E的價格確實偏低。
沒關係,我們來一張,4C合在一起的圖,看能不能看出甚麼。把Clarity拉到欄,把Cut拉到列。
從下圖看來,顏色E的資料中,在Cut ideal這個等級中,四個Clarity的價格表現偏低。這個數據是另一個key,值得在深入挖掘與分析。
恩..... 我再想想怎麼進一步分析好了。