iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 10
1
AI & Data

掌握資料分析之美:就用Tableau來說故事吧!系列 第 10

故事十:把RFM模型的概念套用到新冠肺炎的數據上吧!

  • 分享至 

  • xImage
  •  

  
  第十天了,今天想要學習三組數據結合之後可以帶給我們什麼樣的訊息?三組數據,就資料分析這個領域來說,馬上就會想到鼎鼎大名的RFM模型。
  RFM是根據廣大客戶(消費者)的消費行為以進行分析,就這次手邊的數據來說,國家資料「Countries And Territories」跟廣大客戶的性質很接近,而「Cumulative number for 14 days of COVID-19 cases per 100000」、「Cases」和「Deaths」這三組數據個別的「總和」可以當作這次資料分析的RFM。我們可以這樣的基礎假設下,開始進行吧!
  
  先「建立導出欄位」,把「Cases」的「總和」算出來。公式如下:
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724n33wY7bQxB.png
  「Cumulative number for 14 days of COVID-19 cases per 100000」和「Deaths」的作法與上面公式相同,這邊就不特別貼圖上來了。大家可以自行試試看。 ^_^
  
  接下來,我們把資料分成以20%為一個區間,分別給出1~5分。(Tips : 在這邊,我會把最嚴重的設定為1分,不嚴重的設定為5分)
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724vXpJgvLZrh.png

  其他兩組公式的計算,可以比照辦理。
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724jrnVwTie34.png
  
  哈哈哈!「拖-拉-放」之後,畫出一個都是ABC的圖表.....
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724D5ZevVc0Pa.png
  
  
  原來,我們還沒有把前面公式中 FIXED 欄位的值告訴 Tableau。現在,我們再來創造一個「國家清單」的資料出來。然後拉到「標記」的地方。(Tips : 從解說與範例來看,這個公式很適合把「國家清單」找出來。)
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724gBhifwkt6V.png
  
  接下來就是要調整調整。把「國家清單」設定為「顏色」標記之後,「醒目提示表」就可以選取了,隨後再改成自己喜歡的顏色。完成。
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724I0GiRQiGYU.png
  
  從這個圖表上來看,在210個國家中,有 14 個國家還挺嚴重的「1-1-1」。需要重點觀察。
  可是,我們怎麼知道是哪幾個國家呢?其實還挺直覺的,把「Countries And Territories」拉到Y軸上就可以了哦!
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724bTQ4Lswwif.png
  
  把兩張工作表合在一起看,是不是有了不一樣的感覺呢!
  https://ithelp.ithome.com.tw/upload/images/20200925/20130724QjQ3XFsiL3.png
  
  趕緊下個結論吧!今天將三組資料透過RFM的手法,確實增加了很多「待觀察名單」。不過,這次的實作還是以練習為主,就不特別分析了,因為「Cumulative number for 14 days of COVID-19 cases per 100000」這個數據跟「Cases」這個數據的關聯性太大,在分析上容易產生誤區。不過,RFM模型的思維與應用還是很有研究價值的,當然,有幾個方向是可以考慮,以便進一步改善:
  1. 改變分組的間隔大小。好比說,分成7組,或是分成2組,重建Matrix。
  2. 改變時間週期。今天這邊的實作是「全部加總」,我們也可以只觀察「最近一週」或是「最近一個月」的結果。
  3. 找出更有意義的數據組合。「Cases」和「Deaths」很有代表性,但是「Cumulative number for 14 days of COVID-19 cases per 100000」就有點重複的感覺。或許可以改成,「每日新增確診人數」。這樣的分析,應該會很精彩。
  
  看來,公式的應用機會越來越多了..... 我再好好研究研究,安排安排接下來的學習地圖。 ^_^


上一篇
故事九:今天就來實作散點圖(XY散佈圖)吧!
下一篇
故事十一:成果驗收,來說個資料故事吧!
系列文
掌握資料分析之美:就用Tableau來說故事吧!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言