iT邦幫忙

2022 iThome 鐵人賽

DAY 3
0
自我挑戰組

商業數據分析應用系列 第 3

[Day3] 資料的選擇及初步數據觀察

  • 分享至 

  • xImage
  •  

這次想練習可觀察時間趨勢的數據資料,在Kaggle上鎖定幾個開放資料集,取捨後決定使用:
Case Study Bike-Share Company's 12 months data
是一個在美國芝加哥提供腳踏車租賃服務公司的數據 (csv檔案)
他以季來更新的,所以目前只有2020 Q1的資料(不過我覺得蠻夠我自己用的xd)
選擇主要原因是因為他的時間相對其他資料來得近,感覺可以從中獲得些什麼想法。

資料集的提供者非常好心的附上了他對於數據的看法。
對於想練習的我當然是先略過不看xd 到時候分析結果出來時可以做為比對用個人覺得挺好的。

回到資料集的本身,先來觀察每個欄位所代表的意義。
本資料共有15個欄位,分別代表以下內容:

  1. ride_id: 使用者ID
  2. rideable_type: 租借類型(此份資料中只有一種docked_bike)
  3. started_at: 租借日期與時間
  4. ended_at: 租還日期與時間
  5. start_station_name: 租借站點名稱
  6. start_station_id: 租借站點ID
  7. end_station_name: 租還站點名稱
  8. end_station_id: 租還站點ID
  9. start_lat: 租借站點緯度
  10. start_lng: 租借站點經度
  11. end_lat: 租還站點緯度
  12. end_lng: 租還站點經度
  13. member_casual: 會員/非會員
  14. ride_length: 騎乘時間
  15. day_of_the_week: 於星期幾租借

這份資料可以帶來什麼?

對資料有初步概念後,就該來思考這個資料可以解決什麼樣的問題、可能可以用在哪些決策上。
「定義問題」是開始分析前很重要的工作,聽過不少資料工作者分享在分析前與使用者的來回討論是一大工程。
並不是埋著頭苦清理資料最後發現與使用者需求不符。
根據不同部門可能會有多元方向的業務需求,比如:業務部追求業績成長以及轉換率(廣告點擊>購買, 加入購物車>購買...)、行銷部門一樣追求轉換率,但可能看的是宣傳導流到官網或是參與率等等。

在資料集的前情提要中,作者有提到本次目標是希望新客能夠轉成為會員,就這個需求進行以下初步的延伸:

  • 行銷方面
  1. 找出最熱門租借時間(時間點/DOW),於冷/熱門時段推出針對會員專屬之類的優惠活動,提升加入會員慾望
  2. 計算平均騎乘時間並包裝成行銷活動,搭配健康議題做為主題,例如:騎越久省越多
  • 產品服務方面
  1. 重複/不重複使用者(會員/非會員)
  2. 站點密度(在站與站之間是否有可增設的站點)
  3. 計算人流多的站點,在符合效益下增設車輛數目以維持服務品質

以上是非常粗淺的初步評估,來看看過了一夜之後會不會有新的想法xd
明天見!


上一篇
[Day2] 資料故事與敘事結構
下一篇
[Day4]資料載入
系列文
商業數據分析應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言