這次想練習可觀察時間趨勢的數據資料,在Kaggle上鎖定幾個開放資料集,取捨後決定使用:
Case Study Bike-Share Company's 12 months data
是一個在美國芝加哥提供腳踏車租賃服務公司的數據 (csv檔案)
他以季來更新的,所以目前只有2020 Q1的資料(不過我覺得蠻夠我自己用的xd)
選擇主要原因是因為他的時間相對其他資料來得近,感覺可以從中獲得些什麼想法。
資料集的提供者非常好心的附上了他對於數據的看法。
對於想練習的我當然是先略過不看xd 到時候分析結果出來時可以做為比對用個人覺得挺好的。
回到資料集的本身,先來觀察每個欄位所代表的意義。
本資料共有15個欄位,分別代表以下內容:
對資料有初步概念後,就該來思考這個資料可以解決什麼樣的問題、可能可以用在哪些決策上。
「定義問題」是開始分析前很重要的工作,聽過不少資料工作者分享在分析前與使用者的來回討論是一大工程。
並不是埋著頭苦清理資料最後發現與使用者需求不符。
根據不同部門可能會有多元方向的業務需求,比如:業務部追求業績成長以及轉換率(廣告點擊>購買, 加入購物車>購買...)、行銷部門一樣追求轉換率,但可能看的是宣傳導流到官網或是參與率等等。
在資料集的前情提要中,作者有提到本次目標是希望新客能夠轉成為會員,就這個需求進行以下初步的延伸:
以上是非常粗淺的初步評估,來看看過了一夜之後會不會有新的想法xd
明天見!