不管是問卷分析還是在看用戶的使用資料,都充斥著許多密密麻麻的資料,這些值化的資料最後都會轉換成量化的資料,幫助產品經理做決策時參考,因此今天要來分享非常重要的 數據分析。
在開始把資料量化前,產品經理一定都會先釐清此次執行的目的是什麼,例如想了解學生族群最常通勤的時段,或是飲料店最常爆炸的尖峰時段等。
整體執行流程如下圖,執行順序為由左到右,每步驟內容後面會詳細說明。
一、檢查資料
如果有過自己撈資料的經驗,通常raw data都不會太乾淨XD,需要另外檢查是否有詭異的值存在,不然最後的分析結果會產生偏誤。
關於檢查的方式,較直覺有以下三種做法可以參考:
考慮現實世界,例如:異常的時間
考慮欄位特性,例如:金額欄位不該有小數位、必填欄位有空值
考慮分佈方式,例如:平均銷售金額是否某月異常高或異常低
二、確定資料來源
需要確認此份數據是從哪裡來的,哪個時間點產生的,確保資料的可靠性,因為並非所有數據來源都是自己從公司內部撈出來,有時候可能是別的部門提供的數據資料或問卷結果。
另外,若是抽樣資料,需要考慮是否存在抽樣偏誤,若有偏誤的存在需要進一步評估此偏誤影響大小,避免分析結果落差太大。
三、理解資料定義
資料內總是有五花八門的欄位,需要清楚理解每個欄位的定義,避免理解錯誤欄位影響後續分析方式,畢竟每個人對於字詞的定義不同,下列舉出兩個例子來說明:
平均消費金額計算基礎 -- 算所有店家的平均?算單一店家的平均?
活動出席率計算基礎 -- 遲到3分鐘算出席嗎?遲到30分鐘算出席嗎?活動結束前到算出席嗎?
四、用戶使用脈絡
了解使用者是如何理解與使用此功能或產品,是否有出現理解錯誤的情形,因為這會影響到分析的數據結果,下列分別舉出幾個例子說明:
蝦皮的免運服務,希望可以讓消費者多購買商品,最後卻變成顧客免費的搬家工具。
停車大聲公的APP,多數人以為最常安裝的人會是正駕駛,但若仔細想想,駕駛當下要開車根本無法分心看APP,所以最常安裝的人可能是副駕駛。
分析KOBO每本書的閱讀進度,但仔細想一下KOBO可以下載離線閱讀,因此離線閱讀的進度不會統計回系統內。
五、拆解數據
依據一開始定義的分析目的,從數據中找出有關聯的觀點,並且進行拆解,詳細的作法下列用例子直接說明:
分析註冊率 -- 拆解方式可能是時段、使用裝置、使用者來源
分析離職率 -- 拆解方式可能是部門、年資、升遷
分析活躍用戶 -- 拆解方式可能是活躍時間長度(天數)、常進行的操作行為
分析租屋率 -- 拆解方式可能是租屋人的職業、收入
六、放大鏡檢視
根據前一步拆解出來的數據,整體攤開來看,尋找特別突出的部分,並進一步對該部分放大觀察和研究,找出差異點在哪,參考例子如下:
某月儲值金特別高,進一步去看使用者儲值後的行為是什麼,大家是否有共通性。
七、因果關係
進行沙盤推演,找出前因後果,參考例子如下:
facebook的新用戶註冊後,10天內新增7個好友,新用戶有持續使用超過一個月以上,表示新用戶因為加了新的好友,所以使用facebook的時間拉長了。
八、產生指標
指標的重點在於數字的增加或減少,能夠反映該事情是否作對,一般來說沒有絕對的正確性,參考例子如下:
CPR 獲取一個顧客平均成本。
另外,很多時候在做問卷時都會發送禮物給填答者,需要注意此行為是否會造成偏誤,因此建議每次的禮物品質都要相同,讓比較基準都在同個水平上。
比較
一般來說,無法直接對數值的結果做比較或評論,需要有一個比較基準,才能作出較據說服力的判斷,參考的例子如下:
法國每年超過7.3億美元的食物操到銷毀,乍聽之下數量很驚人,但若是聽到英國每年是30億美元的食物操到摧毀,瞬間覺得法國是小巫見大巫。
法國去年超過7.3億美元的食物操到銷毀,乍聽之下數量很驚人,但若是聽到過去五年法國每年平均有15億食物被銷毀,瞬間覺得法國去年改變很多。
結語,原本密密麻麻的資料,經過一些加工處理後,最後變成一份很有價值的參考文件或決策依據,真的是件很不可思議的事!