今天將昨天的資料進行轉置與合併,然後開始進行分析資料最麻煩的預處理。
一開始我先將沒有回答一日營業總收入的資料刪除掉,畢竟主要目標就是這個變數了,因此我直接進行處理。
後續還有看一些資料有衝突的部分,例如每日營業時間低於4小時,可是空車時間卻大於12小時。還有的資料是不回答載客方式的後續卻有以無線電等方式進行攬客的回答。因為在學校的時候有學到做問卷調查要特別注意問卷是否有效,像選項有衝突的很可能就是資料有問題,可能是回答問卷的人只是亂寫或是看錯導致回答錯之類的,於是這種有問題的資料我也一併刪除。
今天看這些有問題的資料就快要12點了,因此今天就先這樣了,明天會繼續找影片來研究要開始進行分析了。