今天開始要努力試著用python進行資料的分析,雖然剩下的時間只有五天了,不過還是得試試看。因為怕找到不適合的資料,因此我是使用別人有成功做出成果的資料,試著利用 Python 來進行分析。
今天的資料來源是政府的資料開放平台,我將借用計程車營運狀況調查來試著分析看看,以下附上網址:
https://data.gov.tw/dataset/6252
在分析資料之前,要先把原始資料進行預處理,因為下載資料的時候有分兩個檔案,一個是原始資料,一個是變數名稱,所以我先將兩個檔案合併,並將變數名稱先進行判讀,其中要拿來分析的變數為 C9-一天營業總收入,還有 C9a-變數C9, 總收入超過3800元之實際值(元)。
因為我還很菜,要使用 python 進行處理會偏難,因此我先使用 excel 進行預處理,我會先進行一些簡易的判斷,將明顯有問題的資料進行刪除或處理,後續的部分才會試著用 python 進行資料的分析。