不知不覺,已經來到了第十天,資料處理的完結篇。
此篇文是由 Joyce 所撰寫
Series | 大綱 | 內容 |
---|---|---|
1、2 | Python分析函數庫 | NumPy、Pandas |
3、4 | Python繪圖函數庫 | Matplotlib、Seaborn |
5 | 資料總類 | 四種量尺 |
6、7、8 | 資料前處理 | EDA、特徵工程、時間轉換 |
9 | 實戰演練 | 波士頓房價 |
10 | 完賽 | 心得 |
十天的內容說多好像也不多,說很深好像也還好,因為這些都是學習數據處理中的一小步而已。希望大家能透過這十篇的內容學習到一些知識,並能在未來的領域上學以致用。
選擇這十篇的內容介紹是因為之前我們團隊參加的比賽,需要處理大量數據,因此我們是必然需要先有這些工具,才能分析結果。但是對我而言,我沒有接觸過這些,或者說接觸過,但並沒有全面了解,都是東湊西湊,湊出一個不懂的程式碼去執行,所以想說藉著這個機會讓自己,也讓需要分析數據的夥伴們一起了解這些工具。在上個比賽,持續進行兩個月,每個禮拜會有一個題目,按答對率給予積分,採取積分制,內容從資料分析,翻譯到影像辨識都有,涉及的範圍很廣,我們有些範圍完全沒有接觸過,也不知道,更在某次比賽因為對時間資料不熟,而花費大量時間。也正因為這樣,誕生出第八篇文。
我的部分算是小小的完賽啦~ 剩下的部分就是 Justin 來接手了。這十天因為要寫文章也學到很多不一樣的東西,也謝謝各位的支持,後面的機器學習會更精彩,這十天的內容都是為了讓大家可以熟悉這些工具,並應用在後面學習到的知識!