先備知識:
基本python能力 :
熟悉各基本型態,認識串列、字典、函式、class
了解深度學習原理:
需要具有深度學習的基本知識,那需要到什麼程度呢?
基本上只要看懂李宏毅老師在youtube的Machine Learning (2021) Mandarin Version這播放清單的前8部影片
依照下列順序介紹各套件:
numpy:
認識多維資料及各numpy方法,有利於之後操作pandas的DataFrame。
pandas:
大部分的資料都會使用此套件來操作,檢視資料狀況、資料型態轉換,補充缺失直、範圍切割等。
seaborn:
資料視覺化的強大套件,與pandas配合起來便利又輕鬆,pandas與seaborn的相互操作非常有利於我們對於資料的探勘。
sklearn
在此套件裡提供了許多資料前處理方法及機器學習套件,本篇注重於如何使用sklearn的資料前處理方法,如果30day我寫到沒東西可以寫了,將利用剩餘天數介紹如何使用sklearn機器學習套件,例:SVM、隨機森林、決策樹、clustering等
pytorch
深度學習套件,不多說了 哼~
最後專案實際操作:
最後帶領大家使用以上所學 實際操作Kaggle Titanic 進入排名前5%
作者的話:
第一次參加IT鐵人賽,將盡可能的分享我所學知識
本人依舊還在學習階段,過程可能會有錯誤資訊請多多包涵