誒,這不是之前就寫過了嗎?不是的!!如果說之前AI&Data得主是訴說感知器到Transformer的深度,這系列文章就是從不會Python到寫Kaggle的廣度,因為看過太多小夥伴想入門卻一開始不會用Python感到挫折,我會實際先說一下這三十天我希望帶給大家什麼,從動手學深度學習一書啟發,讓章節清晰連貫,每天開頭先設定今天要達成的目標,結尾也有反思回顧,若需要會有執行結果,而這也是我的學習路程
今日目標 查看資料模樣,並觀察以下三點: 非數值欄位 缺值 欄位是否有重複 看完文章您將學到什麼 知道如何查看資料跟做基本分析 程式撰寫 可以發現訓練集有...
今日目標 昨天知道資料有無缺值跟重複的大致長相,今天回顧一下昨天的基礎分析,跟了解一下欄位間相關性 看完文章您將學到什麼 近一步探究資料間相關性 內文 缺值與重...
今日目標 查看資料欄位相關性,並做出判斷 看完文章您將學到什麼 培養分析資料的能力 實際操作或程式 基礎分析部分: 測試資料集ID都沒重複 測試與訓練資料集也...
今日目標 特徵工程,建模,訓練,預測Part1 接下來是這次練習另一個重頭戲,接下來這三天會是各部份講解,第四天(Day16)會展示三部份的程式碼 今天會先來看...
今日目標 特徵工程,建模,訓練,預測Part2 回答三個問題: 1.這邊要思考一下這麼多缺值每個都需要填補,還是該針對對OOB有幫助的特徵填補? 2.又該怎麼填...
今日目標 特徵工程,建模,訓練,預測Part3 Age欄位的預測 看完文章您將學到什麼 如何處理更多缺失值的欄位 內文 Age缺值在Day13知道有263個,在...
今日目標 撰寫特徵工程,建模,訓練,預測Part1,2,3的程式部分 整合前三天提到的內容,內容會有點長,可以搭配前三天說明服用 看完文章您將學到什麼 如何用P...
今日目標 學習如何產生Kaggle要求格式 看完文章您將學到什麼 如何用Python生成csv,提交Kaggle核可的格式 內文 經過一連串觀察,分析,撰寫,驗...
今日目標 產生CSV並上傳 看完文章您將學到什麼 如何使用Pandas生成符合Kaggle要求格式 內文 還記得Day3提過的Pandas嗎? 之前提到他是數據...
看完文章您將學到什麼 知道集成大致概念 內文 集成 Bagging 關注於降低variance 並行方法的原理是利用基礎學習器之間的獨立性,用在強model...