iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

Python機器學習介紹與實戰 系列

由基礎的環境建置教學到簡單解釋機器學習
並使用kaggle上的資料集帶領讀者實戰
並結合團隊的專案將實做結果呈現於網頁

鐵人鍊成 | 共 30 篇文章 | 53 人訂閱 訂閱系列文 RSS系列文 團隊Bikini Bottom
DAY 21

DAY[21]-Kaggle實戰 補值與特徵新增(1)

在上次的處理中尚未除去明顯的極端值,因此這次我們針對面積超過一定程度的資料進行刪除。 train = train[train.GrLivArea < 45...

2019-10-06 ‧ 由 Austin 分享
DAY 22

DAY[22]-Kaggle實戰 補值與特徵新增(2)

延續上一次的補值,在特殊的行當中,我們可以從行本身的意義判斷出應該補的值,例如當車庫的屬性為空值,可能原因就是該棟房子並沒有車庫,因此這些相關的面積等等資訊都可...

2019-10-07 ‧ 由 Austin 分享
DAY 23

DAY[23]-Kaggle實戰 特徵轉換

特徵調整 在這裡要使用一個較特殊的運算叫做boxcox,boxcox1p則是加上1之後才做boxcox避免過程中出現錯誤,boxcox的公式如下。 做完這個轉換...

2019-10-08 ‧ 由 Austin 分享
DAY 24

DAY[24]-Kaggle實戰 特徵新增

新增特徵 本篇文章將特徵之間的關係做一個簡單的連結並產生新的特徵,產生新特徵這個動作在連結不同要素的影響時是很重要的,例如同時購買a與b一個特徵,以及買a、買b...

2019-10-09 ‧ 由 Austin 分享
DAY 25

DAY[25]-Kaggle實戰 特徵處理(2)

將特徵都整理的差不多之後,由於當初我們合併了Train以及Test兩個資料集,要在最後將原先的資料切割開,並簡單處理一下離群值。 # y為測試集 X = fin...

2019-10-10 ‧ 由 Austin 分享
DAY 26

DAY[26]-Kaggle實戰 模型準備-線性模型

資料的部分準備完畢之後,接下來最重要的就是模型的產生以及訓練了,在這裡我們先定義了線性模型的交叉驗證以及參數組合,方便之後進行使用。定義交叉驗證評分函數 imp...

2019-10-11 ‧ 由 Austin 分享
DAY 27

DAY[27]-Kaggle實戰 Boosting模型與Stacking

生成這些Boosting模型時,參數已經調整過,若是對調整超參數有其他想法也可以使用第16天的超參數調整哦! from sklearn.ensemble imp...

2019-10-12 ‧ 由 Austin 分享
DAY 28

DAY[28]-Kaggle實戰 模型預測與答案輸出

訓練模型 print('START Fit') print('stack_gen') stack_gen_model = stack_gen.fit(np.a...

2019-10-13 ‧ 由 Austin 分享
DAY 29

DAY[29]-網頁的資料傳送

結束了機器學習的部分之後,接下來要與其他團隊夥伴進行連結,在我的部分主要是負責處理資料以及傳送資料至後端提供前端做呈現。在這裡,傳送資料的步驟可以使用pytho...

2019-10-14 ‧ 由 Austin 分享
DAY 30

DAY[30]-機器學習介紹與實戰-心得

實戰完整程式碼不知不覺就經過了30天的文章考驗,剛開始的幾天較有餘裕,文章的質量也比較高一些,但之後隨著比賽以及開學的上課時間影響,文章質量有所下降,對讀者還是...

2019-10-15 ‧ 由 Austin 分享