iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

跟top kaggler學習如何贏得資料分析競賽 系列

以Courser 課程 How to Win a Data Science Competition: Learn from Top Kagglers
How to Win a Data Science Competition: Learn from Top Kagglers, 學習如何贏得資料分析競賽.

鐵人鍊成 | 共 30 篇文章 | 21 人訂閱 訂閱系列文 RSS系列文
DAY 11

[Day 11] 資料清理及補充資料連結 / Dataset cleaning and additional materials and links

Dataset cleaning Constant features 重複特徵 Duplicated features Constant features...

2019-09-12 ‧ 由 madeleine 分享
DAY 12

[Day 12] Validation / 驗證 - Part I

Validation / 驗證 了解驗證和 overfitting 過度擬合的概念 確定應進行的分割數以建立穩定的驗證 用在比賽中進行訓練/測試分割的最常用方...

2019-09-13 ‧ 由 madeleine 分享
DAY 13

[Day 13] Validation / 驗證 - Part II

Validation strategy . Holdout. K-fold. LOO / Leave-one-out Holdout : 比較像是切割資料後分作...

2019-09-14 ‧ 由 madeleine 分享
DAY 14

[Day 14] 以 Springleaf competition 實作 EDA

步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...

2019-09-15 ‧ 由 madeleine 分享
DAY 15

[Day 15] Metrics / 評估指標 - Regression metrics

其實應該先解釋 confusion matrix, 但是這是速成班, 下週再找日期來補. 從線性迴歸跟類別型兩大類來看Metrics / 評估指標. Regre...

2019-09-16 ‧ 由 madeleine 分享
DAY 16

[Day 16] Metrics / 評估指標 - Calssification

代號說明 soft label 柔性標記 - 自 Well-Trained 模型蒸餾出有用的知識hard label 剛性標記 - 傳統 1 或 0 表示法...

2019-09-17 ‧ 由 madeleine 分享
DAY 17

[Day 17] Metrics optimization / 評估指標最佳化 - Regression

一樣是從從線性迴歸跟類別型兩大類來看Metrics optimization/ 評估指標最佳化 Regression RMSE, MSE, R-squared...

2019-09-18 ‧ 由 madeleine 分享
DAY 18

[Day 18] Metrics optimization / 評估指標最佳化 - Classification

Loss function 損失函數的作用是算預測值f(x)跟真實值y差異程度的表現 Logloss 對數損失函數/交叉熵損失 .Tree-based XGBo...

2019-09-19 ‧ 由 madeleine 分享
DAY 19

[Day 19] HW/ SW

在 HW hardware, SW Software 準備上除了照片/影像要用到好幾G, 其他不會用到太多容量 1. RAM 64G 或 128G 2. 多核...

2019-09-20 ‧ 由 madeleine 分享
DAY 20

[Day 20] Regularization 正規化 - part I

Regularization 正規化定義 插播一下林軒田老師對正規化(Regularization)的想法,就是 overfitting 發生時,有可能是因為訓...

2019-09-21 ‧ 由 madeleine 分享