以Courser 課程 How to Win a Data Science Competition: Learn from Top Kagglers
How to Win a Data Science Competition: Learn from Top Kagglers, 學習如何贏得資料分析競賽.
Dataset cleaning Constant features 重複特徵 Duplicated features Constant features...
Validation / 驗證 了解驗證和 overfitting 過度擬合的概念 確定應進行的分割數以建立穩定的驗證 用在比賽中進行訓練/測試分割的最常用方...
Validation strategy . Holdout. K-fold. LOO / Leave-one-out Holdout : 比較像是切割資料後分作...
步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...
其實應該先解釋 confusion matrix, 但是這是速成班, 下週再找日期來補. 從線性迴歸跟類別型兩大類來看Metrics / 評估指標. Regre...
代號說明 soft label 柔性標記 - 自 Well-Trained 模型蒸餾出有用的知識hard label 剛性標記 - 傳統 1 或 0 表示法...
一樣是從從線性迴歸跟類別型兩大類來看Metrics optimization/ 評估指標最佳化 Regression RMSE, MSE, R-squared...
Loss function 損失函數的作用是算預測值f(x)跟真實值y差異程度的表現 Logloss 對數損失函數/交叉熵損失 .Tree-based XGBo...
在 HW hardware, SW Software 準備上除了照片/影像要用到好幾G, 其他不會用到太多容量 1. RAM 64G 或 128G 2. 多核...
Regularization 正規化定義 插播一下林軒田老師對正規化(Regularization)的想法,就是 overfitting 發生時,有可能是因為訓...