以Courser 課程 How to Win a Data Science Competition: Learn from Top Kagglers
How to Win a Data Science Competition: Learn from Top Kagglers, 學習如何贏得資料分析競賽.
Extensions and generalization :4 種資料狀態的處理 回歸與多類別中進行 Mean encoding 多對多關係的運用 時間序列...
這一小段主要是說明 Hyperparameter / 超參數 1. Hyperparameter tuning / 調校超參數 2. Hyperparamete...
Tree beased models GBDT: XGBoost, LightGBM, CatBoost RandomForest/ExtraTrees...
Neural nets – Pytorch, Tensorflow, Keras... Linear models – SVM, logistic regres...
tSNE 介紹 : tSNE 非線性降維, 用在非監督問題類類型中, 流形還原的意義是將高維度上相近的點,對應到低維度上相近的點,盡量保持資料點之間的遠近關係...
Exmined ensem methods Averaging(or blending) Weighted averaging Conditional ave...
Boosting / 提升法 定義 提升法是把之前的預測透過權重或殘差整合成一個綜合模型的方法, 厲害的 XGBoost, LightGBM 跟 H2O's...
Stacking / 堆疊 定義 上2篇把預測結果混合以提升泛化效能(也可以是加強Robustness魯棒性), 本篇 Stacking 開始, 講的是改以先...
Stacknet 定義 瑪博(Marios Michailidis)大神級的參賽紀錄, 昨天查還是全世界排名第五名, 根據搜尋到的文章, 瑪博用Java開發了...
由各個課程講師提供參賽各階段的心法 1. 選擇比賽, 瞭解 Kaggle 的類別 --- 作者自己整理 2. Before you enter a compet...