iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

跟top kaggler學習如何贏得資料分析競賽 系列

以Courser 課程 How to Win a Data Science Competition: Learn from Top Kagglers
How to Win a Data Science Competition: Learn from Top Kagglers, 學習如何贏得資料分析競賽.

鐵人鍊成 | 共 30 篇文章 | 21 人訂閱 訂閱系列文 RSS系列文
DAY 1

[Day 1] 跟top kaggler學習如何贏得資料分析競賽 - 4周主題架構

為什麼選這個主題? 學習來源是 coursera 的一群年輕人在前 top 1 kaggler Alexander Djakonov 教導 ML 跟 kaggl...

2019-09-02 ‧ 由 madeleine 分享
DAY 2

[Day 2] kaggle網站重點/ 規劃 pipeline

kaggle網站重點 Data : 資料的區塊有兩個重點, description 跟 rules 要研讀清楚, 尤其是 rulesModel : 建模要發揮最...

2019-09-03 ‧ 由 madeleine 分享
DAY 3

[Day 3] 特徵預處理及生成 Feature Preprocessing and Generation (Numeric Features) - 1/2

預處理分成 tree-based models 跟 non-tree-based models, 他們長得不一樣, 視覺識別可用 tree-based mode...

2019-09-04 ‧ 由 madeleine 分享
DAY 4

[Day 4] 特徵預處理及生成 Feature Preprocessing and Generation (Ordinal Feature, Categorical Feature)-2/2

2. Ordinal Feature 回到 Titanic dataset, 無庸置疑 三個features 'sex, cabin, embarked' 都是...

2019-09-05 ‧ 由 madeleine 分享
DAY 5

[Day 5] Datetime Feature 與 Coordinate Feature (座標)

Datetime Feature 1. 週期性 - 週間星期或月, 季, 年, 秒, 分, 時等, 特別是規律性的 pattern2. 自特定(事件/活動)時間...

2019-09-06 ‧ 由 madeleine 分享
DAY 6

[Day 6] bag of words / BOW 詞袋

從文字或影像提取特徵 Feature extraction from texts, images純 Text 競賽: Allen AI challenge純 I...

2019-09-07 ‧ 由 madeleine 分享
DAY 7

[Day 7] Word2vec, CNN

week 1 是 亞歷珊卓主講, 看了一個禮拜, 一次又一次反覆的看著, 聽者俄式英文加上不僅神似 NPH (Neil Patrick Harris in ho...

2019-09-08 ‧ 由 madeleine 分享
DAY 8

[Day 8] EDA / Exploratory Data Analysis

第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...

2019-09-09 ‧ 由 madeleine 分享
DAY 9

[Day 9] Anonymized data 匿名資料

Anonymized data 匿名是保護資料免於用來找出真實資料的一種模式, 例如雜湊 hash 處理較敏感或機密的資料, 參賽者可透過合法的方式解匿名, 例...

2019-09-10 ‧ 由 madeleine 分享
DAY 10

[Day 10] Visualizations / 視覺化

先說點時事, 今天凌晨有 iPhone 11 發表會, 為了 AI 有新增一個 Core ML 庫可讓開發者調用. 回到 kaggle 比賽的準備. EDA 是...

2019-09-11 ‧ 由 madeleine 分享