Dataset cleaning Constant features 重複特徵 Duplicated features Constant features...
先說點時事, 今天凌晨有 iPhone 11 發表會, 為了 AI 有新增一個 Core ML 庫可讓開發者調用. 回到 kaggle 比賽的準備. EDA 是...
Anonymized data 匿名是保護資料免於用來找出真實資料的一種模式, 例如雜湊 hash 處理較敏感或機密的資料, 參賽者可透過合法的方式解匿名, 例...
第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...
week 1 是 亞歷珊卓主講, 看了一個禮拜, 一次又一次反覆的看著, 聽者俄式英文加上不僅神似 NPH (Neil Patrick Harris in ho...
從文字或影像提取特徵 Feature extraction from texts, images純 Text 競賽: Allen AI challenge純 I...
Datetime Feature 1. 週期性 - 週間星期或月, 季, 年, 秒, 分, 時等, 特別是規律性的 pattern2. 自特定(事件/活動)時間...
2. Ordinal Feature 回到 Titanic dataset, 無庸置疑 三個features 'sex, cabin, embarked' 都是...
kaggle網站重點 Data : 資料的區塊有兩個重點, description 跟 rules 要研讀清楚, 尤其是 rulesModel : 建模要發揮最...
為什麼選這個主題? 學習來源是 coursera 的一群年輕人在前 top 1 kaggler Alexander Djakonov 教導 ML 跟 kaggl...