iT邦幫忙

鐵人檔案

第 11 屆 iT 邦幫忙鐵人賽
回列表
Google Developers Machine Learning

Machine Learning Day30 系列

開啟30天學習Google Developers Machine Learning的旅程

參賽天數 13 天 | 共 26 篇文章 | 26 人訂閱 訂閱系列文 RSS系列文
DAY 11

[Day11]Google提供的API

你有用過Google Translate的拍照翻譯功能嗎? 看似神奇的功能,其實包含很多技術在裡面, 首先,手機要先「辨識出標誌」, 再透過OCR(optica...

2019-09-27 ‧ 由 may1005 分享
DAY 12

[Day12]訓練模型-避免overfit

當我們做完特徵工程, 判斷資料適合的模型後, 進行訓練的同時,要記得避免overfitting。 Overfit vs Underfit Overfit :...

2019-09-28 ‧ 由 may1005 分享
DAY 13

[Day13]特徵工程介紹

為什麼要做特徵工程呢? 特徵工程是什麼? 特徵工程怎麼做? 特徵工程 參考機器學習馬拉松 017 特徵工程簡介說明, 例如在時間管理中,如何將事情排列優先順序,...

2019-09-29 ‧ 由 may1005 分享
DAY 13

[Day14] 數據前處理EDA

補一下特徵工程前的EDA, 探索式資料分析(EDA)進行數據分析流程, 資料來源機器學習百日馬拉松。 什麼是EDA 範例 前處理 資料讀取 格式調整 填補缺...

2019-10-01 ‧ 由 may1005 分享
DAY 13

[Day15] 特徵工程-資料類型處理

特徵工程的資料類型有包含三種, 數值型、類別型、時間型, 需要進行填補空值、特徵處理等, 以下來源參考機器學習百日馬拉松。 數值型 數值型資料,除了填補缺值和去...

2019-10-01 ‧ 由 may1005 分享
DAY 13

[Day16] 特徵工程-處理方法

特徵工程的處理方法有以下三種, 特徵組合、特徵篩選和特徵評估, 資料來源參考機器學習百日馬拉松。 特徵組合 數值與數值 在計程⾞費預估中,有四個欄位分別表示起終...

2019-10-02 ‧ 由 may1005 分享
DAY 13

[Day17] 機器學習三步驟

流程漸漸來到了中段, 開始進行機器學習三步驟, 分別為「選擇模型」、「評估模型」、「最佳參數」。 1. 選擇模型 一個模型中會有「許多參數」 不同參數的模型就...

2019-10-12 ‧ 由 may1005 分享
DAY 13

[Day18] 資料切分方法

通常想找一個Model的variance夠小和bias夠小, 達到一個trade-off(平衡), 如此可得到最小的testing error。 參考影片ML...

2019-10-12 ‧ 由 may1005 分享
DAY 13

[Day19] 線性迴歸VS羅吉斯迴歸

雖然同為迴歸模型, 但是兩模型處理的問題並不同, 線性迴歸處理目標值為「數值型」, 羅吉斯迴歸處理目標值為「類別型」。 線性 羅吉斯 Meani...

2019-10-13 ‧ 由 may1005 分享
DAY 13

[Day20] Lasso 和 Ridge 正規化回歸

Lasso 為 Linear Regression 加上 L1, Ridge 為 Linear Regression 加上 L2, 正則化函數是⽤來衡量模型的複...

2019-10-13 ‧ 由 may1005 分享