iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
Google Developers Machine Learning

Machine Learning Day30 系列

開啟30天學習Google Developers Machine Learning的旅程

參賽天數 13 天 | 共 26 篇文章 | 44 人訂閱 訂閱系列文 RSS系列文
DAY 11

[Day11]Google提供的API

你有用過Google Translate的拍照翻譯功能嗎?看似神奇的功能,其實包含很多技術在裡面,首先,手機要先「辨識出標誌」,再透過OCR(optical c...

2019-09-27 ‧ 由 may1005 分享
DAY 12

[Day12]訓練模型-避免overfit

當我們做完特徵工程,判斷資料適合的模型後,進行訓練的同時,要記得避免overfitting。 Overfit vs Underfit Overfit : Tr...

2019-09-28 ‧ 由 may1005 分享
DAY 13

[Day13]特徵工程介紹

為什麼要做特徵工程呢?特徵工程是什麼?特徵工程怎麼做? 特徵工程 參考機器學習馬拉松 017 特徵工程簡介說明,例如在時間管理中,如何將事情排列優先順序,我們可...

2019-09-29 ‧ 由 may1005 分享
DAY 13

[Day14] 數據前處理EDA

補一下特徵工程前的EDA,探索式資料分析(EDA)進行數據分析流程,資料來源機器學習百日馬拉松。 什麼是EDA 範例 前處理 資料讀取 格式調整 填補缺值...

2019-10-01 ‧ 由 may1005 分享
DAY 13

[Day15] 特徵工程-資料類型處理

特徵工程的資料類型有包含三種,數值型、類別型、時間型,需要進行填補空值、特徵處理等,以下來源參考機器學習百日馬拉松。 數值型 數值型資料,除了填補缺值和去除離群...

2019-10-01 ‧ 由 may1005 分享
DAY 13

[Day16] 特徵工程-處理方法

特徵工程的處理方法有以下三種,特徵組合、特徵篩選和特徵評估,資料來源參考機器學習百日馬拉松。 特徵組合 數值與數值 在計程⾞費預估中,有四個欄位分別表示起終點的...

2019-10-02 ‧ 由 may1005 分享
DAY 13

[Day17] 機器學習三步驟

流程漸漸來到了中段,開始進行機器學習三步驟,分別為「選擇模型」、「評估模型」、「最佳參數」。 1. 選擇模型 一個模型中會有「許多參數」 不同參數的模型就會產...

2019-10-12 ‧ 由 may1005 分享
DAY 13

[Day18] 資料切分方法

通常想找一個Model的variance夠小和bias夠小,達到一個trade-off(平衡),如此可得到最小的testing error。 參考影片ML L...

2019-10-12 ‧ 由 may1005 分享
DAY 13

[Day19] 線性迴歸VS羅吉斯迴歸

雖然同為迴歸模型,但是兩模型處理的問題並不同,線性迴歸處理目標值為「數值型」,羅吉斯迴歸處理目標值為「類別型」。 線性 羅吉斯 Meaning...

2019-10-13 ‧ 由 may1005 分享
DAY 13

[Day20] Lasso 和 Ridge 正規化回歸

Lasso 為 Linear Regression 加上 L1,Ridge 為 Linear Regression 加上 L2,正則化函數是⽤來衡量模型的複雜度...

2019-10-13 ‧ 由 may1005 分享