第 11 屆 iThome 鐵人賽

DAY 5

Google Developers Machine Learning

30天鍊成機器學習系列第 5 篇

梯度下降

11th鐵人賽

Tony.Ko

2019-09-20 22:41:46

1509 瀏覽

分享至

很多機器學習算法最後都被歸納為求解最佳化問題。在各種最佳化問題裡，梯度下降法是最簡單也最常見的一種，因此在深度學習的訓練中被廣為廣用。

最佳化問題

實際應用遇到的問題多半都是多元函數，梯度是導數對多元函數的推廣，它是多元函數對各個自變量偏微分形成的向量。

多元函數的梯度定義為

可微函數在某一點存在極值的必要條件是梯度為0，梯度為0的點稱為函數的鞍點，不過梯度為0只是函數取極值的必要非充分條件，也就是梯度為0的點可能不是極值點。

我們可能會想，那麼直接求出函數的梯度函數，然後令梯度為0去解方程式，不就找到最佳化問題的答案了嗎？
理論上是這樣，但是我們會遇到另外一個問題，就是梯度函數可能很難求解。

因此我們只能用另外一個方法，用數值計算的方式求近似解，不斷的疊代，直到所求收斂到極值為止。

舉個例子來說明數值計算的過程，首先我們假設一個常數學習率：移動的步長 η

步驟一：隨機選取一個w^0作為起點
步驟二：計算梯度，根據梯度來作為移動方向的依據，大於0向右走，小於0向左走。
步驟三：每次移動的距離為學習率的大小
重覆步驟2和3，直到抵達極值為止。

代價函數

正規方程 Normal Equation

系列文

30天鍊成機器學習共 30 篇

RSS系列文訂閱系列文

16 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22207 篇

完賽人數

600 人

從紅隊角度看零信任資安

零信任資安講堂 |

28 分

TS-855X：Intel Atom C5125 八核心 10GbE NAS，內建雙 M.2 NVMe SSD 及 PCIe Gen 3 插槽，大容量混合式儲存架構適合中小企業備份及監控應用

QNAP Systems, Inc. |

23 分

Advanced Email Security與沙箱技術大翻盤，沙箱 ≠ 黑箱！

IT EXPLAINED |

35 分

生成式AI如何重塑開發生產力的關鍵心法

Hello World Dev Conference |

57 分

如何同時達到零信任與資安建設的簡化

零信任資安講堂 |

42 分

加速驅動科學分析，突破數據價值 — HP x NVIDIA 資料科學應用研討會

IT EXPLAINED |

41 分

國軍醫院 DevOps 的第一哩路到最後一哩，以國軍高雄總醫院為例

DevOpsDays |

38 分

迎接數據時代，完整邊緣運算方案加速企業創新轉型

IT EXPLAINED |

37 分

Pact 合約測試 - 確保微服務架構溝通的可靠性

Hello World Dev Conference |

36 分

電信業 Sustainable IT 數位永續雙軸轉型實務與趨勢

數位永續高峰會 |

33 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

30天鍊成機器學習系列 第 5 篇

梯度下降

最佳化問題

尚未有邦友留言

標記使用者

30天鍊成機器學習系列第 5 篇