Day 09 - PyTorch自動計算梯度(autograd)

14th鐵人賽

dengliu2000

2022-09-23 23:54:42

1454 瀏覽

分享至

梯度(gradient)的這個概念對我這個初學來說並不是很容易就能理解,在物理上梯度可以理解成在做一個空間中純量場的數學運算,用來了解純量場隨空間的變化,而數學中我們從梯度下降演算法中可以幫助我們找到函數的極小值.之所以會將梯度下降演算法用在機器學習與深度學習的相關利用中求函數的極小值,主要是因為它能夠透過找近似解的方式去逼近極值.說到找極值的問題,相信不少人都會想到數學上可以利用微分的方式去找,但實際應用與微積分的考試當然不同不會那麼剛好可以找到唯一解的.

Autograd

前幾天我主要是對張量做了很概略的介紹,PyTorch中的張量會記住自己是如何生成的,即產生張量的運算以及母張量為何,並且提供運算對其輸入變數的連鎖導數.也就是我們不必寫出完整的微分式,無論模型的複雜度多高,PyTorch都能自動的幫我們計算參數的梯度.

先定義一個變數(variable)

In:
import torch
from torch.autograd import Variable
tensor = torch.FloatTensor([[1,2,3],[4,5,6]])
variable = Variable(tensor, requires_grad=True)

Out:
tensor([[1., 2., 3.],
        [4., 5., 6.]])
tensor([[1., 2., 3.],
        [4., 5., 6.]], requires_grad=True)

requires_grad 這個設定主要是參不參與反向傳播.

對比張量與變數計算的差異

In:
t_out = torch.mean(tensor*tensor*tensor)  # x^3
v_out = torch.mean(variable*variable*variable)  # x^3
print(t_out)
print(v_out)

Out:
tensor(73.5000)
tensor(73.5000, grad_fn=<MeanBackward0>)

到這裡為止的tensor與variable看不出有何不同.但事實上變數計算時,PyTorch中autograd的底層採用了計算圖,計算圖是用於紀錄運算子與變數之間的關係,一般用矩形表示運算子,橢圓形表示變數.

圖片來源:https://www.qikegu.com/docs/4201

v_out = torch.mean(variable * variable * variable) 就是在計算圖中添加的一個計算步驟,計算誤差反向傳播,以下用程式碼做舉例:

In:
v_out.backward()
print(variable.grad)

Out:
tensor([[ 0.5000,  2.0000,  4.5000],
        [ 8.0000, 12.5000, 18.0000]])

參考資料:

Day 08 - 將張量轉移至GPU

Day 10 - 激勵函數(Activation Function)介紹

系列文

【30天之新手學習筆記】PyTorch 共 30 篇

RSS系列文訂閱系列文

5 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22209 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

【30天之新手學習筆記】PyTorch系列 第 9 篇

Day 09 - PyTorch自動計算梯度(autograd)

Autograd

參考資料:

尚未有邦友留言

標記使用者

【30天之新手學習筆記】PyTorch系列第 9 篇