腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

人工智能學(xué)習(xí)Pytorch梯度下降優(yōu)化示例詳解

更新時(shí)間：2021年11月11日 16:02:16 作者：Swayzzu

這篇文章主要為大家介紹了人工智能學(xué)習(xí)Pytorch梯度下降優(yōu)化示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步早日升職加薪

一、激活函數(shù)

1.Sigmoid函數(shù)

函數(shù)圖像以及表達(dá)式如下：

通過該函數(shù)，可以將輸入的負(fù)無窮到正無窮的輸入壓縮到0-1之間。在x=0的時(shí)候，輸出0.5

通過PyTorch實(shí)現(xiàn)方式如下：

2.Tanh函數(shù)

在RNN中比較常用，由sigmoid函數(shù)變化而來。表達(dá)式以及圖像如下圖所示：

該函數(shù)的取值是-1到1，導(dǎo)數(shù)是：1-Tanh**2。

通過PyTorch的實(shí)現(xiàn)方式如下：

3.ReLU函數(shù)

該函數(shù)可以將輸入小于0的值截?cái)酁?，大于0的值保持不變。因此在小于0的地方導(dǎo)數(shù)為0，大于0的地方導(dǎo)數(shù)為1，因此求導(dǎo)計(jì)算非常方便。

通過PyTorch的實(shí)現(xiàn)方式如下：

二、損失函數(shù)及求導(dǎo)

通常，我們使用mean squared error也就是均方誤差來作為損失函數(shù)。

1.autograd.grad

torch.autograd.grad(loss, [w1,w2,...])

輸入的第一個(gè)是損失函數(shù)，第二個(gè)是參數(shù)的列表，即使只有一個(gè)，也需要加上中括號(hào)。

我們可以直接通過mse_loss的方法，來直接創(chuàng)建損失函數(shù)。

在torch.autograd.grad中輸入損失函數(shù)mse，以及希望求導(dǎo)的對(duì)象[w]，可以直接求導(dǎo)。

注意：我們需要在創(chuàng)建w的時(shí)候，需要添加requires_grad=True，我們才能對(duì)它求導(dǎo)。

也可以通過w.requires_grad_()的方法，為其添加可以求導(dǎo)的屬性。

2.loss.backward()

該方法是直接在損失函數(shù)上面調(diào)用的

這個(gè)方法不會(huì)返回梯度信息，而是將梯度信息保存到了參數(shù)中，直接用w.grad就可以查看。

3.softmax及其求導(dǎo)

該函數(shù)將差距較大的輸入，轉(zhuǎn)換成處于0-1之間的概率，并且所有概率和為1。

對(duì)softmax函數(shù)的求導(dǎo)：

設(shè)輸入是a，通過了softmax輸出的是p

注意：當(dāng)i=j時(shí)，偏導(dǎo)是正的，i != j時(shí)，偏導(dǎo)是負(fù)的。

通過PyTorch實(shí)現(xiàn)方式如下：

三、鏈?zhǔn)椒▌t

1.單層感知機(jī)梯度

單層感知機(jī)其實(shí)就是只有一個(gè)節(jié)點(diǎn)，數(shù)據(jù)*權(quán)重，輸入這個(gè)節(jié)點(diǎn)，經(jīng)過sigmoid函數(shù)轉(zhuǎn)換，得到輸出值。根據(jù)鏈?zhǔn)椒▌t可以求得梯度。

通過PyTorch可以輕松實(shí)現(xiàn)函數(shù)轉(zhuǎn)換以及求導(dǎo)。

2. 多輸出感知機(jī)梯度

輸出值變多了，因此節(jié)點(diǎn)變多了。但求導(dǎo)方式其實(shí)是一樣的。

通過PyTorch實(shí)現(xiàn)求導(dǎo)的方式如下：

3. 中間有隱藏層的求導(dǎo)

中間加了隱藏層，只是調(diào)節(jié)了輸出節(jié)點(diǎn)的輸入內(nèi)容。原本是數(shù)據(jù)直接輸給輸出節(jié)點(diǎn)，現(xiàn)在是中間層的輸出作為輸入，給了輸出節(jié)點(diǎn)。使用PyTorch實(shí)現(xiàn)方式如下：

4.多層感知機(jī)的反向傳播

依舊是通過鏈?zhǔn)椒▌t，每一個(gè)結(jié)點(diǎn)的輸出sigmoid(x)都是下一個(gè)結(jié)點(diǎn)的輸入，因此我們通過前向傳播得到每一個(gè)結(jié)點(diǎn)的sigmoid函數(shù)，以及最終的輸出結(jié)果，算出損失函數(shù)后，即可通過后向傳播依次推算出每一個(gè)結(jié)點(diǎn)每一個(gè)參數(shù)的梯度。

下面的DELTA(k)只是將一部分內(nèi)容統(tǒng)一寫作一個(gè)字母來表示，具體推導(dǎo)不再詳述。

四、優(yōu)化舉例

通過以下函數(shù)進(jìn)行優(yōu)化。

優(yōu)化流程：初始化參數(shù)→前向傳播算出預(yù)測(cè)值→得到損失函數(shù)→反向傳播得到梯度→對(duì)參數(shù)更新→再次前向傳播→......

在此案例中，優(yōu)化流程有一些不同：

優(yōu)化之前先選擇優(yōu)化器，并直接把參數(shù)，以及梯度輸入進(jìn)去。

①pred = f(x)根據(jù)函數(shù)給出預(yù)測(cè)值，用以后面計(jì)算梯度。

②optimizer.zero_grad()梯度歸零。因?yàn)榉聪騻鞑ブ?，梯度?huì)自動(dòng)帶到參數(shù)上去（上面有展示，可以調(diào)用查看）。

③pred.backward()用預(yù)測(cè)值計(jì)算梯度。

④pred.step()更新參數(shù)。

以上步驟循環(huán)即可。

以上就是人工智能學(xué)習(xí)Pytorch梯度下降優(yōu)化示例詳解的詳細(xì)內(nèi)容，更多關(guān)于Pytorch梯度下降優(yōu)化的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫(kù)

CMS

常用工具

人工智能學(xué)習(xí)Pytorch梯度下降優(yōu)化示例詳解

目錄

一、激活函數(shù)

1.Sigmoid函數(shù)

2.Tanh函數(shù)

3.ReLU函數(shù)

二、損失函數(shù)及求導(dǎo)

1.autograd.grad

2.loss.backward()

3.softmax及其求導(dǎo)

三、鏈?zhǔn)椒▌t

1.單層感知機(jī)梯度

2. 多輸出感知機(jī)梯度

3. 中間有隱藏層的求導(dǎo)

4.多層感知機(jī)的反向傳播

四、優(yōu)化舉例

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

人工智能學(xué)習(xí)Pytorch梯度下降優(yōu)化示例詳解

目錄

一、激活函數(shù)

1.Sigmoid函數(shù)

2.Tanh函數(shù)

3.ReLU函數(shù)

二、損失函數(shù)及求導(dǎo)

1.autograd.grad

2.loss.backward()

3.softmax及其求導(dǎo)

三、鏈?zhǔn)椒▌t

1.單層感知機(jī)梯度

2. 多輸出感知機(jī)梯度

3. 中間有隱藏層的求導(dǎo)

4.多層感知機(jī)的反向傳播

四、優(yōu)化舉例

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

一、激活函數(shù)

二、損失函數(shù)及求導(dǎo)

三、鏈?zhǔn)椒▌t

四、優(yōu)化舉例