快捷導(dǎo)航

淺談pytorch中的BN層的注意事項(xiàng)

更新時(shí)間：2020年06月23日 09:08:25 作者：張叫張大衛(wèi)

這篇文章主要介紹了淺談pytorch中的BN層的注意事項(xiàng)，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

最近修改一個(gè)代碼的時(shí)候，當(dāng)使用網(wǎng)絡(luò)進(jìn)行推理的時(shí)候，發(fā)現(xiàn)每次更改測(cè)試集的batch size大小竟然會(huì)導(dǎo)致推理結(jié)果不同，甚至產(chǎn)生錯(cuò)誤結(jié)果，后來(lái)發(fā)現(xiàn)在網(wǎng)絡(luò)中定義了BN層，BN層在訓(xùn)練過(guò)程中，會(huì)將一個(gè)Batch的中的數(shù)據(jù)轉(zhuǎn)變成正太分布，在推理過(guò)程中使用訓(xùn)練過(guò)程中的參數(shù)對(duì)數(shù)據(jù)進(jìn)行處理，然而網(wǎng)絡(luò)并不知道你是在訓(xùn)練還是測(cè)試階段，因此，需要手動(dòng)的加上，需要在測(cè)試和訓(xùn)練階段使用如下函數(shù)。

model.train() or model.eval()

BN類(lèi)的定義見(jiàn)pytorch中文參考文檔

補(bǔ)充知識(shí)：關(guān)于pytorch中BN層（具體實(shí)現(xiàn)）的一些小細(xì)節(jié)

最近在做目標(biāo)檢測(cè)，需要把訓(xùn)好的模型放到嵌入式設(shè)備上跑前向，因此得把各種層的實(shí)現(xiàn)都用C手?jǐn)]一遍，，，此為背景。

其他層沒(méi)什么好說(shuō)的，但是BN層這有個(gè)小坑。pytorch在打印網(wǎng)絡(luò)參數(shù)的時(shí)候，只打出weight和bias這兩個(gè)參數(shù)。咦，說(shuō)好的BN層有四個(gè)參數(shù)running_mean、running_var 、gamma 、beta的呢？一開(kāi)始我以為是pytorch把BN層的計(jì)算簡(jiǎn)化成weight * X + bias，但馬上反應(yīng)過(guò)來(lái)應(yīng)該沒(méi)這么簡(jiǎn)單，因?yàn)閜ytorch中只有可學(xué)習(xí)的參數(shù)才稱(chēng)為parameter。上網(wǎng)找了一些資料但都沒(méi)有說(shuō)到這么細(xì)的，畢竟大部分用戶(hù)使用時(shí)只要模型能跑起來(lái)就行了，，，于是開(kāi)始看BN層有哪些屬性，果然發(fā)現(xiàn)了熟悉的running_mean和running_var，原來(lái)pytorch的BN層實(shí)現(xiàn)并沒(méi)有不同。這里吐個(gè)槽：為啥要把gamma和beta改叫weight、bias啊，很有迷惑性的好不好，，，

扯了這么多，干脆捋一遍pytorch里BN層的具體實(shí)現(xiàn)過(guò)程，幫自己理清思路，也可以給大家提供參考。再吐槽一下，在網(wǎng)上搜“pytorch bn層”出來(lái)的全是關(guān)于這一層怎么用的、初始化時(shí)要輸入哪些參數(shù)，沒(méi)找到一個(gè)pytorch中BN層是怎么實(shí)現(xiàn)的，，，

眾所周知，BN層的輸出Y與輸入X之間的關(guān)系是：Y = (X - running_mean) / sqrt(running_var + eps) * gamma + beta，此不贅言。其中g(shù)amma、beta為可學(xué)習(xí)參數(shù)（在pytorch中分別改叫weight和bias），訓(xùn)練時(shí)通過(guò)反向傳播更新；而running_mean、running_var則是在前向時(shí)先由X計(jì)算出mean和var，再由mean和var以動(dòng)量momentum來(lái)更新running_mean和running_var。所以在訓(xùn)練階段，running_mean和running_var在每次前向時(shí)更新一次；在測(cè)試階段，則通過(guò)net.eval()固定該BN層的running_mean和running_var，此時(shí)這兩個(gè)值即為訓(xùn)練階段最后一次前向時(shí)確定的值，并在整個(gè)測(cè)試階段保持不變。

以上這篇淺談pytorch中的BN層的注意事項(xiàng)就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章: