快捷導航

弄清Pytorch顯存的分配機制

更新時間：2020年12月10日 10:18:22 作者：頎周

這篇文章主要介紹了Pytorch顯存的分配機制的相關(guān)資料，幫助大家更好的理解和使用Pytorch，感興趣的朋友可以了解下

　　對于顯存不充足的煉丹研究者來說，弄清楚Pytorch顯存的分配機制是很有必要的。下面直接通過實驗來推出Pytorch顯存的分配過程。

　　實驗實驗代碼如下：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2) 
y = 5 * x 
print("2", cuda.memory_allocated()/1024**2) 
torch.mean(y).backward()   
print("3", cuda.memory_allocated()/1024**2)  
print(cuda.memory_summary())

輸出如下：

　　代碼首先分配3GB的顯存創(chuàng)建變量x，然后計算y，再用y進行反向傳播?？梢钥吹剑瑒?chuàng)建x后與計算y后分別占顯存3GB與6GB，這是合理的。另外，后面通過backward()，計算出x.grad，占存與x一致，所以最終一共占有顯存9GB，這也是合理的。但是，輸出顯示了顯存的峰值為12GB，這多出的3GB是怎么來的呢？首先畫出計算圖：

下面通過列表的形式來模擬Pytorch在運算時分配顯存的過程：

　　如上所示，由于需要保存反向傳播以前所有前向傳播的中間變量，所以有了12GB的峰值占存。

　　我們可以不存儲計算圖中的非葉子結(jié)點，達到節(jié)省顯存的目的，即可以把上面的代碼中的y=5*x與mean(y)寫成一步：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2)  
torch.mean(5*x).backward()   
print("2", cuda.memory_allocated()/1024**2)  
print(cuda.memory_summary())

　占顯存量減少了3GB：

以上就是弄清Pytorch顯存的分配機制的詳細內(nèi)容，更多關(guān)于Pytorch 顯存分配的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

相關(guān)文章

python訓練數(shù)據(jù)時打亂訓練數(shù)據(jù)與標簽的兩種方法小結(jié)
今天小編就為大家分享一篇python訓練數(shù)據(jù)時打亂訓練數(shù)據(jù)與標簽的兩種方法小結(jié)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-11-11
對tensorflow中tf.nn.conv1d和layers.conv1d的區(qū)別詳解
今天小編就為大家分享一篇對tensorflow中tf.nn.conv1d和layers.conv1d的區(qū)別詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
Python單元測試實例詳解
這篇文章主要介紹了Python單元測試,結(jié)合實例形式詳細分析了Python單元測試模塊的功能、使用方法及相關(guān)操作注意事項,需要的朋友可以參考下
2018-05-05
Python浮點型（float）運算結(jié)果不正確的解決方案
這篇文章主要介紹了Python浮點型（float）運算結(jié)果不正確的解決方案，幫助大家更好的利用python進行運算處理，感興趣的朋友可以了解下
2020-09-09
pytest用例執(zhí)行順序和跳過執(zhí)行詳解
本文主要介紹了pytest用例執(zhí)行順序和跳過執(zhí)行詳解，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-02-02
Python中利用all()來優(yōu)化減少判斷的實例分析
在本篇文章里小編給大家整理的是一篇關(guān)于Python中利用all()來優(yōu)化減少判斷的實例分析內(nèi)容，有需要的朋友們可以學習下。
2021-06-06
Django中prefetch_related()函數(shù)優(yōu)化實戰(zhàn)指南
我們可以利用Django框架中select_related和prefetch_related函數(shù)對數(shù)據(jù)庫查詢優(yōu)化,這篇文章主要給大家介紹了關(guān)于Django中prefetch_related()函數(shù)優(yōu)化的相關(guān)資料,需要的朋友可以參考下
2022-11-11
Python+redis通過限流保護高并發(fā)系統(tǒng)
這篇文章主要介紹了Python+redis通過限流保護高并發(fā)系統(tǒng),文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-04-04
python爬蟲指南之xpath實例解析(附實戰(zhàn))
在進行網(wǎng)頁抓取的時候,分析定位html節(jié)點是獲取抓取信息的關(guān)鍵,目前我用的是lxml模塊,下面這篇文章主要給大家介紹了關(guān)于python爬蟲指南之xpath實例解析的相關(guān)資料,需要的朋友可以參考下
2022-01-01
關(guān)于numpy.array的shape屬性理解
這篇文章主要介紹了關(guān)于numpy.array的shape屬性理解,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-09-09