NVIDIA RTX3080值得入手嗎 NVIDIA RTX3080顯卡詳細(xì)評測

二、安培構(gòu)架解析:流處理器數(shù)量翻倍是否言過其實(shí)?
在圖靈誕生之前,GPU核心中并沒有單獨(dú)的INT32單元,從Kepler到Maxwell到再到Pascal,每一個CUDA核心都就是由FP32單元構(gòu)成。
而Turing每一個CUDA核心除了有一個FP32的單精度浮點(diǎn)單元之外,還有對應(yīng)有一個INT32的單精度整數(shù)單元。
在現(xiàn)代游戲(例如古墓麗影:暗影)中,每100條指令操作中有62條是浮點(diǎn)指令操作,38條是整數(shù)指令操作。以往GPU在只能單獨(dú)、交替的執(zhí)行浮點(diǎn)和整數(shù)運(yùn)算,圖靈構(gòu)架加入了整數(shù)運(yùn)算單元之后,可以與浮點(diǎn)單元一起并發(fā)執(zhí)行,可以將流處理器的執(zhí)行效率提升36%。
不過在游戲中整數(shù)運(yùn)算量遠(yuǎn)遠(yuǎn)低于浮點(diǎn)運(yùn)算量(38:62),因此經(jīng)常會有大量的INT32單元被閑置。為了解決這個問題,提升INT32單元的利用率,NVIDIA改進(jìn)了INT32單元,使之不僅可以運(yùn)行整數(shù)運(yùn)算,也能進(jìn)行單精度浮點(diǎn)運(yùn)算。
如上圖所示,在安培構(gòu)架中,每個SM單元中的64個FP32單元依舊保留,而INT32單元則被賦予了更多的使命,它不僅能進(jìn)行整數(shù)運(yùn)算,但是在不需要進(jìn)行整數(shù)運(yùn)算的情況下,它也能和FP32一樣進(jìn)行單精度浮點(diǎn)運(yùn)算。
也就是說,每個SM單元可以同時執(zhí)行4x(16FP32+16FP32)=128個FP32運(yùn)算,或者4x(16FP32+16INT32)=64個FP32+64個INT32運(yùn)算。
在理想的情況將下,一個SM單元中的64個INT單元全部都做單精度浮點(diǎn)運(yùn)算的話,那么流處理器(FP32單元)數(shù)量將會直接變成128個。相對而言,圖靈構(gòu)架一個SM單元只有固定的64個流處理器。
RTX 3080擁有68個SM單元,理論上能達(dá)到8704個流處理器的規(guī)模。很多同學(xué)可能懷疑NVIDIA在騙我們,這些流處理器是否能夠同時工作還是個問號。
下面我們使用AIDA64 GPGPU進(jìn)行驗(yàn)證,看看RTX 3080的8704個流處理器是否言過其實(shí)。
如果依據(jù)1710MHz的頻率和8704個FP32單元來計算RTX 3080的理論浮點(diǎn)性能應(yīng)當(dāng)是29767GFLOPS。
實(shí)測RTX 3080的單精度浮點(diǎn)運(yùn)算性能是29117GFLOPS,略低于理論值。這是因?yàn)?20W TDP的限制,RTX 3080在進(jìn)行GPGPU單精度浮點(diǎn)測試時,GPU核心的滿載頻率只有1672MHz并沒有達(dá)到默頻的1710MHz。
不過從這里可以看出,RTX 3080的的確確擁有8704個流處理器(FP32單元),現(xiàn)在已經(jīng)沒有什么好質(zhì)疑的了。
實(shí)測RTX 2080 Ti的單精度浮點(diǎn)運(yùn)算性能是16626GFLOPS,接近RTX 3080的6成。
實(shí)際上,在進(jìn)行GPGPU測試時,RTX 2080 Ti的運(yùn)行頻率達(dá)到了1910MHz,所以雖然流處理器數(shù)量只有一半,但是浮點(diǎn)性能卻能達(dá)到6成。
RTX 2080在進(jìn)行GPGPU測試時,運(yùn)行頻率更是高達(dá)1938MHz,單精度浮點(diǎn)運(yùn)算性能達(dá)到了11416GFLOPS,約為RTX 3080的40%。要知道RTX 2080 2944個流處理器只相當(dāng)于RTX 3080 8704個流處理器的1/3。
所以現(xiàn)在大家應(yīng)該知道了RTX 3080 TDP如此之高的原因!即便是320W的TDP,也難以滿足讓8704個流處理器以較高的頻率運(yùn)行的功耗需求。
相關(guān)文章
NVIDIA 30系顯卡怎么樣 NVIDIA 30系顯卡發(fā)布會內(nèi)容詳解
NVIDIA這場發(fā)布會簡短精悍節(jié)奏緊湊,滿打滿算不過40分鐘,但NVIDIA CEO黃仁勛先生的每一句話都值得細(xì)細(xì)品味,乃至反復(fù)觀看,一起看看吧2020-09-02英偉達(dá) RTX 30 顯卡值得入手嗎 一文看懂英偉達(dá) RTX 30 系顯卡
英偉達(dá) RTX 30 顯卡值得入手嗎?9月2日凌晨消息,英偉達(dá)在線上舉行發(fā)布會,正式發(fā)布了GeForce RTX 30系顯卡。下文中為大家?guī)砹擞ミ_(dá) RTX 30 系顯卡詳細(xì)介紹,感興趣的朋2020-09-02win10 2004系統(tǒng)顯卡驅(qū)動報錯怎么辦 顯卡驅(qū)動報錯的原因和解決方法
最近很多win10 2004系統(tǒng)的朋友遇到了不少的問題,最為常見的就是顯卡驅(qū)動總是報錯,那么是什么原因造成的顯卡報錯呢?又該如何解決win10 2004顯卡驅(qū)動報錯呢?還有不知道的2020-08-07影馳GTX 1650 Ultra驍將顯卡怎么樣 影馳GTX 1650 Ultra驍將評測
今天給大家?guī)淼氖菐ltra后綴的1650驍將顯卡,這是一張入門甜品卡,一起看看吧2020-08-06藍(lán)寶石RX570白金 4G版怎么樣 藍(lán)寶石RX570白金 4G版顯卡介紹
藍(lán)寶石RX 570 4G D5白金OC顯卡采用了AMD全新14nm工藝的Polaris 20 XL核心,顯卡的顯存規(guī)格為4GB/256-Bit,核心頻率為1244-1284MHz,搭載了2048個流處理器,一起看看吧2020-07-27七彩虹GeForce RTX+DLSS 2.0怎么樣 七彩虹GeForce RTX+DLSS 2.0實(shí)測
為了全面了解GeForce RTX系列測試光線追蹤及DLSS,我們使用4塊七彩虹iGame的顯卡進(jìn)行全面測試,看看英偉達(dá)DLSS 2.0所帶來的黑科技能夠讓玩家感到興奮,同時滿足光線追蹤所2020-07-22AMD GPU RX-5300M顯卡怎么樣?AMD GPU RX-5300M顯卡詳細(xì)測試
外媒 Notebookcheck 現(xiàn)已發(fā)布了微星 Bravo 15 的評測,這款筆記本搭載了 R7 4800H 和 RX 5300M 顯卡。一起來看一下這款 AMD 移動端入門級顯卡表現(xiàn)如何吧2020-07-15迪蘭RX 56XT X戰(zhàn)神散熱怎么樣 迪蘭RX 56XT X戰(zhàn)神溫度實(shí)測
我們今天主要測試的顯卡為迪蘭RX 5600 XT 6G X戰(zhàn)神,說實(shí)話這張顯卡在溫度控制方面著實(shí)驚艷到我了,一起看看吧2020-07-10性能強(qiáng)大燈效炫目 七彩虹RTX 2080 SUPER顯卡評測
最近,微軟正式公布了DX12 Ultimate,新增對DXR 1.1光線追蹤的支持,提高了光追游戲的性能,所以我就在上個月入手了七彩虹iGame GeForce RTX 2080 SUPER Vulcan X OC,一起2020-07-07暢玩光線追蹤游戲 iGame RTX 2060 SUPER顯卡評測
隨著3A大作游戲的不斷涌進(jìn),所帶來極致光效的渲染畫面也是讓人為之驚嘆,而七彩虹iGame GeForce RTX 2060 SUPER Vulcan X OC作為熱賣的甜品級顯卡之一,不僅外觀炫彩華麗,2020-07-01