亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

NVIDIA RTX3080值得入手嗎 NVIDIA RTX3080顯卡詳細(xì)評測

  發(fā)布時間:2020-09-17 10:22:29   作者:佚名   我要評論
NVIDIA RTX3080顯卡怎么樣?性能如何?玩游戲卡不卡?值得買嗎?下面小編帶來NVIDIA RTX3080顯卡詳細(xì)評測

二、安培構(gòu)架解析:流處理器數(shù)量翻倍是否言過其實(shí)?

在圖靈誕生之前,GPU核心中并沒有單獨(dú)的INT32單元,從Kepler到Maxwell到再到Pascal,每一個CUDA核心都就是由FP32單元構(gòu)成。

而Turing每一個CUDA核心除了有一個FP32的單精度浮點(diǎn)單元之外,還有對應(yīng)有一個INT32的單精度整數(shù)單元。

在現(xiàn)代游戲(例如古墓麗影:暗影)中,每100條指令操作中有62條是浮點(diǎn)指令操作,38條是整數(shù)指令操作。以往GPU在只能單獨(dú)、交替的執(zhí)行浮點(diǎn)和整數(shù)運(yùn)算,圖靈構(gòu)架加入了整數(shù)運(yùn)算單元之后,可以與浮點(diǎn)單元一起并發(fā)執(zhí)行,可以將流處理器的執(zhí)行效率提升36%。

不過在游戲中整數(shù)運(yùn)算量遠(yuǎn)遠(yuǎn)低于浮點(diǎn)運(yùn)算量(38:62),因此經(jīng)常會有大量的INT32單元被閑置。為了解決這個問題,提升INT32單元的利用率,NVIDIA改進(jìn)了INT32單元,使之不僅可以運(yùn)行整數(shù)運(yùn)算,也能進(jìn)行單精度浮點(diǎn)運(yùn)算。

如上圖所示,在安培構(gòu)架中,每個SM單元中的64個FP32單元依舊保留,而INT32單元則被賦予了更多的使命,它不僅能進(jìn)行整數(shù)運(yùn)算,但是在不需要進(jìn)行整數(shù)運(yùn)算的情況下,它也能和FP32一樣進(jìn)行單精度浮點(diǎn)運(yùn)算。

也就是說,每個SM單元可以同時執(zhí)行4x(16FP32+16FP32)=128個FP32運(yùn)算,或者4x(16FP32+16INT32)=64個FP32+64個INT32運(yùn)算。

在理想的情況將下,一個SM單元中的64個INT單元全部都做單精度浮點(diǎn)運(yùn)算的話,那么流處理器(FP32單元)數(shù)量將會直接變成128個。相對而言,圖靈構(gòu)架一個SM單元只有固定的64個流處理器。

RTX 3080擁有68個SM單元,理論上能達(dá)到8704個流處理器的規(guī)模。很多同學(xué)可能懷疑NVIDIA在騙我們,這些流處理器是否能夠同時工作還是個問號。

下面我們使用AIDA64 GPGPU進(jìn)行驗(yàn)證,看看RTX 3080的8704個流處理器是否言過其實(shí)。

如果依據(jù)1710MHz的頻率和8704個FP32單元來計算RTX 3080的理論浮點(diǎn)性能應(yīng)當(dāng)是29767GFLOPS。

實(shí)測RTX 3080的單精度浮點(diǎn)運(yùn)算性能是29117GFLOPS,略低于理論值。這是因?yàn)?20W TDP的限制,RTX 3080在進(jìn)行GPGPU單精度浮點(diǎn)測試時,GPU核心的滿載頻率只有1672MHz并沒有達(dá)到默頻的1710MHz。

不過從這里可以看出,RTX 3080的的確確擁有8704個流處理器(FP32單元),現(xiàn)在已經(jīng)沒有什么好質(zhì)疑的了。

實(shí)測RTX 2080 Ti的單精度浮點(diǎn)運(yùn)算性能是16626GFLOPS,接近RTX 3080的6成。

實(shí)際上,在進(jìn)行GPGPU測試時,RTX 2080 Ti的運(yùn)行頻率達(dá)到了1910MHz,所以雖然流處理器數(shù)量只有一半,但是浮點(diǎn)性能卻能達(dá)到6成。

RTX 2080在進(jìn)行GPGPU測試時,運(yùn)行頻率更是高達(dá)1938MHz,單精度浮點(diǎn)運(yùn)算性能達(dá)到了11416GFLOPS,約為RTX 3080的40%。要知道RTX 2080 2944個流處理器只相當(dāng)于RTX 3080 8704個流處理器的1/3。

所以現(xiàn)在大家應(yīng)該知道了RTX 3080 TDP如此之高的原因!即便是320W的TDP,也難以滿足讓8704個流處理器以較高的頻率運(yùn)行的功耗需求。

相關(guān)文章

最新評論