DLSS4開啟電競級3A新時代 技嘉RTX 5080 AERO雪鷹顯卡全面評測

1月7日,英偉達在CES 2025發(fā)布了備受期待的GeForce RTX 50系列顯卡,首發(fā)產(chǎn)品包括RTX 5090(D)、RTX 5080、RTX 5070Ti和RTX 5070四個型號。GeForce RTX 50系列顯卡搭載了全新的Blackwell架構(gòu),可以說是近年來變革最大的GPU架構(gòu),為我們帶來了全新的SM單元流處理器、第四代RT Core、第五代Tensor Core、GDDR7顯存等新特性,另外還有RTX神經(jīng)網(wǎng)絡(luò)著色器、DLSS 4、Reflex 2、Transformer模型、多幀生成等新技術(shù)的誕生,可謂是重新定義了未來游戲發(fā)展的新方向,將AI技術(shù)納入圖形渲染的核心地位。
NVIDIA Blackwell架構(gòu)
SM單元
我們先來簡單了解一下Blackwell架構(gòu)的變化。首先是SM單元,上代Ada架構(gòu)SM單元里的著色器核心有兩種,一種能執(zhí)行FP32運算,另一種能執(zhí)行FP32或INT32運算,運算能力更傾向于浮點運算。而Blackwell則升級成了統(tǒng)一著色器核心,可按需執(zhí)行FP32或INT32運算,大幅度提高了著色器核心的整數(shù)運算能力,運算效率和調(diào)度也更為靈活。英偉達表示這種運算單元的改動是為了神經(jīng)網(wǎng)絡(luò)著色器而優(yōu)化。
第五代Tensor核心
第五代Tensor核心增加了對FP4精度的支持,相較于上代Ada核心的FP8精度,F(xiàn)P4精度的運算吞吐量可提升2倍。模型精度越低對運算性能和空間的開銷也就越低,低精度的量化可以減少模型的體積,降低對顯存的要求,提高運算速度。而在端側(cè)的推理運算大部分都采用低精度模型,偶有高精度模型也會通過量化操作來降低精度,所以更低精度的支持意味著顯卡有更高的靈活度減少硬件的開銷
第四代RT核心
第四代RT核心繼承了上代的 Box Intersection Engine和Opacity Micromap Engine,原有的Triangle Intersection Engine升級為Triangle Cluster Intersection Engine,并新增Triangle Cluster Decompression Engine用以處理更大規(guī)模的三角形相交場景。另外還新增了 Linear Swept Spheres用以處理毛發(fā)的光線碰撞,減少硬件開銷。
英偉達將其稱為Mega Geometry,并表示其處理幾何圖形相交的能力要比Ada架構(gòu)提升2倍,顯存開銷降低25%。
GDDR7顯存
RTX 50系列顯卡還搭載了GDDR7顯存,因為采用了PAM3信號編碼,數(shù)據(jù)速率可達GDDR6的2倍,但功耗只需要GDDR6的一半。
編解碼功能
還有一個需要補充的是,Blackwell架構(gòu)終于支持DisplayPort 2.1 UHBR 20模式,可以輸出最高8K 165Hz的畫面,并且NVDEC解碼引擎升級到第九代,NVENC編碼引擎升級到第六代,AV1格式支持了UHQ超高質(zhì)量模式,HEVC(H.265)格式支持到MV-HEVC,色度空間支持更高規(guī)格4:2:2格式。
RTX神經(jīng)網(wǎng)絡(luò)著色器
RTX神經(jīng)網(wǎng)絡(luò)著色器是一項頗具科幻色彩的技術(shù),咋聽之下似乎無法理解,但我們可以簡單理解為它是一項借助AI訓練來簡化、壓縮渲染流程和材質(zhì)數(shù)據(jù)的技術(shù)。這其中又細分為神經(jīng)網(wǎng)絡(luò)紋理(Neural Textures)、神經(jīng)網(wǎng)絡(luò)材質(zhì)(Neural Materials)、神經(jīng)網(wǎng)絡(luò)體積云(Neural Volumes)、神經(jīng)網(wǎng)絡(luò)輻射場(Neural Radiance Fields)、神經(jīng)網(wǎng)絡(luò)輻射緩存(Neural Radiance Cache)等5項技術(shù)。通過這項技術(shù),開發(fā)者可以更高效、智能的完成開發(fā)過程,導出更匹配RTX的著色器數(shù)據(jù)。用戶也可以以更低的硬件開銷,獲得更高質(zhì)量的渲染畫面,可謂是雙贏的局面。
DLSS4
DLSS 4迎來了自2019年DLSS發(fā)布以來的最大革新:多幀生成技術(shù)(MFG)和Transformer模型。DLSS 3的幀生成技術(shù)是通過超采樣和光線重構(gòu)技術(shù)生成額外幀,并通過光流加速器插入原始幀中獲得幾乎翻倍的幀數(shù)提升。而DLSS 4技術(shù)得益于第五代Tensor核心的算力提升,可以在DLSS 3的基礎(chǔ)上再額外通過AI模型生成2幀畫面。如此以來,配合超采樣、光線重構(gòu)、光流插針以及多幀生成模型,DLSS4可以實現(xiàn)15/16的畫面生成,實現(xiàn)最高8倍的幀數(shù)提升。除了多幀生成技術(shù),DLSS4還將原有的CNN卷積神經(jīng)網(wǎng)絡(luò)模型替換為Transformer模型(可選),能夠更好的處理自然語言和多頭注意力權(quán)重,生成的畫面會更穩(wěn)定,鬼影和運動模糊等問題也會大幅度減少。
顯卡規(guī)格
從規(guī)格上看,RTX 5080的規(guī)格大約比上代RTX 4080S提高了5%左右,SM單元增加4組,CUDA核心增加512個,Tensor Core張量核心增加16個,RT Core光追核心增加4個。當然,更重要的是Tensor Core張量核心和RT Core光追核心分別從第四代和第三代迭代到第五代和第四代。另外顯存也更換為了速度更快的GDDR7顯存,供電接口則是更安全的12V-2X6接口,TGP功耗提高了40W,達到360W。建議零售價8299元,僅比上代貴了200元,可謂是加量不加價。
基本規(guī)格核心加速頻率:2730MHz顯示核心:GB203CUDA核心:10752個顯存位寬:256-bit顯存容量:16GB GDDR7顯存帶寬:960GB/s顯卡接口:PCIe 5.0 x 16視頻輸出接口:DisplayPort 2.1 x 3 / HDMI 2.1 x 1整體功耗(TGP):360W推薦電源功耗:850W外接供電:12V-2X6厚度:2槽顯卡尺寸:304mm x 126mm x 50mm
我們評測的是技嘉RTX 5080 AERO OC SFF 16G雪鷹顯卡,這是技嘉白色主題的主流級顯卡,搭載技嘉風之力散熱系統(tǒng),采用仿生風扇、服務器級導熱凝膠、大面積均熱板等多項技術(shù),提供強勁的散熱性能,并支持NVIDIA SFF-READY規(guī)范,可安裝在SFF-Ready規(guī)格的小機箱里。
細節(jié)介紹
RTX 5080雪鷹顯卡的外觀以銀白配色為主,圓潤的線條為輔,沒有過多的紋理裝飾,整體看上去比較簡約、素雅。
背部采用全尺寸金屬背板,尾部設(shè)計有大面積進氣格柵。
顯卡供電接口由上代的12VHPWR接口更換為更安全的12V-2×6接口,雖然外觀看上去一模一樣,但里面的針腳長度有所調(diào)整。供電接口旁邊是雙BIOS開關(guān),支持性能和靜音兩檔。
顯卡頂部的線條依然保持了圓角設(shè)計,圓潤感十足。左側(cè)的AERO字樣支持RGB燈光效果,可通過技嘉的GCC管家設(shè)置燈光模式和顏色。
視頻輸出接口由3個DP 2.1和1個HDMI 2.1組成,最高可支持8K 165Hz的視頻輸出。
風之力散熱系統(tǒng)配備三個10cm仿生風扇,葉片設(shè)計靈感來源于鷹的翅膀空氣動力學,有效降低風阻和噪音,可將風壓提升高達53.6%,風量提升12.5%。同時,它也支持3D啟停技術(shù),當GPU溫度較低或處于較低負載時,風扇將會自動停止運轉(zhuǎn),提供更安靜的使用體驗。
附件方面送了一根12V-2×6接口的轉(zhuǎn)接線,注意這根轉(zhuǎn)接線需要3 x 8Pin顯卡供電線。另外還有一組定制顯卡支架,提供更好的顯卡支撐性。
值得一提的是,這張顯卡還有一張黑色版本的RTX 5080 WINDFORCE OC SFF 風魔16G,作為5080的入門款,配有NVIDIA SFF-READY,將強大的性能融入到小巧的外形中, 搭配新一代仿生風扇,可將風壓提升高達53.6%,風量提升12.5%, 服務器級導熱凝膠,大型均熱板和復合式熱管、進氣格柵等散熱技術(shù)進一步提升產(chǎn)品散熱性能,售價8299元。
測試平臺
為保證測試成績沒有瓶頸,選擇了目前最強游戲處理器銳龍7 9800X3D搭配技嘉X870魔鷹主板,內(nèi)存用的金士頓FURT DDR5 6000 CL30,固態(tài)硬盤則選擇致鈦的TiPlus 7100 2TB。
目前2.61版本的GPU-Z還無法正確識別顯卡規(guī)格,但核心加速頻率已正確識別為2730MHz,比公版頻率高出113MHz。
基準測試和游戲測試
我們先來看3Dmark的跑分成績,得益于Blackwell的先進架構(gòu)設(shè)計,RTX 5080以5%的流處理器提升跑出了比RTX 4080S高20%左右的成績,其中光追測試的Port Royal、Speed Way更是能保持23%和22%的領(lǐng)先幅度。
我們選擇了8款游戲用來測試傳統(tǒng)的光柵化性能,分辨率分別是2560 x 1440和3840 x 2160,如果支持光追的游戲手動關(guān)閉,并開啟最高畫質(zhì)設(shè)定。從測試成績可以看到,RTX 5080保持了在基準測試中的性能優(yōu)勢,成績在8款游戲中均領(lǐng)先于RTX 4080S,平均領(lǐng)先幅度在16%左右。其中,領(lǐng)先幅度最高的是《賽博朋克2077》,在2K分辨率和4K分辨率分別比RTX 4080S快23%和25%,其他游戲則各有高低??傮w來說RTX 5080在4K分辨率下的性能優(yōu)勢更強,并且足已駕馭絕大多數(shù)游戲在4K分辨率下的畫質(zhì)全開需求。
光追游戲的測試結(jié)果類似,RTX 5080的幀數(shù)比RTX 4080S快了大約17%,且同樣在4K分辨率下有著更強的性能優(yōu)勢。另一方面,RTX 5080基本能滿足2K分辨率的光追全開畫質(zhì),但在4K分辨率下還是建議開DLSS技術(shù)。
說到DLSS技術(shù),就不得不提和RTX 50系列顯卡同時間上線的DLSS 4技術(shù),它引入了多幀生成技術(shù)(MFG)和Transformer模型的更新,最高可將幀數(shù)提升至原始幀數(shù)的8倍以上。
《賽博朋克2077》便是首批宣布支持DLSS4技術(shù)的游戲之一,我們也提前體驗了支持DLSS4技術(shù)的Beta版更新。不過因為測試版沒有中文,所以只能用英語版本給大家展示,相信到RTX 50正式開售時,正式版本也應該發(fā)布了??梢钥吹健顿惒┡罂?077》的DLSS設(shè)置增加了Transformer模型選項,下方還有DLSS 多幀生成技術(shù)(MFG)選項,一共有三檔,分別是2X、3X和4X,檔位越高幀數(shù)提升也就越高,但相應畫質(zhì)也會有所壓縮。
前面我們測試了RTX 5080在《賽博朋克2077》里,4K分辨率、畫質(zhì)全開、光追全開,幀數(shù)只有36幀。如果打開DLSS 3的質(zhì)量模式,幀數(shù)能翻倍到64幀左右。如果借助DLSS 4技術(shù)的加持,即使只開到2X,幀數(shù)也能達到109幀的流暢水平。如果開到3X,那幀數(shù)就來到了154幀的高刷流暢水平,開到4X幀數(shù)就更恐怖了,直接達到194幀,幾乎是電競游戲的高刷水平,相較原生幀數(shù)提升了5.3倍。
當然,我知道你肯定對畫質(zhì)有所顧慮,我們也對比了DLSS4開到3X和4X的畫質(zhì)表現(xiàn)。坦白的說,DLSS 4和原生畫質(zhì)對比不可能沒有任何損失,但我個人覺得這個畫質(zhì)損失在接受的范圍內(nèi),基本是陰影部分的細節(jié)有略微損失,整體畫質(zhì)與DLSS 3的質(zhì)量模式相當。而DLSS 3的質(zhì)量模式只能實現(xiàn)翻倍的幀數(shù)提升,現(xiàn)在DLSS 4卻能實現(xiàn)5倍以上的幀數(shù),以這點畫質(zhì)損失來換取數(shù)倍的幀數(shù)提升,我認為還是非常劃算的。
除了游戲內(nèi)設(shè)定DLSS 4,還可以通過NVIDIA App來實現(xiàn)DLSS 4的開關(guān)以及畫質(zhì)的優(yōu)化。例如《漫威爭鋒》也是首批支持DLSS 4技術(shù)的游戲之一,但游戲內(nèi)無法實時設(shè)置DLSS 4。這時候就需要NVIDIA App來進行手動設(shè)置或自動優(yōu)化。設(shè)置方法跟游戲內(nèi)置的DLSS 4差不多,都是開啟幀生成然后設(shè)置一下倍率,應用了之后再打開游戲。
漫威爭鋒對于RTX 5080的壓力不算大,4K分辨率畫質(zhì)全開也有93幀左右,開啟DLSS 4幀生成 3X,幀數(shù)達到了296幀左右,幾乎是原生幀數(shù)3.2倍。如果開啟DLSS 4幀生成 4X,幀數(shù)就來到了373幀,搭配一臺高端OLED顯示器,你就能體驗一下極致高刷的樂趣。
AI與生產(chǎn)力性能
雖然RTX 5080是一張游戲顯卡,但我們還是測了它的AI性能。首先測試的是Geekbench AI,在AI相關(guān)的三個量化標準:單精度浮點、半精度浮點、量化性能上,RTX 5080都要強于RTX 4080S。尤其是RTX 5080新增了FP4的低精度支持,在半精度浮點性能上足足比RTX 4080S高出19%。
另外我們還用UL Procyon的Stable Diffusion測試組建測試了文生圖的速度。RTX 5080生成一張512x512的圖大約需要1.785秒,而RTX 4080S生成一張512x512的圖則需要2.083秒,足足快了14%。4組每組4張,共16張圖,RTX 5080耗時28.553秒,RTX 4080S耗時33.334秒,同樣節(jié)約了14%的時間。如果你是Stable Diffusion的內(nèi)容創(chuàng)作者,一天可能出個幾千上萬張圖,那這14%的差距就能為你節(jié)約大量的時間。
生產(chǎn)力我們主要測試了一下渲染軟件的表現(xiàn)。Blender是最常用的3D渲染引擎之一,可以渲染動畫、圖像、結(jié)構(gòu)圖等等,測試使用Blender的Benchmark,對三種場景進行渲染??梢钥吹皆趍onster和classroom項目里,RTX 5080比RTX 4080S快5%左右,而在junkshop項目里更是領(lǐng)先13%。
V-Ray是一個3D渲染引擎,支持路徑跟蹤、光子映射等等,可以使用CUDA加速或者RT Core進行渲染。在V-Ray的Benchmark測試里,RTX 5080的成績比RTX 4080S高出大約22%。
目前已有超過120款常用軟件如Adobe全家桶、MAYA、達芬奇、Blender支持英偉達的CUDA加速和AI功能。
散熱與壓力測試
使用Furmark進行壓力測試,分辨率1920 x 1080,燒機40分鐘后,技嘉RTX 5080 AERO OC雪鷹顯卡的核心溫度大約64度,功耗360W,顯存溫度和熱點溫度未能識別出正確數(shù)值,故不做統(tǒng)計。這時候顯卡風扇轉(zhuǎn)速只有1800RPM左右,比旁邊的CPU風扇還低,基本聽不到什么明顯的風噪。
總結(jié)
總的來說,Blackwell架構(gòu)和RTX 50系列顯卡是極具革新意義的一代顯卡,顯卡光柵化的性能已經(jīng)來到了邊際效應的臨界點,單純靠提升流處理器規(guī)模已經(jīng)很難獲得大幅度的性能提升,所以英偉達另辟蹊徑以AI技術(shù)作為切入點實現(xiàn)了畫質(zhì)和幀數(shù)的平衡點。從第一代的DLSS超分到DLSS幀生成再到DLSS多幀生成,不可否認的是DLSS技術(shù)讓預算不高的玩家也能流暢玩游戲,讓想開光追的玩家體驗到了流暢的光追,讓4K+光追+高刷有了落地的可能,而這也是英偉達將來要繼續(xù)走的路線。
技嘉RTX 5080 AERO OC雪鷹顯卡有著全白色外觀且支持NVIDIA SFF-READY規(guī)范,可以放心的裝在全白主題的小機箱里,它的性能足已滿足你4K分辨率畫質(zhì)全開的游戲需求,如果疊加DLSS4帶來的數(shù)倍幀數(shù)提升,你甚至可以體驗一下4K+畫質(zhì)全開+光追全開+高刷的游戲爽感,不夸張的說用個幾代都不用換顯卡了。
相關(guān)文章
延續(xù)家族系列黑灰配色! 映眾RTX 5090 D曜夜X3顯卡開箱
年發(fā)布的RTX 50系列,可謂搶足風頭,包括超級冰龍、曜夜和映雪三大子品牌,比如那個號稱頂配王者的是RTX5090 D曜夜X3,下面我們就來看看這款顯卡的開箱2025-01-24高端發(fā)燒玩家的白色戀人! AX電競叛客RTX 5090 D X3W顯卡開箱
今天我們就為大家送上來自柏能集團旗下品牌AX電競叛客的RTX 5090 D X3W顯卡的圖賞,近距離欣賞這款純白大作的魅力2025-01-24游戲黨RTX 50顯卡無腦入還是抄底舊款? 建議看完這個你再決定
RTX 5070在光追開啟的情況下相比于RTX 4070提升了不到30%的性能,這樣的高性價比的背后,究竟隱藏了怎樣的玄機?值不值得無腦入?建議看完這個你再決定2025-01-24七彩虹首張RTX 50系顯卡! iGame GeForce RTX 5090 D Advanced 32GB開箱
首款GeForce RTX 50系顯卡---GeForce RTX 5090D就要在國內(nèi)亮相啦,這款顯卡怎么樣?下面我們就來看看開箱體驗2025-01-22雙風扇散熱600W! 英偉達 RTX 50系列公版散熱方案拆解首次揭秘
英偉達最近公布了更多關(guān)于 RTX 50 系列公版顯卡散熱器的細節(jié),并對其作了更完善的技術(shù)剖析,與以往的公版顯卡散熱方案相比,RTX 5090公版采用了全新的散熱架構(gòu),實現(xiàn)了更高2025-01-21RTX 2060 SUPER對比ARC B580差別大嗎? 兩款顯卡游戲性能測評
ARC B580非常適合那些對游戲畫質(zhì)要求不高,仍然在使用老顯卡的游戲玩家入手升級,今天我們就來看看對比ARC B580和GeForce RTX 2060 SUPER的游戲性能2025-01-06ARC B580對比RTX3060性能差多少? 兩款顯卡游戲性能測評
在2024年12月初,英特爾發(fā)布了ARC B580,該顯卡的整體性能表現(xiàn)尚可,大致與GeForce RTX 4060持平,那么和RTX3060差多少呢?詳細請看下文測評2025-01-06RTX 3070和ARC B580性能差別有多大? 兩款顯卡游戲性能對比測評
ARC B580的性能肯定無法與GeForce RTX 3070相提并論,但是加上價格的加持,也是可以放在一起測評一下的,下面我們通過七款游戲?qū)Ρ華RC B580和GeForce RTX 3070的性能2025-01-062K游戲性能領(lǐng)先RTX 4060多少? 傲世LUMI追日B580 OC顯卡評測
傲世LUMI追日B580 OC顯卡以其高顏值的全白化設(shè)計脫穎而出,無論是正面的散熱裝甲、散熱風扇還是背板,都采用了純白色調(diào),顯得既簡約又大氣,下面我們就來看看詳細測評2024-12-18Intel 新顯卡Arc B580對比RTX 4060差多少? 四款游戲性能對比測評
有朋友想看看Intel 新顯卡Arc B580和NVIDIA RTX 4060顯卡兩款哪款更值得選購,下面我們就來看看四款游戲測評2024-12-18