DLSS4開啟電競級3A新時代技嘉RTX 5080 AERO雪鷹顯卡全面評測

發(fā)布時間：2025-02-08 09:09:45 作者：佚名

作為全球一線板卡廠商的技嘉，為玩家們推出了超級雕（黑/白）、魔鷹、雪鷹和風魔、等一系列產(chǎn)品線的旗艦顯卡，今天我們就來看看RTX 5080 AERO雪鷹顯卡測評

1月7日，英偉達在CES 2025發(fā)布了備受期待的GeForce RTX 50系列顯卡，首發(fā)產(chǎn)品包括RTX 5090（D）、RTX 5080、RTX 5070Ti和RTX 5070四個型號。GeForce RTX 50系列顯卡搭載了全新的Blackwell架構(gòu)，可以說是近年來變革最大的GPU架構(gòu)，為我們帶來了全新的SM單元流處理器、第四代RT Core、第五代Tensor Core、GDDR7顯存等新特性，另外還有RTX神經(jīng)網(wǎng)絡(luò)著色器、DLSS 4、Reflex 2、Transformer模型、多幀生成等新技術(shù)的誕生，可謂是重新定義了未來游戲發(fā)展的新方向，將AI技術(shù)納入圖形渲染的核心地位。

NVIDIA Blackwell架構(gòu)

SM單元

我們先來簡單了解一下Blackwell架構(gòu)的變化。首先是SM單元，上代Ada架構(gòu)SM單元里的著色器核心有兩種，一種能執(zhí)行FP32運算，另一種能執(zhí)行FP32或INT32運算，運算能力更傾向于浮點運算。而Blackwell則升級成了統(tǒng)一著色器核心，可按需執(zhí)行FP32或INT32運算，大幅度提高了著色器核心的整數(shù)運算能力，運算效率和調(diào)度也更為靈活。英偉達表示這種運算單元的改動是為了神經(jīng)網(wǎng)絡(luò)著色器而優(yōu)化。

第五代Tensor核心

第五代Tensor核心增加了對FP4精度的支持，相較于上代Ada核心的FP8精度，F(xiàn)P4精度的運算吞吐量可提升2倍。模型精度越低對運算性能和空間的開銷也就越低，低精度的量化可以減少模型的體積，降低對顯存的要求，提高運算速度。而在端側(cè)的推理運算大部分都采用低精度模型，偶有高精度模型也會通過量化操作來降低精度，所以更低精度的支持意味著顯卡有更高的靈活度減少硬件的開銷

第四代RT核心

第四代RT核心繼承了上代的 Box Intersection Engine和Opacity Micromap Engine，原有的Triangle Intersection Engine升級為Triangle Cluster Intersection Engine，并新增Triangle Cluster Decompression Engine用以處理更大規(guī)模的三角形相交場景。另外還新增了 Linear Swept Spheres用以處理毛發(fā)的光線碰撞，減少硬件開銷。

英偉達將其稱為Mega Geometry，并表示其處理幾何圖形相交的能力要比Ada架構(gòu)提升2倍，顯存開銷降低25%。

GDDR7顯存

RTX 50系列顯卡還搭載了GDDR7顯存，因為采用了PAM3信號編碼，數(shù)據(jù)速率可達GDDR6的2倍，但功耗只需要GDDR6的一半。

編解碼功能

還有一個需要補充的是，Blackwell架構(gòu)終于支持DisplayPort 2.1 UHBR 20模式，可以輸出最高8K 165Hz的畫面，并且NVDEC解碼引擎升級到第九代，NVENC編碼引擎升級到第六代，AV1格式支持了UHQ超高質(zhì)量模式，HEVC(H.265)格式支持到MV-HEVC，色度空間支持更高規(guī)格4:2:2格式。

RTX神經(jīng)網(wǎng)絡(luò)著色器

RTX神經(jīng)網(wǎng)絡(luò)著色器是一項頗具科幻色彩的技術(shù)，咋聽之下似乎無法理解，但我們可以簡單理解為它是一項借助AI訓練來簡化、壓縮渲染流程和材質(zhì)數(shù)據(jù)的技術(shù)。這其中又細分為神經(jīng)網(wǎng)絡(luò)紋理（Neural Textures）、神經(jīng)網(wǎng)絡(luò)材質(zhì)（Neural Materials）、神經(jīng)網(wǎng)絡(luò)體積云（Neural Volumes）、神經(jīng)網(wǎng)絡(luò)輻射場（Neural Radiance Fields）、神經(jīng)網(wǎng)絡(luò)輻射緩存（Neural Radiance Cache）等5項技術(shù)。通過這項技術(shù)，開發(fā)者可以更高效、智能的完成開發(fā)過程，導出更匹配RTX的著色器數(shù)據(jù)。用戶也可以以更低的硬件開銷，獲得更高質(zhì)量的渲染畫面，可謂是雙贏的局面。

DLSS4

DLSS 4迎來了自2019年DLSS發(fā)布以來的最大革新：多幀生成技術(shù)（MFG）和Transformer模型。DLSS 3的幀生成技術(shù)是通過超采樣和光線重構(gòu)技術(shù)生成額外幀，并通過光流加速器插入原始幀中獲得幾乎翻倍的幀數(shù)提升。而DLSS 4技術(shù)得益于第五代Tensor核心的算力提升，可以在DLSS 3的基礎(chǔ)上再額外通過AI模型生成2幀畫面。如此以來，配合超采樣、光線重構(gòu)、光流插針以及多幀生成模型，DLSS4可以實現(xiàn)15/16的畫面生成，實現(xiàn)最高8倍的幀數(shù)提升。除了多幀生成技術(shù)，DLSS4還將原有的CNN卷積神經(jīng)網(wǎng)絡(luò)模型替換為Transformer模型（可選），能夠更好的處理自然語言和多頭注意力權(quán)重，生成的畫面會更穩(wěn)定，鬼影和運動模糊等問題也會大幅度減少。

顯卡規(guī)格

從規(guī)格上看，RTX 5080的規(guī)格大約比上代RTX 4080S提高了5%左右，SM單元增加4組，CUDA核心增加512個，Tensor Core張量核心增加16個，RT Core光追核心增加4個。當然，更重要的是Tensor Core張量核心和RT Core光追核心分別從第四代和第三代迭代到第五代和第四代。另外顯存也更換為了速度更快的GDDR7顯存，供電接口則是更安全的12V-2X6接口，TGP功耗提高了40W，達到360W。建議零售價8299元，僅比上代貴了200元，可謂是加量不加價。

基本規(guī)格核心加速頻率：2730MHz顯示核心：GB203CUDA核心：10752個顯存位寬：256-bit顯存容量：16GB GDDR7顯存帶寬：960GB/s顯卡接口：PCIe 5.0 x 16視頻輸出接口：DisplayPort 2.1 x 3 / HDMI 2.1 x 1整體功耗（TGP）：360W推薦電源功耗：850W外接供電：12V-2X6厚度：2槽顯卡尺寸：304mm x 126mm x 50mm

我們評測的是技嘉RTX 5080 AERO OC SFF 16G雪鷹顯卡，這是技嘉白色主題的主流級顯卡，搭載技嘉風之力散熱系統(tǒng)，采用仿生風扇、服務器級導熱凝膠、大面積均熱板等多項技術(shù)，提供強勁的散熱性能，并支持NVIDIA SFF-READY規(guī)范，可安裝在SFF-Ready規(guī)格的小機箱里。

細節(jié)介紹

RTX 5080雪鷹顯卡的外觀以銀白配色為主，圓潤的線條為輔，沒有過多的紋理裝飾，整體看上去比較簡約、素雅。

背部采用全尺寸金屬背板，尾部設(shè)計有大面積進氣格柵。

顯卡供電接口由上代的12VHPWR接口更換為更安全的12V-2×6接口，雖然外觀看上去一模一樣，但里面的針腳長度有所調(diào)整。供電接口旁邊是雙BIOS開關(guān)，支持性能和靜音兩檔。

顯卡頂部的線條依然保持了圓角設(shè)計，圓潤感十足。左側(cè)的AERO字樣支持RGB燈光效果，可通過技嘉的GCC管家設(shè)置燈光模式和顏色。

視頻輸出接口由3個DP 2.1和1個HDMI 2.1組成，最高可支持8K 165Hz的視頻輸出。

風之力散熱系統(tǒng)配備三個10cm仿生風扇，葉片設(shè)計靈感來源于鷹的翅膀空氣動力學，有效降低風阻和噪音，可將風壓提升高達53.6%，風量提升12.5%。同時，它也支持3D啟停技術(shù)，當GPU溫度較低或處于較低負載時，風扇將會自動停止運轉(zhuǎn)，提供更安靜的使用體驗。

附件方面送了一根12V-2×6接口的轉(zhuǎn)接線，注意這根轉(zhuǎn)接線需要3 x 8Pin顯卡供電線。另外還有一組定制顯卡支架，提供更好的顯卡支撐性。

值得一提的是，這張顯卡還有一張黑色版本的RTX 5080 WINDFORCE OC SFF 風魔16G，作為5080的入門款，配有NVIDIA SFF-READY，將強大的性能融入到小巧的外形中，搭配新一代仿生風扇，可將風壓提升高達53.6%，風量提升12.5%，服務器級導熱凝膠，大型均熱板和復合式熱管、進氣格柵等散熱技術(shù)進一步提升產(chǎn)品散熱性能，售價8299元。

測試平臺

為保證測試成績沒有瓶頸，選擇了目前最強游戲處理器銳龍7 9800X3D搭配技嘉X870魔鷹主板，內(nèi)存用的金士頓FURT DDR5 6000 CL30，固態(tài)硬盤則選擇致鈦的TiPlus 7100 2TB。

目前2.61版本的GPU-Z還無法正確識別顯卡規(guī)格，但核心加速頻率已正確識別為2730MHz，比公版頻率高出113MHz。

基準測試和游戲測試

我們先來看3Dmark的跑分成績，得益于Blackwell的先進架構(gòu)設(shè)計，RTX 5080以5%的流處理器提升跑出了比RTX 4080S高20%左右的成績，其中光追測試的Port Royal、Speed Way更是能保持23%和22%的領(lǐng)先幅度。

我們選擇了8款游戲用來測試傳統(tǒng)的光柵化性能，分辨率分別是2560 x 1440和3840 x 2160，如果支持光追的游戲手動關(guān)閉，并開啟最高畫質(zhì)設(shè)定。從測試成績可以看到，RTX 5080保持了在基準測試中的性能優(yōu)勢，成績在8款游戲中均領(lǐng)先于RTX 4080S，平均領(lǐng)先幅度在16%左右。其中，領(lǐng)先幅度最高的是《賽博朋克2077》，在2K分辨率和4K分辨率分別比RTX 4080S快23%和25%，其他游戲則各有高低?？傮w來說RTX 5080在4K分辨率下的性能優(yōu)勢更強，并且足已駕馭絕大多數(shù)游戲在4K分辨率下的畫質(zhì)全開需求。

光追游戲的測試結(jié)果類似，RTX 5080的幀數(shù)比RTX 4080S快了大約17%，且同樣在4K分辨率下有著更強的性能優(yōu)勢。另一方面，RTX 5080基本能滿足2K分辨率的光追全開畫質(zhì)，但在4K分辨率下還是建議開DLSS技術(shù)。

說到DLSS技術(shù)，就不得不提和RTX 50系列顯卡同時間上線的DLSS 4技術(shù)，它引入了多幀生成技術(shù)（MFG）和Transformer模型的更新，最高可將幀數(shù)提升至原始幀數(shù)的8倍以上。

《賽博朋克2077》便是首批宣布支持DLSS4技術(shù)的游戲之一，我們也提前體驗了支持DLSS4技術(shù)的Beta版更新。不過因為測試版沒有中文，所以只能用英語版本給大家展示，相信到RTX 50正式開售時，正式版本也應該發(fā)布了?？梢钥吹健顿惒┡罂?077》的DLSS設(shè)置增加了Transformer模型選項，下方還有DLSS 多幀生成技術(shù)（MFG）選項，一共有三檔，分別是2X、3X和4X，檔位越高幀數(shù)提升也就越高，但相應畫質(zhì)也會有所壓縮。

前面我們測試了RTX 5080在《賽博朋克2077》里，4K分辨率、畫質(zhì)全開、光追全開，幀數(shù)只有36幀。如果打開DLSS 3的質(zhì)量模式，幀數(shù)能翻倍到64幀左右。如果借助DLSS 4技術(shù)的加持，即使只開到2X，幀數(shù)也能達到109幀的流暢水平。如果開到3X，那幀數(shù)就來到了154幀的高刷流暢水平，開到4X幀數(shù)就更恐怖了，直接達到194幀，幾乎是電競游戲的高刷水平，相較原生幀數(shù)提升了5.3倍。

當然，我知道你肯定對畫質(zhì)有所顧慮，我們也對比了DLSS4開到3X和4X的畫質(zhì)表現(xiàn)。坦白的說，DLSS 4和原生畫質(zhì)對比不可能沒有任何損失，但我個人覺得這個畫質(zhì)損失在接受的范圍內(nèi)，基本是陰影部分的細節(jié)有略微損失，整體畫質(zhì)與DLSS 3的質(zhì)量模式相當。而DLSS 3的質(zhì)量模式只能實現(xiàn)翻倍的幀數(shù)提升，現(xiàn)在DLSS 4卻能實現(xiàn)5倍以上的幀數(shù)，以這點畫質(zhì)損失來換取數(shù)倍的幀數(shù)提升，我認為還是非常劃算的。

除了游戲內(nèi)設(shè)定DLSS 4，還可以通過NVIDIA App來實現(xiàn)DLSS 4的開關(guān)以及畫質(zhì)的優(yōu)化。例如《漫威爭鋒》也是首批支持DLSS 4技術(shù)的游戲之一，但游戲內(nèi)無法實時設(shè)置DLSS 4。這時候就需要NVIDIA App來進行手動設(shè)置或自動優(yōu)化。設(shè)置方法跟游戲內(nèi)置的DLSS 4差不多，都是開啟幀生成然后設(shè)置一下倍率，應用了之后再打開游戲。

漫威爭鋒對于RTX 5080的壓力不算大，4K分辨率畫質(zhì)全開也有93幀左右，開啟DLSS 4幀生成 3X，幀數(shù)達到了296幀左右，幾乎是原生幀數(shù)3.2倍。如果開啟DLSS 4幀生成 4X，幀數(shù)就來到了373幀，搭配一臺高端OLED顯示器，你就能體驗一下極致高刷的樂趣。

AI與生產(chǎn)力性能

雖然RTX 5080是一張游戲顯卡，但我們還是測了它的AI性能。首先測試的是Geekbench AI，在AI相關(guān)的三個量化標準：單精度浮點、半精度浮點、量化性能上，RTX 5080都要強于RTX 4080S。尤其是RTX 5080新增了FP4的低精度支持，在半精度浮點性能上足足比RTX 4080S高出19%。

另外我們還用UL Procyon的Stable Diffusion測試組建測試了文生圖的速度。RTX 5080生成一張512x512的圖大約需要1.785秒，而RTX 4080S生成一張512x512的圖則需要2.083秒，足足快了14%。4組每組4張，共16張圖，RTX 5080耗時28.553秒，RTX 4080S耗時33.334秒，同樣節(jié)約了14%的時間。如果你是Stable Diffusion的內(nèi)容創(chuàng)作者，一天可能出個幾千上萬張圖，那這14%的差距就能為你節(jié)約大量的時間。

生產(chǎn)力我們主要測試了一下渲染軟件的表現(xiàn)。Blender是最常用的3D渲染引擎之一，可以渲染動畫、圖像、結(jié)構(gòu)圖等等，測試使用Blender的Benchmark，對三種場景進行渲染?？梢钥吹皆趍onster和classroom項目里，RTX 5080比RTX 4080S快5%左右，而在junkshop項目里更是領(lǐng)先13%。

V-Ray是一個3D渲染引擎，支持路徑跟蹤、光子映射等等，可以使用CUDA加速或者RT Core進行渲染。在V-Ray的Benchmark測試里，RTX 5080的成績比RTX 4080S高出大約22%。

目前已有超過120款常用軟件如Adobe全家桶、MAYA、達芬奇、Blender支持英偉達的CUDA加速和AI功能。

散熱與壓力測試

使用Furmark進行壓力測試，分辨率1920 x 1080，燒機40分鐘后，技嘉RTX 5080 AERO OC雪鷹顯卡的核心溫度大約64度，功耗360W，顯存溫度和熱點溫度未能識別出正確數(shù)值，故不做統(tǒng)計。這時候顯卡風扇轉(zhuǎn)速只有1800RPM左右，比旁邊的CPU風扇還低，基本聽不到什么明顯的風噪。

總結(jié)

總的來說，Blackwell架構(gòu)和RTX 50系列顯卡是極具革新意義的一代顯卡，顯卡光柵化的性能已經(jīng)來到了邊際效應的臨界點，單純靠提升流處理器規(guī)模已經(jīng)很難獲得大幅度的性能提升，所以英偉達另辟蹊徑以AI技術(shù)作為切入點實現(xiàn)了畫質(zhì)和幀數(shù)的平衡點。從第一代的DLSS超分到DLSS幀生成再到DLSS多幀生成，不可否認的是DLSS技術(shù)讓預算不高的玩家也能流暢玩游戲，讓想開光追的玩家體驗到了流暢的光追，讓4K+光追+高刷有了落地的可能，而這也是英偉達將來要繼續(xù)走的路線。

技嘉RTX 5080 AERO OC雪鷹顯卡有著全白色外觀且支持NVIDIA SFF-READY規(guī)范，可以放心的裝在全白主題的小機箱里，它的性能足已滿足你4K分辨率畫質(zhì)全開的游戲需求，如果疊加DLSS4帶來的數(shù)倍幀數(shù)提升，你甚至可以體驗一下4K+畫質(zhì)全開+光追全開+高刷的游戲爽感，不夸張的說用個幾代都不用換顯卡了。