DLSS4開啟電競級3A新時代 技嘉RTX 5080 AERO雪鷹顯卡全面評測

1月7日,英偉達在CES 2025發(fā)布了備受期待的GeForce RTX 50系列顯卡,首發(fā)產(chǎn)品包括RTX 5090(D)、RTX 5080、RTX 5070Ti和RTX 5070四個型號。GeForce RTX 50系列顯卡搭載了全新的Blackwell架構(gòu),可以說是近年來變革最大的GPU架構(gòu),為我們帶來了全新的SM單元流處理器、第四代RT Core、第五代Tensor Core、GDDR7顯存等新特性,另外還有RTX神經(jīng)網(wǎng)絡著色器、DLSS 4、Reflex 2、Transformer模型、多幀生成等新技術的誕生,可謂是重新定義了未來游戲發(fā)展的新方向,將AI技術納入圖形渲染的核心地位。
NVIDIA Blackwell架構(gòu)
SM單元
我們先來簡單了解一下Blackwell架構(gòu)的變化。首先是SM單元,上代Ada架構(gòu)SM單元里的著色器核心有兩種,一種能執(zhí)行FP32運算,另一種能執(zhí)行FP32或INT32運算,運算能力更傾向于浮點運算。而Blackwell則升級成了統(tǒng)一著色器核心,可按需執(zhí)行FP32或INT32運算,大幅度提高了著色器核心的整數(shù)運算能力,運算效率和調(diào)度也更為靈活。英偉達表示這種運算單元的改動是為了神經(jīng)網(wǎng)絡著色器而優(yōu)化。
第五代Tensor核心
第五代Tensor核心增加了對FP4精度的支持,相較于上代Ada核心的FP8精度,F(xiàn)P4精度的運算吞吐量可提升2倍。模型精度越低對運算性能和空間的開銷也就越低,低精度的量化可以減少模型的體積,降低對顯存的要求,提高運算速度。而在端側(cè)的推理運算大部分都采用低精度模型,偶有高精度模型也會通過量化操作來降低精度,所以更低精度的支持意味著顯卡有更高的靈活度減少硬件的開銷
第四代RT核心
第四代RT核心繼承了上代的 Box Intersection Engine和Opacity Micromap Engine,原有的Triangle Intersection Engine升級為Triangle Cluster Intersection Engine,并新增Triangle Cluster Decompression Engine用以處理更大規(guī)模的三角形相交場景。另外還新增了 Linear Swept Spheres用以處理毛發(fā)的光線碰撞,減少硬件開銷。
英偉達將其稱為Mega Geometry,并表示其處理幾何圖形相交的能力要比Ada架構(gòu)提升2倍,顯存開銷降低25%。
GDDR7顯存
RTX 50系列顯卡還搭載了GDDR7顯存,因為采用了PAM3信號編碼,數(shù)據(jù)速率可達GDDR6的2倍,但功耗只需要GDDR6的一半。
編解碼功能
還有一個需要補充的是,Blackwell架構(gòu)終于支持DisplayPort 2.1 UHBR 20模式,可以輸出最高8K 165Hz的畫面,并且NVDEC解碼引擎升級到第九代,NVENC編碼引擎升級到第六代,AV1格式支持了UHQ超高質(zhì)量模式,HEVC(H.265)格式支持到MV-HEVC,色度空間支持更高規(guī)格4:2:2格式。
RTX神經(jīng)網(wǎng)絡著色器
RTX神經(jīng)網(wǎng)絡著色器是一項頗具科幻色彩的技術,咋聽之下似乎無法理解,但我們可以簡單理解為它是一項借助AI訓練來簡化、壓縮渲染流程和材質(zhì)數(shù)據(jù)的技術。這其中又細分為神經(jīng)網(wǎng)絡紋理(Neural Textures)、神經(jīng)網(wǎng)絡材質(zhì)(Neural Materials)、神經(jīng)網(wǎng)絡體積云(Neural Volumes)、神經(jīng)網(wǎng)絡輻射場(Neural Radiance Fields)、神經(jīng)網(wǎng)絡輻射緩存(Neural Radiance Cache)等5項技術。通過這項技術,開發(fā)者可以更高效、智能的完成開發(fā)過程,導出更匹配RTX的著色器數(shù)據(jù)。用戶也可以以更低的硬件開銷,獲得更高質(zhì)量的渲染畫面,可謂是雙贏的局面。
DLSS4
DLSS 4迎來了自2019年DLSS發(fā)布以來的最大革新:多幀生成技術(MFG)和Transformer模型。DLSS 3的幀生成技術是通過超采樣和光線重構(gòu)技術生成額外幀,并通過光流加速器插入原始幀中獲得幾乎翻倍的幀數(shù)提升。而DLSS 4技術得益于第五代Tensor核心的算力提升,可以在DLSS 3的基礎上再額外通過AI模型生成2幀畫面。如此以來,配合超采樣、光線重構(gòu)、光流插針以及多幀生成模型,DLSS4可以實現(xiàn)15/16的畫面生成,實現(xiàn)最高8倍的幀數(shù)提升。除了多幀生成技術,DLSS4還將原有的CNN卷積神經(jīng)網(wǎng)絡模型替換為Transformer模型(可選),能夠更好的處理自然語言和多頭注意力權重,生成的畫面會更穩(wěn)定,鬼影和運動模糊等問題也會大幅度減少。
相關文章
延續(xù)家族系列黑灰配色! 映眾RTX 5090 D曜夜X3顯卡開箱
年發(fā)布的RTX 50系列,可謂搶足風頭,包括超級冰龍、曜夜和映雪三大子品牌,比如那個號稱頂配王者的是RTX5090 D曜夜X3,下面我們就來看看這款顯卡的開箱2025-01-24高端發(fā)燒玩家的白色戀人! AX電競叛客RTX 5090 D X3W顯卡開箱
今天我們就為大家送上來自柏能集團旗下品牌AX電競叛客的RTX 5090 D X3W顯卡的圖賞,近距離欣賞這款純白大作的魅力2025-01-24游戲黨RTX 50顯卡無腦入還是抄底舊款? 建議看完這個你再決定
RTX 5070在光追開啟的情況下相比于RTX 4070提升了不到30%的性能,這樣的高性價比的背后,究竟隱藏了怎樣的玄機?值不值得無腦入?建議看完這個你再決定2025-01-24七彩虹首張RTX 50系顯卡! iGame GeForce RTX 5090 D Advanced 32GB開箱
首款GeForce RTX 50系顯卡---GeForce RTX 5090D就要在國內(nèi)亮相啦,這款顯卡怎么樣?下面我們就來看看開箱體驗2025-01-22雙風扇散熱600W! 英偉達 RTX 50系列公版散熱方案拆解首次揭秘
英偉達最近公布了更多關于 RTX 50 系列公版顯卡散熱器的細節(jié),并對其作了更完善的技術剖析,與以往的公版顯卡散熱方案相比,RTX 5090公版采用了全新的散熱架構(gòu),實現(xiàn)了更高2025-01-21RTX 2060 SUPER對比ARC B580差別大嗎? 兩款顯卡游戲性能測評
ARC B580非常適合那些對游戲畫質(zhì)要求不高,仍然在使用老顯卡的游戲玩家入手升級,今天我們就來看看對比ARC B580和GeForce RTX 2060 SUPER的游戲性能2025-01-06ARC B580對比RTX3060性能差多少? 兩款顯卡游戲性能測評
在2024年12月初,英特爾發(fā)布了ARC B580,該顯卡的整體性能表現(xiàn)尚可,大致與GeForce RTX 4060持平,那么和RTX3060差多少呢?詳細請看下文測評2025-01-06RTX 3070和ARC B580性能差別有多大? 兩款顯卡游戲性能對比測評
ARC B580的性能肯定無法與GeForce RTX 3070相提并論,但是加上價格的加持,也是可以放在一起測評一下的,下面我們通過七款游戲?qū)Ρ華RC B580和GeForce RTX 3070的性能2025-01-062K游戲性能領先RTX 4060多少? 傲世LUMI追日B580 OC顯卡評測
傲世LUMI追日B580 OC顯卡以其高顏值的全白化設計脫穎而出,無論是正面的散熱裝甲、散熱風扇還是背板,都采用了純白色調(diào),顯得既簡約又大氣,下面我們就來看看詳細測評2024-12-18Intel 新顯卡Arc B580對比RTX 4060差多少? 四款游戲性能對比測評
有朋友想看看Intel 新顯卡Arc B580和NVIDIA RTX 4060顯卡兩款哪款更值得選購,下面我們就來看看四款游戲測評2024-12-18