亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

DLSS4開啟電競級3A新時代 技嘉RTX 5080 AERO雪鷹顯卡全面評測

  發(fā)布時間:2025-02-08 09:09:45   作者:佚名   我要評論
作為全球一線板卡廠商的技嘉,為玩家們推出了超級雕(黑/白)、魔鷹、雪鷹和風魔、等一系列產(chǎn)品線的旗艦顯卡,今天我們就來看看RTX 5080 AERO雪鷹顯卡測評

1月7日,英偉達在CES 2025發(fā)布了備受期待的GeForce RTX 50系列顯卡,首發(fā)產(chǎn)品包括RTX 5090(D)、RTX 5080、RTX 5070Ti和RTX 5070四個型號。GeForce RTX 50系列顯卡搭載了全新的Blackwell架構(gòu),可以說是近年來變革最大的GPU架構(gòu),為我們帶來了全新的SM單元流處理器、第四代RT Core、第五代Tensor Core、GDDR7顯存等新特性,另外還有RTX神經(jīng)網(wǎng)絡(luò)著色器、DLSS 4、Reflex 2、Transformer模型、多幀生成等新技術(shù)的誕生,可謂是重新定義了未來游戲發(fā)展的新方向,將AI技術(shù)納入圖形渲染的核心地位。

NVIDIA Blackwell架構(gòu)

SM單元

我們先來簡單了解一下Blackwell架構(gòu)的變化。首先是SM單元,上代Ada架構(gòu)SM單元里的著色器核心有兩種,一種能執(zhí)行FP32運算,另一種能執(zhí)行FP32或INT32運算,運算能力更傾向于浮點運算。而Blackwell則升級成了統(tǒng)一著色器核心,可按需執(zhí)行FP32或INT32運算,大幅度提高了著色器核心的整數(shù)運算能力,運算效率和調(diào)度也更為靈活。英偉達表示這種運算單元的改動是為了神經(jīng)網(wǎng)絡(luò)著色器而優(yōu)化。

第五代Tensor核心

第五代Tensor核心增加了對FP4精度的支持,相較于上代Ada核心的FP8精度,F(xiàn)P4精度的運算吞吐量可提升2倍。模型精度越低對運算性能和空間的開銷也就越低,低精度的量化可以減少模型的體積,降低對顯存的要求,提高運算速度。而在端側(cè)的推理運算大部分都采用低精度模型,偶有高精度模型也會通過量化操作來降低精度,所以更低精度的支持意味著顯卡有更高的靈活度減少硬件的開銷

第四代RT核心

第四代RT核心繼承了上代的 Box Intersection Engine和Opacity Micromap Engine,原有的Triangle Intersection Engine升級為Triangle Cluster Intersection Engine,并新增Triangle Cluster Decompression Engine用以處理更大規(guī)模的三角形相交場景。另外還新增了 Linear Swept Spheres用以處理毛發(fā)的光線碰撞,減少硬件開銷。

英偉達將其稱為Mega Geometry,并表示其處理幾何圖形相交的能力要比Ada架構(gòu)提升2倍,顯存開銷降低25%。

GDDR7顯存

RTX 50系列顯卡還搭載了GDDR7顯存,因為采用了PAM3信號編碼,數(shù)據(jù)速率可達GDDR6的2倍,但功耗只需要GDDR6的一半。

編解碼功能

還有一個需要補充的是,Blackwell架構(gòu)終于支持DisplayPort 2.1 UHBR 20模式,可以輸出最高8K 165Hz的畫面,并且NVDEC解碼引擎升級到第九代,NVENC編碼引擎升級到第六代,AV1格式支持了UHQ超高質(zhì)量模式,HEVC(H.265)格式支持到MV-HEVC,色度空間支持更高規(guī)格4:2:2格式。

RTX神經(jīng)網(wǎng)絡(luò)著色器

RTX神經(jīng)網(wǎng)絡(luò)著色器是一項頗具科幻色彩的技術(shù),咋聽之下似乎無法理解,但我們可以簡單理解為它是一項借助AI訓練來簡化、壓縮渲染流程和材質(zhì)數(shù)據(jù)的技術(shù)。這其中又細分為神經(jīng)網(wǎng)絡(luò)紋理(Neural Textures)、神經(jīng)網(wǎng)絡(luò)材質(zhì)(Neural Materials)、神經(jīng)網(wǎng)絡(luò)體積云(Neural Volumes)、神經(jīng)網(wǎng)絡(luò)輻射場(Neural Radiance Fields)、神經(jīng)網(wǎng)絡(luò)輻射緩存(Neural Radiance Cache)等5項技術(shù)。通過這項技術(shù),開發(fā)者可以更高效、智能的完成開發(fā)過程,導出更匹配RTX的著色器數(shù)據(jù)。用戶也可以以更低的硬件開銷,獲得更高質(zhì)量的渲染畫面,可謂是雙贏的局面。

DLSS4

DLSS 4迎來了自2019年DLSS發(fā)布以來的最大革新:多幀生成技術(shù)(MFG)和Transformer模型。DLSS 3的幀生成技術(shù)是通過超采樣和光線重構(gòu)技術(shù)生成額外幀,并通過光流加速器插入原始幀中獲得幾乎翻倍的幀數(shù)提升。而DLSS 4技術(shù)得益于第五代Tensor核心的算力提升,可以在DLSS 3的基礎(chǔ)上再額外通過AI模型生成2幀畫面。如此以來,配合超采樣、光線重構(gòu)、光流插針以及多幀生成模型,DLSS4可以實現(xiàn)15/16的畫面生成,實現(xiàn)最高8倍的幀數(shù)提升。除了多幀生成技術(shù),DLSS4還將原有的CNN卷積神經(jīng)網(wǎng)絡(luò)模型替換為Transformer模型(可選),能夠更好的處理自然語言和多頭注意力權(quán)重,生成的畫面會更穩(wěn)定,鬼影和運動模糊等問題也會大幅度減少。

顯卡規(guī)格

從規(guī)格上看,RTX 5080的規(guī)格大約比上代RTX 4080S提高了5%左右,SM單元增加4組,CUDA核心增加512個,Tensor Core張量核心增加16個,RT Core光追核心增加4個。當然,更重要的是Tensor Core張量核心和RT Core光追核心分別從第四代和第三代迭代到第五代和第四代。另外顯存也更換為了速度更快的GDDR7顯存,供電接口則是更安全的12V-2X6接口,TGP功耗提高了40W,達到360W。建議零售價8299元,僅比上代貴了200元,可謂是加量不加價。

基本規(guī)格核心加速頻率:2730MHz顯示核心:GB203CUDA核心:10752個顯存位寬:256-bit顯存容量:16GB GDDR7顯存帶寬:960GB/s顯卡接口:PCIe 5.0 x 16視頻輸出接口:DisplayPort 2.1 x 3 / HDMI 2.1 x 1整體功耗(TGP):360W推薦電源功耗:850W外接供電:12V-2X6厚度:2槽顯卡尺寸:304mm x 126mm x 50mm

我們評測的是技嘉RTX 5080 AERO OC SFF 16G雪鷹顯卡,這是技嘉白色主題的主流級顯卡,搭載技嘉風之力散熱系統(tǒng),采用仿生風扇、服務器級導熱凝膠、大面積均熱板等多項技術(shù),提供強勁的散熱性能,并支持NVIDIA SFF-READY規(guī)范,可安裝在SFF-Ready規(guī)格的小機箱里。

細節(jié)介紹

RTX 5080雪鷹顯卡的外觀以銀白配色為主,圓潤的線條為輔,沒有過多的紋理裝飾,整體看上去比較簡約、素雅。

背部采用全尺寸金屬背板,尾部設(shè)計有大面積進氣格柵。

顯卡供電接口由上代的12VHPWR接口更換為更安全的12V-2×6接口,雖然外觀看上去一模一樣,但里面的針腳長度有所調(diào)整。供電接口旁邊是雙BIOS開關(guān),支持性能和靜音兩檔。

顯卡頂部的線條依然保持了圓角設(shè)計,圓潤感十足。左側(cè)的AERO字樣支持RGB燈光效果,可通過技嘉的GCC管家設(shè)置燈光模式和顏色。

視頻輸出接口由3個DP 2.1和1個HDMI 2.1組成,最高可支持8K 165Hz的視頻輸出。

風之力散熱系統(tǒng)配備三個10cm仿生風扇,葉片設(shè)計靈感來源于鷹的翅膀空氣動力學,有效降低風阻和噪音,可將風壓提升高達53.6%,風量提升12.5%。同時,它也支持3D啟停技術(shù),當GPU溫度較低或處于較低負載時,風扇將會自動停止運轉(zhuǎn),提供更安靜的使用體驗。

附件方面送了一根12V-2×6接口的轉(zhuǎn)接線,注意這根轉(zhuǎn)接線需要3 x 8Pin顯卡供電線。另外還有一組定制顯卡支架,提供更好的顯卡支撐性。

值得一提的是,這張顯卡還有一張黑色版本的RTX 5080 WINDFORCE OC SFF 風魔16G,作為5080的入門款,配有NVIDIA SFF-READY,將強大的性能融入到小巧的外形中, 搭配新一代仿生風扇,可將風壓提升高達53.6%,風量提升12.5%, 服務器級導熱凝膠,大型均熱板和復合式熱管、進氣格柵等散熱技術(shù)進一步提升產(chǎn)品散熱性能,售價8299元。

測試平臺

為保證測試成績沒有瓶頸,選擇了目前最強游戲處理器銳龍7 9800X3D搭配技嘉X870魔鷹主板,內(nèi)存用的金士頓FURT DDR5 6000 CL30,固態(tài)硬盤則選擇致鈦的TiPlus 7100 2TB。

目前2.61版本的GPU-Z還無法正確識別顯卡規(guī)格,但核心加速頻率已正確識別為2730MHz,比公版頻率高出113MHz。

基準測試和游戲測試

我們先來看3Dmark的跑分成績,得益于Blackwell的先進架構(gòu)設(shè)計,RTX 5080以5%的流處理器提升跑出了比RTX 4080S高20%左右的成績,其中光追測試的Port Royal、Speed Way更是能保持23%和22%的領(lǐng)先幅度。

我們選擇了8款游戲用來測試傳統(tǒng)的光柵化性能,分辨率分別是2560 x 1440和3840 x 2160,如果支持光追的游戲手動關(guān)閉,并開啟最高畫質(zhì)設(shè)定。從測試成績可以看到,RTX 5080保持了在基準測試中的性能優(yōu)勢,成績在8款游戲中均領(lǐng)先于RTX 4080S,平均領(lǐng)先幅度在16%左右。其中,領(lǐng)先幅度最高的是《賽博朋克2077》,在2K分辨率和4K分辨率分別比RTX 4080S快23%和25%,其他游戲則各有高低??傮w來說RTX 5080在4K分辨率下的性能優(yōu)勢更強,并且足已駕馭絕大多數(shù)游戲在4K分辨率下的畫質(zhì)全開需求。

光追游戲的測試結(jié)果類似,RTX 5080的幀數(shù)比RTX 4080S快了大約17%,且同樣在4K分辨率下有著更強的性能優(yōu)勢。另一方面,RTX 5080基本能滿足2K分辨率的光追全開畫質(zhì),但在4K分辨率下還是建議開DLSS技術(shù)。

說到DLSS技術(shù),就不得不提和RTX 50系列顯卡同時間上線的DLSS 4技術(shù),它引入了多幀生成技術(shù)(MFG)和Transformer模型的更新,最高可將幀數(shù)提升至原始幀數(shù)的8倍以上。

《賽博朋克2077》便是首批宣布支持DLSS4技術(shù)的游戲之一,我們也提前體驗了支持DLSS4技術(shù)的Beta版更新。不過因為測試版沒有中文,所以只能用英語版本給大家展示,相信到RTX 50正式開售時,正式版本也應該發(fā)布了??梢钥吹健顿惒┡罂?077》的DLSS設(shè)置增加了Transformer模型選項,下方還有DLSS 多幀生成技術(shù)(MFG)選項,一共有三檔,分別是2X、3X和4X,檔位越高幀數(shù)提升也就越高,但相應畫質(zhì)也會有所壓縮。

前面我們測試了RTX 5080在《賽博朋克2077》里,4K分辨率、畫質(zhì)全開、光追全開,幀數(shù)只有36幀。如果打開DLSS 3的質(zhì)量模式,幀數(shù)能翻倍到64幀左右。如果借助DLSS 4技術(shù)的加持,即使只開到2X,幀數(shù)也能達到109幀的流暢水平。如果開到3X,那幀數(shù)就來到了154幀的高刷流暢水平,開到4X幀數(shù)就更恐怖了,直接達到194幀,幾乎是電競游戲的高刷水平,相較原生幀數(shù)提升了5.3倍。

當然,我知道你肯定對畫質(zhì)有所顧慮,我們也對比了DLSS4開到3X和4X的畫質(zhì)表現(xiàn)。坦白的說,DLSS 4和原生畫質(zhì)對比不可能沒有任何損失,但我個人覺得這個畫質(zhì)損失在接受的范圍內(nèi),基本是陰影部分的細節(jié)有略微損失,整體畫質(zhì)與DLSS 3的質(zhì)量模式相當。而DLSS 3的質(zhì)量模式只能實現(xiàn)翻倍的幀數(shù)提升,現(xiàn)在DLSS 4卻能實現(xiàn)5倍以上的幀數(shù),以這點畫質(zhì)損失來換取數(shù)倍的幀數(shù)提升,我認為還是非常劃算的。

除了游戲內(nèi)設(shè)定DLSS 4,還可以通過NVIDIA App來實現(xiàn)DLSS 4的開關(guān)以及畫質(zhì)的優(yōu)化。例如《漫威爭鋒》也是首批支持DLSS 4技術(shù)的游戲之一,但游戲內(nèi)無法實時設(shè)置DLSS 4。這時候就需要NVIDIA App來進行手動設(shè)置或自動優(yōu)化。設(shè)置方法跟游戲內(nèi)置的DLSS 4差不多,都是開啟幀生成然后設(shè)置一下倍率,應用了之后再打開游戲。

漫威爭鋒對于RTX 5080的壓力不算大,4K分辨率畫質(zhì)全開也有93幀左右,開啟DLSS 4幀生成 3X,幀數(shù)達到了296幀左右,幾乎是原生幀數(shù)3.2倍。如果開啟DLSS 4幀生成 4X,幀數(shù)就來到了373幀,搭配一臺高端OLED顯示器,你就能體驗一下極致高刷的樂趣。

AI與生產(chǎn)力性能

雖然RTX 5080是一張游戲顯卡,但我們還是測了它的AI性能。首先測試的是Geekbench AI,在AI相關(guān)的三個量化標準:單精度浮點、半精度浮點、量化性能上,RTX 5080都要強于RTX 4080S。尤其是RTX 5080新增了FP4的低精度支持,在半精度浮點性能上足足比RTX 4080S高出19%。

另外我們還用UL Procyon的Stable Diffusion測試組建測試了文生圖的速度。RTX 5080生成一張512x512的圖大約需要1.785秒,而RTX 4080S生成一張512x512的圖則需要2.083秒,足足快了14%。4組每組4張,共16張圖,RTX 5080耗時28.553秒,RTX 4080S耗時33.334秒,同樣節(jié)約了14%的時間。如果你是Stable Diffusion的內(nèi)容創(chuàng)作者,一天可能出個幾千上萬張圖,那這14%的差距就能為你節(jié)約大量的時間。

生產(chǎn)力我們主要測試了一下渲染軟件的表現(xiàn)。Blender是最常用的3D渲染引擎之一,可以渲染動畫、圖像、結(jié)構(gòu)圖等等,測試使用Blender的Benchmark,對三種場景進行渲染??梢钥吹皆趍onster和classroom項目里,RTX 5080比RTX 4080S快5%左右,而在junkshop項目里更是領(lǐng)先13%。

V-Ray是一個3D渲染引擎,支持路徑跟蹤、光子映射等等,可以使用CUDA加速或者RT Core進行渲染。在V-Ray的Benchmark測試里,RTX 5080的成績比RTX 4080S高出大約22%。

目前已有超過120款常用軟件如Adobe全家桶、MAYA、達芬奇、Blender支持英偉達的CUDA加速和AI功能。

散熱與壓力測試

使用Furmark進行壓力測試,分辨率1920 x 1080,燒機40分鐘后,技嘉RTX 5080 AERO OC雪鷹顯卡的核心溫度大約64度,功耗360W,顯存溫度和熱點溫度未能識別出正確數(shù)值,故不做統(tǒng)計。這時候顯卡風扇轉(zhuǎn)速只有1800RPM左右,比旁邊的CPU風扇還低,基本聽不到什么明顯的風噪。

總結(jié)

總的來說,Blackwell架構(gòu)和RTX 50系列顯卡是極具革新意義的一代顯卡,顯卡光柵化的性能已經(jīng)來到了邊際效應的臨界點,單純靠提升流處理器規(guī)模已經(jīng)很難獲得大幅度的性能提升,所以英偉達另辟蹊徑以AI技術(shù)作為切入點實現(xiàn)了畫質(zhì)和幀數(shù)的平衡點。從第一代的DLSS超分到DLSS幀生成再到DLSS多幀生成,不可否認的是DLSS技術(shù)讓預算不高的玩家也能流暢玩游戲,讓想開光追的玩家體驗到了流暢的光追,讓4K+光追+高刷有了落地的可能,而這也是英偉達將來要繼續(xù)走的路線。

技嘉RTX 5080 AERO OC雪鷹顯卡有著全白色外觀且支持NVIDIA SFF-READY規(guī)范,可以放心的裝在全白主題的小機箱里,它的性能足已滿足你4K分辨率畫質(zhì)全開的游戲需求,如果疊加DLSS4帶來的數(shù)倍幀數(shù)提升,你甚至可以體驗一下4K+畫質(zhì)全開+光追全開+高刷的游戲爽感,不夸張的說用個幾代都不用換顯卡了。

相關(guān)文章

最新評論