腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

性能飆升12.5倍! Intel銳炫B580/B570顯卡性能測(cè)評(píng)

發(fā)布時(shí)間：2024-12-05 16:14:49 作者：佚名

我要評(píng)論

Intel發(fā)布了第二代銳炫B系列顯卡，首發(fā)兩型號(hào)銳炫B580、B570，定位主流市場(chǎng)，主要面向2K超高畫質(zhì)游戲玩家，下面我們寄來看看性能測(cè)評(píng)

Intel今天正式發(fā)布了代號(hào)Battlemage的第二代銳炫B系列顯卡，首發(fā)兩型號(hào)銳炫B580、B570，而此時(shí)距離第一代A系列最初登場(chǎng)已經(jīng)兩年多了。

兩款新品定位主流市場(chǎng)，主要面向2K超高畫質(zhì)游戲玩家，大致對(duì)標(biāo)NVIDIA RTX 4060系列、AMD RX 7600系列。

因?yàn)楦鶕?jù)Intel提供的數(shù)據(jù)，1080p在游戲玩家中的占比逐年遞減，如今已經(jīng)降至56％，2K分辨率則增長(zhǎng)到了22％，預(yù)計(jì)到2026年即可實(shí)現(xiàn)反超。

這一代，Intel主打三個(gè)亮點(diǎn)：最佳性價(jià)比、XeSS 2、AI加速。我們會(huì)逐一和大家介紹。

新的Xe2架構(gòu)在前代Xe基礎(chǔ)上進(jìn)行大量的優(yōu)化改進(jìn)，尤其是投入了大量精力對(duì)架構(gòu)的兼容性和軟件開銷進(jìn)行重構(gòu)和優(yōu)化。

Xe2不僅進(jìn)一步提升了軟件的適配性，還增強(qiáng)了架構(gòu)的效率，提高了資源利用率，特別是減輕了軟件對(duì)硬件的開銷。

先來看一下兩款新卡的公版規(guī)格，后邊再講架構(gòu)和技術(shù)。

銳炫B580配備了20個(gè)新一代Xe2核心(分為5個(gè)切片)，對(duì)比上代A580反而少了4個(gè)核心與1個(gè)切片，同時(shí)有20個(gè)光追單元、160個(gè)XXM AI引擎。

不過，核心頻率從1700MHz大幅提高到2670MHz，彌補(bǔ)了核心數(shù)量的不足，INT8算力性能從197 TOPS來到了233 TOPS，提升幅度約18％。

顯存位寬從256-bit降至192-bit，但是容量從8GB GDDR6擴(kuò)大到12GB GDDR6，等效頻率也從16GHz提高到19GHz，因此帶寬從512GB/s略微降至456GB/s。

整卡功耗190W，只增加了區(qū)區(qū)5W，從而大大提高了能效比，只需單個(gè)8針供電。

銳炫B570做了一部分精簡(jiǎn)，配備18個(gè)Xe2核心、18個(gè)光追單元、144個(gè)XMX引擎，核心頻率略降至2500MHz，INT8算力性能203 TOPS。

搭配160-bit 10GB GDDR6顯存，等效頻率依然是19GHz，帶寬380GB/s，整卡功耗僅為150W。

系統(tǒng)總線接口很遺憾并不是PCIe 5.0，而且從PCIe 4.0 x16砍半為PCIe 4.0 x8，當(dāng)然對(duì)這種級(jí)別的卡來說影響可以忽略不計(jì)。

硬件解碼支持AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H，但是不支持更新的VVC(H.266)。

視頻輸出支持HDMI 2.1、DisplayPort 2.1 UHBR 13.5——上代是DP 2.0 UHBR 10。

官方宣稱，銳炫B580對(duì)比定位更高的銳炫A750，平均性能提升幅度可達(dá)24％。

特別是打開XeSS之后，提升更加明顯，《堡壘之夜》甚至可達(dá)78％，《刺客信條：幻景》也能有56％。

對(duì)比競(jìng)品RTX 4060，平均領(lǐng)先幅度為10％，考慮到種種因素，可以大致視為二者基本在同一檔次，和RX 7600也基本差不多。

沒有達(dá)到之前預(yù)期的RTX 4060 Ti的水平，有點(diǎn)小遺憾。

不過無論對(duì)比RTX 4060還是RX 7600，銳炫B580的一個(gè)顯著優(yōu)勢(shì)就是顯存多了一半，在游戲中更不容易爆顯存，運(yùn)行AI負(fù)載時(shí)也更有余力。

這一次，Intel依然打造了官方公版，也就是限量版。

仍舊是雙風(fēng)扇、雙插槽、黑色風(fēng)格，重點(diǎn)優(yōu)化了散熱設(shè)計(jì)，背面有一半都做了散熱格柵，風(fēng)流更大，噪音也更低。

首批合作伙伴除了老朋友宏碁、華擎、藍(lán)戟、撼與，還新增了兩家，一是常年主打高性價(jià)比的銘瑄，二是新的傲世創(chuàng)科(Onix)。

各品牌普遍都做了雙風(fēng)扇、三風(fēng)扇兩種設(shè)計(jì)，除了宏碁暫時(shí)只有一款雙風(fēng)扇，傲世創(chuàng)科則都是雙風(fēng)扇。

銳炫B580顯卡將于12月13日正式上市(12日晚評(píng)測(cè)解禁)，定價(jià)249美元起。

要知道，銳炫A750兩年多前首發(fā)的時(shí)候，還是要289美元。

銳炫B570顯卡則要等到明年1月16日才會(huì)開賣，定價(jià)219美元起。

其實(shí)，Lunar Lake即酷睿Ultra 200V系列處理器中已經(jīng)率先應(yīng)用Xe2架構(gòu)的核顯，也就是銳炫140V、銳炫130V，如今終于來到了桌面獨(dú)立顯卡，未來還會(huì)陸續(xù)進(jìn)入筆記本獨(dú)立顯卡、車載方案、嵌入式方案等。

Intel表示，Xe2架構(gòu)相對(duì)于初代，重點(diǎn)就是提升各方面的效率，包括更高的利用率、更好的負(fù)載分配、更好的軟件開銷等等。

同時(shí)，Xe架構(gòu)誕生兩年多來，Intel一直在努力完善驅(qū)動(dòng)、游戲的生態(tài)支持，先后迭代了50多個(gè)版本的驅(qū)動(dòng)，新游戲0日支持超過120款，游戲適配優(yōu)化數(shù)量也比當(dāng)初增加了2.5倍。

這就是Xe2的整體架構(gòu)圖，主體依然是渲染切片，這是整個(gè)SoC芯片的基本結(jié)構(gòu)，配合指令前端、二級(jí)緩存構(gòu)成一個(gè)整體，和第一代如出一轍，基本沒啥變化。

每個(gè)渲染切片內(nèi)包含4個(gè)Xe核心(計(jì)算引擎)、4個(gè)光追單元，以及4個(gè)采樣器、幾何單元、光柵單元、HiZ單元(層次Z)、兩個(gè)像素后端等模塊。

各個(gè)部分的具體變化，下邊拆開來講。

二代Xe2核心除了繼續(xù)原生支持SIMD16指令，還增加了對(duì)SIMD32的支持，雖然不是原生，但執(zhí)行SIMD32指令是沒問題的，從而能夠更好地分配計(jì)算資源，還支持64位原子操作。

每個(gè)Xe核心內(nèi)部，包含8個(gè)512位的矢量引擎(XVE)、8個(gè)2048位的XMX引擎，比上代減少了足足一半，可能調(diào)度效率會(huì)更高、更靈活。

這一次，Intel為每個(gè)Xe核心加入了多達(dá)256KB容量的一級(jí)緩存、本地共享緩存(SLM)，大大減輕了對(duì)二級(jí)緩存的依賴。

XVE矢量引擎除了支持SIMD16/SIMD32，還支持矩陣擴(kuò)展，包括INT2、INT4、INT8、FP16、BF16、TF32等數(shù)據(jù)類型，其中TF32是針對(duì)AI優(yōu)化的數(shù)據(jù)格式還擴(kuò)展了Math、FP64支持。

另外，它還支持三路并發(fā)，包括FP、INT/EM、XMX，指令調(diào)度和執(zhí)行效率更高。

對(duì)比初代，XVE引擎現(xiàn)在更小巧(基本可以視為砍半)，應(yīng)該也會(huì)更靈活。

光追部分，Intel也做了大刀闊斧地改進(jìn)，整體結(jié)構(gòu)沒太大變化，但是規(guī)模和性能高得多，比如遍歷流水線從2條增至3條、方盒相交增大1.5倍、三角形相交增大2倍、BVH(包圍盒層次結(jié)構(gòu))緩存增大2倍來到16KB。

這樣的規(guī)模當(dāng)然遠(yuǎn)遠(yuǎn)沒法和NVIDIA相比，甚至不如AMD，但提升也是相當(dāng)明顯的，應(yīng)該能夠達(dá)到基本可用的水平，當(dāng)然更有賴于游戲的適配和優(yōu)化。

媒體引擎包含兩個(gè)相同的多媒體解碼器(MFX)，但注意它和Lunar Lake里集成的核顯媒體引擎略有不同，沒有XMX硬件編解碼單元，因此不支持VVC(H.266)硬解碼。

這就是BMG-G21，二代銳炫顯卡首發(fā)的GPU核心芯片。

它總共有5個(gè)渲染切片、20個(gè)Xe2核心、20個(gè)光追單元、160個(gè)XMX引擎、20個(gè)紋理采樣器、10個(gè)像素后端，以及2個(gè)多格式X編解碼器，還有多達(dá)18MB二級(jí)緩存、192位顯存。

各家的GPU架構(gòu)設(shè)計(jì)不同，所以核心規(guī)模不具備直接可比性，但如果將這些與NVIDIA GPU類比，那就相當(dāng)于80個(gè)ROP光柵單元、160個(gè)TMU紋理單元。

這是因?yàn)?，紋理采樣器轉(zhuǎn)換為TMU的比例是1:8，像素后端與ROP的轉(zhuǎn)換比例同樣是1:8。

按照Intel的首發(fā)，經(jīng)過優(yōu)化的第二代Xe核心，性能提高了70％，能效提高了50％。

而在一組微基準(zhǔn)測(cè)試中，性能提升幅度最高可達(dá)驚人的12.5倍。

比如在《堡壘之夜》中，上圖白線代表銳炫A系列，藍(lán)線代表銳炫B系列，單位是毫秒，時(shí)間則越短越好。

銳炫A系列執(zhí)行一幀渲染的時(shí)間為19.33毫秒，銳炫B系列則縮短到了13.01毫秒。

關(guān)鍵是，每一個(gè)渲染環(huán)節(jié)的效率都更高了，比如直接執(zhí)行節(jié)省了1.1毫秒，間接執(zhí)行節(jié)省了1.5毫秒等。

這也就證明，銳炫B系列的每一個(gè)地方都做了微架構(gòu)優(yōu)化，都可以節(jié)省渲染時(shí)間，從而提升渲染效率和性能。

隨著圖形技術(shù)的進(jìn)步，單純的渲染已經(jīng)不足以反應(yīng)GPU計(jì)算能力，也無法做到顯著提升性能，AI渲染就越來越普遍。

XeSS就是Intel打造的AI超分解決方案，對(duì)標(biāo)NVIDIA DLSS、AMD FSR，在較低分辨率的畫面幀的基礎(chǔ)上，提取運(yùn)動(dòng)矢量，使用超分辨率技術(shù)進(jìn)行放大和加速，從而生成更高質(zhì)量的圖像。

官方號(hào)稱，在2K超高畫質(zhì)游戲中，XeSS可以帶來22-80％的性能提升，尤其是在光追等像素生成較為困難的場(chǎng)景中效果更明顯。

經(jīng)過不斷努力，Intel XeSS已經(jīng)有超過150款游戲支持，初具規(guī)模。

如今，XeSS終于升級(jí)為第二代，SR超分技術(shù)基礎(chǔ)上增加了兩項(xiàng)新技術(shù)：XeSS FG幀生成技術(shù)，提升畫面質(zhì)量與幀率；XeLL低延遲技術(shù)，提升響應(yīng)速度。

XeSS FG幀生成技術(shù)的工作原理是：首先使用游戲引擎，原生渲染出第一幀和第二幀，然后通過插幀技術(shù)和AI算法，生成二者之間的中間幀并插入。

為了實(shí)現(xiàn)這一目標(biāo)，Intel采用了兩種技術(shù)，分別是光流重投影技術(shù)、運(yùn)動(dòng)矢量重投影技術(shù)，二者結(jié)合以確保插幀的準(zhǔn)確性、畫面的流暢性。

不過不同于NVIDIA RTX 40系列，Intel不需要單獨(dú)的光流加速器硬件，至于是否支持NVIDIA、AMD的顯卡還在評(píng)估。

目前暫時(shí)還沒有支持XeSS FG幀生成的游戲，畢竟剛剛宣布，但是《F1 24》等游戲已經(jīng)在積極開發(fā)集成，UE等游戲引擎也可以通過插件支持。

當(dāng)然，XeSS SR超分、XeSS FG幀生成兩項(xiàng)技術(shù)也是可以一起使用的。

XeSS SR渲染一個(gè)稍低分辨率的畫面幀，并將它放大，在送到XeSS FG插幀里，實(shí)現(xiàn)幀率翻倍。

比如《F1 24》，可以看到XeSS 2的性能提升是非常顯著的，遠(yuǎn)超初代XeSS。

2K超高畫質(zhì)下，銳炫B580的基準(zhǔn)幀率為48FPS，開啟XeSS 2質(zhì)量模式就能提升至2.8倍，不但比初代XeSS高了超過65％，甚至超過了XeSS SR超高性能模式。

依次開啟XeSS 2平衡模式、性能模式、超高性能模式，幀率還可以逐步提升，最終高達(dá)186FPS，是原生性能的幾乎4倍。

介紹XeLL低延遲技術(shù)之前，先回顧一下PC游戲中的系統(tǒng)延遲怎么來的。

這個(gè)過程始于玩家點(diǎn)擊鼠標(biāo)的動(dòng)作，一直持續(xù)到畫面最終顯示在屏幕上，這個(gè)過程所需要的時(shí)間，就是我們說的延遲。

具體來說，玩家操作的信號(hào)首先傳遞給CPU，隨后進(jìn)入一個(gè)稱作渲染隊(duì)列的環(huán)節(jié)，然后GPU將這些指令轉(zhuǎn)換成屏幕上的像素，最后這些像素構(gòu)成的圖像呈現(xiàn)在顯示器上。

整個(gè)流程中的每一步都可能增加延遲，累積起來就是我們?cè)谟螒蛑懈惺艿降目D現(xiàn)象。

為了盡可能降低延遲，NVIDIA打造了Reflex技術(shù)，AMD則推出了兩代Anti-Lag，現(xiàn)在輪到了Intel XeLL。

XeLL重點(diǎn)針對(duì)CPU渲染隊(duì)列等待過程，基本消除了它，從而大大縮短了從鼠標(biāo)點(diǎn)擊到屏幕顯示的整個(gè)過程。

Intel PresentMon工具已經(jīng)可以顯示具體延遲，方便玩家測(cè)量從鼠標(biāo)輸入到系統(tǒng)顯示的整個(gè)延遲時(shí)間。

同時(shí)，Intel內(nèi)部還開發(fā)了延遲測(cè)量工具(LMT)，基于微控制器的一款特殊設(shè)備。

實(shí)際性能如何呢？還是以《F1 24》為例。

原生渲染時(shí)，48FPS幀率的延遲是57毫秒，而在開啟XeLL之后，延遲降低到了32毫秒，改善了多達(dá)45％。

更神奇的是，如果把XeSS SR、FG、XeLL低延遲全部打開，可以把延遲降至28毫秒，改善51％，同時(shí)幀率高達(dá)152FPS，提升2.17倍。

當(dāng)然，也可以只開啟SR、低延遲，此時(shí)延遲僅有19ms，改善足有67％，而幀率為90FPS，仍有原生渲染的接近2倍。

除了游戲原生支持，XeLL低延遲技術(shù)還可以基于驅(qū)動(dòng)程序?qū)崿F(xiàn)，因此效果不是最好的，但很容易集成到游戲中。

首發(fā)支持的有《F1 24》、《漫威暗夜之子》、《刺客信條：幻景》等等，未來還會(huì)有更多加入。

AI，尤其是生成式AI，是如今GPU繞不開的話題，銳炫B系列也通過增強(qiáng)的XMX引擎，提供了更好的支持。

銳炫B580對(duì)比RTX 4060，運(yùn)行常見的Llama 2、Llama 3.1、Mistral、Phi-3等大型語言模型，都有相當(dāng)大的性能優(yōu)勢(shì)，最多領(lǐng)先約50％。

Intel之前還推出了一個(gè)免費(fèi)的生成式AI工具AI Playground 2.0，專為Xe2架構(gòu)而來(包括核顯)。

它允許用戶在本地端側(cè)體驗(yàn)圖像創(chuàng)建、編輯、AI對(duì)話等，下載模型即可體驗(yàn)，無需連接云端。

好的顯卡，除了好的硬件架構(gòu)技術(shù)，更離不開好的驅(qū)動(dòng)，Intel也在持續(xù)完善，功能不斷豐富，無論是圖形設(shè)置、3D設(shè)置，還是超頻，該有的都有。

說到超頻，銳炫B系列當(dāng)然也可以，而且更簡(jiǎn)單，在驅(qū)動(dòng)中開啟高級(jí)模式即可操作。

上圖中，淺藍(lán)色顯示的是默認(rèn)頻率和電壓曲線，玩家可以向上推動(dòng)該曲線，從而提升頻率，獲得更高的性能。

玩家還可以使用電壓偏移來改變電壓，并訪問更多電壓點(diǎn)，這一切都實(shí)時(shí)可見。

電壓、功耗都可以設(shè)置一定的最高閾值，確保安全超頻。

以銳炫B580為例，默認(rèn)狀態(tài)下即可輕松超頻200MHz；增加20％功耗可以再超200MHz；繼續(xù)增加25％電壓還能繼續(xù)超200MHz。

當(dāng)然，具體超頻幅度和電壓、功耗設(shè)置，取決于顯卡的不同個(gè)體體質(zhì)，以及散熱等外部因素。

Tag：銳炫B580 銳炫B570 顯卡測(cè)評(píng)

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

性能飆升12.5倍! Intel銳炫B580/B570顯卡性能測(cè)評(píng)

相關(guān)文章

最新評(píng)論

文章分類

大家感興趣的內(nèi)容

最近更新的內(nèi)容