狙殺GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版顯卡深度圖解評(píng)測(cè)

AMD正式發(fā)布了這款采用革命性HBM顯存的全球首款公版水冷顯卡,這款卡實(shí)在是太過(guò)驚艷,驚艷了業(yè)界也驚艷了我。過(guò)了一年,AMD發(fā)布了采用14nm的Polaris顯卡,在業(yè)界掀起了紅色革命,AMD的獨(dú)顯市場(chǎng)份額也從2成上升到了3成。又過(guò)了一年,AMD終于在今年7月發(fā)布了久違的旗艦級(jí)顯卡——RADEON RX VEGA 64/56,眾多A飯翹首期盼的AMD卡皇終于降世了!
此時(shí)此刻,距離AMD上一代基于Fiji(斐濟(jì))核心的旗艦顯卡Radeon R9 Fury X誕生已經(jīng)過(guò)去了兩年零一個(gè)多月的時(shí)間,這在以往是非常不可思議的。
尤其是過(guò)去一年多來(lái),NVIDIA Pascal家族逐次推進(jìn),從高到低完整覆蓋,AMD方面雖然也有全新的Polaris(北極星)核心,但畢竟是個(gè)小核心,在中低端市場(chǎng)上表現(xiàn)穩(wěn)健,卻沒(méi)有一位老大哥帶頭,總是缺乏底氣。
Vega核心最早的說(shuō)法是2016年10月份就會(huì)登場(chǎng),但在眾多玩家尤其是A飯們的焦急等待中,又是十個(gè)月過(guò)去了,Vega才終于瓜熟蒂落,而此時(shí)距離其主要競(jìng)爭(zhēng)對(duì)手GTX 1080/1070的誕生,也已經(jīng)有一年零三個(gè)月之久了。
對(duì)于Vega為何遲到這么久,AMD高級(jí)副總裁兼Radeon技術(shù)事業(yè)部首席架構(gòu)師Raja Koduri對(duì)我們解釋說(shuō):
一是14nm工藝,這是AMD第一次同時(shí)在CPU和GPU上使用同一種工藝。
二是Vega架構(gòu)是全新設(shè)計(jì)的,從底層開(kāi)始都煥然一新,而如今設(shè)計(jì)一種全新的高性能計(jì)算架構(gòu),不但要做好高端游戲,還要滿(mǎn)足圖形工作站、高性能計(jì)算、機(jī)器學(xué)習(xí)等各方面的需求。
當(dāng)然,AMD作為唯一一家同時(shí)擁有高性能CPU、GPU計(jì)算平臺(tái)的企業(yè),本身并不是多么財(cái)大氣粗,同時(shí)面臨Intel、NVIDIA兩大可以分別專(zhuān)注一個(gè)領(lǐng)域的強(qiáng)敵,可以說(shuō)相當(dāng)不易,走過(guò)的每一步都值得尊重。
回來(lái)再說(shuō)Vega,作為一個(gè)全新設(shè)計(jì)的高性能核心,它肩上的擔(dān)子是相當(dāng)重的,玩游戲也只是一個(gè)方面,它要做的事兒多著呢。
事實(shí)上在此之前,Vega家族已經(jīng)逐漸開(kāi)始生根發(fā)芽,甚至可以說(shuō)逐漸枝繁葉茂了。
在服務(wù)器和高性能計(jì)算領(lǐng)域,我們見(jiàn)到了Radeon Instinct MI25,直面NVIDIA Tesla系列,完美搭檔自家EPYC服務(wù)器處理器;
在圖形工作站領(lǐng)域,我們有了Radeon Pro WX 9100、Radeon Pro SSG,不但競(jìng)爭(zhēng)NVIDIA Quadro系列,后者還首創(chuàng)了顯卡集成SSD,容量高達(dá)2TB,后續(xù)據(jù)稱(chēng)還有Radeon Pro 64/56;
在游戲開(kāi)發(fā)領(lǐng)域,Radeon Vega Frontier Edition風(fēng)冷版、水冷版大家也都不陌生了,這也是AMD對(duì)于NVIDIA Titan X/Xp的一個(gè)回應(yīng);
在游戲領(lǐng)域,AMD也是卯足了勁,首發(fā)就有三款產(chǎn)品(也可以說(shuō)四款),而且后續(xù)還有更多驚喜!
【Vega架構(gòu)解析:AMD GPU五年來(lái)最革命性進(jìn)步】
不知不覺(jué),Radeon這個(gè)顯卡品牌已經(jīng)誕生17年了,也伴隨太多DIYer走過(guò)了青春歲月,而時(shí)代在變化,Radeon面臨的需求也越發(fā)多樣化。
AMD在技術(shù)白皮書(shū)中特別指出,除了傳統(tǒng)游戲不斷沖擊視覺(jué)技術(shù)極限,GPU還面臨著更廣泛需求的挑戰(zhàn),從機(jī)器學(xué)習(xí)到專(zhuān)業(yè)視覺(jué)化,從虛擬化到虛擬現(xiàn)實(shí),GPU的計(jì)算能力也在快速跟上,以滿(mǎn)足超大數(shù)據(jù)集的需求,但是GPU存儲(chǔ)能力并未得到顯著提升。
為此,AMD全新設(shè)計(jì)了Vega架構(gòu),這也是GCN圖形架構(gòu)誕生五年以來(lái),AMD GPU最革命性的變化。
不過(guò),新核心的變化實(shí)在太多了,涉及幾乎所有方面,而且很多都過(guò)于專(zhuān)業(yè),所以這里我們之挑選其中幾個(gè)要點(diǎn)和大家分享。
1、Vega 10:高集成度的大核心
Vega架構(gòu)的第一個(gè)產(chǎn)品是“Vega 10”,一個(gè)相對(duì)大規(guī)模的芯片,面向高分辨率游戲、VR虛擬現(xiàn)實(shí)、高性能計(jì)算和機(jī)器學(xué)習(xí)、高負(fù)載工作站等領(lǐng)域。
它采用14nm LPP FinFET工藝制造,集成了125億個(gè)晶體管,核心面積486平方毫米。
相比之下,28nm工藝的上代大核心Fiji集成了89億個(gè)晶體管,面積卻有596平方毫米,也就是說(shuō)Vega 10核心晶體管規(guī)模多了整整40%,面積卻縮小了18%!
另外,同樣14nm工藝的Polaris 10核心集成57億個(gè)晶體管,核心面積232平方毫米,Vega 10與之相比晶體管多了1.2倍,面積增大了1.1倍,集成度也有所提高。
Vega 10核心經(jīng)過(guò)優(yōu)化后,可以充分利用FinFET工藝的低漏電率優(yōu)勢(shì),頻率也高于以往任何Radeon顯卡,官方標(biāo)稱(chēng)最高加速頻率就有1.67GHz,而實(shí)際運(yùn)行中完全可以超過(guò)1.7GHz,實(shí)測(cè)中甚至見(jiàn)到過(guò)1.75GHz。
相比之下,上代Fiji核心最多只能加速到1GHz左右,Polaris 10最高則是超過(guò)1.3GHz。
Raja表示,14nm工藝對(duì)CPU和GPU來(lái)說(shuō)都很平衡,在CPU上可以實(shí)現(xiàn)高頻率,GPU上則可以實(shí)現(xiàn)高集成度,比如Vega就因此比Fiji核心要小得多,但是性能高出很多。
Vega 10核心依然有64個(gè)計(jì)算單元、4096個(gè)流處理器,規(guī)模上和Fiji是一樣的,但憑借高進(jìn)的架構(gòu)和更高的頻率,單精度浮點(diǎn)計(jì)算性能達(dá)到了驚人的13.7TFlops(每秒13.7萬(wàn)億次計(jì)算),而且還支持16位數(shù)學(xué)計(jì)算,半精度浮點(diǎn)性能達(dá)27.4TFlops。
Vega 10還是AMD第一個(gè)使用了Infinity Fabric互連設(shè)計(jì)的GPU核心,也就是Zen處理器里的那一套。這種低延遲的SoC型互連總線(xiàn)可以在芯片的不同模塊之間提供一致性通信,也使得芯片設(shè)計(jì)更加彈性靈活,可以做到模塊化,能隨時(shí)根據(jù)需要加入不同配置和模塊。
Vega 10芯片中,Infinity Fabric連接著圖形核心與其他主要邏輯模塊,包括顯存控制器、PCI-E控制器、顯示引擎、視頻加速器等等,也為未來(lái)的APU奠定了基礎(chǔ)。
2、全新顯存架構(gòu)和高帶寬緩存控制器(HBCC)
GPU通常需要在本地顯存中保存所需要數(shù)據(jù)集或者資源的全部,因?yàn)樽逷CI-E等外部通道的話(huà),將無(wú)法保證足夠的帶寬或延遲。
隨著軟件內(nèi)存管理的日益復(fù)雜,這對(duì)開(kāi)發(fā)者提出了越來(lái)越高的挑戰(zhàn),而顯存成本又決定了不可能把容量做到特別大。
為此,Vega架構(gòu)可以將本地顯存作為末級(jí)緩存使用。如果GPU要訪(fǎng)問(wèn)的部分?jǐn)?shù)據(jù)不在顯存之內(nèi),可以通過(guò)PCI-E總線(xiàn)獲取所需內(nèi)存頁(yè)面,并保存在高帶寬緩存中,而不是讓GPU停下來(lái),等待完成全部所需資源的復(fù)制。
頁(yè)面通常比整個(gè)紋理等資源小得多,復(fù)制可以迅速完成,后續(xù)訪(fǎng)問(wèn)就直接從緩存中拉取,延遲自然非常低。
這主要得益于Vega架構(gòu)新增的高帶寬緩存控制器(HBCC),可以將遠(yuǎn)程內(nèi)存作為本地緩存使用,同時(shí)可以將本地顯存作為末級(jí)緩存使用。
HBCC支持49位尋址,最多能訪(fǎng)問(wèn)512TB虛擬尋址空間,而現(xiàn)代CPU的尋址空間也不過(guò)48位,同時(shí)比最多10+GB的顯存也多了幾個(gè)數(shù)量級(jí)。
HBCC被視為Vega架構(gòu)中最大的革新,簡(jiǎn)單地說(shuō)可以把整個(gè)系統(tǒng)內(nèi)存當(dāng)做顯存來(lái)使用,相當(dāng)于一塊顯卡可以擁有TB級(jí)別的高速顯存,無(wú)論性能還是容量都不是事兒。
換言之,它實(shí)現(xiàn)了某種程度上的一體化內(nèi)存池,這部分AMD稱(chēng)之為“HBCC內(nèi)存區(qū)”(HMS)。
Radeon Pro SSG之所以能板載2TB SSD,就是得益于這種設(shè)計(jì),消除了從GPU到SSD之間的隔閡,可以直接訪(fǎng)問(wèn)其中的數(shù)據(jù),從而大大降低延遲和過(guò)載。
為了將這種設(shè)計(jì)發(fā)揮到極致,Vega架構(gòu)其他部分也做了針對(duì)性調(diào)整,比如說(shuō)二級(jí)緩存就扮演著中心角色,容量翻番到4MB,所有圖形區(qū)塊都直接與其相連,而以往像素引擎是有自己的緩存的。
當(dāng)然,HBCC設(shè)計(jì)也需要開(kāi)發(fā)者去學(xué)習(xí)適應(yīng),才能挖掘和釋放其最大潛力,而且它也不是必須使用的,開(kāi)發(fā)者如果對(duì)顯存容量和性能沒(méi)有特別高的要求,仍然可以走傳統(tǒng)路線(xiàn)。
顯存方面,Vega搭配了第二代高帶寬顯存HBM2,類(lèi)似Fiji那樣與GPU核心整合封裝,使用硅中介層與GPU物理互連。
得益于新的技術(shù)和工藝,HBM2最多可以堆疊8個(gè),單顆容量最大8GB,Vega專(zhuān)業(yè)卡就用了兩顆供16GB,RX Vega家族則配備了兩顆供8GB。
同時(shí),HBM2每個(gè)堆棧的位寬達(dá)1024-bit,因此只需很低的頻率,就能提供極高的帶寬。
在顯卡驅(qū)動(dòng)控制面板中,用戶(hù)可以根據(jù)自己的需要,手動(dòng)調(diào)整HMS的容量范圍。
3、下一代計(jì)算單元(NCU)
AMD GCN架構(gòu)的核心模塊是計(jì)算單元(CU),Vega也是如此,但同樣做了全面翻新,官方稱(chēng)之為下一代計(jì)算單元(NCU)。
NCU的一個(gè)亮點(diǎn)變化就是加入了快速堆疊運(yùn)算(Rapid Packed Math/RPM),允許兩個(gè)FP16半精度的運(yùn)算同時(shí)執(zhí)行,并支持豐富的16位浮點(diǎn)和整數(shù)指令集,包括FMA、MUL、ADD、MIN/MAX/MED、Bit Shift等等。
一般來(lái)說(shuō),日常游戲、3D渲染對(duì)單精度FP32、雙精度FP64要求比較高,而在大規(guī)模深度計(jì)算中,F(xiàn)P16半精度十分關(guān)鍵。
Vega首次支持半精度計(jì)算,每個(gè)NCU擁有64個(gè)ALU,可以靈活地執(zhí)行緊縮數(shù)學(xué)操作指令,比如每個(gè)周期可執(zhí)行512個(gè)8位數(shù)學(xué)計(jì)算,或者256個(gè)16位計(jì)算,或者128個(gè)32位計(jì)算。這不僅充分利用了硬件資源,也能大幅度提升Vega在深度學(xué)習(xí)上的性能。
RPM專(zhuān)門(mén)用于加速FP16半精度的運(yùn)算速度,比如新的著色器可以利用RPM,在AMD一直引以為傲的TressFX毛發(fā)渲染中,將每秒能渲染的頭發(fā)數(shù)量增加一倍,因此,RPM可以幫助GPU核心進(jìn)行更快更強(qiáng)的的物理計(jì)算。
NCU還可以同時(shí)進(jìn)行計(jì)算和圖形處理,并且能夠根據(jù)負(fù)載不同而變換SIMD單元寬度,結(jié)果就是以往需要多個(gè)計(jì)算單元才能完成的任務(wù),現(xiàn)在只需一個(gè)就能搞定,不會(huì)造成浪費(fèi)。
種種改進(jìn)結(jié)合,Vega 10核心可以每秒鐘執(zhí)行27萬(wàn)億次浮點(diǎn)計(jì)算,或者55萬(wàn)億次整數(shù)操作。
4、下一代幾何引擎
Vega的整個(gè)幾何引擎針對(duì)更高三角形吞吐量做了優(yōu)化,增加了新的快速硬件路徑,比以往更有彈性、可編程性。
Vega幾何引擎里的創(chuàng)新很多,最具代表性的當(dāng)屬新的原語(yǔ)著色器(Primitive Shader),可以合并部分幾何處理流水線(xiàn),拋棄隱藏的、沒(méi)必要的原語(yǔ),代之以新的高效著色類(lèi)型,而且啟動(dòng)非???,每時(shí)鐘周期的峰值原語(yǔ)剔除率是以前的四倍。
Vega 10擁有四個(gè)幾何引擎,加入了新的原語(yǔ)著色器之后,每時(shí)鐘周期的最大原語(yǔ)吞吐量可以超過(guò)17個(gè),而以前只能做到4個(gè)。
同時(shí),Vega架構(gòu)還加入了新的智能負(fù)載分配器(IWD),可以根據(jù)實(shí)際情況持續(xù)調(diào)整流水線(xiàn)設(shè)定,更好地平衡各個(gè)幾何引擎之間的負(fù)載,提高利用率。
5、下一代像素引擎
隨著4K/5K/8K超高分辨率和240Hz高刷新率顯示器的出現(xiàn)和普及,以及VR虛擬現(xiàn)實(shí)的進(jìn)一步發(fā)展,顯卡像素吞吐能力也面臨著越來(lái)越大的壓力,Vega為此重新設(shè)計(jì)了像素引擎,加入了大量新功能。
相關(guān)文章
GTX1080Ti顯卡對(duì)電源功率有要求嗎?GTX1080Ti顯卡應(yīng)該配多大功率電源才
近日,網(wǎng)上有很多朋友都在問(wèn)“GTX1080ti要搭配多大的電源?1080ti需要多少功率的電源?”等問(wèn)題,針對(duì)這類(lèi)問(wèn)題,本文就為大家介紹GTX1080Ti顯卡對(duì)電源功率的要求2018-03-12迪蘭惡魔RX Vega 56全面詳細(xì)評(píng)測(cè):游戲性能力戰(zhàn)GTX1080公版顯卡
迪蘭惡魔RX Vega 56采用和迪蘭惡魔RX Vega 64一樣的外觀設(shè)計(jì),那么,迪蘭惡魔RX Vega 56性能怎么樣?值得購(gòu)買(mǎi)呢?對(duì)此,本文就為大家?guī)?lái)了迪蘭惡魔RX Vega 56全面詳細(xì)評(píng)測(cè)2018-01-18GTX1070Ti和GTX1080哪個(gè)好 GTX1080與GTX1070Ti性能參數(shù)詳細(xì)對(duì)比評(píng)測(cè)
很顯然GTX1070Ti可以看作是GTX1070進(jìn)化升級(jí)版,且GTX1070Ti性能接近GTX1080顯卡,那么,GTX1070Ti和GTX1080哪個(gè)更值得購(gòu)買(mǎi)呢?對(duì)此,本文就為大家?guī)?lái)了GTX1080與GTX1070Ti2017-11-09微星GTX1080Ti魔龍TRIO性能如何?微星GTX 1080 Ti GAMING X TRIO顯卡圖
MSI微星發(fā)布了發(fā)燒級(jí)旗艦顯卡產(chǎn)品GeForce GTX 1080 Ti GAMING X TRIO魔龍顯卡,使用的是雙風(fēng)扇,其散熱效果絲毫不亞于其他廠商的三風(fēng)扇“巨無(wú)霸”,那么這款顯卡還有什么特2017-10-23微星GTX 1080Ti LightningZ值得買(mǎi)嗎?微星GTX1080 Ti新閃電全面圖解評(píng)
微星新一代閃電GTX1080Ti LIGHTNINGZ發(fā)布,采用的是第四代軍規(guī)用料設(shè)計(jì),是微星旗下最引以為傲的超公版旗艦系列顯卡產(chǎn)品,下面就詳情來(lái)看看微星閃電GTX1080Ti評(píng)測(cè)情況2017-08-19索泰1080Ti小鋼炮怎么樣?索泰GTX1080Ti Mini詳細(xì)評(píng)測(cè)圖解
索泰推出了一款超級(jí)迷你GTX 1080Ti Mini,強(qiáng)大的GP102核心,讓許多愛(ài)好小機(jī)箱的玩家饑渴難耐,那么索泰GTX 1080Ti Mini怎么樣值得買(mǎi)嗎?下面就詳情來(lái)看看評(píng)測(cè)了解下2017-08-10段造極致 七彩虹iGame GTX1080Ti Kudan卡皇全面圖解評(píng)測(cè)+拆解
自于七彩虹最最頂級(jí)的旗艦顯卡系列“九段”會(huì)搭載七彩虹最為先進(jìn)的顯卡技術(shù),而這個(gè)號(hào)稱(chēng)只為1%頂級(jí)玩家服務(wù)全新iGame GTX1080Ti Kudan又是如何的呢?下面就詳情來(lái)看看七彩2017-07-27索泰GTX1080 Ti寒冰至尊顯卡詳細(xì)深度拆解評(píng)測(cè)
索泰十周年使出了終極殺手锏—GeForce GTX 1080 Ti寒冰至尊,11G 352bit GDDR5X的超大顯存,強(qiáng)悍的散熱性能配上極致的用料,對(duì)于喜歡動(dòng)手操作的DIY玩家來(lái)說(shuō),擁有極大的超2017-07-14iGame GTX 1080怎么樣?帶屏幕的iGame GTX 1080評(píng)測(cè)+拆解圖
iGame推出了全新的Vilcan X系列顯卡,此系列由烈焰戰(zhàn)勝升級(jí)而來(lái),并且全系列都將配備彩色液晶顯示屏,那么iGame GTX 1080怎么樣?iGame GTX 1080性能如何?iGame GTX 10802017-07-03絕地求生吸金超十億 映眾GTX1080超級(jí)版冰龍暢爽吃雞
截至今年4月《絕地求生》已經(jīng)賺得了超過(guò)10億美元。此外還有分析師指出,有40%的《絕地求生》玩家來(lái)自中國(guó),今天為大家介紹一款暢玩吃雞游戲的顯卡GTX1080超級(jí)版冰龍,趕緊2018-05-23