銳龍9 3900X/銳龍7 3700X詳細(xì)圖文評測

二、技術(shù)解析:三代銳龍的花式神奇
有關(guān)Zen 2架構(gòu)的特性、三代銳龍?zhí)幚砥鞯男阅?、X570主板和AM4平臺的規(guī)格,之前我們已經(jīng)做過全面、深入的解讀,這里就不再過度贅述,僅總結(jié)一下其中最值得關(guān)注的亮點,也是為了展示新平臺的提升之巨大。
Zen 2架構(gòu)是Zen的第三個進(jìn)化版本,也是第一個大改版,其整體設(shè)計目標(biāo)有三:
一是追求更極致的性能,而且任何一個計算節(jié)點都要有更充裕的帶寬;二是結(jié)合最領(lǐng)先的制造工藝(7nm),在集成度、能效方面實現(xiàn)飛躍;三是靈活的擴(kuò)展性,可以在既有AM4封裝下無縫實現(xiàn)更多核心、更多I/O,并滿足各個領(lǐng)域的需求。
從最終的規(guī)格和性能表現(xiàn)看,Zen 2完美達(dá)成了預(yù)期水平,甚至可以說超額完成了任務(wù):IPC架構(gòu)性能提升達(dá)到了約15%,在任何應(yīng)用上都有顯著進(jìn)步;緩存容量直接翻番,作為最大軟肋的內(nèi)存延遲和游戲性能得到了極大的改觀;浮點性能直接翻倍,對于創(chuàng)作性應(yīng)用來說舊貌換新顏。
Zen 2架構(gòu)整體設(shè)計圖和提升概覽:可以說,在之前Zen+優(yōu)化完善增強(qiáng)的基礎(chǔ)之上,Zen 2將整個架構(gòu)的每一個模塊、每一處細(xì)節(jié)都進(jìn)行了精心的打磨,整體煥然一新。前端、預(yù)取、解碼、浮點單元、整數(shù)執(zhí)行、載入存儲、緩存、安全,Zen 2沒有放過任何一個角落。
于是,我們看到了全新的TAGE分支預(yù)測器、重塑的一致性緩存體系、翻番的三級緩存、4K指令微操作緩存、全面擴(kuò)大的整數(shù)單元、翻了一番的浮點單元、更高帶寬更低延遲的載入存儲、更快的安全虛擬化、硬件增強(qiáng)的安全防御、新的緩存與安全指令、強(qiáng)化的Infinity Fabric總線……等等等等。
最值得重點說道的地方有四個地方,一是預(yù)取部分,這里是一個架構(gòu)執(zhí)行效率和性能高低的關(guān)鍵所在。
三代銳龍采用了chiplet多個小芯片組合的設(shè)計方式,而為了協(xié)調(diào)分散的不同模塊,不但彼此之前有加強(qiáng)版的Infinity Fabric總線(高帶寬低延遲)、翻番的三級緩存(高命中率),還特別強(qiáng)化了分支預(yù)測,尤其是增加了新的TAGE分支預(yù)測器,同時加大了BTB(分支目標(biāo)緩沖器)容量,加大了1K ITA(間接目標(biāo)陣列),優(yōu)化了32KB一級緩存,,從而將預(yù)測錯誤率降低了大約30%,使得處理器可以花更少的時間完成前端分派工作,提高效率的同時也能節(jié)省功耗。
浮點單元的變化也非常大,吞吐量和性能直接翻了一番,關(guān)鍵就在于浮點和載入存儲帶寬從128bit翻倍到256bit,支持AVX2指令集,單個周期就可以一次性完成256bit指令,不必再像以前那樣拆分成兩個128bit指令再耗費兩個周期分別執(zhí)行。
很多人說Zen 2不支持AVX-512,但是一方面512bit指令非常稀少,除了部分專業(yè)領(lǐng)域日常應(yīng)用中是基本沒有的,而且執(zhí)行512bit指令非常耗電,打開之后功耗至少增加20%——不信的話試試用i9-9900K跑幾分鐘AVX-512滿載拷機(jī),不尿崩回來找我。
當(dāng)然,并不是說AVX-512毫無用處,只是需要分場合、分情況,目前消費級處理器支持它的使用價值還太低,架構(gòu)設(shè)計的時候必須有所取舍,或許隨著形勢的變化,未來的Zen架構(gòu)也會加入它。
Zen 2的緩存架構(gòu)也有極大調(diào)整,支持各級緩存一致性,可以大大降低有效延遲,并加入了新的緩存指令。
一級指令緩存從4-way 64KB調(diào)整為8-way 32KB,和一級數(shù)據(jù)緩存保持一致,關(guān)聯(lián)性更強(qiáng),預(yù)取和利用率都得到改進(jìn)。
二級緩存保持每核心8-way 512KB不變,三級緩存則翻番到了每核心對應(yīng)4MB(16核心就是64MB),可以很好地提升命中率和游戲性能。
對于多芯片設(shè)計,最關(guān)鍵的因素就是能不能保證不同模塊之間足夠高的帶寬和足夠低的延遲,AMD為此設(shè)計了Infinity Fabric總線(可以視為當(dāng)年赫赫有名的HyperTransport總線的超級進(jìn)化版),是如今和未來AMD CPU、GPU、APU的根基。
三代銳龍上,Infinity Fabric總線也進(jìn)化到了第二代,在擴(kuò)展性、延遲、能效各個方面都有顯著提升。
其中擴(kuò)展性上,特別針對消費級客戶端應(yīng)用做了優(yōu)化調(diào)整(之前更多還是數(shù)據(jù)中心上),并且總線寬度從256-bit翻番到512-bit,從而更好地支持PCIe 4.0,能效上則將單位功耗降低了多達(dá)27%。
延遲更是多芯片互連的致命所在,一旦處理不好會導(dǎo)致整體效率的低下,包括核心、緩存、內(nèi)存等各個模塊都必須保持最高效率和最低延遲。IF總線如今解綁了Fclk時鐘頻率、Uclk非核心頻率,可讓內(nèi)存運(yùn)行在更高頻率,同時降低了突發(fā)負(fù)載下的內(nèi)存延遲,加速了緩存與緩存之間的傳輸。
說到內(nèi)存,Zen架構(gòu)的內(nèi)存延遲一直是個痛點,但也在不斷改進(jìn),Zen 2架構(gòu)更是在內(nèi)存頻率和延遲之間設(shè)置了巧妙的平衡,根據(jù)實際需要可以有多種選擇。
三代銳龍官方支持的標(biāo)準(zhǔn)內(nèi)存頻率為DDR4-3200(前兩代分別為DDR4-2667/2933),但可以輕松超到DDR4-4200乃至更高,極限情況下甚至做到過DDR4-5133。
但內(nèi)存頻率并非絕對的越高越好。三代銳龍的IF總線頻率與內(nèi)存頻率有兩種比例,DDR4-3733及更低頻率的時候,二者是1:1,繼續(xù)提高內(nèi)存頻率,就變成了1:2,IF總線頻率反而會降低,所以延遲會反彈增加。
DDR4-3733的時候,內(nèi)存延遲是最低的只有67ns,提高到DDR4-3866的時候延遲會增加到80ns,之后緩慢降低,但就算到了DDR4-4400延遲依然有75ns,甚至高于DDR4-3200。
AMD推薦三代銳龍搭配的最佳內(nèi)存頻率是DDR4-3600(CL16),這時候綜合性能、價格是最為平衡的。除非你需要對內(nèi)存頻率特別敏感的地方,否則不建議超太高。
說到頻率,還有銳龍?zhí)幚砥鞅旧淼念l率。受制于架構(gòu)和工藝屬性,第一代銳龍的頻率不算高,自動超頻加速最多也不過4.1GHz,二代則來到了4.35GHz,最新的三代憑借架構(gòu)和工藝的雙重改進(jìn)最高可以跑到4.6GHz。
相比于競品,這似乎仍然還不是足夠高,很多人可是期待5GHz的,但是一方面,Zen 2架構(gòu)和7nm工藝也都有自己的限制,不可能隨拔高頻率,否則功耗就吃不消(7nm也還不是專門針對高性能計算的工藝),另一方面即便是現(xiàn)在的頻率,也足夠?qū)κ趾纫粔亓?,尤其是游戲性能?/p>
架構(gòu)說完了,來看看產(chǎn)品層面。如前所述,三代銳龍(和數(shù)據(jù)中心上的二代霄龍)采用了chiplet小芯片設(shè)計理念,模塊化組合不同單元實現(xiàn)不同規(guī)格,但比當(dāng)年的“膠水封裝”高明和復(fù)雜多了,不只是簡單地疊加芯片,而是要把不同工藝、架構(gòu)、功能的模塊按需搭配在一起,還得有利于整體性能發(fā)揮。
為什么要這么麻煩而不是單獨設(shè)計一個芯片?根本原因就是——錢!
隨著半導(dǎo)體公司的急劇復(fù)雜化,不但設(shè)計和量產(chǎn)一種新的制造工藝成本急劇增加,新的處理器也是如此,有說法稱在7nm工藝上設(shè)計一款芯片的費用超過3億美元。
即便不差錢真的設(shè)計出來,也要面臨制造成本、良品率的問題,因為越大、越復(fù)雜的芯片越容易有大量缺陷而無法正常使用。
chiplet小芯片設(shè)計就可以分擔(dān)風(fēng)險,大大降低成本并提高良品率,而且還有更多好處:一是每一個芯片模塊可以使用最適合自己的工藝,比如Zen 2 CPU部分使用最好的7nm工藝,盡可能提升性能,I/O輸入輸出部分則使用足夠好的12nm(霄龍里還是14nm),優(yōu)化電路并控制成本。
二是將I/O部分單獨拿出來之后,再結(jié)合新的高速低延遲IF總線,可以確保所有核心、緩存通信的一致性,肯定要比全部原生集成要差一些,但是仍然可以有足夠好的性能,而且綜合設(shè)計、制造各方面的因素,這無疑是最佳選擇。
三代銳龍?zhí)幚砥鲀?nèi)部有兩顆(銳龍7 3700X及之下)或三顆(銳龍7 3800X及之上)芯片,其中一顆是I/O Die,基本相當(dāng)于曾經(jīng)的北橋芯片,集成內(nèi)存控制器、IO Hub控制器(包括PCIe/USB/時鐘發(fā)生器/安全等等),另外一顆或兩顆是CPU Die,每一顆里邊有兩個CCX模塊,各有4個物理核心和16MB三級緩存,合計每顆就是8個物理核心和32MB三級緩存。
同時,I/O Die以及每個CPU Die里都有IF總線端口實現(xiàn)高速互通,但注意兩個CPU Die之間是沒有直接聯(lián)系的,比如經(jīng)過IF總線和I/O Die來交流,這樣的好處是CPU Die可以根據(jù)需要添加或減少,比如霄龍上就有多達(dá)八個,從而做到64核心,下一代線程撕裂者應(yīng)該會有最多四個也就是32核心。
三代銳龍chiplet設(shè)計的詳細(xì)架構(gòu)圖和電路走線圖,尤其后者可以清晰地看到I/O Die與CPU Die之間的各種通道,而兩個CPU Die之間并無直接關(guān)聯(lián)。
得益于新工藝、新架構(gòu)和chiplet設(shè)計,三代銳龍的每個CPU Die面積只有74平方毫米,制造起來易如反掌,同時里邊的每個CCX模塊面積僅31.3平方毫米,比二代銳龍縮小了足足47%,從而可以更輕松地做到更多核心。
AMD還宣稱,Zen架構(gòu)的多核擴(kuò)展性極佳,性能幾乎是隨著核心數(shù)量的增加而線性提升,比如從6核心到12核心,性能就增加了98%!
由于Zen系列架構(gòu)的設(shè)計和以往截然不同,除了硬件本身的優(yōu)化,也非常需要操作系統(tǒng)、軟件程序的支持和優(yōu)化。
AMD也在持續(xù)與微軟合作,最新發(fā)布的Windows 10 v1903五月更新版就有兩項針對銳龍的重要功能,可有效提升性能。
一是拓?fù)涓兄?/strong>,它會指示W(wǎng)indows 10進(jìn)程計劃程序優(yōu)先在單個CCX(四核心)內(nèi)生成和分配線程,直到用完這部分之后才會將線程遷移到第二個或者第三個CCX,這將有利于大部分游戲性能的提升。
二是UEFI CPPC2接口(協(xié)同電源和性能控制),是一種較新的時鐘速度選擇方法,對短時間和突發(fā)的工作負(fù)載特別有益,比如如網(wǎng)頁渲染和應(yīng)用程序啟動。
三代銳龍依然是AM4接口,從2016年的第七代APU引入開始已經(jīng)使用了四年,而且官方一直承諾至少會延續(xù)到2020年,目測對應(yīng)Zen 3架構(gòu)的第四代銳龍,而再往后由于要支持DDR5內(nèi)存的緣故,不換就不行了。
從28nm到7nm甚至到7nm+,從4核心4線程到16核心32線程甚至更多,從DDR4-2400到DDR4-3200甚至更高,從12條PCIe 3.0到24條PCIe 4.0甚至更多,一種接口能用這么多年,也是相當(dāng)?shù)牟灰缀土夹摹?/p>
三代銳龍繼續(xù)兼容300/400系列主板(入門級的A320除外),不過最佳拍檔當(dāng)然是新的頂級X570,二者組合才能實現(xiàn)PCIe 4.0,以及更多擴(kuò)展。
三代銳龍?zhí)幚砥鞅旧碇С?4條PCIe 4.0,保留4條用于連接X570,其余20條中有16條固定給顯卡,另外4條可以全部分給NVMe SSD,也可以2條給NVMe、2條做成SATA。
X570芯片組本身支持20條PCIe 4.0,同樣保留4條用于連接三代銳龍,其余16條來自四個PHY物理層,可以靈活組合為1條x16、2條x8、4條x4、8條x2、16條x1,任由主板廠商靈活配置,并且分為兩部分,其中8條為通用目的可連接網(wǎng)卡、聲卡、擴(kuò)展卡等設(shè)備,另外8條還可以配置為8個SATA 6Gbps。
USB接口方面,三代銳龍支持最多4個USB 3.1 10Gbps,X570支持最多8個USB 3.1、4個USB 2.0 480Mbps。
三代銳龍家族型號、定位、規(guī)格與價格,大家都比較熟悉了。
本次我們測試的一個是首發(fā)旗艦銳龍9 3900X,12核心24線程,對標(biāo)8核心16線程的酷睿i9-9900K,3999元對4099元。
另一個是銳龍7 3700X,8核心16線程,對標(biāo)8核心8線程的酷睿i7-9700K/9700F,價格2599元對3099元。
相關(guān)文章
AMD銳龍7 3700X/銳龍5 3600X處理器詳細(xì)圖文評測
AMD正式宣布第三代銳龍?zhí)幚砥髦?,Intel其實也動作頻頻,之前還少見的放出了官方測試以證明AMD新的PCIe 4.0是“無用”的規(guī)格。那么作為一個吊打了AMD這么多年的大廠商,為2019-07-09銳龍7 2700處理器性能如何 銳龍7 2700CPU值得入手嗎
銳龍7 2700處理器性能如何?值得入手嗎?下面和小編一起來看看吧2019-07-04AMD銳龍7 2700X和Intel Core i7-8086K哪款值得買 兩款CPU對比評測
到今年AMD就成立50周年了,在這50年里,AMD推出了很多優(yōu)秀的產(chǎn)品,從K5處理器到采用K8架構(gòu)的速龍?zhí)幚砥?,再?017年正式開售的基于Zen架構(gòu)的銳龍系列處理器。今天給大家?guī)?/div> 2019-06-18銳龍7 2700X值得買嗎 銳龍7 2700X處理器詳細(xì)評測
銳龍7 2700X處理器怎么樣?值得入手嗎?下面小編帶來銳龍7 2700X處理器詳細(xì)評測,希望對大家有所幫助2019-06-17AMD銳龍三代對比Intel酷睿九代哪個好?3代銳龍9/5/7與9代酷睿i9/i7/i5
AMD發(fā)布第三代銳龍?zhí)幚砥?,從低端?核心12線程銳龍5 3600到高端的12核心24線程銳龍9 3900X,再到頂級的16核心32線程銳龍9 3950X,規(guī)格上完全壓制Intel第九代酷睿,下面不2019-06-11AMD銳龍5 2600和Intel酷睿i5-9400F性能對比測試
AMD銳龍5 2600和Intel酷睿i5-9400F哪個好?哪個值得買?下面小編帶來AMD銳龍5 2600和Intel酷睿i5-9400F性能對比測試,希望對大家有所幫助2019-04-26銳龍5 2600和i5-9400F哪個好 R5 2600和酷睿i5-9400F區(qū)別對比評測
銳龍5 2600和i5-9400F哪個好?有什么區(qū)別?哪個值得買?下面小編帶來R5 2600和酷睿i5-9400F區(qū)別對比評測,希望對大家有所幫助2019-04-05銳龍5 3550H值不值得買 AMD移動平臺高性能處理器銳龍5 3550H評測
1月中旬有消息透漏華碩飛行堡壘6S將會是首批搭載AMD Ryzen 3000處理器的產(chǎn)品,如今這款產(chǎn)品終于來到了ZOL。這款產(chǎn)品采用了AMD 銳龍5 3550H(12nm)+AMD RX 560X 4GB的核心2019-03-22銳龍5 2600和酷睿i5-8400哪個好 R5 2600和酷睿i5-8400區(qū)別對比評測
銳龍5 2600和酷睿i5-8400哪個好?銳龍5 2600和酷睿i5-8400有什么區(qū)別?銳龍5 2600和酷睿i5-8400哪個值得買?下面小編帶來銳龍5 2600和酷睿i5-8400區(qū)別對比評測,希望對大家2018-12-24銳龍R5 3700X怎么樣 銳龍R5 3700X處理器深度實用評測
R5 3700X怎么樣?R5 3700X值得買嗎?部分小伙伴可能還不是很清楚吧,下面小編為大家?guī)砹虽J龍R5 3700X處理器深度評測,感興趣的小伙伴們一起來看看吧2019-08-12最新評論