腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

RTX20系顯卡值不值得買 RTX2080和RTX2080Ti詳細(xì)評測

發(fā)布時(shí)間：2018-09-20 10:04:06 作者：佚名

我要評論

RTX20系顯卡怎么樣？RTX20系顯卡值不值得買？RTX2080和RTX2080Ti哪個(gè)好？有什么區(qū)別？下面小編帶來RTX2080和RTX2080Ti詳細(xì)評測，希望對大家有所幫助

RTX20系顯卡怎么樣？RTX20系顯卡值不值得買？RTX2080和RTX2080Ti哪個(gè)好？有什么區(qū)別？下面小編帶來RTX2080和RTX2080Ti詳細(xì)評測，希望對大家有所幫助。

RTX2080和RTX2080Ti詳細(xì)評測：

一、前言：NVIDIA革命性跨越顯卡又熱鬧起來了

作為GPU顯卡行業(yè)的領(lǐng)頭羊，NVIDIA的新產(chǎn)品發(fā)布節(jié)奏多年來一直非常穩(wěn)，而且每一代都有極大的創(chuàng)新和提升(完全不知牙膏味兒)，產(chǎn)品線布局十分豐富，生態(tài)系統(tǒng)合作也是有著厚實(shí)的積累相當(dāng)完備。

在顯卡的江湖里，NVIDIA雖然說不上呼風(fēng)喚雨，但始終也都是首屈一指的，GeForce更是幾乎已經(jīng)成了游戲卡的代名詞。

2017年5月，我們迎來了Pascal帕斯卡架構(gòu)的GeForce GTX 10系列，不過當(dāng)時(shí)恐怕誰都不會(huì)想到，帕斯卡家族的命會(huì)這么長，而新一代讓我們苦苦等待了這么久。

RTX20系顯卡值不值得買 RTX2080和RTX2080Ti詳細(xì)評測

最近幾代產(chǎn)品，NVIDIA都會(huì)選擇當(dāng)年的3-6月份春天或春夏之交來發(fā)布，一般在3月份的GTC圖形技術(shù)大會(huì)上首次披露，但今年非常特殊，一直拖到了9月份，比往年晚了幾乎半年。

更令人稱奇的是，NVIDIA這一次保密工作做的極好，直到發(fā)布前，我們都不知道新卡的架構(gòu)是Volta伏特、Ampere安培還是Turing圖靈，也不知道新卡的命名是GTX 10系列還是GTX 20系列，結(jié)果最終是RTX 20系列。

出現(xiàn)這種局面，最主要的原因是這一代從架構(gòu)技術(shù)到產(chǎn)品體系都發(fā)生了翻天覆地的變化，而研發(fā)全新一代架構(gòu)、完善全新技術(shù)特性，都是需要花費(fèi)無數(shù)精力、金錢和時(shí)間的(想想AMD Zen憋了多久才出來再想想Intel酷睿老本吃了多少年)。

按照NVIDIA的說法，早在10年前就在設(shè)計(jì)和研發(fā)圖靈架構(gòu)了(當(dāng)然當(dāng)時(shí)應(yīng)該沒這個(gè)代號)，主要是光線追蹤方面，因?yàn)樵诖酥?，光線追蹤只能用于影視渲染，誰也不敢想象它能在游戲里實(shí)時(shí)呈現(xiàn)。

最終，NVIDIA創(chuàng)造奇跡，為PC游戲帶來了實(shí)時(shí)光線追蹤(即便是有條件的)，也難怪黃仁勛驕傲地宣稱圖靈架構(gòu)是2006年引入CUDA統(tǒng)一著色核心以來最大的革命。

而另一方面不得不面對的一個(gè)現(xiàn)實(shí)就是，顯卡市場已經(jīng)沉悶太久了，尤其是在電競火熱朝的形勢下，顯卡卻遲遲沒有跟上。

作為市面上僅有的兩大GPU巨頭之一，AMD近些年全力投入Zen CPU架構(gòu)，雖然碩果累累，但也導(dǎo)致GPU方面進(jìn)展緩慢，Polaris北極星架構(gòu)的RX 400/500系列只能在中低端市場混，Vega織女星架構(gòu)的RX Vega系列在高端市場又不具備足夠的競爭力。

這種形勢下，對手很容易懈怠，反正沒什么壓力，但幸運(yùn)的是，NVIDIA并沒有任性擠牙膏，反而奉上了一道更美味的大餐：全新架構(gòu)、實(shí)時(shí)光線追蹤、AI人工智能、GDDR6顯存等都讓人激動(dòng)不已，而且第一次首發(fā)就奉上了三款新卡。

長久的等待終于值了，整個(gè)顯卡市場也再次熱鬧紛呈起來。

接下來，我們就會(huì)探析一下這個(gè)革命性的Turing架構(gòu)，以及全新的RTX 2080 Ti、RTX 2080兩款高端型號到底表現(xiàn)如何。

二、架構(gòu)解析之全新內(nèi)核體系

既然是一個(gè)全新設(shè)計(jì)的架構(gòu)，我們就要好好看一看這個(gè)以計(jì)算機(jī)科學(xué)之父、人工智能之父艾倫·麥席森·圖靈(Alan Mathison Turing)命名的Turing圖靈新架構(gòu)到底有哪些過人之處，不過硬件架構(gòu)總是伴隨各種高深晦澀的技術(shù)名詞、技術(shù)原理，即便專業(yè)人士也得好好研究才行，所以這里我們僅從高級層面，介紹一下新架構(gòu)的大致設(shè)計(jì)、技術(shù)概況，以及能帶來的實(shí)際好處。

在以往，NVIDIA為專業(yè)級計(jì)算卡、消費(fèi)級游戲卡設(shè)計(jì)的都是統(tǒng)一架構(gòu)，只是具體內(nèi)部模塊布局、技術(shù)支持、核心大小不同。好處是可以統(tǒng)一開發(fā)，降低成本，壞處是缺乏針對性，技術(shù)資源要么浪費(fèi)要么不夠。

這一次，NVIDIA選擇了分而治之。針對高性能計(jì)算、圖形渲染、人工智能、深度學(xué)習(xí)等專業(yè)應(yīng)用的是Volta伏特架構(gòu)，目前只有一個(gè)超大核心GV100，是迄今為止GPU歷史上最大的核心，臺積電12nm工藝制造，集成多達(dá)210億個(gè)晶體管，核心面積達(dá)815平方毫米，妥妥的怪物級核彈。

而針對游戲顯卡的就是Turing圖靈架構(gòu)，也是臺積電12nm(有說法稱最初計(jì)劃使用三星10nm)，其中最大的核心TU102集成189億個(gè)晶體管，核心面積754平方毫米，是僅次于GV100的史上第二大GPU核心。

相比上代Pascal帕斯卡家族的大核心GP102，它的晶體管數(shù)量增加了55％，面積則增大了60％，甚至是次級新核心TU104都超越了GF102，擁有136億個(gè)晶體管、545平方毫米面積。

新架構(gòu)核心之所以如此龐大，除了CUDA核心規(guī)模繼續(xù)增大、升級Shading著色渲染之外，更關(guān)鍵的是RT Core光線追蹤核心、Tensor Core人工智能核心的加入，這也是新架構(gòu)革命性變化的根本支撐。

擁有全新著色性能的SM CUDA核心陣列、支持高達(dá)每秒100億條光線計(jì)算的RT光線追蹤核心、為實(shí)時(shí)游戲畫面導(dǎo)入AI人工智能加速的Tensor核心，三者就構(gòu)成了圖靈架構(gòu)的三大支柱，各自有不同分工又互相協(xié)作，共同實(shí)現(xiàn)新的游戲渲染畫面。

同時(shí)，NVIDIA強(qiáng)調(diào)新架構(gòu)的單個(gè)CUDA核心著色渲染性能是帕斯卡架構(gòu)的1.5倍，第一次可以在4K分辨率、HDR開啟的情況下，提供流暢的游戲體驗(yàn)，真正開啟4K時(shí)代。

按照NVIDIA的說法，RTX 2080就能基本實(shí)現(xiàn)4K分辨率下60FPS的游戲幀率，RTX 2080 Ti更是能夠達(dá)到70-80FPS。當(dāng)然具體還要看游戲需求，以及游戲設(shè)置，特別是某些高要求的技術(shù)特性，光線追蹤打開后別說4K了，就連1080p就比較吃力。

圖靈架構(gòu)的基本組成單元之一還是CUDA核心與SM流處理器陣列，這也是2006年的G80以來NVIDIA GPU的基石。

事實(shí)上，圖靈架構(gòu)的SM陣列也融合了伏特架構(gòu)的不少特性，相比帕斯卡架構(gòu)差別還是挺大的，比如每一組TPC里的SM陣列由一個(gè)增至兩個(gè)，同時(shí)SM內(nèi)部的組成方式也截然不同。

帕斯卡架構(gòu)每個(gè)SM陣列集成128個(gè)FP32浮點(diǎn)單元，圖靈架構(gòu)則改成了2個(gè)FP64雙精度浮點(diǎn)單元、64個(gè)FP32單精度浮點(diǎn)單元、64個(gè)INT32整數(shù)單元、8個(gè)Tensor核心、一個(gè)RT核心。支持浮點(diǎn)和整數(shù)并發(fā)操作，并有新的執(zhí)行數(shù)據(jù)路徑，類似伏特架構(gòu)匯總的獨(dú)立線程調(diào)度。

按照NVIDIA的統(tǒng)計(jì)，每執(zhí)行100個(gè)浮點(diǎn)指令，平均會(huì)有36個(gè)整數(shù)指令，兩種指令可以并發(fā)執(zhí)行。

如此一來，帕斯卡架構(gòu)的整數(shù)和浮點(diǎn)計(jì)算就可以分配得更加均衡，并與新的Tensor、RT核心相配合，更合理、高效地完成各種負(fù)載。

整體而言，圖靈核心的CUDA陣列可以每秒執(zhí)行14萬億次FP32浮點(diǎn)操作、14萬億次INT32整數(shù)操作。

緩存架構(gòu)也徹底變化，由兩個(gè)載入/存儲單元牽頭，一級緩存和共享緩存整合在一起，而且容量靈活可變，可以是64KB+32KB，也可以是32KB+64KB，大大降低了延遲，帶寬也翻了一番。

二級緩存容量則從3MB翻倍到6MB。

NVIDIA宣稱，新架構(gòu)每個(gè)CUDA核心的著色渲染性能比上代平均提升50％，部分游戲可達(dá)70％左右，VRMark虛擬現(xiàn)實(shí)測試成績甚至翻了一番還多。

當(dāng)然這只是基礎(chǔ)理論上的數(shù)字，實(shí)際性能還要看其他部分和整體指標(biāo)。

圖靈架構(gòu)還首發(fā)搭配新一代GDDR6顯存，目前業(yè)界最快，等效頻率高達(dá)14GHz，搭配352-bit位寬可以帶來616GB/s的驚人帶寬，相比于GTX 1080 Ti在位寬不變的情況下提升了27％，也比用了2048-bit HBM2高帶寬顯存的AMD RX Vega 64高了27％。

而且關(guān)鍵是，GDDR6的成本比HBM2低得多。

另外，NVIDIA還對新顯存進(jìn)行了各種優(yōu)化，信號竄擾降低了40％，更利于運(yùn)行穩(wěn)定和進(jìn)一步超頻。

三、架構(gòu)解析之RT核心、光線追蹤

圖靈架構(gòu)和RTX 20系列的最大亮點(diǎn)和賣點(diǎn)當(dāng)然是——游戲?qū)崟r(shí)光線追蹤！

從第一顆GPU NVIDIA GeForce 256誕生至今已經(jīng)整整19年，GPU規(guī)模和技術(shù)越來越發(fā)達(dá)，但是最底層的圖形渲染技術(shù)其實(shí)幾乎一成不變，始終都是光柵化渲染，通過計(jì)算三角形和多邊形來獲得畫面輸出，好處是資源消耗容易控制，壞處就是距離真實(shí)畫面相差甚遠(yuǎn)，甚至永遠(yuǎn)不可能接近。

光線追蹤(Ray Tracing)技術(shù)則堪稱圖形界的“圣杯”，簡單地說就是在圖形渲染過程中實(shí)時(shí)跟蹤物體和環(huán)境的光線，準(zhǔn)確進(jìn)行光線反射和折射、全局照明、物理陰影的繪制，可以帶來近乎百分之百真實(shí)的渲染畫面，尤其是光影效果。

光線追蹤技術(shù)其實(shí)并不新鮮，1969年的時(shí)候在IBM工作的Arthur Appel就提出了這種概念，當(dāng)時(shí)叫做Ray Casting，距今已經(jīng)整整半個(gè)世紀(jì)。

1979年，Turner Whitted研究出了遞歸光線追蹤算法(Recursive RayTracing Algorithm)。

1984年，Carpenter等人發(fā)表了一篇關(guān)于分布式光線追蹤的論文《Distributed RayTracing》，影響甚廣。

但是，光線追蹤的算法非常簡單，稍有計(jì)算機(jī)圖形只是的人都能理解，關(guān)鍵在于如何優(yōu)化提高效率，因?yàn)樗枰挠?jì)算量太過龐大，想想要實(shí)時(shí)計(jì)算場景中無數(shù)光線每時(shí)每刻的各種傳播，那是多么恐怖，以前的GPU根本無力承擔(dān)實(shí)時(shí)計(jì)算。

因此直到2006年迪士尼的《汽車總動(dòng)員》(Cars)，影視行業(yè)才開始使用光線追蹤渲染，如今大多數(shù)的照片級渲染系統(tǒng)多時(shí)基于光線追蹤的，但背后都是超大規(guī)模的計(jì)算機(jī)群在吃撐，一幀畫面往往都要渲染幾個(gè)小時(shí)。

雖然大家都在努力，但就在一個(gè)月前，如果說普通顯卡可以在游戲里實(shí)現(xiàn)光線追蹤(盡管是有條件的)，相信絕大多數(shù)人都不會(huì)相信，但是NVIDIA的圖靈做到了。

NVIDIA在圖靈架構(gòu)中集成了最多72個(gè)RT Core核心，每個(gè)SM單元一個(gè)，專門用來服務(wù)光線追蹤運(yùn)算，等于一個(gè)特殊的專用單元，由硬件加速取代軟件模擬，效率自然要比CUDA這種通用單元高很多，就像GPU做并行計(jì)算比CPU強(qiáng)得多

簡單來說，圖靈架構(gòu)的光線追蹤運(yùn)算步驟是這樣的：著色器單元首先發(fā)出光線探測請求，RT Core核心就開始完全接管下邊的工作，并分為兩個(gè)過程，其中包圍盒求交評估單元(Box Intersection Evaluators)進(jìn)行包圍盒的獲取和解碼，并進(jìn)行求交測試，得到子包圍盒或者三角形。

如果是子包圍盒，就返回重新執(zhí)行，重復(fù)剛才的步驟。如果是三角形，那就交給三角形求交評估單元(Triangle Intersection Evaluators)，做下一步的求交測試，直到得到最終結(jié)果并輸出給著色器，進(jìn)行最終渲染。

看懵了對吧？懵了就對了……

整個(gè)光線追蹤計(jì)算過程中，運(yùn)用的主要是BVH算法，也就是Bounding Volume Hierarchy Traversal，層次包圍盒遍歷的意思。

比如渲染對象是一只兔子，要幾算一條光線和兔子本身的交互，就把兔子所在空間劃分成N個(gè)包圍盒，計(jì)算光線和哪一個(gè)包圍盒相交，是的話就再把這個(gè)包圍盒繼續(xù)劃分成N個(gè)更小的包圍盒，再次計(jì)算相交，如此反復(fù)，一直找到和光線相交的三角形所在的包圍盒，再對這個(gè)三角形進(jìn)行最終的渲染。

BVH算法可以大大減少計(jì)算每一條光線最近相交點(diǎn)所需要遍歷的三角形數(shù)量，而且只需要進(jìn)行一次就能給所有光線使用，大大提高了執(zhí)行效率。

除了硬件方面的工作，軟件方面既有NVIDIA自己的OptiX光線追蹤引擎、GameWorks SDK光線追蹤模塊，也有微軟的DirectX 12 Ray-Tracing(DXR) API、Windows ML中間件，后者會(huì)在即將發(fā)布的Windows 10 2018年秋季更新版中正式提供。

性能方面，RTX 2080 Ti在精簡了四個(gè)只有68個(gè)RT核心的情況下，每秒鐘可以計(jì)算超過100億條光線，大約等于100TFlops(每秒1000億次浮點(diǎn)運(yùn)算)。

而上代GTX 1080 Ti雖然也能執(zhí)行光線追蹤，但因?yàn)闆]有專用單元和算法，效率只有RTX 2080 Ti的大約十分之一，不足以實(shí)時(shí)用于游戲。

接下來欣賞欣賞NVIDIA RTX光線追蹤的效果和對比：

↑↑↑官方DEMO

目前支持NVIDIA光線追蹤技術(shù)的游戲有11款(和首發(fā)時(shí)相比沒變)，分別是：

－《神力科莎》 (Assetto Corsa Competizione)

－《原子之心》 (Atomic Heart)

－《戰(zhàn)地5》 (Battlefield V)

－《控制》 (Control)

－《應(yīng)征入伍》 (Enlisted)

－《逆水寒》 (Justice

－《劍網(wǎng)3》 (JX3)

－《機(jī)甲戰(zhàn)士5：雇傭兵》(MechWarrior 5:Mercenaries)

－《地鐵：離去》

－《Project DH》

－《古墓麗影：暗影》(Shadow of the Tomb Raider)

不過，RTX 20系列上市初期，可以玩的光線追蹤游戲暫時(shí)還是零，比如《古墓麗影：暗影》首發(fā)不支持得后期打補(bǔ)丁，《戰(zhàn)地5》則跳票了。

四、架構(gòu)解析之Tensor核心、AI加速

NVIDIA在伏特架構(gòu)上引入了全新的專用處理模塊Tensor Core，也就是張量計(jì)算核心，重點(diǎn)用來支持深度學(xué)習(xí)、高性能計(jì)算(也是晶體管大戶)。

圖靈架構(gòu)則是在游戲卡上引入Tensor Core，同時(shí)針對游戲圖形應(yīng)用做了大量的調(diào)整優(yōu)化，尤其是浮點(diǎn)精度方面。

Tensor的意思是張量，不同于我們常見的標(biāo)量(零維)、矢量(一維)、矩陣(三維)，擁有三維或者更高維度，簡單地說就是一個(gè)數(shù)據(jù)容器，可以包含多個(gè)維度的數(shù)據(jù)。

現(xiàn)在火熱的深度學(xué)習(xí)，就運(yùn)用了超大規(guī)模的數(shù)據(jù)運(yùn)算，其中就經(jīng)常會(huì)用到矩陣融合乘加(FMA)運(yùn)算，Tensor核心就是為這種矩陣數(shù)學(xué)運(yùn)算專門服務(wù)的。

它可以對兩個(gè)4×4 FP16浮點(diǎn)矩陣進(jìn)行相乘操作，然后將結(jié)果加入到另一個(gè)4×4 FP16/FP32浮點(diǎn)矩陣中，最終輸出新的4×4 FP16/FP32矩陣，這叫做混合精度數(shù)學(xué)運(yùn)算，因?yàn)檩斎刖仃囀前刖龋Y(jié)果則可以達(dá)到全精度。

每個(gè)時(shí)鐘周期內(nèi)，圖靈架構(gòu)的Tensor核心可以執(zhí)行64個(gè)FMA運(yùn)算，從而大大加速矩陣運(yùn)算，可用于新的神經(jīng)實(shí)時(shí)圖形渲染、深度學(xué)習(xí)訓(xùn)練和推理。

圖靈架構(gòu)每個(gè)SM陣列里有8個(gè)Tenor核心，總計(jì)576個(gè)，完整支持114TFlops FP16浮點(diǎn)運(yùn)算(每秒114萬億次)，同時(shí)支持228TOPS INT8、455TOPS INT4整數(shù)運(yùn)算(每秒228億次、455億次)，后者是伏特架構(gòu)里沒有的。

NVIDIA把看起來高深莫測的Tensor核心放到游戲卡里，顯然不是做專業(yè)運(yùn)算的，其深度學(xué)習(xí)能力也是為游戲服務(wù)的，結(jié)合新的神經(jīng)圖形框架(Neural Graphics Framework)，簡稱NGX，可以在游戲中實(shí)現(xiàn)DLSS深度學(xué)習(xí)超采樣抗鋸齒、AI Super Rez超級分辨率、AI Slow-Mo慢動(dòng)作、AI InPainting等等。

這些計(jì)算繁瑣、資源消耗巨大的操作，在以往也可以實(shí)現(xiàn)，但會(huì)付出很大的代價(jià)，效果也不盡如人意，如今有了新的Tensor核心，就可以建立屬于GPU核心自己的DNN深度神經(jīng)網(wǎng)絡(luò)，將AI融入游戲。

NVIDIA已經(jīng)向游戲引擎開放NGX API，將其融入其中，實(shí)現(xiàn)底層加速。

另外和很多AI應(yīng)用類似，NVIDIA GeForce Experience軟件的作用也非常重要，它會(huì)自動(dòng)匹配顯卡型號，從云端訓(xùn)練的AI模型哪里下載相應(yīng)的NGX軟件包，并定期更新，達(dá)到越用越好、甚至是因人而異的效果。

AI Super Rez：有點(diǎn)類似高清視頻中常見的Up Scaling，但是引入了人工智能和深度學(xué)習(xí)之后，可以實(shí)現(xiàn)近乎“無損放大”，原來的畫面分辨率放大2倍、4倍乃至8倍，仍然清晰銳利。

AI Slow-Mo：超級慢動(dòng)作我們并不陌生，現(xiàn)在不少高端手機(jī)都支持240FPS、480FPS乃至是960FPS的慢動(dòng)作視頻錄制。圖靈架構(gòu)可以對普通的30FPS視頻進(jìn)行智能插幀運(yùn)算，得到240FPS/480FPS的慢動(dòng)作視頻，也就是說你不需要專門的高幀率攝像頭，就可以獲得很流暢的慢動(dòng)作視頻。

AI InPainting：可以抹掉畫面中不需要的內(nèi)容，也可以智能補(bǔ)全缺失的內(nèi)容，完全超越PS摳圖的存在。它同樣來自現(xiàn)實(shí)中大量真實(shí)世界圖片的訓(xùn)練推理。

其實(shí)，慢動(dòng)作和修圖這兩項(xiàng)在之前就曾有相關(guān)報(bào)道，顯然NVIDIA在硬件、算法兩個(gè)方面都實(shí)現(xiàn)了真正的突破。

接下來就是重中之重的DLSS(深度學(xué)習(xí)超采樣抗鋸齒)。

我們知道，傳統(tǒng)的光柵化圖形渲染畫面會(huì)存在各總各樣的鋸齒(狗牙)，所以GPU廠商都會(huì)在后期處理中加入各種各樣的AA抗鋸齒技術(shù)，但傳統(tǒng)抗鋸齒都是由GPU去運(yùn)算的，效果參差不齊不說，最關(guān)鍵的是會(huì)消耗大量的GPU資源，開啟之后讓游戲卡得沒法玩再正常不過了。

DLSS深度采樣超采樣抗鋸齒則和傳統(tǒng)抗鋸齒技術(shù)走了一條完全不同的路，它是在NVIDIA超級計(jì)算機(jī)上進(jìn)行訓(xùn)練，而不再消耗GPU本身的資源。

針對每一款游戲，NVIDIA會(huì)在運(yùn)算建立對應(yīng)的訓(xùn)練神經(jīng)網(wǎng)絡(luò)，收集大量的64x超采樣數(shù)據(jù)，對像素點(diǎn)進(jìn)行64次偏移著色合成輸出，理論上可以獲得近乎完美的抗鋸齒平滑效果，同時(shí)還會(huì)對比和普通渲染畫面之間的差異，調(diào)整網(wǎng)絡(luò)權(quán)重，反復(fù)迭代，最后獲得更合理的抗鋸齒畫面效果，還可以避免傳統(tǒng)TAA時(shí)間抗鋸齒的運(yùn)動(dòng)模糊等問題。

云端訓(xùn)練完成后，NVIDIA會(huì)通過GFE軟件將成果分發(fā)給玩家，再用到游戲中，而且隨著游戲運(yùn)行得越多，DLSS學(xué)習(xí)效果就會(huì)越來越優(yōu)化，甚至每個(gè)玩家都可以得到屬于自己的不同效果。

當(dāng)然了，這也意味著NVIDIA需要和每一款游戲或者每一個(gè)游戲引擎合作，去進(jìn)行專門的優(yōu)化，還是相當(dāng)費(fèi)時(shí)費(fèi)力的，不過考慮到NVIDIA在游戲行業(yè)廣泛深入的合作關(guān)系，這方面倒不必?fù)?dān)心。

尤其是隨著合作優(yōu)化的深入，NVIDIA完全可以建立起屬于自己的技術(shù)壁壘，讓對手望塵莫及，進(jìn)一步帶動(dòng)大量玩家忠實(shí)地跟隨NVIDIA。

更神奇的是，DLSS因?yàn)榛静恍枰腉PU本地資源，因此可以大大釋放GPU性能，讓其專心渲染游戲，提升性能。

比如根據(jù)官方數(shù)據(jù)，Epic的《滲透者》(Infiltrator)游戲里，4K分辨率下1080 Ti開啟TAA平均幀率還不到40FPS，2080 Ti開啟DLSS則能達(dá)到80FPS，提升了整整一倍！

游戲支持方面也不是啥大事兒，RTX 20系列發(fā)布之初就有16款游戲(PPT上寫錯(cuò)了)，現(xiàn)在產(chǎn)品還沒完全上市就已經(jīng)增加到25款。

首發(fā)名單如下：

－《方舟：生存進(jìn)化》 (Ark: Survival Evolved)

－《原子之心》 (Atomic Heart)

－《無畏》 (Dauntless)

－《最終幻想XV》 (Final Fantasy XV)

－《破碎之地》 (Fractured Lands)

－《殺手2》 (Hitman 2)

－《奈恩群島》 (Islands of Nyne)

－《逆水寒》 (Justice)

－《劍網(wǎng)3》 (JX3)

－《機(jī)甲戰(zhàn)士5：雇傭兵》 (Mechwarrior 5:Mercenaries)

－《絕地求生》 (PlayerUnknown’s Battlegrounds)

－《遺跡：灰燼重生》 (Remnant: From the Ashes)

－《英雄薩姆4：星球惡棍》 (Serious Sam 4: PlanetBadass)

－《古墓麗影：暗影》 (Shadow of the Tomb Raider)

－《鍛造競技場》 (The Forge Arena)

－《少數(shù)幸運(yùn)兒》 (We Happy Few)

新增名單如下：

－《暗黑血統(tǒng)3》(Darksiders 3)

－《飛向月球：財(cái)富》(Deliver Us The Moon: Fortuna)

－《恐懼群狼》(Fear the Wolves)

－《地獄之刃：塞娜的獻(xiàn)祭》(Hellblade: Senua's Sacrifice)

－《KINETIK》

－《前哨零》(Outpost Zero)

－《超殺：行尸走肉》(Overkill's The Walking Dead)

－《人渣》(SCUM)

－《風(fēng)暴奇兵》(Stormdivers)

這其中有5款游戲同時(shí)支持RTX光線追蹤和DLSS抗鋸齒技術(shù)，分別是《原子之心》、《逆水寒》、《劍網(wǎng)3》、《機(jī)甲戰(zhàn)士5：雇傭兵》、《古墓麗影：暗影》。

七、架構(gòu)解析之三大核心與型號

圖靈家族除了架構(gòu)本身變化巨大，產(chǎn)品體系也和以往明顯不同，首發(fā)一口氣就是三款型號RTX 2080 Ti、RTX 2080、RTX 2070，而且分別對應(yīng)三個(gè)不同核心TU102、TU104、TUF106，而以往的x80、x70都是共享一個(gè)核心。

具體原因不詳，可能是新一代核心太大，x70直接用大核心閹割成本比較高，還不如再造一個(gè)省錢的小核心。

這就是最頂級的TU102核心，186億個(gè)晶體管、754平方毫米面積確實(shí)不是蓋的。

內(nèi)有4608個(gè)CUDA核心，分為6組GPC、36組TPC、72組SM陣列(每組SM 64個(gè)CUDA核心)，同時(shí)有72個(gè)RT核心、576個(gè)Tensor核心、288個(gè)紋理單元、96個(gè)ROP光柵單元，二級緩存容量6MB，寄存器文件18MB，352-bit位寬。

不過，RTX 2080 Ti并未完全使用整個(gè)TU102核心，而是有所精簡，僅提供4352個(gè)CUDA核心(68組SM陣列)，RT核心則減少為68個(gè)，Tensor核心544個(gè)。

目前只有Quadro RTX 8000用了完整的TUF102，可能是初期良品率不足，優(yōu)先供給專業(yè)市場，也可能是功耗和發(fā)熱在游戲卡上不好控制，還有可能是留一手……

RTX 2080 Ti的核心頻率基礎(chǔ)為1350MHz，加速頻率FE公版做到了1635MHz，非公版則規(guī)定是1545MHz，當(dāng)然大家可以隨意超頻。

顯存搭配11GB GDDR6，等效頻率14GHz，帶寬為616GB/s，整卡功耗260W。

TU104核心，136億個(gè)晶體管，545平方毫米，比帕斯卡家族的大核心GP102都要大一圈。

它集成了3072個(gè)CUDA核心，劃分為6組GPC、24組TPC、48組SM(每組SM還是64個(gè))，同時(shí)有192個(gè)紋理單元、64個(gè)ROP單元、384個(gè)Tensor核心、48個(gè)RT核心，二級緩存容量4MB，寄存器文件12MB，顯存位寬256-bit。

RTX 2080同樣沒有用滿TU104核心，而是精簡了兩組SM，提供2944個(gè)CUDA核心、368個(gè)Tensor核心、46個(gè)RT核心，完整版還是在專業(yè)卡上，Quadro RTX 6000。

RTX 2080核心基礎(chǔ)頻率1515MHz，加速頻率非公版1710MHz，公版直接定在1800MHz，搭配8GB GDDR6顯存，等效頻率14GHz，帶寬448GB/s，功耗225W。

它的渲染性能為60 TRX-OPS，相比于RTX 2080 Ti削弱了23％，光線追蹤性能8 GigaRays/s(每秒80億條光線)，削弱了20％。

TU106核心，108億個(gè)晶體管，445平方毫米，相比GP102也只是分別差了10％、6％，更可見圖靈家族的龐大。

TU106核心內(nèi)建2304個(gè)CUDA核心，分為3組GPC、18組TPC、36組SM陣列(每組繼續(xù)64個(gè))，同時(shí)有144個(gè)紋理單元、64個(gè)ROP單元、288個(gè)Tensor核心、36個(gè)RT核心，二級緩存容量4MB，寄存器文件9MB，顯存位寬還是256-bit。

RTX 2070終于用了完整的TU106核心，核心頻率基礎(chǔ)1410MHz，加速公版1710MHz、非公版1620MHz，繼續(xù)搭配8GB 14GHz GDDR6顯存，功耗185W。

渲染性能45 RTX-OPS，相比于RTX 2080 Ti、RTX 2080分別低了25％、42％，光線追蹤性能6 GigaRays/s(每秒60億條光線)，分別低了25％、40％。

圖靈家族三大核心與帕斯卡家族大核心GP102對比。

八、圖賞：16相數(shù)字供電售價(jià)萬元的雙風(fēng)扇“煤氣灶”

以下是RTX 2080的圖賞。

RTX 2080包裝盒。

公版RTX 2080顯卡的外觀有了巨大的變化，放棄以往的渦輪散熱，轉(zhuǎn)而采用開放式雙風(fēng)扇設(shè)計(jì)，加上銀色金屬機(jī)身，看起來像極了“煤氣灶”。

一塊巨大的全覆銀色金屬背板，背板厚度達(dá)到了3mm，具有良好的散熱效果。

8+6PIN的供電輸入，可以提供350W的輸入功率。

拋棄了傳統(tǒng)的SLI接口，采用了第二代NVIDIA NVLink高速互聯(lián)方案，能提供100GB/s的雙向帶寬，并且大大降低了延遲。

拆開扇熱器后的PCB本體，RTX 2080采用TU104核心，擁有136億晶體管，幾乎2倍于GTX 1080。顯存采用的美光GDDR6 14000MHz，單顆1GB，一共8顆組成256Bit 8GB，顯存帶寬達(dá)到了448GB/s。

供電部分采用了8相核心+2相顯存的供電方案，并且大量采用了高端的鉭電容，供電規(guī)模及用料遠(yuǎn)遠(yuǎn)超過了公版的GTX 1080（6+1相供電）。

散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件，顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過高的情況。

以下是RTX 2080 Ti的圖賞。

RTX 2080 Ti包裝盒。

與RTX 2080一樣，RTX 2080 Ti也同樣舍棄了以往的渦輪散熱，轉(zhuǎn)而采用雙風(fēng)扇設(shè)計(jì)，看上去就是一個(gè)價(jià)值一萬元的煤氣灶。

銀色全覆金屬背板，也同樣是和RTX 2080一樣，沒有什么區(qū)別。

雙8Pin供電，最高能提供400W的收入功率。

同樣采用了第二代NVIDIA NVLink高速互聯(lián)方案。

RTX 2080 Ti采用TU102核心，擁有189億晶體管。

顯存采用的美光GDDR6 14000MHz，單顆1GB，一共11顆組成352Bit 11GB，顯存帶寬達(dá)到了616GB/s。

供電部分則采用了14+2一共16相供電方案，頂級非公都很難達(dá)到這樣的規(guī)模，看來售價(jià)萬元的顯卡在用料方面果真是舍得下本錢。

散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件，顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過高的情況。

九、測試平臺：5.2GHz的i7-8086K助陣

測試平臺如下:

i7-8086K基于八代酷睿Coffee Lake構(gòu)架，14++納米工藝制造，核心面積約150平方毫米，擁有六個(gè)核心十二線程，睿頻加速達(dá)5GHz，這是Intel史上第一顆默認(rèn)能跑到5GHz頻率的處理器。

為了盡可能的發(fā)揮RTX 2080 Ti強(qiáng)大的性能，我們將此U超頻到了5.2GHz。

主板選用了華碩MAXIMUS X HERO，擁有高達(dá)10相超合金數(shù)字供電，超頻能力在Z370主板中屬于頂級水準(zhǔn)。BIOS已經(jīng)更新到最新版本。

內(nèi)存使用了影馳HOF II DDR4-4000 8GBx2套裝，測試中開啟XMP保持4000MHz頻率，時(shí)序?yàn)?9-25-25-45 CR2。

機(jī)箱采用了酷冷至尊頂級的H500M型號，其前置雙200mm風(fēng)扇以及大面積的金屬散熱孔能夠?qū)C(jī)箱內(nèi)部熱量快速排出，有效降低電源和硬盤的溫度。

機(jī)箱背部的金屬鎧甲將背線打理的井井有條，看上去十分干凈。

我們采用的顯示器是LG 38UC99，其支持的最高分辨率為3840X1600，測試中的4K分辨率就是指的這個(gè)。

測試平臺使用的是酷冷至尊MasterWatt Maker1200W鈦金電源。

MasterWatt Maker1200W是目前頂級的雙路電源，轉(zhuǎn)換效率高達(dá)93%。雙路12V輸出，每路限流50A即600W的功率。

為了壓制5.2GHz的i7-8086K，散熱器采用了九州風(fēng)神頂級的船長280一體水冷散熱器。

十、1080P分辨率測試：RTX 2080碾壓帕斯卡全系處理器開始瓶頸

Turing的核心構(gòu)架完全不同于以往的產(chǎn)品，從Kepler到Maxwell到再到Pascal,每一個(gè)CUDA核心都就是由FP32單元構(gòu)成。

而Turing每一個(gè)CUDA核心除了有一個(gè)FP32的單精度浮點(diǎn)單元之外，還有一個(gè)INT32的單精度整數(shù)單元。每8個(gè)CUDA單元搭配一個(gè)TENSOR核心，64個(gè)CUDA CORE+8個(gè)TENSOR CORE再加上一個(gè)RT CORE構(gòu)成一組SM（其實(shí)每一組SM中還有2個(gè)FP64雙精度浮點(diǎn)單元，只是下圖并沒有標(biāo)示出來）。

根據(jù)NVIDIA的說法，INT32可以為每個(gè)CUDA核心帶來36%的性能提升，再加上L1緩存帶寬的成本增加以及降低延遲，最終圖靈每個(gè)CUDA核心相比帕斯卡能有50%的性能提升。

圖靈是否真如所說還是需要具體的測試來驗(yàn)證，下面正式進(jìn)入游戲測試環(huán)節(jié)。

3DMark Time Spy

RTX 2080 Ti的3DMark Time Spy跑分，圖形分?jǐn)?shù)達(dá)到了13597。

RTX 2080 Ti的3DMark Time Spy跑分，圖形分?jǐn)?shù)達(dá)到了10838。

在3DMark Time Spy 測試中，RTX 2080超越了GTX 1080 Ti，領(lǐng)先了20%，相比GTX 1080的7393分則提升了46%之多。

RTX 2080 Ti比GTX 1080 Ti提升了52%。

3DMark Fire Strike Extreme

2013年誕生的3DMark Fire Strike其實(shí)已經(jīng)不再適合充當(dāng)最新顯卡的測試工具，RTX 2080的表現(xiàn)不如GTX 1080 Ti，有500分的差距，但是依然比GTX 1080強(qiáng)了22%。

RTX 2080 Ti相比GTX 1080 Ti有21%的提升。

GTA V

《GTA V》于2015年登陸PC平臺，全平臺的銷量已經(jīng)超過了1億，算是 10年來最成功的單機(jī)大作，現(xiàn)在依然人氣不減。

畫質(zhì)手動(dòng)調(diào)為最高特效，開啟MSAA 2X以及NVIDIA TXAA，分辨率為1920x1080，顯存占用3422M。

1080P分辨率下受制于CPU性能瓶頸，RTX 2080 Ti與RTX 2080幀數(shù)幾乎一樣，比GTX 1080 Ti只有2幀的優(yōu)勢，比起GTX 1080多了14幀。

刺客信條：起源

《刺客信條：起源》是由育碧制作并發(fā)行的《刺客信條》系列歷史上規(guī)模最大的一個(gè)。本作采用開放地圖沙盒玩法，游戲幾乎呈現(xiàn)了整個(gè)古埃及王國，畫質(zhì)與風(fēng)景無人能出其右。

測試時(shí)開啟極高畫質(zhì)，分辨率為1920x1080。

圖靈的2張顯卡都過了100幀，RTX 2080領(lǐng)先GTX 1080 19幀，RTX 2080 Ti比GTX 1080 Ti多了12幀。

孤島驚魂5

《孤島驚魂5》是一款由育碧(Ubisoft)制作的第一人稱射擊游戲。已于2018年3月正式發(fā)售。

在《孤島驚魂5》中，RTX 2080 Ti領(lǐng)先GTX 1080 Ti 23幀，RTX 2080領(lǐng)先GTX 1080 29幀。

古墓麗影10

畫面設(shè)置為1920*1080 FXAA、DX12+默認(rèn)非常高畫質(zhì)。

RTX 2080 Ti幀數(shù)達(dá)到了204，領(lǐng)先GTX 1080 Ti 32幀這是第一次有顯卡能在1080P最高畫質(zhì)下跑出200+的幀數(shù)。RTX 2080領(lǐng)先GTX 1080 33幀。

GTX980Ti在進(jìn)行此項(xiàng)測試時(shí)，若選擇DX12模式，幀數(shù)會(huì)爆降30%，因此該卡是以DX11進(jìn)行的游戲測試。

古墓麗影11

《古墓麗影：暗影》是一款由Eidos Montreal工作室制作的動(dòng)作冒險(xiǎn)游戲，本作是重啟版《古墓麗影》的系列第三作，已于2018年9月15日正式發(fā)售。該游戲在后續(xù)的補(bǔ)丁中將提供對RTX系列顯卡DLSS與光線追蹤技術(shù)的支持。

畫面設(shè)置為1920*1080 FXAA、DX12+手動(dòng)最高畫質(zhì)。

在1080P最高畫質(zhì)下，RTX 2080 Ti跑出了136幀，比GTX 1080 Ti快了43幀，領(lǐng)先幅度將近50%。

RTX 2080幀數(shù)為115FPS，領(lǐng)先GTX 1080 32幀。

中土世界：戰(zhàn)爭之影

在最高畫質(zhì)下，同時(shí)開啟TAA抗鋸齒，RTX 2080 Ti能跑出160FPS的幀率，領(lǐng)先GTX 1080 Ti 39幀，

十一、2K分辨率測試：新構(gòu)架威力進(jìn)一步顯現(xiàn)

本來2K分辨率測試不在計(jì)劃之內(nèi)，考慮到現(xiàn)在不少玩家都用上2K分辨率顯示器，臨時(shí)決定將此分辨率加入測試。

由于文明6過于依賴CPU性能，GTX1070以上的顯卡都沒有跑出差距，在計(jì)算性能百分比時(shí)并未加入此游戲的數(shù)據(jù)。

在2560x1440分辨率下，RTX 2080 Ti的性能稍稍得以施展，相比GTX 1080領(lǐng)先幅度達(dá)到了65%，比GTX 1080 Ti則快了39%。

RTX 2080相比GTX 1080領(lǐng)先幅度達(dá)到了34%，比GTX 1080 Ti也快了13%。

麥克斯韋年代的旗艦GTX980Ti與GTX1070的性能進(jìn)一步拉開，僅能達(dá)到后者86%的性能。

AMD這邊的期間顯卡VEGA64稍強(qiáng)與GTX 1080，領(lǐng)先幅度為4%。

十二、4K分辨率測試：高端顯卡的主戰(zhàn)場圖靈得以一展雄風(fēng)

對于RTX 2080 Ti這種級別的顯卡而言，只有4K分辨率才能真正榨干它全部的性能，低分辨下進(jìn)行測試時(shí)，由于CPU本身在渲染建模方面無法跑出太高幀率，RTX 2080 Ti的性能難以完全發(fā)揮。

我們采用的顯示器是LG 38UC99，測試的分辨率為3860X1600，與標(biāo)準(zhǔn)的3840X2160的4K分辨率有些許差異。測試時(shí)的畫面設(shè)置與1080P相同，不再一一贅述。

3DMark Time Spy Extreme

RTX 2080的3DMark Time Spy Extreme跑分，圖形分?jǐn)?shù)達(dá)到了4949。

RTX 2080 Ti的3DMark Time Spy Extreme跑分，圖形分?jǐn)?shù)達(dá)到了6364。

在3DMark Time Spy 測試中RTX 2080跑分比GTX 1080 Ti高了761分，領(lǐng)先幅度為18%，相比GTX 1080的3314分則提升了50%之多。

RTX 2080 Ti比GTX 1080 Ti提升了52%。

3DMark Fire Strike Ultra

3DMark Fire Strike Ultra現(xiàn)在無法反應(yīng)圖靈的真實(shí)性能，此項(xiàng)測試中RTX 2080要落后GTX 1080 Ti大概4%，但在所有其他的游戲測試中，RTX 2080都是大幅度領(lǐng)先GTX 1080 Ti，無一例外。

RTX 2080 Ti在此項(xiàng)測試中的得分為7907，領(lǐng)先GTX 1080 Ti 1446分。

RTX 2080得分則為6225，領(lǐng)先GTX 1080 1035分。

最終幻想15

《最終幻想15》是Square Enix史上最昂貴的游戲開發(fā)項(xiàng)目，歷時(shí)10年的開發(fā)周期。本作是《最終幻想》系列中最接近 “水晶的神話”的核心內(nèi)容的一部，向玩家呈現(xiàn)了一個(gè)廣大而又開放的世界

RTX 2080 Ti跑出了5579的分?jǐn)?shù)，領(lǐng)先GTX 1080 Ti 1691分，領(lǐng)先幅度為43%。

RTX 2080的分?jǐn)?shù)為4528，領(lǐng)先GTX 1080 Ti 16%，相比GTX 1080領(lǐng)先幅度有32%。

GTA V

RTX 2080 Ti幀率為85FPS，領(lǐng)先GTX 1080 Ti 20幀。

RTX 2080幀率為73FPS，領(lǐng)先GTX 1080 18幀。

刺客信條：起源

在《刺客信條：起源》測試中，RTX 2080 Ti幀率為75FPS，領(lǐng)先GTX 1080 Ti 幀。

RTX 2080幀率為62FPS，領(lǐng)先GTX 1080 16幀。

孤島驚魂5

4K分辨率的測試數(shù)據(jù)匯總?cè)缦拢?/p>

由于文明6過于依賴CPU性能，3DMark Fire Strike Ultra的跑分無法反應(yīng)圖靈性能，在計(jì)算性能百分比時(shí)并未加入這2個(gè)項(xiàng)目的測試數(shù)據(jù)。

在4K分辨率下，RTX 2080 Ti的性能得以釋放，相比GTX 1080領(lǐng)先了69%，和GTX 1080 Ti相比，有41%的領(lǐng)先幅度。

RTX 2080相比GTX 1080有36%的領(lǐng)先幅度，和GTX 1080 Ti相比，也能領(lǐng)先13%。

VEGA64的表現(xiàn)甚至不如2K分辨率，對GTX 1080的領(lǐng)先優(yōu)勢只剩下3%。

十三、CPU需求測試：4核4線程處理器無法勝任i7-7700K老當(dāng)益壯

在7代酷睿年代，很多玩家覺得4核i5與頂級的4核i7處理器相比，在單機(jī)游戲上面方面沒有多少差異，為此我們收集了7款主流的CPU逐一測試，方便玩家了解頂級顯卡對CPU性能的需求。

1、測試平臺

因?yàn)锳MD平臺無法支持4000MHz頻率內(nèi)存條，測試時(shí)內(nèi)存統(tǒng)一采用3200MHz頻率

2、1080P分辨率測試

以下是1920x1080分辨率下7款CPU的測試成績匯總：

在1080P分辨率下，各種檔次的處理器跑出來的游戲幀數(shù)差別明顯，特別是沒有超線程功能里處理器嚴(yán)重限制了RTX 2080 Ti的性能。在多款游戲中，R5 1300X與i3-8100與頂級處理器之間都有超過50%的差距。

I7-7700K老當(dāng)益壯，游戲性能與默頻的8086K幾乎完全一樣，如果手上還有7700K的同學(xué)，想要購買RTX 2080級別的顯卡，可以不用升級處理器。4核4線程的R3 1300X和I3-8100完全無法發(fā)揮RTX 2080 Ti的性能。超頻到5.2GHz的8086K比默頻時(shí)提升了6%的幀數(shù)。

3、4K分辨率測試

以下是3840x1600分辨率下7款CPU的測試成績匯總：

4K分辨率最高特效下，壓力都在顯卡這一邊，除了《奇點(diǎn)灰燼》和《文明6》這2款比較吃CPU的游戲之外，其他游戲游戲的測試中,各款CPU的幀數(shù)差距并沒有很大。

在4K分辨率下，8086K、7700K、2700X、2600在處于同一檔次，6核6線程的I5-8400與前面幾款產(chǎn)品有6%的差距，R3 1300X和I3-8100這2款處理器落后的幅度沒有1080P那么明顯，但也有10%以上的差距。

4、內(nèi)存需求測試：

分別測試2133MHz單通道、2133MHz雙通道、4000MHz雙通道三種狀態(tài)下，RTX 2080 Ti的游戲幀數(shù)，內(nèi)存容量16GB。測試數(shù)據(jù)如下：

由上表可以看出，2133MHz單通道已經(jīng)完全不能滿足RTX 2080 Ti的需求，比雙通道時(shí)普遍慢了20%左右，特別是在《奇點(diǎn)灰燼》、《古墓麗影10》、《古墓麗影11》和《孤島驚魂5》這幾個(gè)游戲中更是大幅度落后。

在使用4000MHz雙通道內(nèi)存后，相比2133MHz雙通道，還能額外增加8%的游戲性能。

這2年內(nèi)存價(jià)格居高不下，很多同學(xué)在購機(jī)時(shí)往往選擇單條8GB內(nèi)存。如果想要發(fā)揮高端顯卡的實(shí)力，雙通道內(nèi)存是基本要求，必要時(shí)可以選擇高頻內(nèi)存條。

十四、超頻測試：核心幾無空間顯存輕松15GHz

從帕斯卡開始，NVIDIA的BOOST 3.0技術(shù)就能在TDP允許的范圍內(nèi)最大限度提升核心頻率，基礎(chǔ)頻率僅有1.5GHz的GTX1070實(shí)際游戲中運(yùn)行頻率經(jīng)常能夠超過2GHz。BOOST 3.O已經(jīng)充分發(fā)揮了顯卡的潛力，導(dǎo)致留給玩家的超頻空間非常之小，一般也就能超過幾十MHz而已了。

到了圖靈時(shí)代，超頻會(huì)不會(huì)有所好轉(zhuǎn)呢？帶著這個(gè)疑問，我們對2張圖靈顯卡的超頻能力做了簡要嘗試。

首先是RTX 2080，這張顯卡默認(rèn)TDP為225W，我們先將它拉到272W。

然后開始嘗試提升核心頻率，悲催的是，經(jīng)過反復(fù)測試，在不加電壓的情況下，最高只能將核心頻率增加可憐的65MHz，再加一點(diǎn)點(diǎn)運(yùn)行游戲時(shí)都會(huì)無響應(yīng)。

不過好在美光顯存超頻能力不錯(cuò)，從14GHz拉到 15GHz都能穩(wěn)定運(yùn)行，此時(shí)顯卡的帶寬達(dá)到了480GB/s，與GTX 1080 Ti持平。

超頻之后3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的10838增加到了11632，增長了800分，提升幅度7.3%，核心頻率最高能到2070MHz，大多數(shù)時(shí)候維持在2000MHz上下。

同樣的事情也發(fā)生在RTX 2080 Ti身上，其默認(rèn)TDP為260W，我們將它拉到301W。然后在調(diào)整核心頻率的時(shí)候，也只能增加65MHz，顯存頻率則能從14GHz超至15GHz。

超頻之后的RTX 2080 Ti 3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的13661增加到了14763，增長了1100分，提升幅度8%。

2018-09-19 21:43kkj0+ 關(guān)注

十五、功耗溫度測試：能耗比提升40%

1、功耗測試

公版RTX 2080 TDP達(dá)到了225W較GTX 1080的180W增加了45W，而RTX 2080 Ti的TDP則為260W，比GTX 1080 Ti高出10瓦，讓我看看他們世界的表現(xiàn)如何。

分別測試待機(jī)與Furmark烤機(jī)功耗，測試所用的電源為酷冷至尊MasterWatt Maker1200W鉑金電源。

圖靈的功耗表現(xiàn)再一次給了我們驚喜，RTX 2080烤機(jī)時(shí)整機(jī)功耗只有305W，僅僅比GTX 1080高出了20W的功耗，卻有著40%的性能提升。與GTX 1080 Ti相比，功耗低了35W，性能則強(qiáng)了15%。

同樣的事情也發(fā)生在RTX 2080 Ti身上，其烤機(jī)功耗僅有330W。相比GTX 1080 Ti增加了768個(gè)流處理器，核心與顯存頻率都有所增加的情況下，功耗依然降低了10W，而性能則是強(qiáng)了40%以上。

對比AMD最強(qiáng)的VEGA 64,RTX 2080 Ti在性能幾乎翻倍的情況下，TDP只有對手的70%，能耗比差不多有3倍的差距。

2、溫度測試

由于參與對比評測的顯卡都已在倉庫存放許久，可能會(huì)出現(xiàn)硅脂干化等情況，因此不對這些顯卡進(jìn)行溫度測試，我們在這里只測試2張圖靈顯卡的溫度表現(xiàn)。測試時(shí)室溫26度、測試軟件為Furmark。

經(jīng)過5分鐘的Furmark烤機(jī)測試，RTX 2080的溫度穩(wěn)定在75度。

同樣是5分鐘的Furmark烤機(jī)測試，RTX 2080 Ti的溫度則穩(wěn)定在79度。

圖靈的公版顯卡舍棄了原來的渦輪風(fēng)扇改換成了現(xiàn)在的雙風(fēng)扇散熱系統(tǒng)，溫度也好看了很多。RTX 2080烤機(jī)溫度只有75度，比GTX 1080低了8度，RTX 2080 Ti機(jī)溫度為79度，比GTX 1080 Ti低了6度。

十六、DLSS測試：鋸齒肉眼幾乎不可見游戲性能毫無影響

3D游戲畫面在運(yùn)行時(shí)，物體邊緣會(huì)產(chǎn)生“狗牙”（鋸齒），分辨率越低，鋸齒越嚴(yán)重，嚴(yán)重影響觀感。由此產(chǎn)生了許許多多的抗鋸齒技術(shù)，例如SSAA、SMAA、FXAA、TAA。以上這些技術(shù)要么需要對額外的像素進(jìn)行渲染，要么需要對額外的幀進(jìn)行渲染，無論怎樣都需要消耗GPU資源，使游戲的幀率大大降低。有鑒于此，NVIDIA推出了DLSS（Deep Learning Super Sampling）深度學(xué)習(xí)超級采樣抗鋸齒技術(shù)。

不用于以往任何抗鋸齒技術(shù)，DLSS使用圖靈核心中的Tensor單元來進(jìn)行運(yùn)算，不需要消耗CUDA單元，因此不會(huì)對顯卡的性能造成任何損失，不過卻能得到等同于TAA（時(shí)間抗鋸齒）的畫質(zhì)。

下面我們以最終幻想15 BenchMark程序來體驗(yàn)DLSS的效果。

1、畫質(zhì)對比

這是未開啟抗鋸齒的畫質(zhì)，幀數(shù)很高，達(dá)到了59FPS。但是汽車邊緣的鋸齒感非常明顯，要知道這可是4K分辨率，如果降低到1080P，鋸齒現(xiàn)象會(huì)更加嚴(yán)重。

上圖是開啟了TAA抗鋸齒的畫面，汽車邊緣的鋸齒肉眼幾乎不可見，但幀率也降低至43FPS。

這是開啟了DLSS抗鋸齒的畫面，汽車的鋸齒也基本上幾乎看不到，但是幀率則維持在較高的57FPS，大大優(yōu)于開啟TAA時(shí)的表現(xiàn)。。

2、性能測試

GTX 1080/1080Ti開啟DLSS模式直接報(bào)錯(cuò)，只能運(yùn)行TAA。

左邊是1080ti，開啟TAA模式測得3001分；右邊是GTX 1080，TAA模式下的分?jǐn)?shù)為2524分。

測試成績匯總?cè)缦拢?/p>

在NOAA模式下，RTX 2080 Ti比GTX 1080 Ti強(qiáng)42%，RTX 2080比GTX 1080強(qiáng)了32%。開啟TAA后，每張顯卡都要損失25%左右的性能。但是2張圖靈顯卡在開啟DLSS后，性能都沒有下滑，RTX 2080 Ti性能甚至還有提升。

至于圖靈DLSS與帕斯卡TAA性能對比，RTX 2080 Ti相比GTX 1080 Ti領(lǐng)先幅度增加到了93%，而RTX 2080相比GTX 1080領(lǐng)先幅度也提升到了80%。由此看來NVIDIA官方宣傳的RTX 2080 DLSS性能相比GTX 1080 TAA提升一倍也有一定的依據(jù)。

十七、光線追蹤測試：體驗(yàn)真實(shí)世界的光影效果

傳統(tǒng)的光柵化渲染是將一個(gè)3D圖形的幾何信息轉(zhuǎn)變?yōu)橐粋€(gè)個(gè)柵格組成的2D圖像的過程，可以理解為在這個(gè)3D圖形的每個(gè)點(diǎn)都包含有顏色、深度以及紋理數(shù)據(jù)，經(jīng)過一系列計(jì)算變換后，將其轉(zhuǎn)換為2D圖像的像素，進(jìn)而呈現(xiàn)在顯示設(shè)備上。

這一過程也就構(gòu)成了我們愛游戲中所看到的各類陰影效果以及光線投射，在這過程中所有的光影效果都是提前設(shè)計(jì)好的，如果開發(fā)者設(shè)計(jì)時(shí)不那么嚴(yán)謹(jǐn)，就會(huì)在不應(yīng)該有陰影的地方出現(xiàn)陰影。同時(shí)即便耗費(fèi)巨大精力去提前設(shè)計(jì)好的所有陰影的可能情況，也只能做到無限接近于真實(shí)，況且這一點(diǎn)本身也很難做到。于是實(shí)時(shí)光線追蹤(ray tracing)便成為了玩家與游戲開發(fā)者最終極的選擇與夢想。

傳統(tǒng)的光線追蹤技術(shù)是以光源為起點(diǎn)定義光線，進(jìn)而追蹤由此產(chǎn)生的光線與物體表面以及光線與光線之間交互關(guān)系的過程。但該技術(shù)目前實(shí)現(xiàn)起來非常困難，因?yàn)檫@一技術(shù)需要無限多的光線照射在物體表面，通過反射、折射、漫射等途徑進(jìn)入最終的“攝像機(jī)”成像。這一過程需要耗費(fèi)大量的算力且會(huì)有大量光線損失。因此光線追蹤技術(shù)自誕生之日起，就有人斷言20年之內(nèi)光線追蹤不可能實(shí)現(xiàn)。

然而天才的NVIDIA工程師們解決了這個(gè)難題。提出了一種新的Ray tracing理念，即是通過進(jìn)入“攝像機(jī)”的光線，來回溯尋找光源。大部分從光源發(fā)出被折射或者漫反射不被玩家所看到的光線將不會(huì)被運(yùn)算，這種思路將需要實(shí)時(shí)計(jì)算的光線數(shù)量降低了數(shù)十倍，使得實(shí)時(shí)光線追蹤技術(shù)至少提前十年成為現(xiàn)實(shí)。

下面我們通過3Dmark Ray Tracing Tech Demo來體驗(yàn)光線追蹤的奇妙之處。

從上面2張圖可以可以明顯的看到小飛行器飛行時(shí)，在飛船上的倒影也是一直在變化方位。小飛機(jī)器自身也在發(fā)光，因此它的倒影的明暗度以及形狀也是隨時(shí)在發(fā)生著變化。

除此之外，大飛船本身也在緩慢滑行，周圍的環(huán)形燈柱投射在飛船上的倒影也是無時(shí)無刻都在變化著。

RTX 2080 Ti集成了68個(gè)RT Cores，每秒能處理100億條光線，而GTX 1080 Ti只能靠CUDA來計(jì)算光線，每秒能處理11億光線。下面我們通過星球大戰(zhàn)DEMO來演示光線追蹤的性能，這個(gè)DEMO可以為展現(xiàn)出一個(gè)如果科幻電影般的光影世界。

這是 GTX 1080 Ti的幀率，非?？D，僅有3.31FPS

由于星球大戰(zhàn)DEMO鎖定24FPS，RTX 2080與RTX 2080 Ti都只能跑出24幀，即便如此，也達(dá)到了GTX 1080 Ti 7倍以上的性能。

十八、總結(jié)：NVIDIA完成自我突破圖靈徹底無敵

毫不夸張的說，圖靈是NVIDIA是十年來最大的一次構(gòu)架更新，其意義不亞于2006年發(fā)布的世界上第一塊支持DirectX 10 的代號為G80的GeForce 8800 Ultra顯卡。圖靈的改進(jìn)如此之多，我們此篇評測只是測試了其中一部分特性，之后還會(huì)有一篇補(bǔ)充評測。

圖靈第一次將深度學(xué)習(xí)引入了游戲卡中，目前來說最主要的用途就是DLSS（深度學(xué)習(xí)超級采樣抗鋸齒），他能提供與TAA抗鋸齒技術(shù)幾乎相同的畫質(zhì)（未來會(huì)在畫質(zhì)上會(huì)超越TAA），但絲毫不會(huì)影響到游戲性能，在我們的測試中，RTX 2080 DLSS的性能領(lǐng)先GTX 1080 TAA達(dá)到了80%。

而RTX(實(shí)時(shí)光線追蹤)是一項(xiàng)革命性的技術(shù)，NVIDIA花了整整10年時(shí)間來開發(fā)，才有現(xiàn)在的成果。過去所有的陰影技術(shù)無論看上去多么逼真，其實(shí)都是虛假的，實(shí)時(shí)光線追蹤技術(shù)能構(gòu)造出一個(gè)完全真實(shí)的光影世界。RTX 2080 Ti集成了68個(gè)RT核心，RTX-OPS性能十倍于GTX 1080 Ti，在星球大戰(zhàn)DEMO測試中，后者僅能跑出3FPS的幀率，而RTX 2080/2080 Ti能輕松達(dá)到24FPS。

Turing還在每個(gè)流處理中增加了一個(gè)INT32整數(shù)單元，能將流處理器運(yùn)算效能提升36%，因此在我們的測試中，2944個(gè)流處理器的RTX 2080在游戲性能上比3584個(gè)流處理器的GTX 1080 Ti還要強(qiáng)了15%以上，而功耗更低。在能耗比這個(gè)指標(biāo)上，圖靈相比帕斯卡至少有30%的提升。

再來說說NVIDIA的老對手AMD。最近幾年AMD的GPU研發(fā)幾近停滯，相比NVIDIA一次又一次的徹底更新內(nèi)核構(gòu)架，AMD則是一個(gè)GCN構(gòu)架從2011年一直用到現(xiàn)在（VEGA構(gòu)架也是GCN之上做了一些修修補(bǔ)補(bǔ)）。目前VEGA與圖靈的能耗比差距已經(jīng)達(dá)到了3倍之多，這個(gè)差距之大，可能即將發(fā)布的7nm的VEGA游戲卡都難以彌補(bǔ)，然后明年又要面對NVIDIA 7nm制程工藝的安培,結(jié)局不用想都很明了!

再說說圖靈的售價(jià)，雖說他的性能完全對得起價(jià)格，但是售價(jià)一萬元的游戲顯卡已經(jīng)遠(yuǎn)遠(yuǎn)超過的普通玩家的預(yù)算以及預(yù)期。如果AMD不能推出一款類似于圖靈這樣革命性的GPU構(gòu)架，未來很長一段時(shí)間，獨(dú)立顯卡都將是NVIDIA一人的獨(dú)角戲。