亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

RTX20系顯卡值不值得買 RTX2080和RTX2080Ti詳細(xì)評(píng)測(cè)

  發(fā)布時(shí)間:2018-09-20 10:04:06   作者:佚名   我要評(píng)論
RTX20系顯卡怎么樣?RTX20系顯卡值不值得買?RTX2080和RTX2080Ti哪個(gè)好?有什么區(qū)別?下面小編帶來(lái)RTX2080和RTX2080Ti詳細(xì)評(píng)測(cè),希望對(duì)大家有所幫助

RTX20系顯卡怎么樣?RTX20系顯卡值不值得買?RTX2080和RTX2080Ti哪個(gè)好?有什么區(qū)別?下面小編帶來(lái)RTX2080和RTX2080Ti詳細(xì)評(píng)測(cè),希望對(duì)大家有所幫助。

RTX2080和RTX2080Ti詳細(xì)評(píng)測(cè):

一、前言:NVIDIA革命性跨越 顯卡又熱鬧起來(lái)了

作為GPU顯卡行業(yè)的領(lǐng)頭羊,NVIDIA的新產(chǎn)品發(fā)布節(jié)奏多年來(lái)一直非常穩(wěn),而且每一代都有極大的創(chuàng)新和提升(完全不知牙膏味兒),產(chǎn)品線布局十分豐富,生態(tài)系統(tǒng)合作也是有著厚實(shí)的積累相當(dāng)完備。

在顯卡的江湖里,NVIDIA雖然說(shuō)不上呼風(fēng)喚雨,但始終也都是首屈一指的,GeForce更是幾乎已經(jīng)成了游戲卡的代名詞。

2017年5月,我們迎來(lái)了Pascal帕斯卡架構(gòu)的GeForce GTX 10系列,不過(guò)當(dāng)時(shí)恐怕誰(shuí)都不會(huì)想到,帕斯卡家族的命會(huì)這么長(zhǎng),而新一代讓我們苦苦等待了這么久。

RTX20系顯卡值不值得買 RTX2080和RTX2080Ti詳細(xì)評(píng)測(cè)

最近幾代產(chǎn)品,NVIDIA都會(huì)選擇當(dāng)年的3-6月份春天或春夏之交來(lái)發(fā)布,一般在3月份的GTC圖形技術(shù)大會(huì)上首次披露,但今年非常特殊,一直拖到了9月份,比往年晚了幾乎半年。

更令人稱奇的是,NVIDIA這一次保密工作做的極好,直到發(fā)布前,我們都不知道新卡的架構(gòu)是Volta伏特、Ampere安培還是Turing圖靈,也不知道新卡的命名是GTX 10系列還是GTX 20系列,結(jié)果最終是RTX 20系列。

出現(xiàn)這種局面,最主要的原因是這一代從架構(gòu)技術(shù)到產(chǎn)品體系都發(fā)生了翻天覆地的變化,而研發(fā)全新一代架構(gòu)、完善全新技術(shù)特性,都是需要花費(fèi)無(wú)數(shù)精力、金錢和時(shí)間的(想想AMD Zen憋了多久才出來(lái)再想想Intel酷睿老本吃了多少年)。

按照NVIDIA的說(shuō)法,早在10年前就在設(shè)計(jì)和研發(fā)圖靈架構(gòu)了(當(dāng)然當(dāng)時(shí)應(yīng)該沒(méi)這個(gè)代號(hào)),主要是光線追蹤方面,因?yàn)樵诖酥?,光線追蹤只能用于影視渲染,誰(shuí)也不敢想象它能在游戲里實(shí)時(shí)呈現(xiàn)。

最終,NVIDIA創(chuàng)造奇跡,為PC游戲帶來(lái)了實(shí)時(shí)光線追蹤(即便是有條件的),也難怪黃仁勛驕傲地宣稱圖靈架構(gòu)是2006年引入CUDA統(tǒng)一著色核心以來(lái)最大的革命。

而另一方面不得不面對(duì)的一個(gè)現(xiàn)實(shí)就是,顯卡市場(chǎng)已經(jīng)沉悶太久了,尤其是在電競(jìng)火熱朝的形勢(shì)下,顯卡卻遲遲沒(méi)有跟上。

作為市面上僅有的兩大GPU巨頭之一,AMD近些年全力投入Zen CPU架構(gòu),雖然碩果累累,但也導(dǎo)致GPU方面進(jìn)展緩慢,Polaris北極星架構(gòu)的RX 400/500系列只能在中低端市場(chǎng)混,Vega織女星架構(gòu)的RX Vega系列在高端市場(chǎng)又不具備足夠的競(jìng)爭(zhēng)力。

這種形勢(shì)下,對(duì)手很容易懈怠,反正沒(méi)什么壓力,但幸運(yùn)的是,NVIDIA并沒(méi)有任性擠牙膏,反而奉上了一道更美味的大餐:全新架構(gòu)、實(shí)時(shí)光線追蹤、AI人工智能、GDDR6顯存等都讓人激動(dòng)不已,而且第一次首發(fā)就奉上了三款新卡。

長(zhǎng)久的等待終于值了,整個(gè)顯卡市場(chǎng)也再次熱鬧紛呈起來(lái)。

接下來(lái),我們就會(huì)探析一下這個(gè)革命性的Turing架構(gòu),以及全新的RTX 2080 Ti、RTX 2080兩款高端型號(hào)到底表現(xiàn)如何。

二、架構(gòu)解析之全新內(nèi)核體系

既然是一個(gè)全新設(shè)計(jì)的架構(gòu),我們就要好好看一看這個(gè)以計(jì)算機(jī)科學(xué)之父、人工智能之父艾倫·麥席森·圖靈(Alan Mathison Turing)命名的Turing圖靈新架構(gòu)到底有哪些過(guò)人之處,不過(guò)硬件架構(gòu)總是伴隨各種高深晦澀的技術(shù)名詞、技術(shù)原理,即便專業(yè)人士也得好好研究才行,所以這里我們僅從高級(jí)層面,介紹一下新架構(gòu)的大致設(shè)計(jì)、技術(shù)概況,以及能帶來(lái)的實(shí)際好處。

在以往,NVIDIA為專業(yè)級(jí)計(jì)算卡、消費(fèi)級(jí)游戲卡設(shè)計(jì)的都是統(tǒng)一架構(gòu),只是具體內(nèi)部模塊布局、技術(shù)支持、核心大小不同。好處是可以統(tǒng)一開(kāi)發(fā),降低成本,壞處是缺乏針對(duì)性,技術(shù)資源要么浪費(fèi)要么不夠。

這一次,NVIDIA選擇了分而治之。針對(duì)高性能計(jì)算、圖形渲染、人工智能、深度學(xué)習(xí)等專業(yè)應(yīng)用的是Volta伏特架構(gòu),目前只有一個(gè)超大核心GV100,是迄今為止GPU歷史上最大的核心,臺(tái)積電12nm工藝制造,集成多達(dá)210億個(gè)晶體管,核心面積達(dá)815平方毫米,妥妥的怪物級(jí)核彈。

而針對(duì)游戲顯卡的就是Turing圖靈架構(gòu),也是臺(tái)積電12nm(有說(shuō)法稱最初計(jì)劃使用三星10nm),其中最大的核心TU102集成189億個(gè)晶體管,核心面積754平方毫米,是僅次于GV100的史上第二大GPU核心。

相比上代Pascal帕斯卡家族的大核心GP102,它的晶體管數(shù)量增加了55%,面積則增大了60%,甚至是次級(jí)新核心TU104都超越了GF102,擁有136億個(gè)晶體管、545平方毫米面積。

新架構(gòu)核心之所以如此龐大,除了CUDA核心規(guī)模繼續(xù)增大、升級(jí)Shading著色渲染之外,更關(guān)鍵的是RT Core光線追蹤核心、Tensor Core人工智能核心的加入,這也是新架構(gòu)革命性變化的根本支撐。

擁有全新著色性能的SM CUDA核心陣列、支持高達(dá)每秒100億條光線計(jì)算的RT光線追蹤核心、為實(shí)時(shí)游戲畫面導(dǎo)入AI人工智能加速的Tensor核心,三者就構(gòu)成了圖靈架構(gòu)的三大支柱,各自有不同分工又互相協(xié)作,共同實(shí)現(xiàn)新的游戲渲染畫面。

同時(shí),NVIDIA強(qiáng)調(diào)新架構(gòu)的單個(gè)CUDA核心著色渲染性能是帕斯卡架構(gòu)的1.5倍,第一次可以在4K分辨率、HDR開(kāi)啟的情況下,提供流暢的游戲體驗(yàn),真正開(kāi)啟4K時(shí)代。

按照NVIDIA的說(shuō)法,RTX 2080就能基本實(shí)現(xiàn)4K分辨率下60FPS的游戲幀率,RTX 2080 Ti更是能夠達(dá)到70-80FPS。當(dāng)然具體還要看游戲需求,以及游戲設(shè)置,特別是某些高要求的技術(shù)特性,光線追蹤打開(kāi)后別說(shuō)4K了,就連1080p就比較吃力。

圖靈架構(gòu)的基本組成單元之一還是CUDA核心與SM流處理器陣列,這也是2006年的G80以來(lái)NVIDIA GPU的基石。

事實(shí)上,圖靈架構(gòu)的SM陣列也融合了伏特架構(gòu)的不少特性,相比帕斯卡架構(gòu)差別還是挺大的,比如每一組TPC里的SM陣列由一個(gè)增至兩個(gè),同時(shí)SM內(nèi)部的組成方式也截然不同。

帕斯卡架構(gòu)每個(gè)SM陣列集成128個(gè)FP32浮點(diǎn)單元,圖靈架構(gòu)則改成了2個(gè)FP64雙精度浮點(diǎn)單元、64個(gè)FP32單精度浮點(diǎn)單元、64個(gè)INT32整數(shù)單元、8個(gè)Tensor核心、一個(gè)RT核心。支持浮點(diǎn)和整數(shù)并發(fā)操作,并有新的執(zhí)行數(shù)據(jù)路徑,類似伏特架構(gòu)匯總的獨(dú)立線程調(diào)度。

按照NVIDIA的統(tǒng)計(jì),每執(zhí)行100個(gè)浮點(diǎn)指令,平均會(huì)有36個(gè)整數(shù)指令,兩種指令可以并發(fā)執(zhí)行。

如此一來(lái),帕斯卡架構(gòu)的整數(shù)和浮點(diǎn)計(jì)算就可以分配得更加均衡,并與新的Tensor、RT核心相配合,更合理、高效地完成各種負(fù)載。

整體而言,圖靈核心的CUDA陣列可以每秒執(zhí)行14萬(wàn)億次FP32浮點(diǎn)操作、14萬(wàn)億次INT32整數(shù)操作。

緩存架構(gòu)也徹底變化,由兩個(gè)載入/存儲(chǔ)單元牽頭,一級(jí)緩存和共享緩存整合在一起,而且容量靈活可變,可以是64KB+32KB,也可以是32KB+64KB,大大降低了延遲,帶寬也翻了一番。

二級(jí)緩存容量則從3MB翻倍到6MB。

NVIDIA宣稱,新架構(gòu)每個(gè)CUDA核心的著色渲染性能比上代平均提升50%,部分游戲可達(dá)70%左右,VRMark虛擬現(xiàn)實(shí)測(cè)試成績(jī)甚至翻了一番還多。

當(dāng)然這只是基礎(chǔ)理論上的數(shù)字,實(shí)際性能還要看其他部分和整體指標(biāo)。

圖靈架構(gòu)還首發(fā)搭配新一代GDDR6顯存,目前業(yè)界最快,等效頻率高達(dá)14GHz,搭配352-bit位寬可以帶來(lái)616GB/s的驚人帶寬,相比于GTX 1080 Ti在位寬不變的情況下提升了27%,也比用了2048-bit HBM2高帶寬顯存的AMD RX Vega 64高了27%。

而且關(guān)鍵是,GDDR6的成本比HBM2低得多。

另外,NVIDIA還對(duì)新顯存進(jìn)行了各種優(yōu)化,信號(hào)竄擾降低了40%,更利于運(yùn)行穩(wěn)定和進(jìn)一步超頻。

三、架構(gòu)解析之RT核心、光線追蹤

圖靈架構(gòu)和RTX 20系列的最大亮點(diǎn)和賣點(diǎn)當(dāng)然是——游戲?qū)崟r(shí)光線追蹤!

從第一顆GPU NVIDIA GeForce 256誕生至今已經(jīng)整整19年,GPU規(guī)模和技術(shù)越來(lái)越發(fā)達(dá),但是最底層的圖形渲染技術(shù)其實(shí)幾乎一成不變,始終都是光柵化渲染,通過(guò)計(jì)算三角形和多邊形來(lái)獲得畫面輸出,好處是資源消耗容易控制,壞處就是距離真實(shí)畫面相差甚遠(yuǎn),甚至永遠(yuǎn)不可能接近。

光線追蹤(Ray Tracing)技術(shù)則堪稱圖形界的“圣杯”,簡(jiǎn)單地說(shuō)就是在圖形渲染過(guò)程中實(shí)時(shí)跟蹤物體和環(huán)境的光線,準(zhǔn)確進(jìn)行光線反射和折射、全局照明、物理陰影的繪制,可以帶來(lái)近乎百分之百真實(shí)的渲染畫面,尤其是光影效果。

光線追蹤技術(shù)其實(shí)并不新鮮,1969年的時(shí)候在IBM工作的Arthur Appel就提出了這種概念,當(dāng)時(shí)叫做Ray Casting,距今已經(jīng)整整半個(gè)世紀(jì)。

1979年,Turner Whitted研究出了遞歸光線追蹤算法(Recursive RayTracing Algorithm)。

1984年,Carpenter等人發(fā)表了一篇關(guān)于分布式光線追蹤的論文《Distributed RayTracing》,影響甚廣。

但是,光線追蹤的算法非常簡(jiǎn)單,稍有計(jì)算機(jī)圖形只是的人都能理解,關(guān)鍵在于如何優(yōu)化提高效率,因?yàn)樗枰挠?jì)算量太過(guò)龐大,想想要實(shí)時(shí)計(jì)算場(chǎng)景中無(wú)數(shù)光線每時(shí)每刻的各種傳播,那是多么恐怖,以前的GPU根本無(wú)力承擔(dān)實(shí)時(shí)計(jì)算。

因此直到2006年迪士尼的《汽車總動(dòng)員》(Cars),影視行業(yè)才開(kāi)始使用光線追蹤渲染,如今大多數(shù)的照片級(jí)渲染系統(tǒng)多時(shí)基于光線追蹤的,但背后都是超大規(guī)模的計(jì)算機(jī)群在吃撐,一幀畫面往往都要渲染幾個(gè)小時(shí)。

雖然大家都在努力,但就在一個(gè)月前,如果說(shuō)普通顯卡可以在游戲里實(shí)現(xiàn)光線追蹤(盡管是有條件的),相信絕大多數(shù)人都不會(huì)相信,但是NVIDIA的圖靈做到了。

NVIDIA在圖靈架構(gòu)中集成了最多72個(gè)RT Core核心,每個(gè)SM單元一個(gè),專門用來(lái)服務(wù)光線追蹤運(yùn)算,等于一個(gè)特殊的專用單元,由硬件加速取代軟件模擬,效率自然要比CUDA這種通用單元高很多,就像GPU做并行計(jì)算比CPU強(qiáng)得多

簡(jiǎn)單來(lái)說(shuō),圖靈架構(gòu)的光線追蹤運(yùn)算步驟是這樣的:著色器單元首先發(fā)出光線探測(cè)請(qǐng)求,RT Core核心就開(kāi)始完全接管下邊的工作,并分為兩個(gè)過(guò)程,其中包圍盒求交評(píng)估單元(Box Intersection Evaluators)進(jìn)行包圍盒的獲取和解碼,并進(jìn)行求交測(cè)試,得到子包圍盒或者三角形。

如果是子包圍盒,就返回重新執(zhí)行,重復(fù)剛才的步驟。如果是三角形,那就交給三角形求交評(píng)估單元(Triangle Intersection Evaluators),做下一步的求交測(cè)試,直到得到最終結(jié)果并輸出給著色器,進(jìn)行最終渲染。

看懵了對(duì)吧?懵了就對(duì)了……

整個(gè)光線追蹤計(jì)算過(guò)程中,運(yùn)用的主要是BVH算法,也就是Bounding Volume Hierarchy Traversal,層次包圍盒遍歷的意思。

比如渲染對(duì)象是一只兔子,要幾算一條光線和兔子本身的交互,就把兔子所在空間劃分成N個(gè)包圍盒,計(jì)算光線和哪一個(gè)包圍盒相交,是的話就再把這個(gè)包圍盒繼續(xù)劃分成N個(gè)更小的包圍盒,再次計(jì)算相交,如此反復(fù),一直找到和光線相交的三角形所在的包圍盒,再對(duì)這個(gè)三角形進(jìn)行最終的渲染。

BVH算法可以大大減少計(jì)算每一條光線最近相交點(diǎn)所需要遍歷的三角形數(shù)量,而且只需要進(jìn)行一次就能給所有光線使用,大大提高了執(zhí)行效率。

除了硬件方面的工作,軟件方面既有NVIDIA自己的OptiX光線追蹤引擎、GameWorks SDK光線追蹤模塊,也有微軟的DirectX 12 Ray-Tracing(DXR) API、Windows ML中間件,后者會(huì)在即將發(fā)布的Windows 10 2018年秋季更新版中正式提供。

性能方面,RTX 2080 Ti在精簡(jiǎn)了四個(gè)只有68個(gè)RT核心的情況下,每秒鐘可以計(jì)算超過(guò)100億條光線,大約等于100TFlops(每秒1000億次浮點(diǎn)運(yùn)算)。

而上代GTX 1080 Ti雖然也能執(zhí)行光線追蹤,但因?yàn)闆](méi)有專用單元和算法,效率只有RTX 2080 Ti的大約十分之一,不足以實(shí)時(shí)用于游戲。

接下來(lái)欣賞欣賞NVIDIA RTX光線追蹤的效果和對(duì)比:

↑↑↑官方DEMO

目前支持NVIDIA光線追蹤技術(shù)的游戲有11款(和首發(fā)時(shí)相比沒(méi)變),分別是:

- 《神力科莎》 (Assetto Corsa Competizione)

- 《原子之心》 (Atomic Heart)

- 《戰(zhàn)地5》 (Battlefield V)

- 《控制》 (Control)

- 《應(yīng)征入伍》 (Enlisted)

- 《逆水寒》 (Justice

- 《劍網(wǎng)3》 (JX3)

- 《機(jī)甲戰(zhàn)士5:雇傭兵》(MechWarrior 5:Mercenaries)

- 《地鐵:離去》

- 《Project DH》

- 《古墓麗影:暗影》(Shadow of the Tomb Raider)

不過(guò),RTX 20系列上市初期,可以玩的光線追蹤游戲暫時(shí)還是零,比如《古墓麗影:暗影》首發(fā)不支持得后期打補(bǔ)丁,《戰(zhàn)地5》則跳票了。

四、架構(gòu)解析之Tensor核心、AI加速

NVIDIA在伏特架構(gòu)上引入了全新的專用處理模塊Tensor Core,也就是張量計(jì)算核心,重點(diǎn)用來(lái)支持深度學(xué)習(xí)、高性能計(jì)算(也是晶體管大戶)。

圖靈架構(gòu)則是在游戲卡上引入Tensor Core,同時(shí)針對(duì)游戲圖形應(yīng)用做了大量的調(diào)整優(yōu)化,尤其是浮點(diǎn)精度方面。

Tensor的意思是張量,不同于我們常見(jiàn)的標(biāo)量(零維)、矢量(一維)、矩陣(三維),擁有三維或者更高維度,簡(jiǎn)單地說(shuō)就是一個(gè)數(shù)據(jù)容器,可以包含多個(gè)維度的數(shù)據(jù)。

現(xiàn)在火熱的深度學(xué)習(xí),就運(yùn)用了超大規(guī)模的數(shù)據(jù)運(yùn)算,其中就經(jīng)常會(huì)用到矩陣融合乘加(FMA)運(yùn)算,Tensor核心就是為這種矩陣數(shù)學(xué)運(yùn)算專門服務(wù)的。

它可以對(duì)兩個(gè)4×4 FP16浮點(diǎn)矩陣進(jìn)行相乘操作,然后將結(jié)果加入到另一個(gè)4×4 FP16/FP32浮點(diǎn)矩陣中,最終輸出新的4×4 FP16/FP32矩陣,這叫做混合精度數(shù)學(xué)運(yùn)算,因?yàn)檩斎刖仃囀前刖龋Y(jié)果則可以達(dá)到全精度。

每個(gè)時(shí)鐘周期內(nèi),圖靈架構(gòu)的Tensor核心可以執(zhí)行64個(gè)FMA運(yùn)算,從而大大加速矩陣運(yùn)算,可用于新的神經(jīng)實(shí)時(shí)圖形渲染、深度學(xué)習(xí)訓(xùn)練和推理。

圖靈架構(gòu)每個(gè)SM陣列里有8個(gè)Tenor核心,總計(jì)576個(gè),完整支持114TFlops FP16浮點(diǎn)運(yùn)算(每秒114萬(wàn)億次),同時(shí)支持228TOPS INT8、455TOPS INT4整數(shù)運(yùn)算(每秒228億次、455億次),后者是伏特架構(gòu)里沒(méi)有的。

NVIDIA把看起來(lái)高深莫測(cè)的Tensor核心放到游戲卡里,顯然不是做專業(yè)運(yùn)算的,其深度學(xué)習(xí)能力也是為游戲服務(wù)的,結(jié)合新的神經(jīng)圖形框架(Neural Graphics Framework),簡(jiǎn)稱NGX,可以在游戲中實(shí)現(xiàn)DLSS深度學(xué)習(xí)超采樣抗鋸齒、AI Super Rez超級(jí)分辨率、AI Slow-Mo慢動(dòng)作、AI InPainting等等。

這些計(jì)算繁瑣、資源消耗巨大的操作,在以往也可以實(shí)現(xiàn),但會(huì)付出很大的代價(jià),效果也不盡如人意,如今有了新的Tensor核心,就可以建立屬于GPU核心自己的DNN深度神經(jīng)網(wǎng)絡(luò),將AI融入游戲。

NVIDIA已經(jīng)向游戲引擎開(kāi)放NGX API,將其融入其中,實(shí)現(xiàn)底層加速。

另外和很多AI應(yīng)用類似,NVIDIA GeForce Experience軟件的作用也非常重要,它會(huì)自動(dòng)匹配顯卡型號(hào),從云端訓(xùn)練的AI模型哪里下載相應(yīng)的NGX軟件包,并定期更新,達(dá)到越用越好、甚至是因人而異的效果。

AI Super Rez:有點(diǎn)類似高清視頻中常見(jiàn)的Up Scaling,但是引入了人工智能和深度學(xué)習(xí)之后,可以實(shí)現(xiàn)近乎“無(wú)損放大”,原來(lái)的畫面分辨率放大2倍、4倍乃至8倍,仍然清晰銳利。

AI Slow-Mo:超級(jí)慢動(dòng)作我們并不陌生,現(xiàn)在不少高端手機(jī)都支持240FPS、480FPS乃至是960FPS的慢動(dòng)作視頻錄制。圖靈架構(gòu)可以對(duì)普通的30FPS視頻進(jìn)行智能插幀運(yùn)算,得到240FPS/480FPS的慢動(dòng)作視頻,也就是說(shuō)你不需要專門的高幀率攝像頭,就可以獲得很流暢的慢動(dòng)作視頻。

AI InPainting:可以抹掉畫面中不需要的內(nèi)容,也可以智能補(bǔ)全缺失的內(nèi)容,完全超越PS摳圖的存在。它同樣來(lái)自現(xiàn)實(shí)中大量真實(shí)世界圖片的訓(xùn)練推理。

其實(shí),慢動(dòng)作和修圖這兩項(xiàng)在之前就曾有相關(guān)報(bào)道,顯然NVIDIA在硬件、算法兩個(gè)方面都實(shí)現(xiàn)了真正的突破。

接下來(lái)就是重中之重的DLSS(深度學(xué)習(xí)超采樣抗鋸齒)。

我們知道,傳統(tǒng)的光柵化圖形渲染畫面會(huì)存在各總各樣的鋸齒(狗牙),所以GPU廠商都會(huì)在后期處理中加入各種各樣的AA抗鋸齒技術(shù),但傳統(tǒng)抗鋸齒都是由GPU去運(yùn)算的,效果參差不齊不說(shuō),最關(guān)鍵的是會(huì)消耗大量的GPU資源,開(kāi)啟之后讓游戲卡得沒(méi)法玩再正常不過(guò)了。

DLSS深度采樣超采樣抗鋸齒則和傳統(tǒng)抗鋸齒技術(shù)走了一條完全不同的路,它是在NVIDIA超級(jí)計(jì)算機(jī)上進(jìn)行訓(xùn)練,而不再消耗GPU本身的資源。

針對(duì)每一款游戲,NVIDIA會(huì)在運(yùn)算建立對(duì)應(yīng)的訓(xùn)練神經(jīng)網(wǎng)絡(luò),收集大量的64x超采樣數(shù)據(jù),對(duì)像素點(diǎn)進(jìn)行64次偏移著色合成輸出,理論上可以獲得近乎完美的抗鋸齒平滑效果,同時(shí)還會(huì)對(duì)比和普通渲染畫面之間的差異,調(diào)整網(wǎng)絡(luò)權(quán)重,反復(fù)迭代,最后獲得更合理的抗鋸齒畫面效果,還可以避免傳統(tǒng)TAA時(shí)間抗鋸齒的運(yùn)動(dòng)模糊等問(wèn)題。

云端訓(xùn)練完成后,NVIDIA會(huì)通過(guò)GFE軟件將成果分發(fā)給玩家,再用到游戲中,而且隨著游戲運(yùn)行得越多,DLSS學(xué)習(xí)效果就會(huì)越來(lái)越優(yōu)化,甚至每個(gè)玩家都可以得到屬于自己的不同效果。

當(dāng)然了,這也意味著NVIDIA需要和每一款游戲或者每一個(gè)游戲引擎合作,去進(jìn)行專門的優(yōu)化,還是相當(dāng)費(fèi)時(shí)費(fèi)力的,不過(guò)考慮到NVIDIA在游戲行業(yè)廣泛深入的合作關(guān)系,這方面倒不必?fù)?dān)心。

尤其是隨著合作優(yōu)化的深入,NVIDIA完全可以建立起屬于自己的技術(shù)壁壘,讓對(duì)手望塵莫及,進(jìn)一步帶動(dòng)大量玩家忠實(shí)地跟隨NVIDIA。

更神奇的是,DLSS因?yàn)榛静恍枰腉PU本地資源,因此可以大大釋放GPU性能,讓其專心渲染游戲,提升性能。

比如根據(jù)官方數(shù)據(jù),Epic的《滲透者》(Infiltrator)游戲里,4K分辨率下1080 Ti開(kāi)啟TAA平均幀率還不到40FPS,2080 Ti開(kāi)啟DLSS則能達(dá)到80FPS,提升了整整一倍!

游戲支持方面也不是啥大事兒,RTX 20系列發(fā)布之初就有16款游戲(PPT上寫錯(cuò)了),現(xiàn)在產(chǎn)品還沒(méi)完全上市就已經(jīng)增加到25款。

首發(fā)名單如下:

- 《方舟:生存進(jìn)化》 (Ark: Survival Evolved)

- 《原子之心》 (Atomic Heart)

- 《無(wú)畏》 (Dauntless)

- 《最終幻想XV》 (Final Fantasy XV)

- 《破碎之地》 (Fractured Lands)

- 《殺手2》 (Hitman 2)

- 《奈恩群島》 (Islands of Nyne)

- 《逆水寒》 (Justice)

- 《劍網(wǎng)3》 (JX3)

- 《機(jī)甲戰(zhàn)士5:雇傭兵》 (Mechwarrior 5:Mercenaries)

- 《絕地求生》 (PlayerUnknown’s Battlegrounds)

- 《遺跡:灰燼重生》 (Remnant: From the Ashes)

- 《英雄薩姆4:星球惡棍》 (Serious Sam 4: PlanetBadass)

- 《古墓麗影:暗影》 (Shadow of the Tomb Raider)

- 《鍛造競(jìng)技場(chǎng)》 (The Forge Arena)

- 《少數(shù)幸運(yùn)兒》 (We Happy Few)

新增名單如下:

- 《暗黑血統(tǒng)3》(Darksiders 3)

- 《飛向月球:財(cái)富》(Deliver Us The Moon: Fortuna)

- 《恐懼群狼》(Fear the Wolves)

- 《地獄之刃:塞娜的獻(xiàn)祭》(Hellblade: Senua's Sacrifice)

- 《KINETIK》

- 《前哨零》(Outpost Zero)

- 《超殺:行尸走肉》(Overkill's The Walking Dead)

- 《人渣》(SCUM)

- 《風(fēng)暴奇兵》(Stormdivers)

這其中有5款游戲同時(shí)支持RTX光線追蹤和DLSS抗鋸齒技術(shù),分別是《原子之心》、《逆水寒》、《劍網(wǎng)3》、《機(jī)甲戰(zhàn)士5:雇傭兵》、《古墓麗影:暗影》。

七、架構(gòu)解析之三大核心與型號(hào)

圖靈家族除了架構(gòu)本身變化巨大,產(chǎn)品體系也和以往明顯不同,首發(fā)一口氣就是三款型號(hào)RTX 2080 Ti、RTX 2080、RTX 2070,而且分別對(duì)應(yīng)三個(gè)不同核心TU102、TU104、TUF106,而以往的x80、x70都是共享一個(gè)核心。

具體原因不詳,可能是新一代核心太大,x70直接用大核心閹割成本比較高,還不如再造一個(gè)省錢的小核心。

這就是最頂級(jí)的TU102核心,186億個(gè)晶體管、754平方毫米面積確實(shí)不是蓋的。

內(nèi)有4608個(gè)CUDA核心,分為6組GPC、36組TPC、72組SM陣列(每組SM 64個(gè)CUDA核心),同時(shí)有72個(gè)RT核心、576個(gè)Tensor核心、288個(gè)紋理單元、96個(gè)ROP光柵單元,二級(jí)緩存容量6MB,寄存器文件18MB,352-bit位寬。

不過(guò),RTX 2080 Ti并未完全使用整個(gè)TU102核心,而是有所精簡(jiǎn),僅提供4352個(gè)CUDA核心(68組SM陣列),RT核心則減少為68個(gè),Tensor核心544個(gè)。

目前只有Quadro RTX 8000用了完整的TUF102,可能是初期良品率不足,優(yōu)先供給專業(yè)市場(chǎng),也可能是功耗和發(fā)熱在游戲卡上不好控制,還有可能是留一手……

RTX 2080 Ti的核心頻率基礎(chǔ)為1350MHz,加速頻率FE公版做到了1635MHz,非公版則規(guī)定是1545MHz,當(dāng)然大家可以隨意超頻。

顯存搭配11GB GDDR6,等效頻率14GHz,帶寬為616GB/s,整卡功耗260W。

TU104核心,136億個(gè)晶體管,545平方毫米,比帕斯卡家族的大核心GP102都要大一圈。

它集成了3072個(gè)CUDA核心,劃分為6組GPC、24組TPC、48組SM(每組SM還是64個(gè)),同時(shí)有192個(gè)紋理單元、64個(gè)ROP單元、384個(gè)Tensor核心、48個(gè)RT核心,二級(jí)緩存容量4MB,寄存器文件12MB,顯存位寬256-bit。

RTX 2080同樣沒(méi)有用滿TU104核心,而是精簡(jiǎn)了兩組SM,提供2944個(gè)CUDA核心、368個(gè)Tensor核心、46個(gè)RT核心,完整版還是在專業(yè)卡上,Quadro RTX 6000。

RTX 2080核心基礎(chǔ)頻率1515MHz,加速頻率非公版1710MHz,公版直接定在1800MHz,搭配8GB GDDR6顯存,等效頻率14GHz,帶寬448GB/s,功耗225W。

它的渲染性能為60 TRX-OPS,相比于RTX 2080 Ti削弱了23%,光線追蹤性能8 GigaRays/s(每秒80億條光線),削弱了20%。

TU106核心,108億個(gè)晶體管,445平方毫米,相比GP102也只是分別差了10%、6%,更可見(jiàn)圖靈家族的龐大。

TU106核心內(nèi)建2304個(gè)CUDA核心,分為3組GPC、18組TPC、36組SM陣列(每組繼續(xù)64個(gè)),同時(shí)有144個(gè)紋理單元、64個(gè)ROP單元、288個(gè)Tensor核心、36個(gè)RT核心,二級(jí)緩存容量4MB,寄存器文件9MB,顯存位寬還是256-bit。

RTX 2070終于用了完整的TU106核心,核心頻率基礎(chǔ)1410MHz,加速公版1710MHz、非公版1620MHz,繼續(xù)搭配8GB 14GHz GDDR6顯存,功耗185W。

渲染性能45 RTX-OPS,相比于RTX 2080 Ti、RTX 2080分別低了25%、42%,光線追蹤性能6 GigaRays/s(每秒60億條光線),分別低了25%、40%。

圖靈家族三大核心與帕斯卡家族大核心GP102對(duì)比。

八、圖賞:16相數(shù)字供電 售價(jià)萬(wàn)元的雙風(fēng)扇“煤氣灶”

以下是RTX 2080的圖賞。

RTX 2080包裝盒。

公版RTX 2080顯卡的外觀有了巨大的變化,放棄以往的渦輪散熱,轉(zhuǎn)而采用開(kāi)放式雙風(fēng)扇設(shè)計(jì),加上銀色金屬機(jī)身,看起來(lái)像極了“煤氣灶”。

一塊巨大的全覆銀色金屬背板,背板厚度達(dá)到了3mm,具有良好的散熱效果。

8+6PIN的供電輸入,可以提供350W的輸入功率。

拋棄了傳統(tǒng)的SLI接口,采用了第二代NVIDIA NVLink高速互聯(lián)方案,能提供100GB/s的雙向帶寬,并且大大降低了延遲。

拆開(kāi)扇熱器后的PCB本體,RTX 2080采用TU104核心,擁有136億晶體管,幾乎2倍于GTX 1080。顯存采用的美光GDDR6 14000MHz,單顆1GB,一共8顆組成256Bit 8GB,顯存帶寬達(dá)到了448GB/s。

供電部分采用了8相核心+2相顯存的供電方案,并且大量采用了高端的鉭電容,供電規(guī)模及用料遠(yuǎn)遠(yuǎn)超過(guò)了公版的GTX 1080(6+1相供電)。

散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件,顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過(guò)高的情況。

以下是RTX 2080 Ti的圖賞。

RTX 2080 Ti包裝盒。

與RTX 2080一樣,RTX 2080 Ti也同樣舍棄了以往的渦輪散熱,轉(zhuǎn)而采用雙風(fēng)扇設(shè)計(jì),看上去就是一個(gè)價(jià)值一萬(wàn)元的煤氣灶。

銀色全覆金屬背板,也同樣是和RTX 2080一樣,沒(méi)有什么區(qū)別。

雙8Pin供電,最高能提供400W的收入功率。

同樣采用了第二代NVIDIA NVLink高速互聯(lián)方案。

RTX 2080 Ti采用TU102核心,擁有189億晶體管。

顯存采用的美光GDDR6 14000MHz,單顆1GB,一共11顆組成352Bit 11GB,顯存帶寬達(dá)到了616GB/s。

供電部分則采用了14+2一共16相供電方案,頂級(jí)非公都很難達(dá)到這樣的規(guī)模,看來(lái)售價(jià)萬(wàn)元的顯卡在用料方面果真是舍得下本錢。

散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件,顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過(guò)高的情況。

九、測(cè)試平臺(tái):5.2GHz的i7-8086K助陣

測(cè)試平臺(tái)如下:

i7-8086K基于八代酷睿Coffee Lake構(gòu)架,14++納米工藝制造,核心面積約150平方毫米,擁有六個(gè)核心十二線程,睿頻加速達(dá)5GHz,這是Intel史上第一顆默認(rèn)能跑到5GHz頻率的處理器。

為了盡可能的發(fā)揮RTX 2080 Ti強(qiáng)大的性能,我們將此U超頻到了5.2GHz。

主板選用了華碩MAXIMUS X HERO,擁有高達(dá)10相超合金數(shù)字供電,超頻能力在Z370主板中屬于頂級(jí)水準(zhǔn)。BIOS已經(jīng)更新到最新版本。

內(nèi)存使用了影馳HOF II DDR4-4000 8GBx2套裝,測(cè)試中開(kāi)啟XMP保持4000MHz頻率,時(shí)序?yàn)?9-25-25-45 CR2。

機(jī)箱采用了酷冷至尊頂級(jí)的H500M型號(hào),其前置雙200mm風(fēng)扇以及大面積的金屬散熱孔 能夠?qū)C(jī)箱內(nèi)部熱量快速排出,有效降低電源和硬盤的溫度。

機(jī)箱背部的金屬鎧甲將背線打理的井井有條,看上去十分干凈。

我們采用的顯示器是LG 38UC99,其支持的最高分辨率為3840X1600,測(cè)試中的4K分辨率就是指的這個(gè)。

測(cè)試平臺(tái)使用的是酷冷至尊MasterWatt Maker1200W鈦金電源。

MasterWatt Maker1200W是目前頂級(jí)的雙路電源,轉(zhuǎn)換效率高達(dá)93%。雙路12V輸出,每路限流50A即600W的功率。

為了壓制5.2GHz的i7-8086K,散熱器采用了九州風(fēng)神頂級(jí)的船長(zhǎng)280一體水冷散熱器。

十、1080P分辨率測(cè)試:RTX 2080碾壓帕斯卡全系 處理器開(kāi)始瓶頸

Turing的核心構(gòu)架完全不同于以往的產(chǎn)品,從Kepler到Maxwell到再到Pascal,每一個(gè)CUDA核心都就是由FP32單元構(gòu)成。

而Turing每一個(gè)CUDA核心除了有一個(gè)FP32的單精度浮點(diǎn)單元之外,還有一個(gè)INT32的單精度整數(shù)單元。每8個(gè)CUDA單元搭配一個(gè)TENSOR核心,64個(gè)CUDA CORE+8個(gè)TENSOR CORE再加上一個(gè)RT CORE構(gòu)成一組SM(其實(shí)每一組SM中還有2個(gè)FP64雙精度浮點(diǎn)單元,只是下圖并沒(méi)有標(biāo)示出來(lái))。

根據(jù)NVIDIA的說(shuō)法,INT32可以為每個(gè)CUDA核心帶來(lái)36%的性能提升,再加上L1緩存帶寬的成本增加以及降低延遲,最終圖靈每個(gè)CUDA核心相比帕斯卡能有50%的性能提升。

圖靈是否真如所說(shuō)還是需要具體的測(cè)試來(lái)驗(yàn)證,下面正式進(jìn)入游戲測(cè)試環(huán)節(jié)。

3DMark Time Spy

RTX 2080 Ti的3DMark Time Spy跑分,圖形分?jǐn)?shù)達(dá)到了13597。

RTX 2080 Ti的3DMark Time Spy跑分,圖形分?jǐn)?shù)達(dá)到了10838。

在3DMark Time Spy 測(cè)試中,RTX 2080超越了GTX 1080 Ti,領(lǐng)先了20%,相比GTX 1080的7393分則提升了46%之多。

RTX 2080 Ti比GTX 1080 Ti提升了52%。

3DMark Fire Strike Extreme

2013年誕生的3DMark Fire Strike其實(shí)已經(jīng)不再適合充當(dāng)最新顯卡的測(cè)試工具,RTX 2080的表現(xiàn)不如GTX 1080 Ti,有500分的差距,但是依然比GTX 1080強(qiáng)了22%。

RTX 2080 Ti相比GTX 1080 Ti有21%的提升。

GTA V

《GTA V》于2015年登陸PC平臺(tái),全平臺(tái)的銷量已經(jīng)超過(guò)了1億,算是 10年來(lái)最成功的單機(jī)大作,現(xiàn)在依然人氣不減。

畫質(zhì)手動(dòng)調(diào)為最高特效,開(kāi)啟MSAA 2X以及NVIDIA TXAA,分辨率為1920x1080,顯存占用3422M。

1080P分辨率下受制于CPU性能瓶頸,RTX 2080 Ti與RTX 2080幀數(shù)幾乎一樣,比GTX 1080 Ti只有2幀的優(yōu)勢(shì),比起GTX 1080多了14幀。

刺客信條:起源

《刺客信條:起源》是由育碧制作并發(fā)行的《刺客信條》系列歷史上規(guī)模最大的一個(gè)。本作采用開(kāi)放地圖沙盒玩法,游戲幾乎呈現(xiàn)了整個(gè)古埃及王國(guó),畫質(zhì)與風(fēng)景無(wú)人能出其右。

測(cè)試時(shí)開(kāi)啟極高畫質(zhì),分辨率為1920x1080。

圖靈的2張顯卡都過(guò)了100幀,RTX 2080領(lǐng)先GTX 1080 19幀,RTX 2080 Ti比GTX 1080 Ti多了12幀。

孤島驚魂5

《孤島驚魂5》是一款由育碧(Ubisoft)制作的第一人稱射擊游戲。 已于2018年3月正式發(fā)售。

在《孤島驚魂5》中,RTX 2080 Ti領(lǐng)先GTX 1080 Ti 23幀,RTX 2080領(lǐng)先GTX 1080 29幀。

古墓麗影10

畫面設(shè)置為1920*1080 FXAA、DX12+默認(rèn)非常高畫質(zhì)。

RTX 2080 Ti幀數(shù)達(dá)到了204,領(lǐng)先GTX 1080 Ti 32幀這是第一次有顯卡能在1080P最高畫質(zhì)下跑出200+的幀數(shù)。RTX 2080領(lǐng)先GTX 1080 33幀。

GTX980Ti在進(jìn)行此項(xiàng)測(cè)試時(shí),若選擇DX12模式,幀數(shù)會(huì)爆降30%,因此該卡是以DX11進(jìn)行的游戲測(cè)試。

古墓麗影11

《古墓麗影:暗影》是一款由Eidos Montreal工作室制作的動(dòng)作冒險(xiǎn)游戲, 本作是重啟版《古墓麗影》的系列第三作,已于2018年9月15日正式發(fā)售。該游戲在后續(xù)的補(bǔ)丁中將提供對(duì)RTX系列顯卡DLSS與光線追蹤技術(shù)的支持。

畫面設(shè)置為1920*1080 FXAA、DX12+手動(dòng)最高畫質(zhì)。

在1080P最高畫質(zhì)下,RTX 2080 Ti跑出了136幀,比GTX 1080 Ti快了43幀,領(lǐng)先幅度將近50%。

RTX 2080幀數(shù)為115FPS,領(lǐng)先GTX 1080 32幀。

中土世界:戰(zhàn)爭(zhēng)之影

在最高畫質(zhì)下,同時(shí)開(kāi)啟TAA抗鋸齒,RTX 2080 Ti能跑出160FPS的幀率,領(lǐng)先GTX 1080 Ti 39幀,

十一、2K分辨率測(cè)試:新構(gòu)架威力進(jìn)一步顯現(xiàn)

本來(lái)2K分辨率測(cè)試不在計(jì)劃之內(nèi),考慮到現(xiàn)在不少玩家都用上2K分辨率顯示器,臨時(shí)決定將此分辨率加入測(cè)試。

由于文明6過(guò)于依賴CPU性能,GTX1070以上的顯卡都沒(méi)有跑出差距,在計(jì)算性能百分比時(shí)并未加入此游戲的數(shù)據(jù)。

在2560x1440分辨率下,RTX 2080 Ti的性能稍稍得以施展,相比GTX 1080領(lǐng)先幅度達(dá)到了65%,比GTX 1080 Ti則快了39%。

RTX 2080相比GTX 1080領(lǐng)先幅度達(dá)到了34%,比GTX 1080 Ti也快了13%。

麥克斯韋年代的旗艦GTX980Ti與GTX1070的性能進(jìn)一步拉開(kāi),僅能達(dá)到后者86%的性能。

AMD這邊的期間顯卡VEGA64稍強(qiáng)與GTX 1080,領(lǐng)先幅度為4%。

十二、4K分辨率測(cè)試:高端顯卡的主戰(zhàn)場(chǎng) 圖靈得以一展雄風(fēng)

對(duì)于RTX 2080 Ti這種級(jí)別的顯卡而言,只有4K分辨率才能真正榨干它全部的性能,低分辨下進(jìn)行測(cè)試時(shí),由于CPU本身在渲染建模方面無(wú)法跑出太高幀率,RTX 2080 Ti的性能難以完全發(fā)揮。

我們采用的顯示器是LG 38UC99,測(cè)試的分辨率為3860X1600,與標(biāo)準(zhǔn)的3840X2160的4K分辨率有些許差異。測(cè)試時(shí)的畫面設(shè)置與1080P相同,不再一一贅述。

3DMark Time Spy Extreme

RTX 2080的3DMark Time Spy Extreme跑分,圖形分?jǐn)?shù)達(dá)到了4949。

RTX 2080 Ti的3DMark Time Spy Extreme跑分,圖形分?jǐn)?shù)達(dá)到了6364。

在3DMark Time Spy 測(cè)試中RTX 2080跑分比GTX 1080 Ti高了761分,領(lǐng)先幅度為18%,相比GTX 1080的3314分則提升了50%之多。

RTX 2080 Ti比GTX 1080 Ti提升了52%。

3DMark Fire Strike Ultra

3DMark Fire Strike Ultra現(xiàn)在無(wú)法反應(yīng)圖靈的真實(shí)性能,此項(xiàng)測(cè)試中RTX 2080要落后GTX 1080 Ti大概4%,但在所有其他的游戲測(cè)試中,RTX 2080都是大幅度領(lǐng)先GTX 1080 Ti,無(wú)一例外。

RTX 2080 Ti在此項(xiàng)測(cè)試中的得分為7907,領(lǐng)先GTX 1080 Ti 1446分。

RTX 2080得分則為6225,領(lǐng)先GTX 1080 1035分。

最終幻想15

《最終幻想15》是Square Enix史上最昂貴的游戲開(kāi)發(fā)項(xiàng)目,歷時(shí)10年的開(kāi)發(fā)周期。本作是《最終幻想》系列中最接近 “水晶的神話”的核心內(nèi)容的一部,向玩家呈現(xiàn)了一個(gè)廣大而又開(kāi)放的世界

RTX 2080 Ti跑出了5579的分?jǐn)?shù),領(lǐng)先GTX 1080 Ti 1691分,領(lǐng)先幅度為43%。

RTX 2080的分?jǐn)?shù)為4528,領(lǐng)先GTX 1080 Ti 16%,相比GTX 1080領(lǐng)先幅度有32%。

GTA V

RTX 2080 Ti幀率為85FPS,領(lǐng)先GTX 1080 Ti 20幀。

RTX 2080幀率為73FPS,領(lǐng)先GTX 1080 18幀。

刺客信條:起源

在《刺客信條:起源》測(cè)試中,RTX 2080 Ti幀率為75FPS,領(lǐng)先GTX 1080 Ti 幀。

RTX 2080幀率為62FPS,領(lǐng)先GTX 1080 16幀。

孤島驚魂5

4K分辨率的測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>

由于文明6過(guò)于依賴CPU性能,3DMark Fire Strike Ultra的跑分無(wú)法反應(yīng)圖靈性能,在計(jì)算性能百分比時(shí)并未加入這2個(gè)項(xiàng)目的測(cè)試數(shù)據(jù)。

在4K分辨率下,RTX 2080 Ti的性能得以釋放,相比GTX 1080領(lǐng)先了69%,和GTX 1080 Ti相比,有41%的領(lǐng)先幅度。

RTX 2080相比GTX 1080有36%的領(lǐng)先幅度,和GTX 1080 Ti相比,也能領(lǐng)先13%。

VEGA64的表現(xiàn)甚至不如2K分辨率,對(duì)GTX 1080的領(lǐng)先優(yōu)勢(shì)只剩下3%。

十三、CPU需求測(cè)試:4核4線程處理器無(wú)法勝任i7-7700K老當(dāng)益壯

在7代酷睿年代,很多玩家覺(jué)得4核i5與頂級(jí)的4核i7處理器相比,在單機(jī)游戲上面方面沒(méi)有多少差異,為此我們收集了7款主流的CPU逐一測(cè)試,方便玩家了解頂級(jí)顯卡對(duì)CPU性能的需求。

1、測(cè)試平臺(tái)

因?yàn)锳MD平臺(tái)無(wú)法支持4000MHz頻率內(nèi)存條,測(cè)試時(shí)內(nèi)存統(tǒng)一采用3200MHz頻率

2、1080P分辨率測(cè)試

以下是1920x1080分辨率下7款CPU的測(cè)試成績(jī)匯總:

在1080P分辨率下,各種檔次的處理器跑出來(lái)的游戲幀數(shù)差別明顯,特別是沒(méi)有超線程功能里處理器嚴(yán)重限制了RTX 2080 Ti的性能。在多款游戲中,R5 1300X與i3-8100與頂級(jí)處理器之間都有超過(guò)50%的差距。

I7-7700K老當(dāng)益壯,游戲性能與默頻的8086K幾乎完全一樣,如果手上還有7700K的同學(xué),想要購(gòu)買RTX 2080級(jí)別的顯卡,可以不用升級(jí)處理器。4核4線程的R3 1300X和I3-8100完全無(wú)法發(fā)揮RTX 2080 Ti的性能。超頻到5.2GHz的8086K比默頻時(shí)提升了6%的幀數(shù)。

3、4K分辨率測(cè)試

以下是3840x1600分辨率下7款CPU的測(cè)試成績(jī)匯總:

4K分辨率最高特效下,壓力都在顯卡這一邊,除了《奇點(diǎn)灰燼》和《文明6》這2款比較吃CPU的游戲之外,其他游戲游戲的測(cè)試中,各款CPU的幀數(shù)差距并沒(méi)有很大。

在4K分辨率下,8086K、7700K、2700X、2600在處于同一檔次,6核6線程的I5-8400與前面幾款產(chǎn)品有6%的差距,R3 1300X和I3-8100這2款處理器落后的幅度沒(méi)有1080P那么明顯,但也有10%以上的差距。

4、內(nèi)存需求測(cè)試:

分別測(cè)試2133MHz單通道、2133MHz雙通道、4000MHz雙通道三種狀態(tài)下,RTX 2080 Ti的游戲幀數(shù),內(nèi)存容量16GB。測(cè)試數(shù)據(jù)如下:

由上表可以看出,2133MHz單通道已經(jīng)完全不能滿足RTX 2080 Ti的需求,比雙通道時(shí)普遍慢了20%左右,特別是在《奇點(diǎn)灰燼》、《古墓麗影10》、《古墓麗影11》和《孤島驚魂5》這幾個(gè)游戲中更是大幅度落后。

在使用4000MHz雙通道內(nèi)存后,相比2133MHz雙通道,還能額外增加8%的游戲性能。

這2年內(nèi)存價(jià)格居高不下,很多同學(xué)在購(gòu)機(jī)時(shí)往往選擇單條8GB內(nèi)存。如果想要發(fā)揮高端顯卡的實(shí)力,雙通道內(nèi)存是基本要求,必要時(shí)可以選擇高頻內(nèi)存條。

十四、超頻測(cè)試:核心幾無(wú)空間 顯存輕松15GHz

從帕斯卡開(kāi)始,NVIDIA的BOOST 3.0技術(shù)就能在TDP允許的范圍內(nèi)最大限度提升核心頻率,基礎(chǔ)頻率僅有1.5GHz的GTX1070實(shí)際游戲中運(yùn)行頻率經(jīng)常能夠超過(guò)2GHz。BOOST 3.O已經(jīng)充分發(fā)揮了顯卡的潛力,導(dǎo)致留給玩家的超頻空間非常之小,一般也就能超過(guò)幾十MHz而已了。

到了圖靈時(shí)代,超頻會(huì)不會(huì)有所好轉(zhuǎn)呢?帶著這個(gè)疑問(wèn),我們對(duì)2張圖靈顯卡的超頻能力做了簡(jiǎn)要嘗試。

首先是RTX 2080,這張顯卡默認(rèn)TDP為225W,我們先將它拉到272W。

然后開(kāi)始嘗試提升核心頻率,悲催的是,經(jīng)過(guò)反復(fù)測(cè)試,在不加電壓的情況下,最高只能將核心頻率增加可憐的65MHz,再加一點(diǎn)點(diǎn)運(yùn)行游戲時(shí)都會(huì)無(wú)響應(yīng)。

不過(guò)好在美光顯存超頻能力不錯(cuò),從14GHz拉到 15GHz都能穩(wěn)定運(yùn)行,此時(shí)顯卡的帶寬達(dá)到了480GB/s,與GTX 1080 Ti持平。

超頻之后3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的10838增加到了11632,增長(zhǎng)了800分,提升幅度7.3%,核心頻率最高能到2070MHz,大多數(shù)時(shí)候維持在2000MHz上下。

同樣的事情也發(fā)生在RTX 2080 Ti身上,其默認(rèn)TDP為260W,我們將它拉到301W。然后在調(diào)整核心頻率的時(shí)候,也只能增加65MHz,顯存頻率則能從14GHz超至15GHz。

超頻之后的RTX 2080 Ti 3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的13661增加到了14763,增長(zhǎng)了1100分,提升幅度8%。

2018-09-19 21:43kkj0+ 關(guān)注

十五、功耗溫度測(cè)試:能耗比提升40%

1、功耗測(cè)試

公版RTX 2080 TDP達(dá)到了225W較GTX 1080的180W增加了45W,而RTX 2080 Ti的TDP則為260W,比GTX 1080 Ti高出10瓦,讓我看看他們世界的表現(xiàn)如何。

分別測(cè)試待機(jī)與Furmark烤機(jī)功耗,測(cè)試所用的電源為酷冷至尊MasterWatt Maker1200W鉑金電源。

圖靈的功耗表現(xiàn)再一次給了我們驚喜,RTX 2080烤機(jī)時(shí)整機(jī)功耗只有305W,僅僅比GTX 1080高出了20W的功耗,卻有著40%的性能提升。與GTX 1080 Ti相比,功耗低了35W,性能則強(qiáng)了15%。

同樣的事情也發(fā)生在RTX 2080 Ti身上,其烤機(jī)功耗僅有330W。相比GTX 1080 Ti增加了768個(gè)流處理器,核心與顯存頻率都有所增加的情況下,功耗依然降低了10W,而性能則是強(qiáng)了40%以上。

對(duì)比AMD最強(qiáng)的VEGA 64,RTX 2080 Ti在性能幾乎翻倍的情況下,TDP只有對(duì)手的70%,能耗比差不多有3倍的差距。

2、溫度測(cè)試

由于參與對(duì)比評(píng)測(cè)的顯卡都已在倉(cāng)庫(kù)存放許久,可能會(huì)出現(xiàn)硅脂干化等情況,因此不對(duì)這些顯卡進(jìn)行溫度測(cè)試,我們?cè)谶@里只測(cè)試2張圖靈顯卡的溫度表現(xiàn)。測(cè)試時(shí)室溫26度、測(cè)試軟件為Furmark。

經(jīng)過(guò)5分鐘的Furmark烤機(jī)測(cè)試,RTX 2080的溫度穩(wěn)定在75度。

同樣是5分鐘的Furmark烤機(jī)測(cè)試,RTX 2080 Ti的溫度則穩(wěn)定在79度。

圖靈的公版顯卡舍棄了原來(lái)的渦輪風(fēng)扇改換成了現(xiàn)在的雙風(fēng)扇散熱系統(tǒng),溫度也好看了很多。RTX 2080烤機(jī)溫度只有75度,比GTX 1080低了8度,RTX 2080 Ti機(jī)溫度為79度,比GTX 1080 Ti低了6度。

十六、DLSS測(cè)試:鋸齒肉眼幾乎不可見(jiàn) 游戲性能毫無(wú)影響

3D游戲畫面在運(yùn)行時(shí),物體邊緣會(huì)產(chǎn)生“狗牙”(鋸齒),分辨率越低,鋸齒越嚴(yán)重,嚴(yán)重影響觀感。由此產(chǎn)生了許許多多的抗鋸齒技術(shù),例如SSAA、SMAA、FXAA、TAA。以上這些技術(shù)要么需要對(duì)額外的像素進(jìn)行渲染,要么需要對(duì)額外的幀進(jìn)行渲染,無(wú)論怎樣都需要消耗GPU資源,使游戲的幀率大大降低。有鑒于此,NVIDIA推出了DLSS(Deep Learning Super Sampling)深度學(xué)習(xí)超級(jí)采樣抗鋸齒技術(shù)。

不用于以往任何抗鋸齒技術(shù),DLSS使用圖靈核心中的Tensor單元來(lái)進(jìn)行運(yùn)算,不需要消耗CUDA單元,因此不會(huì)對(duì)顯卡的性能造成任何損失,不過(guò)卻能得到等同于TAA(時(shí)間抗鋸齒)的畫質(zhì)。

下面我們以最終幻想15 BenchMark程序來(lái)體驗(yàn)DLSS的效果。

1、畫質(zhì)對(duì)比

這是未開(kāi)啟抗鋸齒的畫質(zhì),幀數(shù)很高,達(dá)到了59FPS。但是汽車邊緣的鋸齒感非常明顯,要知道這可是4K分辨率,如果降低到1080P,鋸齒現(xiàn)象會(huì)更加嚴(yán)重。

上圖是開(kāi)啟了TAA抗鋸齒的畫面,汽車邊緣的鋸齒肉眼幾乎不可見(jiàn),但幀率也降低至43FPS。

這是開(kāi)啟了DLSS抗鋸齒的畫面,汽車的鋸齒也基本上幾乎看不到,但是幀率則維持在較高的57FPS,大大優(yōu)于開(kāi)啟TAA時(shí)的表現(xiàn)。。

2、性能測(cè)試

GTX 1080/1080Ti開(kāi)啟DLSS模式直接報(bào)錯(cuò),只能運(yùn)行TAA。

左邊是1080ti,開(kāi)啟TAA模式測(cè)得3001分;右邊是GTX 1080,TAA模式下的分?jǐn)?shù)為2524分。

測(cè)試成績(jī)匯總?cè)缦拢?/p>

在NOAA模式下,RTX 2080 Ti比GTX 1080 Ti強(qiáng)42%,RTX 2080比GTX 1080強(qiáng)了32%。開(kāi)啟TAA后,每張顯卡都要損失25%左右的性能。但是2張圖靈顯卡在開(kāi)啟DLSS后,性能都沒(méi)有下滑,RTX 2080 Ti性能甚至還有提升。

至于圖靈DLSS與帕斯卡TAA性能對(duì)比,RTX 2080 Ti相比GTX 1080 Ti領(lǐng)先幅度增加到了93%,而RTX 2080相比GTX 1080領(lǐng)先幅度也提升到了80%。由此看來(lái)NVIDIA官方宣傳的RTX 2080 DLSS性能相比GTX 1080 TAA提升一倍也有一定的依據(jù)。

十七、光線追蹤測(cè)試:體驗(yàn)真實(shí)世界的光影效果

傳統(tǒng)的光柵化渲染是將一個(gè)3D圖形的幾何信息轉(zhuǎn)變?yōu)橐粋€(gè)個(gè)柵格組成的2D圖像的過(guò)程,可以理解為在這個(gè)3D圖形的每個(gè)點(diǎn)都包含有顏色、深度以及紋理數(shù)據(jù),經(jīng)過(guò)一系列計(jì)算變換后,將其轉(zhuǎn)換為2D圖像的像素,進(jìn)而呈現(xiàn)在顯示設(shè)備上。

這一過(guò)程也就構(gòu)成了我們愛(ài)游戲中所看到的各類陰影效果以及光線投射,在這過(guò)程中所有的光影效果都是提前設(shè)計(jì)好的,如果開(kāi)發(fā)者設(shè)計(jì)時(shí)不那么嚴(yán)謹(jǐn),就會(huì)在不應(yīng)該有陰影的地方出現(xiàn)陰影。同時(shí)即便耗費(fèi)巨大精力去提前設(shè)計(jì)好的所有陰影的可能情況,也只能做到無(wú)限接近于真實(shí),況且這一點(diǎn)本身也很難做到。于是實(shí)時(shí)光線追蹤(ray tracing)便成為了玩家與游戲開(kāi)發(fā)者最終極的選擇與夢(mèng)想。

傳統(tǒng)的光線追蹤技術(shù)是以光源為起點(diǎn)定義光線,進(jìn)而追蹤由此產(chǎn)生的光線與物體表面以及光線與光線之間交互關(guān)系的過(guò)程。但該技術(shù)目前實(shí)現(xiàn)起來(lái)非常困難,因?yàn)檫@一技術(shù)需要無(wú)限多的光線照射在物體表面,通過(guò)反射、折射、漫射等途徑進(jìn)入最終的“攝像機(jī)”成像。這一過(guò)程需要耗費(fèi)大量的算力且會(huì)有大量光線損失。因此光線追蹤技術(shù)自誕生之日起,就有人斷言20年之內(nèi)光線追蹤不可能實(shí)現(xiàn)。

然而天才的NVIDIA工程師們解決了這個(gè)難題。提出了一種新的Ray tracing理念,即是通過(guò)進(jìn)入“攝像機(jī)”的光線,來(lái)回溯尋找光源。大部分從光源發(fā)出被折射或者漫反射不被玩家所看到的光線將不會(huì)被運(yùn)算,這種思路將需要實(shí)時(shí)計(jì)算的光線數(shù)量降低了數(shù)十倍,使得實(shí)時(shí)光線追蹤技術(shù)至少提前十年成為現(xiàn)實(shí)。

下面我們通過(guò)3Dmark Ray Tracing Tech Demo來(lái)體驗(yàn)光線追蹤的奇妙之處。

從上面2張圖可以可以明顯的看到小飛行器飛行時(shí),在飛船上的倒影也是一直在變化方位。小飛機(jī)器自身也在發(fā)光,因此它的倒影的明暗度以及形狀也是隨時(shí)在發(fā)生著變化。

除此之外,大飛船本身也在緩慢滑行,周圍的環(huán)形燈柱投射在飛船上的倒影也是無(wú)時(shí)無(wú)刻都在變化著。

RTX 2080 Ti集成了68個(gè)RT Cores,每秒能處理100億條光線,而GTX 1080 Ti只能靠CUDA來(lái)計(jì)算光線,每秒能處理11億光線。下面我們通過(guò)星球大戰(zhàn)DEMO來(lái)演示光線追蹤的性能,這個(gè)DEMO可以為展現(xiàn)出一個(gè)如果科幻電影般的光影世界。

這是 GTX 1080 Ti的幀率,非??D,僅有3.31FPS

由于星球大戰(zhàn)DEMO鎖定24FPS,RTX 2080與RTX 2080 Ti都只能跑出24幀,即便如此,也達(dá)到了GTX 1080 Ti 7倍以上的性能。

十八、總結(jié):NVIDIA完成自我突破 圖靈徹底無(wú)敵

毫不夸張的說(shuō),圖靈是NVIDIA是十年來(lái)最大的一次構(gòu)架更新,其意義不亞于2006年發(fā)布的世界上第一塊支持DirectX 10 的代號(hào)為G80的GeForce 8800 Ultra顯卡。圖靈的改進(jìn)如此之多,我們此篇評(píng)測(cè)只是測(cè)試了其中一部分特性,之后還會(huì)有一篇補(bǔ)充評(píng)測(cè)。

圖靈第一次將深度學(xué)習(xí)引入了游戲卡中,目前來(lái)說(shuō)最主要的用途就是DLSS(深度學(xué)習(xí)超級(jí)采樣抗鋸齒),他能提供與TAA抗鋸齒技術(shù)幾乎相同的畫質(zhì)(未來(lái)會(huì)在畫質(zhì)上會(huì)超越TAA),但絲毫不會(huì)影響到游戲性能,在我們的測(cè)試中,RTX 2080 DLSS的性能領(lǐng)先GTX 1080 TAA達(dá)到了80%。

而RTX(實(shí)時(shí)光線追蹤)是一項(xiàng)革命性的技術(shù),NVIDIA花了整整10年時(shí)間來(lái)開(kāi)發(fā),才有現(xiàn)在的成果。過(guò)去所有的陰影技術(shù)無(wú)論看上去多么逼真,其實(shí)都是虛假的,實(shí)時(shí)光線追蹤技術(shù)能構(gòu)造出一個(gè)完全真實(shí)的光影世界。RTX 2080 Ti集成了68個(gè)RT核心,RTX-OPS性能十倍于GTX 1080 Ti,在星球大戰(zhàn)DEMO測(cè)試中,后者僅能跑出3FPS的幀率,而RTX 2080/2080 Ti能輕松達(dá)到24FPS。

Turing還在每個(gè)流處理中增加了一個(gè)INT32整數(shù)單元,能將流處理器運(yùn)算效能提升36%,因此在我們的測(cè)試中,2944個(gè)流處理器的RTX 2080在游戲性能上比3584個(gè)流處理器的GTX 1080 Ti還要強(qiáng)了15%以上,而功耗更低。在能耗比這個(gè)指標(biāo)上,圖靈相比帕斯卡至少有30%的提升。

再來(lái)說(shuō)說(shuō)NVIDIA的老對(duì)手AMD。最近幾年AMD的GPU研發(fā)幾近停滯,相比NVIDIA一次又一次的徹底更新內(nèi)核構(gòu)架,AMD則是一個(gè)GCN構(gòu)架從2011年一直用到現(xiàn)在(VEGA構(gòu)架也是GCN之上做了一些修修補(bǔ)補(bǔ))。目前VEGA與圖靈的能耗比差距已經(jīng)達(dá)到了3倍之多,這個(gè)差距之大,可能即將發(fā)布的7nm的VEGA游戲卡都難以彌補(bǔ),然后明年又要面對(duì)NVIDIA 7nm制程工藝的安培,結(jié)局不用想都很明了!

再說(shuō)說(shuō)圖靈的售價(jià),雖說(shuō)他的性能完全對(duì)得起價(jià)格,但是售價(jià)一萬(wàn)元的游戲顯卡已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)的普通玩家的預(yù)算以及預(yù)期。如果AMD不能推出一款類似于圖靈這樣革命性的GPU構(gòu)架,未來(lái)很長(zhǎng)一段時(shí)間,獨(dú)立顯卡都將是NVIDIA一人的獨(dú)角戲。

相關(guān)文章

  • NVIDIA顯卡光線追蹤什么時(shí)候普及

    英偉達(dá)一代RTX20系顯卡帶來(lái)“光線追蹤”全新技術(shù),被稱為是顛覆性的技術(shù)革新,堪稱12年來(lái)GPU的最大飛躍。由于光線追蹤的算法與現(xiàn)實(shí)的真實(shí)世界物理規(guī)則幾乎一致,能夠大幅改
    2018-09-18
  • GTX2060顯卡跑分曝光 性能相比GTX1060高出了30%

    英偉達(dá)最近發(fā)布了全新的RTX20系列顯卡,其中頂級(jí)的2080ti顯卡作為1080ti的升級(jí)版本,價(jià)格也進(jìn)行了升級(jí),并且價(jià)格竟然高于很多非公版。高昂的價(jià)格似乎讓很多消費(fèi)者失望,因
    2018-09-12
  • 最新4款值得買的旗艦級(jí)顯卡介紹 輕松駕馭3A游戲大作

    隨著3A游戲在內(nèi)容和畫質(zhì)上的提升,它們對(duì)于電腦的硬件配置要求也越來(lái)越高,尤其是顯卡部分,沒(méi)有過(guò)硬的實(shí)力,還真是帶不起高清的游戲畫面。所以,如果你也想暢玩3A游戲大作
    2018-09-05
  • RTX2080Ti配什么主板好 RTX2080Ti顯卡配什么CPU好

    隨著RTX2080Ti顯卡正式發(fā)布,備受高端游戲玩家關(guān)注。相比于RTX2080高端顯卡,顯然RTX2080Ti無(wú)疑更發(fā)燒、更強(qiáng)悍。相信大家都已經(jīng)知道了,那就是該顯卡將于本月20日會(huì)上市,
    2018-09-04
  • 顯卡天梯圖2018年9月最新版 秒懂桌面顯卡性能排行

    八月再見(jiàn),九月你好!轉(zhuǎn)眼間又進(jìn)入了忙碌的9月季,對(duì)于大部分朋友來(lái)說(shuō),9月是個(gè)忙碌的日子,在本月對(duì)于DIY市場(chǎng)來(lái)說(shuō),也不會(huì)平淡,本月RTX2080/2080Ti顯卡會(huì)上市,對(duì)于新顯
    2018-09-03
  • Vega56顯卡怎么刷Bios VEGA56顯卡刷Vega64方法

    刷Bios很多人都不會(huì)陌生,一起是主板刷Bios也比較常見(jiàn)。但最近網(wǎng)上有大神玩起了顯卡刷Bios,成功將Vega56顯卡Bios刷成了RX VEGA 64的Bios,顯卡性能提升超過(guò)了10%。那么,V
    2018-08-31
  • GTX 1080Ti顯卡怎么樣 值得買嗎

    相信關(guān)注DIY新聞和資訊的小伙伴都知道了,那就是最近NVIDIA已經(jīng)正式發(fā)布了全新的RTX 20系顯卡,該系列顯卡基于全新的Turing圖靈架構(gòu),采用了光線追蹤技術(shù),可謂在性能方面
    2018-08-29
  • RTX2080和RTX2080Ti哪個(gè)好 RTX2080/RTX2080Ti價(jià)格和參數(shù)對(duì)比

    RTX2080和RTX2080Ti會(huì)在下個(gè)月正式上市,那么RTX2080和RTX2080Ti哪個(gè)好?下面小編帶來(lái)RTX2080/RTX2080Ti價(jià)格和參數(shù)對(duì)比,希望對(duì)大家有所幫助
    2018-08-25
  • RTX2080性能怎么樣 顯卡天梯圖秒懂RTX2080性能排行

    近日NVIDIA正式發(fā)布了全新的RTX20系列顯卡,此次帶來(lái)的新顯卡一共有三款。其中最先上市的是RTX2080,由于這款顯卡將于9月才會(huì)正式上市,當(dāng)然我們通過(guò)參數(shù)規(guī)格和官方公布的
    2018-08-25
  • RTX2080Ti和GTX1080Ti哪個(gè)好 GTX1080Ti與RTX2080Ti詳細(xì)對(duì)比

    RTX2080Ti和GTX1080Ti哪個(gè)好呢?下面小編為大家?guī)?lái)了GTX1080Ti與RTX2080Ti規(guī)格對(duì)比,趕緊看看吧
    2018-08-22

最新評(píng)論