技嘉RTX 3060 Ti GAMING OC PRO 魔鷹詳細(xì)評(píng)測(cè)

如果說(shuō)具體到哪一款顯卡值得等等黨的選購(gòu),那大概就是RTX 3060Ti顯卡莫屬了,在性能方面要小幅度領(lǐng)先上一代RTX 2080 SUPER顯卡,但是卻支持眾多的“黑科技軟件應(yīng)用”,并且在價(jià)格上更是讓人大快人心,感興趣的朋友不要錯(cuò)過(guò)了。
今天筆者將給大家?guī)?lái)一款出自技嘉之手的RTX 3060 Ti GAMING OC PRO 魔鷹,按照慣例,在評(píng)測(cè)之前,我們先來(lái)了解一下這款顯卡的特點(diǎn)。
性能表現(xiàn)出眾,性能略強(qiáng)于RTX 2080 SUPER,并且價(jià)格更低,真正的新一代“甜品卡”。
注重散熱細(xì)節(jié),正逆轉(zhuǎn)氣流導(dǎo)向設(shè)計(jì)。風(fēng)扇正逆轉(zhuǎn)設(shè)計(jì)形成氣流漩渦,能夠快速帶走熱量。實(shí)測(cè)壓力測(cè)試中顯卡在平臺(tái)上最高僅為64°且噪音極低,表現(xiàn)出眾。
光線追蹤、DLSS等功能加持,游戲畫面更加真實(shí)暢爽。
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡采用了NVIDIA Ampere架構(gòu),相較于上一代的NVIDIA Turing架構(gòu)有什么不同呢?
第一代RTX架構(gòu) Turing下的RTX 2060 SUPER
第二代RTX架構(gòu) Ampere下的RTX 3060 Ti
相較于初代的Turing RTX架構(gòu),NVIDIA Ampere架構(gòu)在算力上有著成倍的增長(zhǎng),這一點(diǎn)在RTX 3060 Ti中依舊有體現(xiàn),每個(gè)時(shí)鐘執(zhí)行2次著色器運(yùn)算,而Turing為1次,RTX 3060 Ti的著色器性能達(dá)到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIA Ampere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到31.6 RT TFLOPS,而Turing為21.7 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對(duì)游戲中運(yùn)動(dòng)模糊部分場(chǎng)景的光線追蹤計(jì)算加速。
例如最新發(fā)布的《賽博朋克2077》中,當(dāng)玩家在游戲中遭遇賽車,追逐,打斗等激烈運(yùn)動(dòng)場(chǎng)景,第二代光追在架構(gòu)上可以確保顯卡渲染幀率相對(duì)更平穩(wěn),游戲體驗(yàn)上不會(huì)有頻繁掉幀帶來(lái)的頓挫感。
《賽博朋克2077》
全新的Tensor Core可自動(dòng)識(shí)別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達(dá)129.6 Tensor TFLOPS,而Turing為57.4 Tensor TFLOPS。
芯片雖然決定了顯卡的性能和規(guī)格,但是顯卡工作的整體穩(wěn)定性,溫度表現(xiàn),噪音等級(jí)卻更依賴顯卡制造商在PCB布線,電子元器件的適配,散熱系統(tǒng)調(diào)校等綜合能力。
01 技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡產(chǎn)品概述
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡整體采用黑色的設(shè)計(jì),表面采用磨砂工藝,在提供出色的手感之外還能防止留下指紋痕跡。
在背部,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的背部設(shè)計(jì)金屬感十足,具有十分不錯(cuò)觀賞性。同時(shí),我們能夠看到,散熱鰭片一直延伸到PCB板之外能夠進(jìn)一步強(qiáng)化散熱效率。
在散熱方面則為是重點(diǎn),技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡采用的是技嘉風(fēng)之力散熱系統(tǒng),正面搭載了三個(gè)80mm的刀刃式風(fēng)扇,并采用了特殊的刀刃式設(shè)計(jì),透過(guò)扇葉的邊緣三角立體造型以及扇葉葉面的導(dǎo)流溝槽,能夠提供更強(qiáng)的進(jìn)風(fēng)量。并且還支持正逆轉(zhuǎn)功能以及風(fēng)扇智能啟停功能。
正逆轉(zhuǎn)功能
在內(nèi)部,搭載了5根高性能復(fù)核導(dǎo)熱管,可以直接與GPU相接觸,最大效率的進(jìn)行散熱。整套散熱系統(tǒng)搭配起相得益彰,關(guān)于溫度方面的測(cè)試,將會(huì)在下文體現(xiàn)。
在接口方面,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡搭載了2個(gè)HDMI 2.1接口,還有2個(gè) DP 1.4a接口。新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
在供電方面,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡采用的是單6Pin+單8Pin的設(shè)計(jì)。同時(shí)在顯卡的上方搭載了一個(gè)RGB LOGO燈。
關(guān)于顯卡的外觀,相信大家已經(jīng)有所了解,接下來(lái)帶大家了解一下NVIDIA Ampere架構(gòu)。
02 NVIDIA Ampere架構(gòu)下RTX 3060 Ti
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡采用了NVIDIA Ampere架構(gòu),我們首先來(lái)看一下RTX 3060 Ti的提升。
第一代RTX架構(gòu) Turing下的RTX 2060 SUPER
第二代RTX架構(gòu) Ampere下的RTX 3060 Ti
相較于初代的Turing RTX架構(gòu),NVIDIA Ampere架構(gòu)在算力上有著成倍的增長(zhǎng),這一點(diǎn)在RTX 3060 Ti中依舊有體現(xiàn),每個(gè)時(shí)鐘執(zhí)行2次著色器運(yùn)算,而Turing為1次,RTX 3060 Ti的著色器性能達(dá)到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIA Ampere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到31.6 RT TFLOPS,而Turing為21.7 RT TFLOPS。
全新的Tensor Core可自動(dòng)識(shí)別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達(dá)129.6 Tensor TFLOPS,而Turing為57.4 Tensor TFLOPS。
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡采用GA104核心擁有174億個(gè)晶體管,392平方毫米的面積,基于三星的8nm NVIDIA定制工藝,另外在RTX 3060 Ti中我們都知道仍然采用了GDDR6顯存,不過(guò)不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6顯存。
我們?cè)诎l(fā)布會(huì)中經(jīng)常聽到性能翻倍的說(shuō)法,其實(shí)是因?yàn)楸敬蜰VIDIA Ampere的SM在Turing基礎(chǔ)上增加了一倍的FP32運(yùn)算單元,這就使得每個(gè)SM的FP32運(yùn)算單元數(shù)量提高了一倍,同時(shí)吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計(jì)算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來(lái)計(jì)數(shù),而是只統(tǒng)計(jì)FP32單元的數(shù)量,所以這樣一來(lái),SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
RTX 3060 Ti共有4864個(gè)CUDA,其實(shí)它有2432個(gè)INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實(shí)現(xiàn)了4864這個(gè)驚人的數(shù)字。
而這樣粗暴的提升CUDA數(shù)量對(duì)于游戲其實(shí)有著非常大的幫助,通常在游戲中浮點(diǎn)運(yùn)算相比整數(shù)計(jì)算要常用的多,圖形、算法以及各種計(jì)算操作中著色器工作負(fù)載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIA Ampere架構(gòu)中,NVIDIA官方宣布為第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,著色器發(fā)出光線追蹤的請(qǐng)求,交給RT Core來(lái)處理,它將進(jìn)行兩種測(cè)試,分別為邊界交叉測(cè)試(Box Intersection testing)和三角形交叉測(cè)試(Triangle Intersection testing)。基于BVH算法來(lái)判斷,如果是方形,那么就返回縮小范圍繼續(xù)測(cè)試,如果是三角形,則反饋結(jié)果進(jìn)行渲染。
而光線追蹤最耗時(shí)的正是求交計(jì)算,因此,要提升光線追蹤性能,主要是對(duì)兩種求交(BVH/三角形求交)進(jìn)行加速。
RT Core的變化
在Turing的RT Core中,可以每個(gè)周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個(gè)新的三角形位置插值模塊以及一個(gè)的額外的三角形求交模塊,這樣做的目的是為了提升諸如運(yùn)動(dòng)模糊特效時(shí)候的光線追蹤性能。
運(yùn)動(dòng)模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時(shí)進(jìn)行,進(jìn)行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動(dòng)態(tài)模糊的影像時(shí),按照NVIDIA自己的實(shí)測(cè),比Turing快8倍。
稀疏深度學(xué)習(xí)
Tensor Core可以看作是GeForce RTX GPU上的AI大腦??杉铀儆糜谏疃壬窠?jīng)網(wǎng)絡(luò)處理功能的線性代數(shù),這是現(xiàn)代AI的基礎(chǔ)。例如用于AI超分辨率的NVIDIA DLSS和用于AI增強(qiáng)的聲畫處理技術(shù)NVIDIA Broadcast應(yīng)用。
在本次的NVIDIA Ampere架構(gòu)的Tensor Core也得到了極大地加強(qiáng),在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動(dòng)識(shí)別并消除不太重要的DNN(深度神經(jīng)網(wǎng)絡(luò))權(quán)重,同時(shí)依然能保持不錯(cuò)的精度。
首先原始的密集矩陣會(huì)經(jīng)過(guò)訓(xùn)練,刪除掉稀疏矩陣,再經(jīng)過(guò)訓(xùn)練稀疏矩陣,從而實(shí)現(xiàn)稀疏優(yōu)化,進(jìn)而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發(fā)布的還有一項(xiàng)新技術(shù)——RTX IO。目前很多游戲動(dòng)輒幾十G甚至百G的安裝空間,對(duì)于存儲(chǔ)空間的負(fù)擔(dān)暫且不提,但存放在硬盤中的數(shù)據(jù),如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過(guò)的數(shù)據(jù),經(jīng)過(guò)解壓縮再發(fā)送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機(jī)械硬盤能夠快20倍,但受制于傳統(tǒng)I/O限制,NVMe高達(dá)7GB/秒的高速讀寫對(duì)于CPU是極大的負(fù)擔(dān)。
傳統(tǒng)的數(shù)據(jù)交換
在這個(gè)過(guò)程中,會(huì)占用多個(gè)CPU核心,壓力急劇增大,占用較多的內(nèi)存,而此時(shí)其實(shí)GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過(guò)CPU解壓再傳輸數(shù)據(jù)這一步,直接從PCIE總線讀取硬盤上經(jīng)過(guò)壓縮的數(shù)據(jù),并且完成無(wú)損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負(fù)擔(dān)
當(dāng)然這項(xiàng)技術(shù)作為系統(tǒng)底層的運(yùn)行方式改變,還需要借助微軟發(fā)布的DirectStorage來(lái)實(shí)現(xiàn),對(duì)于目前容量的游戲來(lái)說(shuō),RTX IO的改善效果有限,但假以時(shí)日等游戲容量上百G成為常態(tài)的時(shí)候,這項(xiàng)技術(shù)將會(huì)發(fā)揮巨大的功效。
03 測(cè)試平臺(tái)簡(jiǎn)介
首先介紹一下測(cè)試平臺(tái),為了保證此次評(píng)測(cè)能夠發(fā)揮技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級(jí)配置,具體如下。
配置信息
在測(cè)試成績(jī)上,基準(zhǔn)測(cè)試采用3D MARK,游戲性能測(cè)試使用游戲自帶Benchmark取游戲平均幀數(shù)。
GPU-Z
首先看一下GPU-Z的參數(shù),軟件更新到2.36已經(jīng)可以正確顯示核心并修復(fù)了紋理單元識(shí)別錯(cuò)誤的情況。RTX 3060 Ti采用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有4864個(gè)CUDA,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的頻率為1410-1770MHz。頻率相較于公版要更高一些,顯卡采用8GB GDDR6顯存,位寬為256bit,顯存帶寬達(dá)到了448GB/s,光柵單元和紋理單元為80和152。
相關(guān)文章
索泰RTX 3060 Ti X-GAMING OC怎么樣 索泰RTX 3060 Ti X-GAMING OC評(píng)測(cè)
30系顯卡有著非??植赖男阅茱w躍,即使是RTX 3060 Ti這種甜品級(jí)顯卡的性能都在RTX 2080 SUPER,也就是上一代的準(zhǔn)旗艦之上。今天為大家?guī)?lái)的是索泰RTX 3060 Ti X-GAMING OC2020-12-17影馳RTX 3060Ti金屬大師OC怎么樣 影馳RTX 3060Ti金屬大師OC詳細(xì)評(píng)測(cè)
這次,筆者就對(duì)影馳的一款RTX 3060Ti 金屬大師 OC顯卡進(jìn)行評(píng)測(cè),讓大家通過(guò)這款性能出色外觀好看的非公版顯卡,更加直觀的對(duì)RTX 3060Ti顯卡增加了解,一起看看吧2020-12-14影馳RTX3060Ti金屬大師OC顯卡拆解與性能評(píng)測(cè)
影馳RTX3060Ti金屬大師OC顯卡怎么樣?值得入手嗎?下文中為大家?guī)?lái)了影馳RTX3060Ti金屬大師OC顯卡拆解與性能評(píng)測(cè)。感興趣的朋友不妨閱讀下文內(nèi)容,參考一下吧2020-12-08NVIDIA RTX 3060 Ti顯卡怎么樣 NVIDIA RTX 3060 Ti詳細(xì)評(píng)測(cè)
全新的RTX 30系顯卡截至目前已經(jīng)解禁了RTX 3070/3080/3090三款顯卡,今天要給大家?guī)?lái)的則是NVIDIA GeForce RTX 3060 Ti的評(píng)測(cè),一起看看吧2020-12-02影馳RTX 3090 GAMER OC顯卡怎么樣 影馳RTX 3090 GAMER OC顯卡評(píng)測(cè)
今天筆者將給大家?guī)?lái)一款出自影馳之手的GeForce RTX 3090 GAMER OC顯卡評(píng)測(cè),這款顯卡在外觀設(shè)計(jì)上可以用穿越經(jīng)典來(lái)形容,與我們傳統(tǒng)所認(rèn)知的顯卡設(shè)計(jì)與眾不同,影馳開發(fā)2020-11-28AMD RX 6800顯卡拆解高清大圖 四大亮點(diǎn)曝光
昨晚,RX 6800、RX 6800 XT首發(fā)開售,售價(jià)分別為4599元、5099元,那么這款顯卡的內(nèi)部構(gòu)造如何?有哪些亮點(diǎn)?下面我們就來(lái)看看AMDRX6800拆解圖,需要的朋友可以參考下2020-11-19AMD RX 6800/6800 XT顯卡怎么樣 AMD RX 6800/6800 XT詳細(xì)評(píng)測(cè)
AMD舉行線上發(fā)布會(huì),發(fā)布了RX 6800/6800 XT/6900 XT 共3款顯卡。本次性能解禁的為RX 6800和RX 6800 XT兩款顯卡,兩款產(chǎn)品的公版售價(jià)分別為4599元和5099元,一起看看吧2020-11-19索泰RTX3070 X-GAMING OC值得入手嗎 索泰RTX3070 X-GAMING OC顯卡評(píng)測(cè)
索泰RTX3070 X-GAMING OC怎么樣?性能如何?好不好用?值得買嗎?下面小編帶來(lái)索泰RTX3070 X-GAMING OC顯卡評(píng)測(cè)2020-11-18華碩ROG STRIX RTX3070怎么樣 華碩ROG STRIX RTX3070顯卡評(píng)測(cè)
華碩ROG STRIX RTX3070怎么樣?性能如何?值得入手嗎?下面小編帶來(lái)華碩ROG STRIX RTX3070顯卡評(píng)測(cè)2020-11-17索泰RTX 3070 X-GAMING OC怎么樣 索泰RTX 3070 X-GAMING OC詳細(xì)評(píng)測(cè)
旗艦RTX 3080真香,因?yàn)樗醴兜男阅芴嵘?,中端RTX 3070真香,因?yàn)樗鼧O具標(biāo)志性的性價(jià)比。今天我們?yōu)榇蠹規(guī)?lái)的評(píng)測(cè)為索泰GeForce RTX 3070 X-GAMING OC顯卡,一起看看2020-11-09