新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > 萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

作者: 時(shí)間:2020-09-26 來(lái)源:快科技 收藏

前言:安培頂級(jí)旗艦降臨 價(jià)格達(dá)1.2萬(wàn)

本文引用地址:http://2s4d.com/article/202009/418814.htm

或許很多同學(xué)對(duì)于這一次RTX 3080/3090在流處理器數(shù)量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX,流處理器數(shù)量?jī)H僅只是從2880個(gè)提升到了4608個(gè)。也就是整整6年的時(shí)間,流處理器數(shù)量?jī)H僅只是增加了60%而已。

而此次完整的GA102核心竟然有10752個(gè)流處理器,相當(dāng)于 Titan RTX的2.33倍,如此巨大的提升的確是很多年沒有出現(xiàn)過(guò)了!

PS:上一次N卡大幅提升流處理器是8年前的GTX 680,1536個(gè)流處理器數(shù)量是GTX 580的三倍,性能則提升了30%!

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

相較上一代圖靈構(gòu)架的RTX 20系列顯卡,安培構(gòu)架主要帶來(lái)的如下改進(jìn):

1、8nm制程工藝:

圖靈構(gòu)架使用的三星12FFN工藝,在754mm2的面積內(nèi)集成了186億只晶體管。安培構(gòu)架使用的是三星8N工藝,在628mm2的芯片內(nèi)部集成了280億只晶體管。算下來(lái)晶體管密度提升了83%之多。

2、整合INT32與FP32單元:

圖靈的INT32單元只能做整數(shù)運(yùn)算,閑置率很高。為了解決這個(gè)問(wèn)題,提升INT32單元的利用率,NVIDIA改進(jìn)了INT32單元,使之不僅可以運(yùn)行整數(shù)運(yùn)算,也能進(jìn)行單精度浮點(diǎn)運(yùn)算,相當(dāng)于整合了INT32和FP32單元,因而使得以FP32單元計(jì)數(shù)的GPU流處理器數(shù)量直接翻倍,單精度浮點(diǎn)性能也同樣翻倍。

3、將ROP單元從內(nèi)存控制器中分離:

傳統(tǒng)的ROP單元被集成在內(nèi)存控制器中,閹割GPU位寬會(huì)降低ROP單元數(shù)量。而安培構(gòu)架將ROP單元變成了GPC的一部分,每個(gè)GPC含有16個(gè)ROP單元,只要GPC數(shù)量不被閹割,ROP單元數(shù)量就不會(huì)減少。

比如即將發(fā)布的RTX 3070與RTX 3080一樣都有6組GPC,ROP單元數(shù)量同樣都是96個(gè)。

4、第二代RT Core:

NVIDIA通過(guò)提升插值算法,提升了光線追蹤技術(shù)在動(dòng)態(tài)模糊效果下的精確度,使得安培構(gòu)架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以達(dá)到20Giga Rays/s。

5、第三代Tensor Core:

第三代Tensor Core的效率是第二代的4倍,即便安培構(gòu)架將每個(gè)SM中的Tensor Core減半,它依然能達(dá)到圖靈2倍的效能。

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

6、RTX IO技術(shù):

這項(xiàng)技術(shù)可以讓游戲在加載時(shí)完全規(guī)避CPU,直接將游戲數(shù)據(jù)包從SSD寫入到GPU的顯存中,由GPU替代CPU進(jìn)行數(shù)據(jù)解包。GPU的整數(shù)/浮點(diǎn)性能數(shù)十倍于CPU,可以瞬間完成數(shù)據(jù)的解包工作。

不過(guò)這項(xiàng)技術(shù)需要微軟DirectStorage API的支持,預(yù)計(jì)2022年會(huì)正式開始應(yīng)用。

除了以上技術(shù)之外,安培構(gòu)架還支持PCIe 4.0、NVIDIA Reflex等技術(shù),就不再一一敘述了。

9月初,NVIDIA一共發(fā)布了3款GA10X核心的顯卡型號(hào),此前已經(jīng)解禁了RTX 3080,今天我們將向大家展示位于頂端的的詳盡性能評(píng)測(cè)。

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

RTX 3090基于GA102-300-A1核心,擁有7組GPC,82組SM單元共計(jì)10496個(gè)流處理器、112個(gè)ROP、328個(gè)紋理單元、328個(gè)第三代Tensor Cores、82個(gè)第二代RT Cores。搭配24GB GDDR6X顯存,顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。

由于此次NVIDIA并未提供公版的 Founder Edition,我們拿規(guī)格與之完全一致的影馳金屬大師來(lái)進(jìn)行測(cè)試。

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超
影馳RTX 3090金屬大師GPU-Z截圖

RTX 3090的詳細(xì)規(guī)格如下:

萬(wàn)元頂級(jí)旗艦降臨!RTX 3090首發(fā)評(píng)測(cè):沒想到這么能超

對(duì)比RTX 3080,RTX 3090的流處理器數(shù)量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右。

TDP也從RTX 3080的320W進(jìn)一步提高到了350W,這恐怖是有史以來(lái)TDP最高的單芯片N卡。




關(guān)鍵詞: RTX 3090

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉