新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 2倍RTX 2080 Ti性能 RTX 3090 1萬多個核心怎么來的?老黃變戲法

2倍RTX 2080 Ti性能 RTX 3090 1萬多個核心怎么來的?老黃變戲法

作者: 時間:2020-09-03 來源:快科技 收藏

NVIDIA的RTX 30系列顯卡今天凌晨發(fā)布了,旗艦顯卡雖然價格漲到了1.2萬元,但是性能比RTX 2080 Ti翻倍,簡直是開掛一樣。

本文引用地址:http://m.butianyuan.cn/article/202009/417873.htm

就跟2018年圖靈GPU發(fā)布時一樣,老黃這次在發(fā)布會上再次強調安培GPU是有史以來性能提升最大的一次,這點上也沒錯,畢竟顯卡性能翻倍是這10年來都少見的。

顯卡是怎樣做到性能翻倍的?除了第二代RT單元、第三代Tensor單元之外,CUDA核心數(shù)也猛增到了10496個,要知道RTX 2080 Ti也不過4352個。

2倍RTX 2080 Ti性能 RTX 3090 1萬多個核心怎么來的?老黃變戲法

CUDA核心數(shù)一下子從4000+翻倍到了10000+,這規(guī)模提升也太恐怖了,NVIDIA到底是怎么做到的?

特別是在發(fā)布之前,連AIC顯卡廠商拿到的數(shù)據(jù)都顯示是5248個CUDA核心而已,怎么就一下子翻倍了?

現(xiàn)在NVIDIA還沒公布安培GPU的架構,具體如何還不好說,不過我們可以分析下幾種可能。

2倍RTX 2080 Ti性能 RTX 3090 1萬多個核心怎么來的?老黃變戲法

上面是7nm安培GA100的架構圖,每組SM單元中有64個INT32單元、64個FP32單元及32個FP64單元。

8nm安培游戲GPU跟A100主要架構應該差不多,但是不需要多少FP64單元,多了RT Core光追單元。

所以第一種FP32單元翻倍的可能就是——A100中的FP64單元被游戲GPU中的FP32取代了,這樣帶來額外一倍的FP32單元。

不過算起來簡單,實際上就不好說了,因為A100是7nm工藝,核心面積依然有826mm,安培游戲GPU才8nm工藝,晶體管密度更低,280億只有A100的540億的一半,核心面積會小很多,還要加上RT Core單元,所以這種可能性非常小。

2倍RTX 2080 Ti性能 RTX 3090 1萬多個核心怎么來的?老黃變戲法

第二種可能在推上有人分析過,那就是游戲GPU不僅砍掉了FP64單元,同時還做到了INT32單元跟FP32一樣的功能——可以同時計算整數(shù)或者浮點,這樣一來64個INT32搖身一變也是FP32單元了,直接數(shù)量翻倍。

這個可能性比較大,也是NVIDIA之前稱CUDA核心數(shù)是5248個,臨到頭改成10496個的合理解釋了。

當然,最后一種可能就是陰謀論了,老黃并沒有做到1萬多個FP32,就是馬甲忽悠——不過真要是這么做,以后會有法律麻煩,老黃不會這么輕易讓人抓到把柄的。

總之,在沒有官方公布的細節(jié)之前,1萬多個CUDA核心的由來比較迷,但不論那種解釋,NVIDIA肯定是技術上可以做到,否認也不會有如此大的性能提升了。



關鍵詞: RTX 3090 3080 3070

評論


相關推薦

技術專區(qū)

關閉