第二代光追究竟有哪些提升？來看詳解

作者：時間：2020-10-21 來源：中關(guān)村在線

當玩家之間還在探討20系顯卡的光線追蹤是否實用的時候，搭載第二代光線追蹤的30系顯卡來了。

第二代光線追蹤技術(shù)在NVIDIA的宣傳中相比上一代都做了哪些改進，今天筆者給大家通俗易懂的進行簡單介紹。

其實，光線追蹤（Ray Tracing）的概念在很早就已經(jīng)被人所提出了。

光線追蹤技術(shù)其實就是將光源產(chǎn)生的光線所產(chǎn)生的折射，反射等光線變化和對陰影產(chǎn)生的反應通過計算準確的反映到畫面之中，為人們帶來百分之百的光影效果。

光線追蹤這一技術(shù)對于我們其實不難理解，畢竟在生活中隨處可見，但應用到圖形領(lǐng)域則其算法于1979年由Turner Whitted提出。

那么為什么直到2006年，皮克斯的《Cars》才開始使用這項技術(shù)用于光線渲染呢？

那就是因為其所需要的計算量實在是過于龐大，上面提到的Turner這張512x512的渲染DEMO當時支持的計算機就要耗費上百萬美元，還是花費1.2小時才渲染完成，足見其耗費的資源是如何巨大。

相較于初代的Turing RTX架構(gòu)，NVIDIA Ampere架構(gòu)在算力上有著成倍的增長，同時新的架構(gòu)翻倍了光線與三角形的相交吞吐量，RT Core達到58 RT TFLOPS，而Turing為34 RT TFLOPS。

怎么理解上面這句話，首先要知道RT Core的工作原理是，著色器發(fā)出光線追蹤的請求，交給RT Core來處理。

它將進行兩種測試，分別為邊界交叉測試（Box Intersection testing）和三角形交叉測試（Triangle Intersection testing）。

基于BVH算法來判斷，如果是方形，那么就返回縮小范圍繼續(xù)測試，如果是三角形，則反饋結(jié)果進行渲染。

而光線追蹤最耗時的正是求交計算，因此，要提升光線追蹤性能，主要是對兩種求交（BVH/三角形求交）進行加速。

在Turing的RT Core中，可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交，在第二代RT Core 里，NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊，這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。

再簡單一點，我們用示意圖來解釋光追，左邊是基本的光線追蹤流程，只需要考慮光線的方向，在得出需要追蹤的邊界體積后，再計算三角形的相交面，最后輸出結(jié)果。

如果要對運動模糊的過程進行完整渲染，第一代RT Core則需要計算多個圖形，最終再進行完整輸出。

而第二代RT Core可以讓光線追蹤與著色同時進行，進行的光線追蹤越多，加速就越快，它將光線相交的處理性能提升了一倍，在渲染有動態(tài)模糊的影像時，按照NVIDIA自己的實測，比Turing快8倍。

所以在更為復雜的光線追蹤環(huán)境下，基于NVIDIA Ampere架構(gòu)的第二代RT Core相較上一代有著質(zhì)的飛躍，當然只有光追核心的加強并不能帶來多少實際變化。

全新的NVIDIA Ampere GPU核心擁有280億個晶體管，628平方毫米的面積，基于三星的8nm NVIDIA定制工藝，來自美光的最新一代GDDR6X顯存。

除了硬件上的更新，在參數(shù)上，GeForce RTX 3080擁有8704個CUDA，相比上一代旗艦同樣有了翻倍的提升，頻率為1440-1710MHz，采用10GB GDDR6X顯存，位寬為320bit，顯存帶寬達到了760.3GB/s，光柵單元和紋理單元分別為96和272。

種種翻倍式的提升，共同構(gòu)成了有史以來性能最強大的GPU——NVIDIA Ampere。

而目前30系顯卡全球斷貨也從側(cè)面說明了它的搶手，雖然供貨量不足是一方面，不過也只有當產(chǎn)品足夠好的時候，才會有人關(guān)心它的供貨量，不然誰會管呢？

新聞中心