顯卡技術(shù)革命:英偉達(dá)如何用AI撐起未來游戲?作者 | ZeR0
編輯 | 漠影
本周三,游戲顯卡的“新天花板”——GeForce RTX 40系列GPU——就要正式上市了。自9月中旬正式發(fā)布后,英偉達(dá)RTX 40系列GPU帶來的性能提升一直備受關(guān)注。隨著近段時(shí)間相應(yīng)測(cè)評(píng)成績陸續(xù)出爐,相信這個(gè)被稱作“游戲玩家和創(chuàng)作者終極平臺(tái)”的全新顯卡系列,在性能提升上給很多玩家留下了深刻印象。刨去圍繞價(jià)格和功耗的爭議,如今RTX 4090已成當(dāng)之無愧的新晉“卡皇”,論空前的算力、論堆滿的前沿技術(shù),都做到了全面壓制同行競品:現(xiàn)代游戲性能相較上一代RTX 3090 Ti提升最高達(dá)2倍,光線追蹤游戲性能的提升最高達(dá)4倍。就連次旗艦RTX 4080,也實(shí)現(xiàn)了比上一代旗艦顯卡RTX 3090 Ti更高的性能。用英偉達(dá)創(chuàng)始人兼CEO黃仁勛的話說,以前要花2000美元買到的性能,現(xiàn)在只用900美元就能買到。有趣的是,這次RTX 40系列GPU實(shí)現(xiàn)性能、性價(jià)比飆漲的核心功臣,是英偉達(dá)近年來引以為傲的人工智能(AI)技術(shù)。以往,AI更多是英偉達(dá)數(shù)據(jù)中心產(chǎn)品線的主角,為何在主攻游戲的消費(fèi)級(jí)領(lǐng)域也開始凸顯AI的作用?在這背后,英偉達(dá)的雄心宏圖,已經(jīng)透過游戲,布向更廣闊的潛在AI應(yīng)用未來。
01.幀率更高,AI補(bǔ)幀成“殺招”
說起RTX 40系列最惹人注目的技術(shù)上新,AI工具DLSS 3當(dāng)仁不讓。AI在游戲領(lǐng)域的應(yīng)用并不少見,從DeepMind研發(fā)的AlphaGo擊敗世界圍棋冠軍開始,AI陸續(xù)制霸國際象棋、日本將棋、星際爭霸、Dota 2、王者榮耀等棋牌及即時(shí)戰(zhàn)略游戲。在游戲開發(fā)領(lǐng)域,AI也逐漸承擔(dān)起寫臺(tái)詞劇本、配音、翻譯到生成實(shí)時(shí)3D面部動(dòng)畫等更具創(chuàng)造力的任務(wù)。對(duì)于頂級(jí)游戲大作而言,劇情、系統(tǒng)、關(guān)卡設(shè)計(jì)和視覺效果缺一不可。人們總在追求更高清的畫質(zhì)、更絲滑的流暢度、更炫酷的特效、更仿真的場(chǎng)景……這些都是英偉達(dá)一直大力投入研發(fā)的方向,通過引入AI,優(yōu)化PC游戲的各種體驗(yàn)。其中極具開創(chuàng)性的DLSS 3(深度學(xué)習(xí)超級(jí)采樣)技術(shù),正是拉開RTX 40系列與上一代性能差距的重要“殺器”。上一代DLSS技術(shù)能夠做到從糊圖"腦補(bǔ)"出清晰圖,即讓AI通過分析低分辨率的當(dāng)前幀和高分辨率的上一幀,預(yù)測(cè)出更高分辨率的當(dāng)前幀大概是什么樣子,然后生成高分辨率圖像,實(shí)現(xiàn)畫質(zhì)提升。畫質(zhì)提升了,但幀率還是個(gè)棘手問題。
如果幀率提不上去,那就相當(dāng)于裸眼看3D畫面PPT切換,視效再震撼,也會(huì)卡頓到令人失去耐心。英偉達(dá)新推出的DLSS 3技術(shù),便是為了“補(bǔ)幀”而生。DLSS 3直接做到“無中生有”,通過增加開創(chuàng)性的光學(xué)多幀生成技術(shù),讓AI實(shí)時(shí)“腦補(bǔ)”出全新的完整高質(zhì)量畫面,實(shí)現(xiàn)幀率翻倍。英偉達(dá)測(cè)試顯示,在《賽博朋克:2077》這款經(jīng)典的現(xiàn)代光線追蹤游戲的overdrive模式、4K分辨率下,開啟光線追蹤時(shí),如果同時(shí)開啟DLSS 3可使幀率達(dá)到100FPS。
由于DLSS生成幀在GPU上作為后處理執(zhí)行,即便游戲受CPU性能限制,比如《微軟飛行模擬》等物理計(jì)算密集型或大型場(chǎng)景游戲,DLSS 3也能讓RTX 40系列GPU實(shí)現(xiàn)高達(dá)2倍于CPU可計(jì)算的性能來渲染游戲。
借助這個(gè)技術(shù),英偉達(dá)RTX 40系顯卡能夠撐起大型游戲的渲染需求,讓玩家們一邊享受到圖像質(zhì)量改善帶來的震撼視效,一邊因幀數(shù)暴漲而玩得流暢度飛起,玩得更過癮。DLSS 3的“補(bǔ)幀”原理并不復(fù)雜,但若具體拆解其所涉及的一系列技術(shù),就不難理解為什么率先做出這樣開創(chuàng)性的研發(fā)成果,還得看英偉達(dá)了。
02.摩爾定律"續(xù)航"不夠,還得AI來接班
應(yīng)對(duì)摩爾定律放緩,英偉達(dá)近年的核心思路可以概括為一個(gè)詞:全棧。按照黃仁勛的說法,摩爾定律每一年半以一半成本提供相同性能的時(shí)代已經(jīng)結(jié)束,晶體管密度增長帶動(dòng)的算力性價(jià)比提升速度早已不及當(dāng)年,工藝是在持續(xù)進(jìn)步,但成本也上漲得多。▲英偉達(dá)創(chuàng)始人兼CEO黃仁勛
以RTX GPU為例,從RTX 30系列到RTX 40系列,芯片制程工藝從三星8N工藝升級(jí)到更先進(jìn)的臺(tái)積電4N工藝,但據(jù)黃仁勛透露,這一升級(jí)只帶給RTX 40系列約15%的性能提升,其余的性能提升來自像DLSS 3、Tensor Core、著色器執(zhí)行重排序(SER)這樣的研發(fā)創(chuàng)新。實(shí)現(xiàn)這些技術(shù)組合的關(guān)鍵杠桿,便是AI。DLSS 3包括3個(gè)組件:深度學(xué)習(xí)超級(jí)分辨率(也就是之前的DLSS 2)、深度學(xué)習(xí)幀生成(就是DLSS 3中新加入的插幀)和降低PC延遲的Reflex。其中,英偉達(dá)新一代Ada架構(gòu)內(nèi)置的光流加速器是支持實(shí)現(xiàn)DLSS 3的硬件核心之一,它能分析兩幀連續(xù)的游戲圖像,并為神經(jīng)網(wǎng)絡(luò)提供像素級(jí)幀到幀中物體和元素的運(yùn)動(dòng)方向和速度信息,知道在物體移動(dòng)時(shí)應(yīng)該如何正確地渲染光照和陰影。另一個(gè)關(guān)鍵的架構(gòu)創(chuàng)新,是Ada架構(gòu)中擅長做矩陣運(yùn)算的Tensor Core,它為加速AI計(jì)算提供了硬件基礎(chǔ)。英偉達(dá)稱RTX 40系顯卡中升級(jí)的第四代Tensor Core,新增了Hopper FP8 Transformer Engine,F(xiàn)P8處理性能高達(dá)1.4Petaflops,超過上一代顯卡的5倍。DLSS超級(jí)分辨率技術(shù)用AI構(gòu)建分辨率更高的圖像幀。綜合游戲中的一對(duì)超分圖像幀、運(yùn)動(dòng)矢量、光流場(chǎng)信息后,將所有信息輸入到英偉達(dá)已經(jīng)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)AI幀生成器,經(jīng)計(jì)算分析,AI幀生成器便可準(zhǔn)確重建幾何圖形和效果,高效渲染生成出全新的高質(zhì)量游戲幀。將DLSS生成的全新幀與DLSS超級(jí)分辨率幀相結(jié)合,就能用AI計(jì)算重建連續(xù)兩幀中高達(dá)7/8的像素,生成全新的高分辨率幀,然后將其插入到正常的游戲畫面之間。與沒有DLSS相比,DLSS 3能將游戲性能提升4倍。考慮到插幀會(huì)帶來額外的延遲,英偉達(dá)還引入了Reflex低延遲技術(shù),通過讓GPU和CPU同步,消除GPU渲染隊(duì)列中的無用幀,來確保最佳響應(yīng)速度。雖說多幀生成技術(shù)靠“腦補(bǔ)”,并非傳統(tǒng)渲染那樣從建模貼圖到光照信息進(jìn)行一系列的暴力計(jì)算,但因?yàn)橛蠥I這一大殺器,插幀的效果足以亂真。最終,影響游戲體驗(yàn)的三要素:流暢度、響應(yīng)速度、畫質(zhì),全部得到保證。《逆水寒》《黑神話:悟空》《賽博朋克2077》等超過35款游戲已經(jīng)宣布即將支持DLSS 3,可以由RTX 40系列顯卡上的特定硬件加速提供支持,實(shí)現(xiàn)更絲滑的補(bǔ)幀效果。回想最初DLSS推出時(shí),游戲和應(yīng)用開發(fā)商的集成速度并不快。為了推進(jìn)DLSS 3的迅速普及,英偉達(dá)還在4月推出了Streamline開源開發(fā)插件,使開發(fā)者可以很容易地以模塊化的方式在游戲中添加各種新技術(shù),顯著降低了新技術(shù)集成的難度。應(yīng)用的門檻降低了,就會(huì)有越來越多的游戲開發(fā)商選擇迅速擁抱新技術(shù)。可以看到,AI技術(shù)已經(jīng)跟英偉達(dá)的另一個(gè)“金字招牌”——硬件加速的實(shí)時(shí)光線追蹤——形成互補(bǔ),進(jìn)一步拉大英偉達(dá)旗艦級(jí)顯卡在領(lǐng)先性能上與其他顯卡之間的差距。
03.AI超級(jí)采樣+實(shí)時(shí)光追,敲開渲染創(chuàng)新之門
2018年,英偉達(dá)RTX系列的問世,正式開啟了實(shí)時(shí)光線追蹤時(shí)代。光線追蹤是一種圖形渲染技術(shù),會(huì)模擬計(jì)算環(huán)境中各種光源發(fā)出的光線經(jīng)過反射、折射、陰影和間接照明,最終進(jìn)入人眼時(shí)所呈現(xiàn)的光影效果,具有比傳統(tǒng)光柵化更高、更準(zhǔn)確的視覺保真度,但也擁有更高的計(jì)算開銷,很吃硬件配置。四年過去,像賽博朋克之類的現(xiàn)代游戲?qū)γ總€(gè)像素執(zhí)行超過600次光線追蹤計(jì)算來確定光照,所需計(jì)算量提升高達(dá)16倍,但GPU中負(fù)責(zé)此類計(jì)算的晶體管數(shù)量的提升已經(jīng)跟不上這一速度。正是通過前文所述的,借助AI計(jì)算一部分像素、預(yù)測(cè)大部分像素的策略,英偉達(dá)才做到4年內(nèi)不斷將性能提升以滿足這一計(jì)算需求增長。截至現(xiàn)在,近三年發(fā)布的光線追蹤游戲已有280余款。雖然如今新推出的各主流顯卡紛紛宣布支持光線追蹤,但絕大多數(shù)游戲依然是混合渲染的模式,光追僅僅用來表現(xiàn)某些場(chǎng)景的光線特效,整體效果依然有非常大的提升空間。既然游戲中并不是完全的光線追蹤,那么英偉達(dá)為何還要進(jìn)行如此超前的技術(shù)布局呢?正如黃仁勛所言,Ada架構(gòu)引入的實(shí)時(shí)光線追蹤、AI超級(jí)采樣等前沿技術(shù)創(chuàng)新,都是在為完全基于仿真的未來游戲鋪路。回顧歷史,這其實(shí)是英偉達(dá)一貫的行事風(fēng)格——如果需求尚不存在,那就去創(chuàng)造需求。當(dāng)英偉達(dá)發(fā)明可著色編程GPU時(shí),GPU應(yīng)用市場(chǎng)還相當(dāng)沉寂;當(dāng)英偉達(dá)創(chuàng)建世界上第一個(gè)3D電子游戲平臺(tái)時(shí),電子游戲市場(chǎng)很小;當(dāng)英偉達(dá)提出一種新的計(jì)算方法“加速計(jì)算”,并為研發(fā)通用計(jì)算GPU和統(tǒng)一編程軟件CUDA而砸下重金時(shí),鮮少有人相信它描繪的藍(lán)圖……結(jié)果,歷史一次又一次地驗(yàn)證了黃仁勛對(duì)未來市場(chǎng)趨勢(shì)的準(zhǔn)確判斷和洞察。從游戲顯卡到AI計(jì)算平臺(tái)、元宇宙平臺(tái),英偉達(dá)一再“破圈”,通過軟硬件結(jié)合的全棧創(chuàng)新,不斷挖掘新的業(yè)務(wù)增長點(diǎn),為其更長期的市場(chǎng)空間開疆辟土。類似的,在優(yōu)化實(shí)時(shí)光線追蹤體驗(yàn)上,英偉達(dá)也在為長遠(yuǎn)地培養(yǎng)生態(tài)優(yōu)勢(shì)謀篇。根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)的數(shù)據(jù),英偉達(dá)在獨(dú)立GPU市場(chǎng)的出貨量占率高達(dá)8成,這使得其游戲GPU的優(yōu)勢(shì)滾雪球般形成正向循環(huán)——其光線追蹤游戲的用戶越多,給出的反饋就越多,對(duì)此類游戲的優(yōu)化就會(huì)更友好,而游戲優(yōu)化體驗(yàn)越好、適用性越廣、兼容和穩(wěn)定性更強(qiáng),用戶黏性就會(huì)越高。等游戲玩家們習(xí)慣了“AI超級(jí)采樣+實(shí)時(shí)光追”帶來的更有層次感的光影變化和絲滑的高幀率體驗(yàn),回過頭就很難再接受傳統(tǒng)渲染方式做出的生硬視覺效果了。屆時(shí)實(shí)時(shí)光追技術(shù)在游戲領(lǐng)域的地位將從“聊勝于無”轉(zhuǎn)向“大殺四方”,英偉達(dá)在高端游戲顯卡市場(chǎng)的話語權(quán)也將更加穩(wěn)固。正因如此,黃仁勛才對(duì)RTX 40系列有相當(dāng)高的信心,稱這意味著“實(shí)時(shí)光線追蹤和利用AI生成像素的神經(jīng)網(wǎng)絡(luò)渲染的新時(shí)代已然來臨”。英偉達(dá)也在著力降低開發(fā)光追游戲的門檻,同時(shí)對(duì)那些受人歡迎的老游戲,提供了RTX化的可能。比如它為游戲MOD打造了一款A(yù)I工具RTX Remix,以便將老游戲快速光追化。
開發(fā)者可以用其AI輔助工具來提升紋理、素材的分辨率,或者把材質(zhì)轉(zhuǎn)換為具有精確物理屬性的材質(zhì),同時(shí)呈現(xiàn)出逼真的光影效果,讓游戲質(zhì)感煥然一新。
隨著更多游戲可以快速通過RTX Remix被“RTX化”,英偉達(dá)所看好的光追游戲市場(chǎng),有望得到加速開拓。
04.結(jié)語:不要低估英偉達(dá)
“過去十年是AI在算法發(fā)明方面的革命,未來十年是AI應(yīng)用的十年。”在GTC主題演講中,黃仁勛談道,推動(dòng)計(jì)算技術(shù)這枚火箭發(fā)展的引擎是加速計(jì)算,而燃料是AI。十年前,加拿大多倫多大學(xué)Geoffrey Hinton教授的團(tuán)隊(duì)用深度學(xué)習(xí)算法奪魁ImageNet大規(guī)模視覺識(shí)別競賽,由此開始掀起AI普及的狂瀾。而支撐這一突破性進(jìn)展實(shí)現(xiàn)的硬件基礎(chǔ),便是從圖形處理和游戲發(fā)家的英偉達(dá)GPU。今天,英偉達(dá)已經(jīng)成長為AI計(jì)算領(lǐng)域公認(rèn)的“頭號(hào)玩家”,但其所預(yù)見的AI應(yīng)用潛在市場(chǎng),遠(yuǎn)比當(dāng)前既有市場(chǎng)更為廣闊。從3D游戲到元宇宙世界,AI有太多能大展拳腳的地方,AI任務(wù)愈發(fā)復(fù)雜,也就需要更強(qiáng)大的計(jì)算能力,這恰恰是英偉達(dá)技術(shù)及產(chǎn)品所擅長之處。RTX 40系列GPU給AI驅(qū)動(dòng)圖形處理打了個(gè)樣,通過一系列AI能力的加持,為優(yōu)化計(jì)算圖形、改變游戲體驗(yàn)開辟一條新路。長遠(yuǎn)來看,英偉達(dá)在架構(gòu)、設(shè)計(jì)、算法等技術(shù)創(chuàng)新上持續(xù)積淀的全棧優(yōu)勢(shì),將不斷推動(dòng)其以更低價(jià)格提供更高游戲性能,并為英偉達(dá)站在GPU金字塔尖傲視群雄提供長期的資本。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
全息投影相關(guān)文章:全息投影原理