Arm全面進(jìn)化:CPU超越酷睿i7、GPU光追性能猛增3倍
作為移動(dòng)芯片領(lǐng)域的王者,Arm每年都會(huì)帶來新的CPU、GPU、互連技術(shù)方案,近日就奉上了全新的Arm TCS22,也就是2022年全面計(jì)算解決方案,包括一系列IP組合。
本文引用地址:http://m.butianyuan.cn/article/202207/436080.htmCPU方面是全新旗艦超大核心Cortex-X3、大核心Cortex-A715,以及升級(jí)版小核心Cortex-A510(名字沒變)。
GPU方面是首次支持硬件光線追蹤的旗艦級(jí)Immotalis-G715、高端的Mali-G715、高端的Mali-G615。
互連方面則是升級(jí)版的DSU-110。
接下來,我們就分別看看都有哪些變化。
【CPU:超大核性能提升25%、三種核心組合更靈活】
2021年3月底,Arm正式發(fā)布了全新的Armv9指令集,號(hào)稱10年最重要的創(chuàng)新、面向未來10年移動(dòng)計(jì)算的基石。
Armv9重點(diǎn)增強(qiáng)矢量計(jì)算(SVE2指令集)、機(jī)器學(xué)習(xí)、數(shù)字信號(hào)處理,強(qiáng)化安全性,并繼續(xù)提升性能,號(hào)稱IPC性能未來兩代提升會(huì)超過30%。
當(dāng)然,它完全向下兼容Armv8。
Armv9指令集的Cortex-X2超大核心已經(jīng)在驍龍8/驍龍8+、天璣9000/天璣9000+等旗艦移動(dòng)處理器中得到應(yīng)用,這次發(fā)布的是新一代Cortex-X3。
Cortex-X3在架構(gòu)設(shè)計(jì)上的變化相當(dāng)深入、廣泛,比如解碼器每周期指令從5個(gè)增加到6個(gè),亂序執(zhí)行窗口從288個(gè)增加到320個(gè), ALU整數(shù)算數(shù)單元從4個(gè)增加到6個(gè),二級(jí)緩存容量從512KB翻番到1MB,并且不再支持32位指令集。
性能方面,3.3GHz頻率、1MB二級(jí)緩存、8MB三級(jí)緩存的配置下,與基于Cortex-X2的安卓旗艦處理器對(duì)比,提升最多25%。
3.6GHz頻率、1MB二級(jí)緩存、16MB三級(jí)緩存的配置下,與主流筆記本處理器(Intel i7-1260p)相比,單核性能高出最多34%。
Cortex-A715注重性能與能效的平衡,對(duì)比去年的Cortex-A710,在同等性能下能效提升最多20%,而在同等功耗下性能提升最多5%。
同時(shí),它已經(jīng)達(dá)到了上上代超大核Cortex-X1的性能水準(zhǔn)。
對(duì)了,A715也僅支持64位指令集。
Cortex-A510名字沒變,性能也沒變,不過能效提升了5%,應(yīng)該是與更新制造工藝結(jié)合的效果。
同時(shí),它也是唯一保留32位指令集支持的核心。如果一款A(yù)pp還沒有升級(jí)到64位,今后只能依賴小核心執(zhí)行,效率必然大打折扣。
Arm也是意在通過此舉推動(dòng)行業(yè)向64位加速轉(zhuǎn)型。
另外,DSU-110互連單元也更加強(qiáng)大靈活,支持核心數(shù)量增加50%,比如Cortex-X3可以最多12核心、16MB三級(jí)緩存,還支持更多指令集。
big.LITTLE大小核的組合也更加靈活、豐富,同樣1+3+4,X3+A715+A510的組合比去年的X2+A710+A510性能可提升12%。
1+4+4則可比1+3+4性能提升最多21%,2+2+4可提升最多23%,還首次加入了8+4+0這樣的組合,面向中高端筆記本,性能高出足足120%。
總體而言,Cortex CPU今年的升級(jí)比較中規(guī)中矩。X3、A715都是預(yù)料之中的對(duì)位升級(jí),A510本身幾乎毫無變化。
但是,結(jié)合新的DSU-10互連單元,三種核心的配置更加靈活多變,可滿足不同設(shè)備、應(yīng)用場(chǎng)景的不同需求,包括在筆記本領(lǐng)域繼續(xù)競(jìng)爭(zhēng)Intel、AMD x86雙雄。
【GPU:首次迎來硬件光追 名字都變了】
Arm Mali GPU憑借與Cortex CPU的整合優(yōu)化、持續(xù)不斷的迭代升級(jí),已經(jīng)成為移動(dòng)行業(yè)的絕對(duì)主流,出貨量全球領(lǐng)先,累計(jì)已超80億。
這一次,Arm GPU迎來了一次超級(jí)變臉,旗艦型號(hào)放棄了Mali的傳統(tǒng)名字,改成了全新的“Immortalis”,首款型號(hào)“Immortalis-G715”。
之所以改名,首要原因就是第一次支持基于硬件的光線追蹤,和NVIDIA、AMD、Intel的高性能顯卡一樣進(jìn)入了光追時(shí)代。
當(dāng)然,Arm GPU不是第一個(gè)支持光追的移動(dòng)端產(chǎn)品,Imagination此前已經(jīng)做到,但是兩家的影響力不可同日而語,Imagination的光追方案時(shí)至今日仍然沒有落地。
其實(shí),去年的Mali-G710已經(jīng)支持軟件光追,聯(lián)發(fā)科天璣9000就開啟了這一功能,并用在了OPPO Find X5 Pro天璣版手機(jī)中,今年則升級(jí)為硬件光追。
當(dāng)然,光線追蹤非常消耗硬件和軟件資源,一般也會(huì)大大增加功耗,不過Arm宣稱,Immortalis-G715的光追單元只占用了大約4%的著色器核心面積,而且功耗非常低,就帶來了超過3倍的性能提升(對(duì)比軟件光追)。
以下是Arm官方給出的光追效果對(duì)比圖,右半部分為開啟光追,可以看到豐富、清晰的反射、陰影,與非光追不可同日而語。
當(dāng)然,無論是性能、功耗、效果,都還有待實(shí)際考驗(yàn)。
VRS可變刷新率也成了標(biāo)配,同樣追上了NVIDIA、AMD、Intel的腳步。
該技術(shù)隸屬于DX12范疇,簡(jiǎn)單地說可在單個(gè)幀畫面內(nèi)改變著色速率,選擇性地降低畫面部分區(qū)域的細(xì)節(jié)水平(被遮擋/畫面邊緣等),從而在幾乎不影響畫質(zhì)的情況下,提升圖形性能。
Arm展示了VRS在騰訊《王者榮耀》中的效果,原畫面和VRS畫面幾乎看不出任何區(qū)別,而在性能上,官方號(hào)稱可將幀率提升最多達(dá)40%。
回到常規(guī)層面,Immotalis-G715的提升也非??捎^,官方號(hào)稱對(duì)比上代Mali-G710同等功耗下性能提升最多15%,機(jī)器學(xué)習(xí)性能直接翻番,而在同等性能下能效可提升最多15%。
它可以配置10-16個(gè)核心。
另外,Arm對(duì)執(zhí)行引擎也做了全方位增強(qiáng),主要有三個(gè)方面:
一是重新設(shè)計(jì)轉(zhuǎn)換模塊,大大縮小占用面積。
二是升級(jí)乘積累加運(yùn)算(FMA),模塊數(shù)量翻番,進(jìn)一步提升性能和能效。
三是支持矩陣乘法指令(Matrix Multiply),可提升計(jì)算攝影、圖像增強(qiáng)的效率,這也是機(jī)器學(xué)習(xí)性能翻倍的主要來源。
其他方面,指令流前端(Command Stream Frontend)、層次細(xì)節(jié)(LOD)、固定率壓縮(AFRC)等技術(shù)都得到了升級(jí)。
同時(shí),Arm 也發(fā)布了高端的Mali-G715 GPU(是的編號(hào)一樣),沒有光追,能效提升15%,可配置7-9個(gè)核心。
還有高端的Mali-G615,可配置最多6個(gè)核心。
它們倆也都支持VRS可變刷新率,這已經(jīng)是Arm GPU的標(biāo)配,同時(shí)也升級(jí)了執(zhí)行引擎。
總體而言,Arm GPU今年的變化比較極端,新引入的頂級(jí)核心Immortalis-G715整體煥然一新,性能提升明顯,尤其是將開啟手游的光追新時(shí)代。
Mali-G715、G615的亮點(diǎn)則在于普及了VRS。
【未來:一年一變 每年提升兩位數(shù)性能】
有趣的是,Arm這次很大方地公布了未來兩年的路線圖。
明年的TCS23,超大核CPU升級(jí)為CXC23(預(yù)計(jì)命名Cortex-X4),大核、小核分別升級(jí)為Hunter、Hayes,DSU互聯(lián)單元升級(jí)為Hayden,旗艦GPU則升級(jí)為Titan。
后年的TCS24,超大核CPU再次升級(jí)為CXC24(預(yù)計(jì)命名Cortex-X5),大核升級(jí)為Chaberton,小核則維持不變還是Hayes,旗艦GPU則繼續(xù)升級(jí)為Krake。
另外,沿用多代的CoreLink CI-700一致性互連技術(shù)、CoreLink NI-700片上網(wǎng)絡(luò)互連技術(shù),也終將迎來更新,代號(hào)Tower。
希望Arm未來能在能效、擴(kuò)展性、平臺(tái)安全性方面齊頭并進(jìn)。
評(píng)論