Arm發(fā)布全新終端計(jì)算子系統(tǒng),引領(lǐng)AI驅(qū)動(dòng)下的移動(dòng)設(shè)備性能革新
5 月 30 日,Arm發(fā)布了最新的 Arm 終端計(jì)算子系統(tǒng) (Arm CSS for Client),為移動(dòng)設(shè)備行業(yè)帶來(lái)了新的突破。隨著人工智能 (AI) 發(fā)展的逐漸深入,AI帶給了我們?cè)絹?lái)越多的體驗(yàn)提升,我們正在見(jiàn)證 AI 從手機(jī)到筆記本電腦所取得的顯著創(chuàng)新,并由此誕生了 AI 智能手機(jī)和 AI PC。就在這AI的浪潮之下,Arm所發(fā)布的終端 CSS 旨在加速設(shè)備端AI 的發(fā)展,為智能手機(jī)、筆記本電腦、可穿戴設(shè)備和數(shù)字電視等設(shè)備提供更強(qiáng)大的性能和更高的能效。
Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven在日前舉辦的媒體溝通會(huì)上介紹了Arm發(fā)布的終端 CSS。
James McNiven表示,Arm終端CSS將物理實(shí)現(xiàn)與 Armv9 的 AI 優(yōu)勢(shì)結(jié)合在一起,整合了最新的 Armv9.2 CPU 和最新的 Immortalis GPU,最新的 CoreLink 系統(tǒng)互連和系統(tǒng)內(nèi)存管理單元 (SMMU),并優(yōu)化到內(nèi)存及 SoC 其他部分的計(jì)算路徑。其中,Arm首次在終端領(lǐng)域?yàn)?a class="contentlabel" href="http://m.butianyuan.cn/news/listbylabel/label/CPU">CPU 和 GPU 提供物理實(shí)現(xiàn),不僅簡(jiǎn)化了 SoC 設(shè)計(jì)流程,還可確保了產(chǎn)品上市速度。
本次發(fā)布的重頭戲是最新的 Armv9 CPU —— Arm Cortex-X925,以及 Immortalis GPU —— Arm Immortalis-G925。
我們先來(lái)看看Cortex-X925,命名的改變代表的不止是新一代的設(shè)計(jì),更是性能的大幅提升。對(duì)此James McNiven進(jìn)一步談到,Cortex-X925 是 Cortex-X 推出以來(lái)取得最高 IPC 同比增幅的 CPU,通過(guò)結(jié)合新設(shè)計(jì)所實(shí)現(xiàn)的微架構(gòu)改進(jìn)和頻率提升,Cortex-X925 在 Geekbench 中實(shí)現(xiàn)了 36% 的單線程性能增長(zhǎng)。以 AI 性能為例,與去年的 Cortex-X CPU 相比,詞元 (Token) 首次響應(yīng)時(shí)間提高了 41%,其LLM的初始響應(yīng)能力有了顯著改善。Arm是怎么做到如此顯著的性能提升的呢?James McNiven在現(xiàn)場(chǎng)對(duì)媒體進(jìn)行了深入的闡述,得益于微架構(gòu)的顯著演進(jìn)——Arm迄今為止最寬的解碼和矢量設(shè)計(jì)帶來(lái)了巨幅的提升,實(shí)現(xiàn)了 50% TOPS 數(shù)的增長(zhǎng)。通過(guò)更強(qiáng)的可配置性和更大的私有 L2 緩存大小,保留進(jìn)出過(guò)CPU的指令和數(shù)據(jù)。而且Arm的 RTL 和物理設(shè)計(jì)團(tuán)隊(duì)之間也展開(kāi)了進(jìn)一步協(xié)作,針對(duì)3nm工藝,提升頻率和效率。
而在GPU方面,Arm帶來(lái)了全新的Arm Immortalis-G925。與CPU的命名一致,作為Arm性能最強(qiáng)、效率最高的 GPU,其在名字上也作出了相應(yīng)的調(diào)整。在各種圖形應(yīng)用上,Immortalis-G925 的性能同比提高了 37%;而在多個(gè) AI/ML 網(wǎng)絡(luò)上進(jìn)行測(cè)量時(shí),實(shí)現(xiàn)了約 34% 的性能提升。此外,還有光線追蹤技術(shù)。2022 年,Immortalis 將光線追蹤技術(shù)引入智能手機(jī)。今年,Arm大幅提高了光線追蹤技術(shù)在面對(duì)復(fù)雜物體時(shí)的表現(xiàn),其性能提升高達(dá) 52%。
在 CSS 上的效率方面,James McNiven介紹到,與 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。該成果源于Arm改進(jìn)了微架構(gòu),并善用工藝和物理 IP 優(yōu)化。“小核”Cortex-A520 CPU 也隨著工藝和物理實(shí)現(xiàn)的提升而得到了改進(jìn)。至于圖形效率,Arm發(fā)現(xiàn)在提供與去年終端平臺(tái)相同水平的游戲性能下,《堡壘之夜》等手游的功耗降低了 30%。至于可擴(kuò)展性,Arm的合作伙伴可以利用這一系列不同的 CPU 和 GPU 選項(xiàng),針對(duì)大屏幕計(jì)算、智能手機(jī)、數(shù)字電視和可穿戴設(shè)備等精心設(shè)計(jì)自己的解決方案。
除了通過(guò) CSS 推動(dòng)性能和效率提升之外,Arm也一直始終致力于為每一位安卓設(shè)備用戶提高性能。在 Cortex-X925 帶來(lái)的 30% 性能提升基礎(chǔ)上,Arm對(duì)網(wǎng)頁(yè)瀏覽器進(jìn)行了改進(jìn),使其性能提高了 23%。除了 Chrome,中國(guó)的手機(jī)廠商也將這些改進(jìn)引入到其瀏覽器中。與此同時(shí),Arm繼續(xù)攜手 Google,推動(dòng)其安卓動(dòng)態(tài)性能框架 (Android Dynamic Performance Framework) 的發(fā)展。在最新版本的框架中,實(shí)現(xiàn)高端內(nèi)容的每幀能耗降低了 25%,幀速率則提高了 35%。此外,Arm還調(diào)整了安卓工作負(fù)載在不同 CPU 核心之間的平衡方式,從而為 YouTube 節(jié)省了高達(dá) 10% 的功耗。針對(duì) Google 的 AV1 視頻編解碼器,Arm對(duì)其進(jìn)行了軟件優(yōu)化,使當(dāng)下安卓設(shè)備的視頻性能最多可提高 40%。
Arm 終端 CSS 的發(fā)布標(biāo)志著移動(dòng)設(shè)備行業(yè)邁向了新的階段,將推動(dòng)設(shè)備端 AI 應(yīng)用的普及和發(fā)展。開(kāi)發(fā)者可以利用終端CSS 的強(qiáng)大性能和軟件支持,打造出更加智能、高效和用戶體驗(yàn)更佳的設(shè)備。
圖:Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven(圖左)與 vivo 首席芯片規(guī)劃專家夏曉菲(圖右)分享雙方合作
vivo作為Arm的合作伙伴也來(lái)到了溝通會(huì)的現(xiàn)場(chǎng),vivo 首席芯片規(guī)劃專家夏曉菲表示,vivo 非常注重用戶體驗(yàn),在 Arm CSS 的技術(shù)基礎(chǔ)之上,vivo與 Arm 密切合作,共同推動(dòng)開(kāi)發(fā)者生態(tài),使手機(jī)更流暢更好用,同時(shí)也為設(shè)備端帶來(lái)了前沿的 AI 體驗(yàn)。Arm 持續(xù)加大 AI 技術(shù)上的布局。相信大家會(huì)看到 Arm CSS 里面集成更多更強(qiáng)大的 AI 能力,同時(shí)提供一個(gè)更加廣泛的針對(duì)開(kāi)發(fā)者的開(kāi)發(fā)環(huán)境,能夠讓所有的開(kāi)發(fā)者基于通用平臺(tái)開(kāi)發(fā)出自己基于端側(cè)的生成式 AI 應(yīng)用和體驗(yàn)。
Arm 終端CSS 的發(fā)布為移動(dòng)設(shè)備行業(yè)帶來(lái)了新的機(jī)遇,將推動(dòng)設(shè)備端 AI 應(yīng)用的快速發(fā)展。其卓越的的高性能、高效率和高可擴(kuò)展性,將幫助開(kāi)發(fā)者打造出更加智能、高效和用戶體驗(yàn)更佳的設(shè)備,為消費(fèi)者帶來(lái)更加美好的未來(lái)。
評(píng)論