新的Armv9 CPU加速AI在移動設(shè)備等領(lǐng)域的發(fā)展
當(dāng)今移動設(shè)備上的大多數(shù)人工智能 (AI) 工作負載均可在 Arm CPU 上運行。在智能手機領(lǐng)域,基于 Armv9 CPU 技術(shù)構(gòu)建的 AI 旗艦智能手機立于技術(shù)前沿,其中包括搭載MediaTek天璣9300芯片的vivo X100和X100 Pro智能手機、三星Galaxy S24 以及Google Pixel 8,為AI創(chuàng)新提供了前所未有的機遇。
本文引用地址:http://m.butianyuan.cn/article/202406/459862.htm隨著 AI 工作負載的計算強度及復(fù)雜度持續(xù)增長,Arm 最新的 Armv9.2 CPU 集群帶來更強性能、更高效率,以及更多功能,為新一代 AI 奠定扎實基礎(chǔ)。這些優(yōu)勢可擴展到包括旗艦智能手機、AI PC,以及主流移動設(shè)備、XR 和可穿戴設(shè)備等在內(nèi)的各類消費電子設(shè)備,彰顯了我們致力于實現(xiàn)無處不在的 AI 所作的努力。
新增至 Armv9 CPU 組合的新品包括具備超強性能的Arm Cortex-X925 CPU 和可持續(xù)提供出色性能的Arm Cortex-A725 CPU,而更新后的Arm Cortex-A520可為低強度工作負載提供更卓越的能效表現(xiàn)。與此同時,我們也更新了DynamIQ Shared Unit (DSU-120),從而在 Armv9.2 CPU 集群配置中,降低功耗和縮小面積。這些產(chǎn)品被集成至 Arm 迄今為止針對安卓系統(tǒng)速度最快的計算平臺——新的Arm終端計算子系統(tǒng)(CSS)。
圖 Armv9 CPU系列的新產(chǎn)品及更新
Cortex-X925實現(xiàn)了最顯著的Cortex-X性能提升
Cortex-X925(內(nèi)部代號為 Blackhawk)與此前的 Cortex-X 產(chǎn)品相比,實現(xiàn)了最高的同比性能提升,重新定義了計算性能的發(fā)展軌跡。Cortex-X925 的單線程(峰值)性能提高了 36%(與 2023 年高端安卓手機上運行 Geekbench 6.2 相比),并且其 AI 性能提升了 46%(與前代 Cortex-X4 CPU 上的 Phi-3 詞元首次響應(yīng)時間相比)。
圖 Cortex-X925性能提升
Cortex-X925 的功耗性能配置意味著它能在關(guān)鍵時刻提供峰值性能。這有助于提高跨應(yīng)用、生成式 AI 工作負載、網(wǎng)頁瀏覽、攝像頭后處理、視頻錄制和 AAA 游戲的響應(yīng)能力,進而帶來更優(yōu)異的用戶體驗。
這些性能提升得益于 Cortex-X925 出眾的性能基礎(chǔ)及其開創(chuàng)性的新微架構(gòu)。Cortex-X925 通過經(jīng)優(yōu)化的三納米工藝,輔以卓越的子系統(tǒng)和封裝,使得新一代消費電子設(shè)備的性能分數(shù)可提高 30% 以上。包括高達 3MB 的私有 L2 緩存在內(nèi)的微架構(gòu)改進,提供了更強的 CPU 集群可配置性,讓各類消費電子設(shè)備的創(chuàng)新成為可能。
作為 Arm 終端 CSS的一部分,我們協(xié)同設(shè)計并交付了 CPU 物理實現(xiàn)。我們攜手領(lǐng)先的代工廠合作伙伴,實現(xiàn)了流片就緒的 Cortex-X925 三納米工藝的物理實現(xiàn),助力我們的合作伙伴能夠在三納米工藝上充分發(fā)揮功耗、性能和面積 (PPA) 優(yōu)勢,同時通過大批量生產(chǎn)就緒的芯片解決方案來縮短芯片的開發(fā)與部署進程。
Cortex-A725持續(xù)提供出色性能
Arm Cortex-A700 系列 CPU 的出色性能效率一脈相承,Cortex-A725 也不例外。作為 CPU 工作負載的主力,我們的工程和設(shè)計團隊就 Cortex-A725 進行了針對性更新,著力于需要持續(xù)出色性能的關(guān)鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
圖 Cortex-A725性能和能效提升
Cortex-A725 的性能效率提升同樣得益于其微架構(gòu)的改進。和 Cortex-X925 一樣,通過 Arm 先進的物理實現(xiàn),我們在三納米工藝上優(yōu)化了 Cortex-A725 的實現(xiàn)。我們還可為主流消費技術(shù)市場提供面積優(yōu)化的實現(xiàn)。
Cortex-A520和DSU-120的更新
Cortex-A520已針對Arm終端CSS進行更新,從而提供更為出色的能效,與 2023 Arm 全面計算解決方案 (TCS23) 中的 Cortex-A520 相比,其效率提升了 15%。Cortex-A520 的更新得益于更新的實現(xiàn)與先進的三納米物理實現(xiàn)。
圖 更新后的Cortex-A520
作為新的Arm終端CSS的一部分,DSU-120 已針對新一代用例和消費電子設(shè)備體驗進行了強化。其中包括新的性能和效率功能、新的低功耗模式和面向主流消費電子設(shè)備的強化,并保留了為高性能用例擴展到 14 個核心的選項。得益于此,典型工作負載的功耗顯著降低 50%,并且整個 CPU 集群的緩存未命中功耗降低 60%,從而減少漏電并延長設(shè)備的電池壽命。新的低功耗模式(例如 half slice power down 和 quick nap)和增強功能支持大量低強度和高強度的 AI 工作負載,包括生物特征識別、語音轉(zhuǎn)文本、AI 智能攝像頭、內(nèi)容創(chuàng)建和基于機器學(xué)習(xí) (ML) 的 AAA 游戲。
圖 DSU-120更新和提升
Arm性能最強、效率最高、用途最廣泛的CPU集群
這些新推出和更新后的 CPU 構(gòu)成了 Arm CPU 集群配置,為廣泛的消費電子設(shè)備提供前所未有的性能、效率和廣泛用途。概括地說,與采用上一代 Cortex-X4 的 CPU 集群相比,新的 CPU 集群的 AI 性能提高了 46%,能實現(xiàn)了更高的響應(yīng)性能和持續(xù)的吞吐量。與 TCS23 CPU 集群相比,它使關(guān)鍵用戶體驗指標(biāo)(結(jié)合性能與功耗)提高 30%,進而加快應(yīng)用訪問和網(wǎng)頁瀏覽速度,提升 AAA 游戲體驗,并延長電池使用壽命。
最新的 Arm CPU 集群還可為各類的消費電子設(shè)備提供出色的擴展能力。例如,它為 PC 和筆記本電腦提供一流的性能,與當(dāng)前發(fā)售的 PC 和筆記本電腦設(shè)備相比,性能提高了 25%。同時,與 TCS23 中的 DSU-120 相比,功耗和面積均獲得降低,加上通過 Cortex-A725 和 Cortex-A520 帶來的面積和功耗優(yōu)化,為主流設(shè)備提供了靈活的 CPU 集群配置組合。這有助于在各類低成本的消費電子設(shè)備上提供優(yōu)異性能和 AI 功能,確保日常設(shè)備用戶能夠獲得高級的 AI 體驗。
Armv9 CPU面向新一代AI體驗
新的 Armv9.2 CPU 集群為安卓智能手機、PC 和筆記本電腦等設(shè)備提供出色的性能與用戶體驗。該集群提供一整套實際用例的改進,集群中各個 CPU 組件均涵蓋廣泛的實際用例和工作負載。例如,Cortex-X925 可處理應(yīng)用啟動和網(wǎng)頁瀏覽的“突發(fā)”工作負載,Cortex-A725 可提供常見 AI 工作負載和 AAA 游戲所需的持續(xù)性能,Cortex-A520 的高效率則非常適合輕量型媒體和閑置及后臺任務(wù)。所有這些增強的實際用例體驗都可以擴展到各類消費技術(shù)領(lǐng)域,新推出的 Armv9 CPU 為主流設(shè)備和日常用戶帶來了更高的性能和更強大的 AI 功能,從而使關(guān)鍵用戶體驗指標(biāo)提高 30%。
隨著用戶在其設(shè)備上花費的時間不斷增多,并期望獲得更高級的體驗,消費者對技術(shù)的需求永無止境。無論是更快的網(wǎng)頁瀏覽和應(yīng)用訪問速度,還是增強的 AAA 游戲與生成式 AI 工作負載,新的 Armv9 CPU 通過先進的計算功能提升各類體驗,進而定義消費技術(shù)的未來。
評論