Arm帶來AI基礎設施關鍵技術,新一代Neoverse CSS N3和CSS V3
近年來,隨著第四次科技革命浪潮的驅(qū)動,基礎設施領域不再局限于芯片、服務器或機架,而是牽系著整個數(shù)據(jù)中心,它正在轉(zhuǎn)向更復雜的倉庫級計算。如今全球正邁入一個新的階段,即生成式人工智能(GenAI)時代,Arm認為2024年及未來,預計將出現(xiàn)大規(guī)模的創(chuàng)新應用。作為基礎設施領域技術變革的基石,Arm再次帶來創(chuàng)新。
本文引用地址:http://m.butianyuan.cn/article/202402/455772.htm2024年2月22日,Arm召開技術媒體溝通會,宣布推出兩款基于全新第三代Neoverse IP構建的新的Arm? Neoverse?計算子系統(tǒng) (CSS),主要包括Arm Neoverse CSS V3以及Arm Neoverse CSS N3。
打造協(xié)同設計新模式,滿足計算基礎設施需求
Arm基礎設施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll表示,從兩個將推動未來基礎設施發(fā)展的重要顛覆性趨勢來看,人們希望對支持云計算關鍵工作負載的計算進行優(yōu)化,以及頭部企業(yè)正在打造定制芯片,并需要一種行之有效的方式來實現(xiàn)這一目標。而軟件和硬件在過去分別由不同的公司負責開發(fā),這樣老舊的模式已經(jīng)無法滿足現(xiàn)在客戶對性能的需求,也無法適配軟件或硬件的復雜性。客戶希望其部署的硬件,甚至是微架構層面,都能被優(yōu)化,以便順利運行其軟件工作負載。此類聯(lián)合優(yōu)化很難實現(xiàn),需要軟硬件雙方做出巨大的投入才能夠完成。
在這樣的背景下,Arm的合作式IP業(yè)務模式和計算子系統(tǒng)在其中可以發(fā)揮關鍵作用。據(jù)Dermot O’Driscoll表示,“通過與Arm的協(xié)作模式,合作伙伴可以在我們IP的開發(fā)過程中,在對應IP的典型系統(tǒng)上運行其工作負載。這種協(xié)作模式直接影響Arm架構的發(fā)展方向,以及我們在IP產(chǎn)品中實現(xiàn)微架構的方式。在交付IP之后,我們也將為合作伙伴提供貫穿整個芯片開發(fā)周期的支持。通過模擬和仿真,我們幫助他們評估由Arm提供的設計選擇,并在開發(fā)與配置的全流程中提供支持,從而縮短產(chǎn)品上市進程?!?/p>
Dermot O’Driscoll認為,“我們與合作伙伴通力協(xié)作為定制計算開辟了一條獨特路徑,以滿足當今計算基礎設施的需求,這種協(xié)同設計并不局限于 CPU。為了深入優(yōu)化TCO,就必須著眼于整個平臺。而只有Arm能夠在平臺級別上調(diào)優(yōu)內(nèi)存和I/O,并添加自定義工作負載加速器。”
Arm于去年推出了Neoverse CSS,有助于更快地開發(fā)芯片或小芯片。在Neoverse CSS中,Arm負責配置、優(yōu)化和驗證一套完整的計算子系統(tǒng),并針對基礎設施市場的各種關鍵用例進行配置,使其合作伙伴能夠?qū)W⒂卺槍μ囟ㄏ到y(tǒng)級工作負載塑造差異化競爭優(yōu)勢,比如軟件調(diào)優(yōu)、定制加速等。此外,客戶還能從CSS中額外獲得選購優(yōu)勢,他們能夠加速產(chǎn)品上市時間、降低工程成本,同時還能夠善用前沿的處理器技術。
值得一提的是,以Neoverse CSS為基礎的Arm全面設計(Arm Total Design)生態(tài)項目也在去年下半年推出。Arm 基礎設施事業(yè)部營銷副總裁 Eddie Ramirez表示,Arm全面設計(Arm Total Design)生態(tài)項目在推出后四個月內(nèi),已經(jīng)有20多家成員加入。其中包括新的EDA和配套IP提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰(zhàn)略市場的芯片設計合作伙伴,這些市場存在巨大的發(fā)展?jié)摿?。Arm正在與三家主要代工廠合作,以確保其CSS產(chǎn)品能在其先進工藝節(jié)點上進行優(yōu)化。
CSS定制芯片強力輔助,新一代Arm Neoverse技術功能深度優(yōu)化
Arm發(fā)布的新一代Neoverse技術包括通過性能效率更優(yōu)異的 N 系列新 IP 擴展Arm Neoverse CSS產(chǎn)品路線圖,即Neoverse CSS N3;以及首次將計算子系統(tǒng)引入性能優(yōu)先的V系列產(chǎn)品線,即新的Neoverse CSS V3。
01.Arm Neoverse CSS N3每瓦性能提高20%
本次Arm推出了N系列新的CSS產(chǎn)品——Neoverse CSS N3,新產(chǎn)品在N2的基礎之上更新了許多功能。據(jù)Arm介紹,CSS N3是基于新的Neoverse N3 IP平臺打造,為新的N系列產(chǎn)品引入了Armv9.2功能,能為每個核心提供2MB的專用L2緩存,并支持最新的PCIe和CXLI/O標準以及UCIe芯粒標準。
性能方面,與CSS N2相比,CSS N3每核心的每瓦性能可提高20%,單芯片可支持8到32核。此外,CSS N3的首個實例可提供 32 核,熱設計功耗(TDP)低至40W,可擴展性非常強,可覆蓋電信、網(wǎng)絡和DPU等一系列應用。在AI 數(shù)據(jù)分析工作負載方面,通過有效的微架構調(diào)整,N3的性能提升高達 196%。
合作方面,Arm透露,智原科技正在構建基于芯粒的服務器芯片,該芯片將搭載64顆N系列核心,并基于英特爾代工服務的18A工藝節(jié)點進行生產(chǎn)制造。同時,ADTechnology將提供高性價比的16核CSS N系列邊緣服務器平臺,他們將與三星代工廠合作,為邊緣計算釋放更強大的算力。
02. Arm Neoverse CSS V3單芯片性能提高了 50%
Arm Neoverse CSS V3是Arm首次針對Neoverse V系列CPU內(nèi)核提供該IP的現(xiàn)成CSS版本。
Arm Neoverse CSS V3是基于新的Neoverse V3核心打造,是Arm目前單線程性能最高的Neoverse核心,并為Arm機密計算架構(CCA)提供硬件支持。與N3核心一樣,V3也可提供業(yè)界領先的專用L2緩存大小,顯著改善性能表現(xiàn)。
從性能上看,與CSS N2產(chǎn)品相比,Arm Neoverse CSS V3單芯片性能可提高50%,在單芯片上最多可擴展至128核,同時還支持最新的高速內(nèi)存和I/O標準。在AI 數(shù)據(jù)分析工作負載方面,相較于V2,V3的性能提升了84%。不過至于功耗方面,Arm并未提及更多內(nèi)容。
從內(nèi)部結構看,Arm Neoverse CSS V3每個集群擁有64個核心,每個插槽最多有128個核心,支持PCIe Gen5、CXL 3.0甚至HBM3等現(xiàn)代功能。此外,據(jù)Arm透露,Socionext正在設計一款32核Neoverse CSS V3小芯片,將在臺積電(TSMC)生產(chǎn)。
Dermot O’Driscoll表示,新產(chǎn)品全方位地實現(xiàn)了非常良好的提升,從視頻處理到 SQL 數(shù)據(jù)庫的性能均有所躍進。N系列在壓縮方面取得了性能優(yōu)勢,可降低云服務運營商的成本,并最終降低云服務客戶的成本,同樣地V系列顯著提高了協(xié)議緩沖區(qū)的性能,這是在數(shù)據(jù)中心內(nèi)傳輸數(shù)據(jù)的一項關鍵功能。以下是基于Neoverse N系列和V系列打造的芯片在一些關鍵工作負載下的性能數(shù)據(jù)。
Arm指出,憑借兩款全新的Neoverse CSS產(chǎn)品CSS N3和CSS V3,Arm專注于釋放芯粒等新技術的潛力,并更大限度地優(yōu)化實際工作負載的TCO,這對于整個生態(tài)系統(tǒng)至關重要,其中包括AI、數(shù)據(jù)庫、網(wǎng)絡等。
這次的發(fā)布會中,Arm還向業(yè)界披露了其下一代CSS V系列(代號:CSS Vega)和N系列(代號:CSS Ranger)平臺的代號,其中,Dionysus將是下一個N系列核心,Adonis將是下一個V系列核心。而Lycius將是下一個Neoverse E系列核心。但Arm只是公布了下一代產(chǎn)品代號,并未介紹更多技術細節(jié)。
“隨著越來越多的AI工作負載被采用,并貫穿于整個計算流程,涵蓋從大型數(shù)據(jù)中心到網(wǎng)絡、服務器以及計算基礎設施的方方面面。Arm Neoverse V3和N3提供了支撐這一轉(zhuǎn)型所需的計算性能和效率,而在Arm全面設計生態(tài)項目的支持下,我們的計算子系統(tǒng)能夠加速產(chǎn)品上市時間,并加大對創(chuàng)新的投資力度。”Arm高級副總裁兼基礎設施事業(yè)部總經(jīng)理Mohamed Awad在會上表示。
此外,基于 Arm 全面設計生態(tài)伙伴的反饋意見,Arm 近期發(fā)布芯粒系統(tǒng)架構 (Chiplet System Architecture,CSA)。CSA 旨在定義一個功能強大、支持通用的芯粒生態(tài)系統(tǒng),以提高多個供應商之間的組件(包括物理設計 IP、軟 IP 等)復用率。
評論