Arm帶來AI基礎(chǔ)設(shè)施關(guān)鍵技術(shù),新一代Neoverse CSS N3和CSS V3
近年來,隨著第四次科技革命浪潮的驅(qū)動,基礎(chǔ)設(shè)施領(lǐng)域不再局限于芯片、服務(wù)器或機(jī)架,而是牽系著整個數(shù)據(jù)中心,它正在轉(zhuǎn)向更復(fù)雜的倉庫級計(jì)算。如今全球正邁入一個新的階段,即生成式人工智能(GenAI)時代,Arm認(rèn)為2024年及未來,預(yù)計(jì)將出現(xiàn)大規(guī)模的創(chuàng)新應(yīng)用。作為基礎(chǔ)設(shè)施領(lǐng)域技術(shù)變革的基石,Arm再次帶來創(chuàng)新。
本文引用地址:http://m.butianyuan.cn/article/202402/455772.htm2024年2月22日,Arm召開技術(shù)媒體溝通會,宣布推出兩款基于全新第三代Neoverse IP構(gòu)建的新的Arm? Neoverse?計(jì)算子系統(tǒng) (CSS),主要包括Arm Neoverse CSS V3以及Arm Neoverse CSS N3。
打造協(xié)同設(shè)計(jì)新模式,滿足計(jì)算基礎(chǔ)設(shè)施需求
Arm基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll表示,從兩個將推動未來基礎(chǔ)設(shè)施發(fā)展的重要顛覆性趨勢來看,人們希望對支持云計(jì)算關(guān)鍵工作負(fù)載的計(jì)算進(jìn)行優(yōu)化,以及頭部企業(yè)正在打造定制芯片,并需要一種行之有效的方式來實(shí)現(xiàn)這一目標(biāo)。而軟件和硬件在過去分別由不同的公司負(fù)責(zé)開發(fā),這樣老舊的模式已經(jīng)無法滿足現(xiàn)在客戶對性能的需求,也無法適配軟件或硬件的復(fù)雜性??蛻粝M洳渴鸬挠布踔潦俏⒓軜?gòu)層面,都能被優(yōu)化,以便順利運(yùn)行其軟件工作負(fù)載。此類聯(lián)合優(yōu)化很難實(shí)現(xiàn),需要軟硬件雙方做出巨大的投入才能夠完成。
在這樣的背景下,Arm的合作式IP業(yè)務(wù)模式和計(jì)算子系統(tǒng)在其中可以發(fā)揮關(guān)鍵作用。據(jù)Dermot O’Driscoll表示,“通過與Arm的協(xié)作模式,合作伙伴可以在我們IP的開發(fā)過程中,在對應(yīng)IP的典型系統(tǒng)上運(yùn)行其工作負(fù)載。這種協(xié)作模式直接影響Arm架構(gòu)的發(fā)展方向,以及我們在IP產(chǎn)品中實(shí)現(xiàn)微架構(gòu)的方式。在交付IP之后,我們也將為合作伙伴提供貫穿整個芯片開發(fā)周期的支持。通過模擬和仿真,我們幫助他們評估由Arm提供的設(shè)計(jì)選擇,并在開發(fā)與配置的全流程中提供支持,從而縮短產(chǎn)品上市進(jìn)程?!?/p>
Dermot O’Driscoll認(rèn)為,“我們與合作伙伴通力協(xié)作為定制計(jì)算開辟了一條獨(dú)特路徑,以滿足當(dāng)今計(jì)算基礎(chǔ)設(shè)施的需求,這種協(xié)同設(shè)計(jì)并不局限于 CPU。為了深入優(yōu)化TCO,就必須著眼于整個平臺。而只有Arm能夠在平臺級別上調(diào)優(yōu)內(nèi)存和I/O,并添加自定義工作負(fù)載加速器。”
Arm于去年推出了Neoverse CSS,有助于更快地開發(fā)芯片或小芯片。在Neoverse CSS中,Arm負(fù)責(zé)配置、優(yōu)化和驗(yàn)證一套完整的計(jì)算子系統(tǒng),并針對基礎(chǔ)設(shè)施市場的各種關(guān)鍵用例進(jìn)行配置,使其合作伙伴能夠?qū)W⒂卺槍μ囟ㄏ到y(tǒng)級工作負(fù)載塑造差異化競爭優(yōu)勢,比如軟件調(diào)優(yōu)、定制加速等。此外,客戶還能從CSS中額外獲得選購優(yōu)勢,他們能夠加速產(chǎn)品上市時間、降低工程成本,同時還能夠善用前沿的處理器技術(shù)。
值得一提的是,以Neoverse CSS為基礎(chǔ)的Arm全面設(shè)計(jì)(Arm Total Design)生態(tài)項(xiàng)目也在去年下半年推出。Arm 基礎(chǔ)設(shè)施事業(yè)部營銷副總裁 Eddie Ramirez表示,Arm全面設(shè)計(jì)(Arm Total Design)生態(tài)項(xiàng)目在推出后四個月內(nèi),已經(jīng)有20多家成員加入。其中包括新的EDA和配套IP提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰(zhàn)略市場的芯片設(shè)計(jì)合作伙伴,這些市場存在巨大的發(fā)展?jié)摿?。Arm正在與三家主要代工廠合作,以確保其CSS產(chǎn)品能在其先進(jìn)工藝節(jié)點(diǎn)上進(jìn)行優(yōu)化。
CSS定制芯片強(qiáng)力輔助,新一代Arm Neoverse技術(shù)功能深度優(yōu)化
Arm發(fā)布的新一代Neoverse技術(shù)包括通過性能效率更優(yōu)異的 N 系列新 IP 擴(kuò)展Arm Neoverse CSS產(chǎn)品路線圖,即Neoverse CSS N3;以及首次將計(jì)算子系統(tǒng)引入性能優(yōu)先的V系列產(chǎn)品線,即新的Neoverse CSS V3。
01.Arm Neoverse CSS N3每瓦性能提高20%
本次Arm推出了N系列新的CSS產(chǎn)品——Neoverse CSS N3,新產(chǎn)品在N2的基礎(chǔ)之上更新了許多功能。據(jù)Arm介紹,CSS N3是基于新的Neoverse N3 IP平臺打造,為新的N系列產(chǎn)品引入了Armv9.2功能,能為每個核心提供2MB的專用L2緩存,并支持最新的PCIe和CXLI/O標(biāo)準(zhǔn)以及UCIe芯粒標(biāo)準(zhǔn)。
性能方面,與CSS N2相比,CSS N3每核心的每瓦性能可提高20%,單芯片可支持8到32核。此外,CSS N3的首個實(shí)例可提供 32 核,熱設(shè)計(jì)功耗(TDP)低至40W,可擴(kuò)展性非常強(qiáng),可覆蓋電信、網(wǎng)絡(luò)和DPU等一系列應(yīng)用。在AI 數(shù)據(jù)分析工作負(fù)載方面,通過有效的微架構(gòu)調(diào)整,N3的性能提升高達(dá) 196%。
合作方面,Arm透露,智原科技正在構(gòu)建基于芯粒的服務(wù)器芯片,該芯片將搭載64顆N系列核心,并基于英特爾代工服務(wù)的18A工藝節(jié)點(diǎn)進(jìn)行生產(chǎn)制造。同時,ADTechnology將提供高性價(jià)比的16核CSS N系列邊緣服務(wù)器平臺,他們將與三星代工廠合作,為邊緣計(jì)算釋放更強(qiáng)大的算力。
02. Arm Neoverse CSS V3單芯片性能提高了 50%
Arm Neoverse CSS V3是Arm首次針對Neoverse V系列CPU內(nèi)核提供該IP的現(xiàn)成CSS版本。
Arm Neoverse CSS V3是基于新的Neoverse V3核心打造,是Arm目前單線程性能最高的Neoverse核心,并為Arm機(jī)密計(jì)算架構(gòu)(CCA)提供硬件支持。與N3核心一樣,V3也可提供業(yè)界領(lǐng)先的專用L2緩存大小,顯著改善性能表現(xiàn)。
從性能上看,與CSS N2產(chǎn)品相比,Arm Neoverse CSS V3單芯片性能可提高50%,在單芯片上最多可擴(kuò)展至128核,同時還支持最新的高速內(nèi)存和I/O標(biāo)準(zhǔn)。在AI 數(shù)據(jù)分析工作負(fù)載方面,相較于V2,V3的性能提升了84%。不過至于功耗方面,Arm并未提及更多內(nèi)容。
從內(nèi)部結(jié)構(gòu)看,Arm Neoverse CSS V3每個集群擁有64個核心,每個插槽最多有128個核心,支持PCIe Gen5、CXL 3.0甚至HBM3等現(xiàn)代功能。此外,據(jù)Arm透露,Socionext正在設(shè)計(jì)一款32核Neoverse CSS V3小芯片,將在臺積電(TSMC)生產(chǎn)。
Dermot O’Driscoll表示,新產(chǎn)品全方位地實(shí)現(xiàn)了非常良好的提升,從視頻處理到 SQL 數(shù)據(jù)庫的性能均有所躍進(jìn)。N系列在壓縮方面取得了性能優(yōu)勢,可降低云服務(wù)運(yùn)營商的成本,并最終降低云服務(wù)客戶的成本,同樣地V系列顯著提高了協(xié)議緩沖區(qū)的性能,這是在數(shù)據(jù)中心內(nèi)傳輸數(shù)據(jù)的一項(xiàng)關(guān)鍵功能。以下是基于Neoverse N系列和V系列打造的芯片在一些關(guān)鍵工作負(fù)載下的性能數(shù)據(jù)。
Arm指出,憑借兩款全新的Neoverse CSS產(chǎn)品CSS N3和CSS V3,Arm專注于釋放芯粒等新技術(shù)的潛力,并更大限度地優(yōu)化實(shí)際工作負(fù)載的TCO,這對于整個生態(tài)系統(tǒng)至關(guān)重要,其中包括AI、數(shù)據(jù)庫、網(wǎng)絡(luò)等。
這次的發(fā)布會中,Arm還向業(yè)界披露了其下一代CSS V系列(代號:CSS Vega)和N系列(代號:CSS Ranger)平臺的代號,其中,Dionysus將是下一個N系列核心,Adonis將是下一個V系列核心。而Lycius將是下一個Neoverse E系列核心。但Arm只是公布了下一代產(chǎn)品代號,并未介紹更多技術(shù)細(xì)節(jié)。
“隨著越來越多的AI工作負(fù)載被采用,并貫穿于整個計(jì)算流程,涵蓋從大型數(shù)據(jù)中心到網(wǎng)絡(luò)、服務(wù)器以及計(jì)算基礎(chǔ)設(shè)施的方方面面。Arm Neoverse V3和N3提供了支撐這一轉(zhuǎn)型所需的計(jì)算性能和效率,而在Arm全面設(shè)計(jì)生態(tài)項(xiàng)目的支持下,我們的計(jì)算子系統(tǒng)能夠加速產(chǎn)品上市時間,并加大對創(chuàng)新的投資力度。”Arm高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理Mohamed Awad在會上表示。
此外,基于 Arm 全面設(shè)計(jì)生態(tài)伙伴的反饋意見,Arm 近期發(fā)布芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture,CSA)。CSA 旨在定義一個功能強(qiáng)大、支持通用的芯粒生態(tài)系統(tǒng),以提高多個供應(yīng)商之間的組件(包括物理設(shè)計(jì) IP、軟 IP 等)復(fù)用率。
評論