DPU:2023的洪荒之力
日前,華為輪值董事長(zhǎng)胡厚崑說(shuō)道,科技革命經(jīng)過(guò)了數(shù)次浪潮,從互聯(lián)網(wǎng)到移動(dòng)化到云計(jì)算、到人工智能,每一輪的變革都給社會(huì)帶來(lái)了深遠(yuǎn)的影響。毫無(wú)疑問(wèn),今天通用人工智能(AI)正給我們無(wú)窮的想象空間,也正帶領(lǐng)我們走進(jìn)下一個(gè)黃金十年。
本文引用地址:http://m.butianyuan.cn/article/202307/448786.htm當(dāng)前,人工智能、大數(shù)據(jù)應(yīng)用進(jìn)入快速發(fā)展階段,自動(dòng)駕駛、機(jī)器人、AR/VR、元宇宙等應(yīng)用加速落地,傳統(tǒng)數(shù)字基礎(chǔ)設(shè)施難以滿足大模型、多模態(tài)等新型技術(shù)發(fā)展,擁有強(qiáng)大集群算力的新型數(shù)據(jù)中心成為突破人工智能發(fā)展瓶頸的重要基礎(chǔ)。
DPU 作為突破數(shù)據(jù)流量指數(shù)級(jí)增長(zhǎng)帶來(lái)的性能瓶頸的關(guān)鍵技術(shù),通過(guò)算力卸載、算力釋放和算力拓展,釋放 CPU 的計(jì)算資源,實(shí)現(xiàn)任務(wù)加速處理,提升整體計(jì)算效率,達(dá)到降本增效,產(chǎn)業(yè)賦能價(jià)值凸顯。因此,也成為構(gòu)建新型算力基礎(chǔ)設(shè)施的重要基礎(chǔ)部件和下一代芯片技術(shù)競(jìng)爭(zhēng)的高地。
DPU 也被預(yù)測(cè)為 2023 年的十大科技趨勢(shì)之一,這份「洪荒之力」發(fā)展的如何呢?
「新貴」是怎樣練成的
有人說(shuō),DPU 將成為未來(lái)計(jì)算的三大支柱之一,未來(lái)的數(shù)據(jù)中心標(biāo)配是:CPU + DPU + GPU。
DPU 最直接的作用是作為 CPU 的卸載(offload)引擎,其效果是給 CPU「減負(fù)」。《DPU 技術(shù)白皮書》主編、中科院計(jì)算所研究員鄢貴海作了一個(gè)形象比喻,說(shuō) DPU 提供了數(shù)據(jù)中心一把「殺雞」的工具,節(jié)省的是 CPU 這把「牛刀」,以釋放 CPU 算力,留給更需要它的業(yè)務(wù)負(fù)載。這個(gè)比喻也形象地說(shuō)明了 DPU 這個(gè)新貴的定位。
DPU 通過(guò)執(zhí)行以下主要功能為現(xiàn)代數(shù)據(jù)中心帶來(lái)許多好處:
一、提高處理能力: DPU 減輕 CPU 的網(wǎng)絡(luò)和通信工作負(fù)載,從而釋放資源用于應(yīng)用程序處理。
二、提高效率和性能: 通過(guò)將處理核心與硬件加速器塊相結(jié)合來(lái)大規(guī)模處理以數(shù)據(jù)為中心的工作負(fù)載,DPU 可以提高性能并減少延遲。
三、處理復(fù)雜任務(wù)的能力: DPU 旨在處理大型數(shù)據(jù)中心中的數(shù)據(jù)密集型工作負(fù)載,支持云環(huán)境或驅(qū)動(dòng)人工智能、深度學(xué)習(xí)算法和其他數(shù)據(jù)密集型應(yīng)用的超級(jí)計(jì)算機(jī)。
四、能夠滿足數(shù)據(jù)中心不斷增長(zhǎng)的需求: 隨著數(shù)據(jù)中心需求的增長(zhǎng)和變得更加密集,DPU 可以進(jìn)行擴(kuò)展,以適應(yīng)數(shù)量和復(fù)雜性不斷增加的工作負(fù)載。此外,DPU 可以添加到現(xiàn)有的硬件基礎(chǔ)設(shè)施中,從而實(shí)現(xiàn)靈活且適應(yīng)性強(qiáng)的數(shù)據(jù)中心架構(gòu)。
五、提高可靠性和可用性: DPU 可以通過(guò)冗余和高可用性等功能提供更高的可靠性,確保在發(fā)生硬件故障時(shí)關(guān)鍵數(shù)據(jù)處理任務(wù)的連續(xù)性。
六、降低成本: DPU 可以通過(guò)從 CPU 卸載處理任務(wù)并處理復(fù)雜任務(wù)來(lái)降低與管理數(shù)據(jù)中心相關(guān)的總體硬件成本,從而需要更少的硬件組件。
DPU、CPU 和 GPU 之間有什么區(qū)別呢?
首先在功能上,DPU(數(shù)據(jù)處理單元)、CPU(中央處理單元)和 GPU(圖形處理單元)都是計(jì)算處理器,各自執(zhí)行不同的功能。CPU 是負(fù)責(zé)計(jì)算機(jī)系統(tǒng)整體運(yùn)行的主處理器,是計(jì)算機(jī)的「大腦」。GPU 是用于圖形計(jì)算任務(wù)(例如渲染 3D 圖像或視頻)的專用處理器。DPU 是最新的處理器,專門用于以數(shù)據(jù)為中心的工作負(fù)載,例如數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)和安全操作。
其次是架構(gòu),CPU 由幾個(gè)強(qiáng)大的處理核心組成,這些核心針對(duì)串行或順序處理進(jìn)行了優(yōu)化,這意味著一項(xiàng)又一項(xiàng)任務(wù)。GPU 具有大量針對(duì)并行處理(即同時(shí)執(zhí)行任務(wù))進(jìn)行優(yōu)化的更簡(jiǎn)單的內(nèi)核。DPU 結(jié)合了處理核心、硬件加速器塊和高性能網(wǎng)絡(luò)接口,可大規(guī)模處理以數(shù)據(jù)為中心的任務(wù)。
另外,CPU 幾乎用于所有計(jì)算機(jī)設(shè)備,從智能手機(jī)到計(jì)算機(jī)再到服務(wù)器。GPU 經(jīng)常用于游戲電腦。DPU 主要用于數(shù)據(jù)中心。
基于明顯的優(yōu)勢(shì),國(guó)外大廠已經(jīng)早早地開始發(fā)展 DPU 了。
2019 年,英偉達(dá)以 69 億美元的價(jià)格收購(gòu)以色列網(wǎng)絡(luò)芯片公司 Mellanox,并于同年推出 BlueField-2 DPU,自此拉開 DPU 高速發(fā)展的序幕。
在 2020 年 GPU 技術(shù)大會(huì)上,英偉達(dá)首席執(zhí)行官黃仁勛推出了名為 BlueField-2 數(shù)據(jù)處理單元 (DPU) 的全新處理器系列。開發(fā)人員可以通過(guò)軟件平臺(tái) DOCA SDK 訪問(wèn) DPU。DPU 和 DOCA SDK 可與英偉達(dá) GPU 硬件和 CUDA 軟件的強(qiáng)大組合相媲美。
7 月 11 日業(yè)內(nèi)四名知情人士報(bào)道,歐盟監(jiān)管機(jī)構(gòu)將于本周三批準(zhǔn)博通以 690 億美元收購(gòu)軟件制造商 VMware 的交易。報(bào)道稱,歐盟委員會(huì)將接受博通的讓步,即 VMware 的軟件將繼續(xù)與競(jìng)爭(zhēng)對(duì)手的硬件兼容。知情人士表示,這一舉措已被證明足以解決歐盟競(jìng)爭(zhēng)監(jiān)管機(jī)構(gòu)的擔(dān)憂,而無(wú)需博通出售 VMware 的部分業(yè)務(wù)。
這次的收購(gòu)如果成功,博通就可以進(jìn)一步進(jìn)軍數(shù)據(jù)中心市場(chǎng),特別是數(shù)據(jù)處理單元(DPU)市場(chǎng),也稱為智能網(wǎng)絡(luò)接口卡(smartNIC)市場(chǎng)。VMware 也一直在尋找自己的 DPU/smartNIC 市場(chǎng)之路。自 2020 年以來(lái),該公司一直致力于一項(xiàng)名為 Project Monterey 的項(xiàng)目,研究其虛擬化軟件如何與 DPU 配合使用。
2022 年 3 月,高級(jí)技術(shù)營(yíng)銷架構(gòu)師 Dave Morera 對(duì)該項(xiàng)目的描述是:「根據(jù) VMware 的蒙特利項(xiàng)目,網(wǎng)絡(luò)流量、分布式防火墻等網(wǎng)絡(luò)進(jìn)程將被卸載到 SmartNIC(智能網(wǎng)絡(luò)接口卡);這意味著不僅 x86 服務(wù)器的資源被繞過(guò),流量本身也被繞過(guò)。蒙特利項(xiàng)目還將促進(jìn)在 DPU 本身上安裝 ESXi 和 NSX,從而將所需的 CPU 資源從 x86 卸載到 DPU,不僅釋放 x86 上的資源供虛擬機(jī)使用,而且還提供額外的安全層」。
除了英偉達(dá)之外,下表展示了其他國(guó)際廠商的 DPU 產(chǎn)品
國(guó)內(nèi) DPU 起勢(shì)猛
雖然國(guó)內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)與國(guó)外一線廠商相比還有差距,但是在 DPU 架構(gòu)的理解上還是有獨(dú)到的見解的,而且我國(guó)目前在數(shù)據(jù)中心這個(gè)領(lǐng)域,無(wú)論是市場(chǎng)規(guī)模還是增速,特別是用戶數(shù)量,相較于國(guó)外都有巨大的優(yōu)勢(shì)。國(guó)內(nèi)廠商有望充分利用這一市場(chǎng)優(yōu)勢(shì),加快發(fā)展步伐,在 DPU 這個(gè)賽道與國(guó)外廠商逐鹿中原。
國(guó)內(nèi)廠商在啃的是一塊新的「硬骨頭」。DPU 技術(shù)的特點(diǎn)是燒錢多、周期長(zhǎng)、產(chǎn)品面向政企、很難快速上量, 但是技術(shù)壁壘高、客戶黏性強(qiáng)。同時(shí), DPU 是全球新近發(fā)展起來(lái)的一項(xiàng)新技術(shù), 不像很多成熟芯片已經(jīng)形成了「西強(qiáng)東弱」的格局, 在 DPU 上中國(guó)和西方國(guó)家沒有代際差。
也就是說(shuō) DPU 是全球新近發(fā)展起來(lái)的一種專用處理器。國(guó)內(nèi)廠商的一些產(chǎn)品處在從小批量到規(guī)?;瘧?yīng)用的階段, 已經(jīng)有了第一批客戶。當(dāng)下的任務(wù)是, 保持產(chǎn)品迭代以適應(yīng)用戶需求。同時(shí), 推動(dòng)產(chǎn)品從小批量到規(guī)模化落地, 再要考慮如何去復(fù)制同類客戶。
然而 DPU 產(chǎn)業(yè)化的挑戰(zhàn)很大, 這包括一些供應(yīng)鏈緊張、人才不足的共性難題, 還有需求碎片化、大量兼容適配的特殊挑戰(zhàn), 目前單顆 DPU 成本較高。
與存儲(chǔ)器、CPU 這種成熟產(chǎn)品不同, 這些芯片已經(jīng)被標(biāo)準(zhǔn)化,國(guó)際大廠擁有技術(shù)的、成本的優(yōu)勢(shì), 并善于利用產(chǎn)品的周期性調(diào)整價(jià)格, 以驅(qū)逐追趕者。國(guó)產(chǎn)的道路是后發(fā)追趕式的, 面臨的競(jìng)爭(zhēng)非常殘酷。
DPU 未來(lái)也會(huì)走向標(biāo)準(zhǔn)化。中科馭數(shù)公司的創(chuàng)始人兼 CEO 鄢貴海說(shuō):「我們感受到的競(jìng)爭(zhēng)氛圍更寬松, 而且創(chuàng)新的空間更大, 比如我們正在研究如何將端到端的延遲從 20 微秒降低到 2 微秒, 對(duì)于很多技術(shù)點(diǎn), 各家都有不同的實(shí)現(xiàn)方法, 但若這項(xiàng)技術(shù)在國(guó)際上已經(jīng)相對(duì)成熟, 那國(guó)產(chǎn)幾乎沒有空間去創(chuàng)新了, 最緊要的任務(wù)就是趕上國(guó)際的水平, 做出一個(gè)自主可控的方案。」
在全球格局尚未形成之前, 國(guó)產(chǎn) DPU 需要利用國(guó)內(nèi)的資源稟賦和更多國(guó)產(chǎn)芯片達(dá)成生態(tài)協(xié)同, 并服務(wù)于本土的信息基礎(chǔ)設(shè)施, 在全球角逐一項(xiàng)新技術(shù)的關(guān)鍵窗口期, 探索出一種「中國(guó)方案」。
其中「定制化方案」就是國(guó)產(chǎn) DPU 很好的發(fā)展方向和布局思路。DPU 是個(gè)新興市場(chǎng),客戶需求還處于粗放階段,各種方案都有適合的應(yīng)用場(chǎng)景。因?yàn)橥婕也欢?,客戶需求比較分散,單個(gè)廠商無(wú)法服務(wù)眾多客戶,因此現(xiàn)階段都能夠通過(guò)為客戶進(jìn)行定制化服務(wù)獲得訂單。
國(guó)內(nèi)未來(lái) DPU 的發(fā)展和布局應(yīng)采取一些差異化競(jìng)爭(zhēng)思路,一方面,加快自主研發(fā) DPU 的進(jìn)程。不管是處理器架構(gòu)的研發(fā),還是網(wǎng)絡(luò)芯片的研發(fā),都要加快產(chǎn)品的迭代速度。另一方面,在商業(yè)模式上,找一些細(xì)分的產(chǎn)品角度進(jìn)行創(chuàng)新。多與國(guó)內(nèi)的云計(jì)算、數(shù)據(jù)中心的廠商合作,先進(jìn)行小批量的產(chǎn)品鋪設(shè),再進(jìn)行大規(guī)模的布局。
評(píng)論