新聞中心

EEPW首頁 > 網(wǎng)絡與存儲 > 新品快遞 > 當我們談論DPU時,我們在談論什么

當我們談論DPU時,我們在談論什么

作者: 時間:2024-06-25 來源:EEPW 收藏

2024年6月19日,重新定義——2024產(chǎn)品發(fā)布會順利舉辦,這對來說是個大日子。故事還要從6年前說起,據(jù)CEO鄢貴海分享,“從創(chuàng)立之處中科馭數(shù)團隊就帶著對科技創(chuàng)新無比堅定的信念、對發(fā)展自主可控核心技術的不懈追求,對變幻莫測的市場的深深敬畏,和對未來智能計算技術趨勢的研判,從實驗室勇敢地邁出了科技創(chuàng)業(yè)的穩(wěn)健步伐。不僅要把做成一個產(chǎn)品,更要把“馭數(shù)”做成一個品牌,做成一個在數(shù)字時代助力數(shù)字中國的品牌,成為這個時代趁勢而上的企業(yè)?!薄?/span>

本文引用地址:http://m.butianyuan.cn/article/202406/460320.htm

1719300527641869.jpg


在復雜大型芯片每代產(chǎn)品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年的時間,完成了三代芯片的迭代,平均每代芯片迭代僅有不到2年的時間。同時在成本控制上,也遠小于行業(yè)的平均值。其秘訣——就是全棧技術自主研發(fā),重硅前驗證,快速迭代。用理論來指導實踐,而非盲目地訴諸于通過工程試錯來優(yōu)化設計。

何為“重新定義

DPU是當下算力基礎設施的核心創(chuàng)新之一,被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比數(shù)據(jù)網(wǎng)絡的——高鐵時代,已經(jīng)不僅僅是連通城市問題,而是徹底重構了地理位置的邏輯距離。

1719300550550932.png

如果把CPU比做大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞。CPU承載了應用生態(tài),決定了計算系統(tǒng)是否可以通用;GPU提供了高密度各類精度的算力,決定了系統(tǒng)是否有足夠的“力量”;DPU負責數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。

關于DPU的重新定義,鄢貴海表示可以從兩個維度來深入理解。首先,DPU已超越單純的芯片范疇,它涵蓋了更廣泛的架構和軟件生態(tài)。同時我們也強調了軟件護城的概念,這意味著基礎軟件和平臺在云端的深度集成與應用是DPU技術落地的關鍵。因此,要真正發(fā)揮DPU的潛力,需要在架構、軟件以及應用這三個層次上共同發(fā)力。

第二個維度涉及DPU的目標應用。傳統(tǒng)的DPU理解往往局限于卸載CPU上的某些任務,但這種觀念已經(jīng)過時且具有誤導性。如今的DPU應用遠不止于此,它處理的任務類型更為廣泛和復雜。例如,在處理安全業(yè)務或構建分布式安全機制時,DPU能夠輕松應對CPU難以有效處理的負載。DPU已成為算網(wǎng)融合的關鍵組件,特別是在網(wǎng)絡中進行計算的任務,這是CPU無法替代的。

綜上所述,DPU的定義需要分層次理解,不能僅局限于芯片本身。同時,也應該摒棄狹義的DPU功能認知,而是將其置于更廣泛的分布式和集群性系統(tǒng)背景下考慮。這樣才能更準確地把握DPU在計算機系統(tǒng)中所承載的負載類型,從而更好地利用這一關鍵組件提升系統(tǒng)的整體性能。

不同技術路線的DPU

       全球DPU芯片市場正在經(jīng)歷一場由多家科技巨頭引領的變革。NVIDIA之外,Intel在2015年收購Altera后,于2021年6月推出了IPU類DPU產(chǎn)品,而Marvell自2018年起通過收購Cavium、Avera Semiconductor和Innovium等公司增強實力。Xilinx在2019年收購Solarflare后,于2020年發(fā)布Alveo系列加速卡,隨后于2022年被AMD收購,進一步擴大了AMD在DPU領域的布局,完成了從CPU、GPU、FPGA到DPU的全云端覆蓋。

國內市場上,除了阿里巴巴、華為和騰訊等領軍企業(yè)外,新興廠商如中科馭數(shù)、云豹智能、云脈芯聯(lián)等也紛紛崛起。

在技術層面,DPU的不同技術路徑各有優(yōu)劣。ASIC以其高性能、低功耗和低成本著稱,但可編程性較低;FPGA提供了高靈活性和可編程性,但成本高昂、功耗較大;而基于SoC的技術路線,如NVIDIA的Blue Field DPU,以其可編程性和高靈活性成為DPU發(fā)展的主流方向,為更復雜、更廣泛的應用場景提供了更優(yōu)的實施選項。

中科馭數(shù)CTO盧文巖指出,F(xiàn)PGA在過去兩年中因其開發(fā)效率而受到廣泛青睞,但其局限性也愈發(fā)明顯:功耗偏高、頻率難以大幅提升,且資源受限。因此,F(xiàn)PGA更適合作為DPU產(chǎn)品早期驗證階段的產(chǎn)品路線。

中科馭數(shù)所走的技術路線與AMD相近,強調可編程處理核心與輕量級控制的結合,這種技術策略近期表現(xiàn)出強勁的生命力。業(yè)界普遍認可的重數(shù)據(jù)通路加輕量級控制的趨勢,正是中科馭數(shù)與AMD所采納的發(fā)展方向,并經(jīng)過數(shù)年探索,這一路線已得到業(yè)界的廣泛認同。

打造獨立自主的DPU生態(tài)

國內首顆量產(chǎn)全功能DPU芯片K2-Pro,由中科馭數(shù)研發(fā),是專為突破大規(guī)模數(shù)據(jù)中心性能瓶頸而設計的高效數(shù)據(jù)處理芯片。它采用自主研發(fā)的KPU架構,集成了網(wǎng)絡、存儲、安全及計算等多功能,實現(xiàn)包處理速率翻倍至80Mpps,并支持高達200G的網(wǎng)絡帶寬。

K2-Pro憑借高度可編程性,為數(shù)據(jù)中心提供了靈活擴展性,并在處理復雜任務時能耗降低30%。作為純國產(chǎn)高性能解決方案,K2-Pro適用于云計算、智能計算及高性能計算等領域。其背后的KPU架構基于“軟件定義硬件”技術,通過定制化的功能核實現(xiàn)高效處理,而KISA指令集則是業(yè)界首個面向DPU的專用指令系統(tǒng),支持敏捷異構。


1719300588368187.jpg 

在專用計算領域,DPU作為一種復雜的算力芯片,其編程范式的多樣性和不統(tǒng)一性,很難滿足上層應用敏捷迭代的需求。KISA(Kernel-based Instruction Set Architecture)是中科馭數(shù)面向DPU強IO、強數(shù)據(jù)、弱控制、敏捷異構的需求而推出的強擴展指令集,是業(yè)界首個面向DPU領域的專用指令集。不同于傳統(tǒng)的CPU指令集,KISA面向數(shù)據(jù)而非控制,高計算密度型而非低計算密度型,以數(shù)據(jù)流為基本操作單元,而非字節(jié)。更重要的是,KISA首次在指令集層次支持敏捷異構,用一套統(tǒng)一的指令實現(xiàn)了多種異構處理核進行管理調度。

目前,KISA指令集涵蓋了KISA基礎架構、以及面向DPU專用處理擴展指令,包含包解析、轉發(fā)指令、以及表查詢指令等?;贙ISA已經(jīng)覆蓋25大類應用場景,累計數(shù)百個用例,得到非常充分驗證。

1719300630974763.jpg

此外,中科馭數(shù)還推出了DPU敏捷異構軟件開發(fā)平臺HADOS 3.0,該平臺集成了DPU核心軟件能力,并提供了豐富的API和模塊,已廣泛應用于金融、電信等行業(yè),展現(xiàn)出與業(yè)界巨頭競爭的實力。K2-Pro芯片的成功研發(fā),使得中科馭數(shù)能夠推出思威、福來、功夫三大產(chǎn)品系列,精準滿足各類業(yè)務場景需求。

潛力無限的DPU市場

隨著信息技術的持續(xù)發(fā)展,數(shù)據(jù)中心網(wǎng)絡帶寬從100G邁入400G,甚至將提升至800G或1.6T。然而,作為提供算力的物理載體,受限于通用CPU的結構的馮諾依曼瓶頸、摩爾定律逐漸失效等因素的影響,以CPU為網(wǎng)絡核心的數(shù)據(jù)處理能力難以支持大規(guī)模新型數(shù)據(jù)中心的網(wǎng)絡和數(shù)據(jù)的算力需求。

由此,DPU已經(jīng)成為繼CPU、GPU之后未來數(shù)據(jù)中心的第三顆主力芯片。DPU提供的高吞吐、低時延、基礎設施卸載能力,幫助數(shù)據(jù)中心完美的規(guī)避了“信息孤島”問題。未來的技術發(fā)展趨勢將會是高度集成化的片上數(shù)據(jù)中心的模式(Data Center Infrastructure on a chip),即一個GPU、CPU、DPU共存的時代。

全球范圍內,英偉達、英特爾、AMD、微軟等業(yè)界巨頭紛紛在DPU領域展開積極布局。特別是英偉達,憑借其GPU與DPU的強強聯(lián)合,推出了針對高性能計算的先進算力方案,并在每年的GTC大會上持續(xù)展現(xiàn)其創(chuàng)新實力。而在國內,中科馭數(shù)更是脫穎而出,率先完成了三代DPU芯片的研發(fā)迭代,并成功實現(xiàn)規(guī)模化商用,展現(xiàn)了國內DPU產(chǎn)業(yè)的強勁實力。

從國際市場上來看,2020年,全球DPU市場空間為30.5億美元,截至2021年達到50.7億美元,預計至2025年,市場空間將有望達到245.3億美元,五年復合增速為51.73%。

1719300646621123.png

近年來,受新基建、數(shù)字化轉型及數(shù)字中國等國家政策推動,以及企業(yè)降本增效的迫切需求,我國數(shù)據(jù)中心業(yè)務收入呈現(xiàn)出持續(xù)高速增長的態(tài)勢。據(jù)權威統(tǒng)計,2021年我國數(shù)據(jù)中心行業(yè)市場收入已高達1500.2億元,同比增長率高達28.5%。隨著各地區(qū)、各行業(yè)數(shù)字化轉型的深入,預計數(shù)據(jù)中心市場收入將持續(xù)保持增長。

根據(jù)2023年《中國數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展白皮書》,預計至 2025 年“十四五”規(guī)劃期末,擬實現(xiàn)數(shù)據(jù)中心機架規(guī)模增長至 1400 萬架,規(guī)??偭糠瓋杀?,總增量投資約7000 億元。

按服務器規(guī)模預計,未來幾年云與數(shù)據(jù)中心領域每年國內服務器出貨量將維持在500萬臺左右,其中DPU滲透率在10%左右,單臺服務器可以配置一塊到多塊DPU板卡,預計每年DPU需求量將在100萬片左右。

云計算行業(yè)也呈現(xiàn)出強勁的增長勢頭。隨著數(shù)據(jù)中心帶寬的不斷迭代(平均每2-3年一次),DPU(數(shù)據(jù)處理單元)在支持用戶數(shù)據(jù)中心帶寬升級和靈活部署新功能方面發(fā)揮著重要作用。2017-2019年,我國云計算行業(yè)規(guī)模增速均保持在30%以上,2021年市場規(guī)模更是達到了3102億元。亞馬遜、阿里云、華為等云計算巨頭紛紛發(fā)展符合自身需求的DPU產(chǎn)品線,以應對市場的高速增長。

在自動駕駛領域,DPU的部署將顯著提升車載終端的處理能力和傳輸速率,降低時延,確保車輛在高速移動場景下維持穩(wěn)定的數(shù)據(jù)交換。未來,智能駕駛的每個車機節(jié)點都可以視為一個小型數(shù)據(jù)中心,產(chǎn)生大量的數(shù)據(jù)處理、轉發(fā)、交換和存儲需求。預計每輛智能駕駛汽車都將配備DPU以降低無線側傳輸時延。例如,NVIDIA的智能駕駛平臺Atlan就集成了DPU芯片,并計劃于2025年應用于車機之上。隨著L3及以上級別自動駕駛汽車的逐步落地,DPU在車載領域的應用前景廣闊。

       綜上所述,DPU技術作為數(shù)據(jù)中心繼CPU、GPU之后的第三顆主力芯片,其未來的發(fā)展勢頭強勁且前景廣闊。隨著數(shù)字化轉型的深入推進和AI技術的飛速發(fā)展,數(shù)據(jù)處理和計算需求呈現(xiàn)爆炸式增長,DPU以其高效的數(shù)據(jù)處理能力和低延遲特性,正逐步成為算力基礎設施中的關鍵組成部分。

我們期待在中科馭數(shù)作為國產(chǎn)DPU廠商能夠帶領行業(yè)扎實走好創(chuàng)新之路,助力大數(shù)據(jù)時代的發(fā)展,推動“3U一體”的國內認知和布局。



關鍵詞: 中科馭數(shù) DPU

評論


技術專區(qū)

關閉