新聞中心

EEPW首頁 > 物聯(lián)網(wǎng)與傳感器 > 業(yè)界動態(tài) > AI/ML數(shù)據(jù)中心的多太比特互連解決方案

AI/ML數(shù)據(jù)中心的多太比特互連解決方案

作者:EEPW 時間:2024-09-03 來源:EEPW 收藏

即使在AI出現(xiàn)之前,從物聯(lián)網(wǎng)到云計算的一系列數(shù)字創(chuàng)新就已經(jīng)產(chǎn)生了對服務(wù)的前所未有的需求。在這一需求之上,生成式AI、大型語言模型(LLMs)及其他耗電量大的AI相關(guān)工作負載的需求如洪水般涌現(xiàn)。因此,AI/ML正在迅速轉(zhuǎn)向多太比特網(wǎng)絡(luò)傳輸速度,以跟上AI相關(guān)工作負載所需的計算資源的不斷增加。

本文引用地址:http://m.butianyuan.cn/article/202409/462607.htm

盡管當(dāng)今的主要依賴于400-Gb以太網(wǎng)(400G)網(wǎng)絡(luò)設(shè)備,但根據(jù)Dell’Oro Group的預(yù)測,到2025年,大多數(shù)AI后端端口將達到800G。而到2027年,大多數(shù)AI GPU集群預(yù)計將達到1.6T。更高速度的網(wǎng)絡(luò)技術(shù)消耗更多的電力并產(chǎn)生更多的熱量,這促使數(shù)據(jù)中心運營商尋求更節(jié)能、低成本的基礎(chǔ)設(shè)施解決方案。

其中一個創(chuàng)新領(lǐng)域是高速互連技術(shù),它負責(zé)在AI加速器、交換機、服務(wù)器及其他組件之間傳輸數(shù)據(jù)、應(yīng)用和工作負載。傳統(tǒng)的選擇是銅纜和光纖互連,每種技術(shù)都有顯著的優(yōu)勢和挑戰(zhàn)。

一種更新的解決方案是通過塑料電纜進行射頻傳輸,簡稱e-Tube。這為GPU集群的后端擴展提供了一個引人注目的第三選擇,特別是在需要太比特以上速度以支持AI/ML工作負載的情況下。

銅纜和光纖互連的權(quán)衡

長期以來,銅纜直連電纜(DAC)一直是400G網(wǎng)絡(luò)設(shè)備的默認選擇。銅纜互連因其簡單、便宜、可靠,且非常適合短距離應(yīng)用(如機架頂部的交換機連接)而聞名。然而,隨著網(wǎng)絡(luò)速度的提升以支持800G甚至1.6T以太網(wǎng)及更高速度,銅纜互連的局限性變得越來越明顯。

銅纜在速度增加時會遭受顯著的信號損失(如圖1所示),特別是在短距離的應(yīng)用中,這成為一個問題。盡管技術(shù)上可以通過使用更厚的銅線來延長電纜長度,但這樣一來,DAC本身會變得過于厚重和僵硬,無法部署。

因此,企業(yè)和超大規(guī)模數(shù)據(jù)中心紛紛轉(zhuǎn)向光纖互連,包括有源光纜(AOC),用于許多AI相關(guān)工作負載。由于光纖通過光信號傳輸數(shù)據(jù),傳輸速度更快,距離更長,并且信號損失極小。此外,光纖互連比銅纜明顯更薄、更輕。

然而,光纖互連也比銅纜復(fù)雜得多,耗電量更大,且成本更高,因為它們需要昂貴的電光組件進行電光轉(zhuǎn)換。與銅纜相比,光纖互連的成本可能高達7倍(如圖2所示)。

隨著網(wǎng)絡(luò)速度的增加,光纖互連的功耗迅速上升(如圖3所示)。這種成本和功耗問題使得完全依賴光纖解決方案來實現(xiàn)多太比特速度變得不切實際。

為了應(yīng)對光纖互連的一些問題,諸如共封裝光學(xué)技術(shù)(CPO)等創(chuàng)新應(yīng)運而生,這些技術(shù)支持更好的能效和更高的密度。然而,共封裝光學(xué)仍然面臨傳統(tǒng)光纖解決方案的成本、散熱、功耗和可靠性挑戰(zhàn)。盡管它們可能為中層交換機提供一個可行的解決方案,但對于高容量的機架內(nèi)、相鄰機架和背板應(yīng)用而言,共封裝光學(xué)仍然在成本和功耗方面存在較大的限制。

e-Tube:更好的射頻傳輸替代方案

鑒于銅纜的物理限制以及光纖互連的高功耗和高成本特性,人們對低功耗、低延遲且具有成本效益的多太比特可擴展互連技術(shù)的興趣日益濃厚。e-Tube技術(shù)是一種通過塑料電介質(zhì)波導(dǎo)進行射頻數(shù)據(jù)傳輸?shù)目蓴U展互連平臺,波導(dǎo)由普通的塑料材料制成。

e-Tube電纜的重量比銅纜輕80%,體積小50%。它們不會像銅纜那樣在高頻時遭受信號損失,因此同樣的e-Tube內(nèi)核可用于1.6T、3.2T,甚至更高速度的未來電纜。由于e-Tube是一種不需要功耗大的昂貴光學(xué)組件的電子技術(shù),電纜的能效大約比共封裝光學(xué)(CPO)高50%,比傳統(tǒng)的重定時光纖高約75%(如圖4所示)。

e-Tube的延遲以皮秒計算,比傳統(tǒng)光纖電纜快了三個數(shù)量級(如圖5所示)。

在機架內(nèi)和相鄰機架的通信鏈路中,e-Tube電纜提供了比銅纜更低的損耗、更長的傳輸距離和更高的能效,成本相似。根據(jù)MSA定義的標(biāo)準(zhǔn)設(shè)計和測試,這些電纜可以與現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備生態(tài)系統(tǒng)兼容使用。

e-Tube電纜利用成熟的半導(dǎo)體工藝技術(shù)和電纜制造設(shè)備,最大限度地減少了電纜制造商的資本支出。由于比銅纜體積小50%,薄型的e-Tube電纜有助于消除機架擁堵,并使安裝更加易于維護,使其成為太比特機架內(nèi)和相鄰機架應(yīng)用中最多達7米的理想選擇。

企業(yè)和超大規(guī)模數(shù)據(jù)中心需要權(quán)衡用光纖技術(shù)替代銅纜的所有優(yōu)勢和局限性。e-Tube為超大規(guī)模云數(shù)據(jù)中心、AI/ML GPU部署和高性能計算集群中的機架內(nèi)和相鄰機架部署提供了一個更好的選擇。盡管沒有一種解決方案可以滿足所有需求,但對于數(shù)據(jù)中心中的AI/ML應(yīng)用,e-Tube為其他新興的光纖互連解決方案提供了一個有前景的替代方案(如圖6所示)。



關(guān)鍵詞: 數(shù)據(jù)中心

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉