新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò)與存儲(chǔ) > 設(shè)計(jì)應(yīng)用 > 應(yīng)對(duì)人工智能數(shù)據(jù)中心的電力挑戰(zhàn)

應(yīng)對(duì)人工智能數(shù)據(jù)中心的電力挑戰(zhàn)

作者: 時(shí)間:2024-06-24 來(lái)源:安森美 收藏


本文引用地址:http://m.butianyuan.cn/article/202406/460233.htm

image.png

國(guó)際能源署 (IEA)的數(shù)據(jù)表明,2022 年的耗電量約占全球總用電量的 2%,達(dá)到 460 TWh 左右。如今,加密貨幣和/機(jī)器學(xué)習(xí) (AI/ML) 等高耗能應(yīng)用方興未艾,而這些技術(shù)中通常需要部署大量的高性能圖形處理單元 (GPU)。因此,耗電量仍將不斷攀升。

應(yīng)用的擴(kuò)展速度令人震驚。ChatGPT 上線僅 5 天,用戶數(shù)量就達(dá)到了 100 萬(wàn),并在 2 個(gè)月內(nèi)突破了 1 億,這一增長(zhǎng)速度遠(yuǎn)超于 TikTok 和 Instagram。GPT-4 訓(xùn)練包含超過(guò) 1.7 萬(wàn)億參數(shù)和 13 萬(wàn)億 token,總共使用了 2.5 萬(wàn)個(gè) NVIDIA A100 GPU,每臺(tái)服務(wù)器的功耗約為 6.5 kW。據(jù) OpenAI 稱(chēng),GPT-4 的訓(xùn)練耗時(shí) 100 天,消耗能源約 50 GWh,耗資 1 億美元。

在當(dāng)前環(huán)境中,我們很難準(zhǔn)確估計(jì)未來(lái)耗電情況,其中為支持而部署的 GPU 消耗了大部分電力。國(guó)際能源署保守預(yù)測(cè),到 2026 年,的耗電量將至少達(dá)到 650 TWh,甚至可能超過(guò) 1,000 TWh。

人工智能數(shù)據(jù)中心的架構(gòu)演變

早期數(shù)據(jù)中心將電網(wǎng)電壓集中轉(zhuǎn)換為 12V,然后通過(guò)總線將電力傳輸至服務(wù)器,再通過(guò)邏輯電平轉(zhuǎn)換器將電壓轉(zhuǎn)換為 3.3/5V。然而功率需求不斷提升,這種供電方法的電能損耗變得不可接受。因此,母線電壓被提高到 48V,電流減小到原來(lái)的 1/4,損耗降低到了原來(lái)的 1/16。

而目前處理器電壓進(jìn)一步降低,從 3.3V 降到了低于 1V 的亞伏特級(jí)別,此時(shí)就需要使用多條功率相對(duì)較高的電壓軌。這進(jìn)而催生了兩級(jí)電壓轉(zhuǎn)換方案。該方案使用 DC-DC 轉(zhuǎn)換器作為中間總線轉(zhuǎn)換器 (IBC),先將 48V 電壓轉(zhuǎn)換為 12V 的局部總線電壓,然后再將此轉(zhuǎn)換為所需的低電壓。

1719199390491380.png

圖1 典型服務(wù)器電源架構(gòu)–中間總線

人工智能數(shù)據(jù)中心需要高能效電源轉(zhuǎn)換

功率損耗帶來(lái)了雙重挑戰(zhàn),不僅會(huì)造成能源浪費(fèi)、增加運(yùn)營(yíng)成本,而且會(huì)產(chǎn)生大量熱量,進(jìn)而需占用更大空間、消耗更多成本。運(yùn)營(yíng)超大規(guī)模人工智能數(shù)據(jù)中心時(shí),機(jī)架功率需求為 120 kW。將電網(wǎng)電力轉(zhuǎn)換為 GPU 所用電壓的能效約為 88%,這意味著會(huì)產(chǎn)生大約 15 kW 廢熱,并需要通過(guò)液冷技術(shù)進(jìn)行有效散熱。

在服務(wù)器電源設(shè)計(jì)中,能效和功率密度是兩個(gè)重要概念,二者相輔相成。我們必須盡可能高效地將來(lái)自電網(wǎng)的能量轉(zhuǎn)換為有用功率,減少損耗。為此,電源拓?fù)洳粩嘌葑儯瑯I(yè)界開(kāi)發(fā)了同步整流等技術(shù),并在整流器中采用 MOSFET 取代了損耗較大的二極管。

改進(jìn)拓?fù)浣Y(jié)構(gòu)只成功了一半。為了優(yōu)化能效,還必須盡可能提高所有元器件的能效,尤其是對(duì)轉(zhuǎn)換過(guò)程至關(guān)重要的 MOSFET。

MOSFET 并非無(wú)損耗器件,在導(dǎo)通和開(kāi)關(guān)過(guò)程中也會(huì)產(chǎn)生損耗。隨著服務(wù)器電源不斷提高運(yùn)行頻率以縮小尺寸,開(kāi)關(guān)損耗成為了優(yōu)化的重點(diǎn)。

高效PowerTrench? MOSFET

(onsemi) 的中低壓 T10 PowerTrench? MOSFET 采用了新型屏蔽柵極溝槽技術(shù),降低了開(kāi)關(guān)損耗和導(dǎo)通損耗,并進(jìn)而顯著降低了其 Qg,RDS(ON) 也降至 1mOhm 以下。其中的先進(jìn)軟恢復(fù)體二極管緩解了振鈴、過(guò)沖和噪聲問(wèn)題,同時(shí)降低了 Qrr 損耗,為快速開(kāi)關(guān)應(yīng)用找到了性能與恢復(fù)時(shí)間的平衡點(diǎn)。

與早期器件相比,這些新型 MOSFET 可使開(kāi)關(guān)損耗降低高達(dá) 50%,并使導(dǎo)通損耗降低 30% 以上。

1719199408719834.png

圖2 PowerTrench? T10 MOSFET的優(yōu)勢(shì)

新型 40V和 80V T10 PowerTrench 器件的 RDS(on) 表現(xiàn)出色。NTMFWS1D5N08X(80 V、1.43 mΩ、5 mm x 6 mm SO8-FL 封裝)和 NTTFSSCH1D3N04XL(40 V、1.3 mΩ、3.3 mm x 3.3 mm 源極向下雙散熱封裝)具有優(yōu)異的品質(zhì)因數(shù) (FOM),是人工智能數(shù)據(jù)中心電源供應(yīng)器(PSU) 和中間總線轉(zhuǎn)換器應(yīng)用的理想選擇。T10 PowerTrench MOSFET 符合嚴(yán)格的 Open Rack V3 能效標(biāo)準(zhǔn),即能效達(dá)到 97.5% 以上。



評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉