新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 英特爾緊隨英偉達(dá)步伐,擬推中國特供版AI芯片,高端AI芯片受限為中國企業(yè)帶來新機(jī)遇?

英特爾緊隨英偉達(dá)步伐,擬推中國特供版AI芯片,高端AI芯片受限為中國企業(yè)帶來新機(jī)遇?

作者: 時(shí)間:2024-04-17 來源:搜芯易 收藏

據(jù)報(bào)道,在美國限制措施的壓力下,計(jì)劃效仿,為中國市場打造“特別版”的加速芯片—Gaudi 3。這兩款相關(guān)產(chǎn)品據(jù)傳將于6月底和9月底發(fā)布。

本文引用地址:http://m.butianyuan.cn/article/202404/457722.htm

最近發(fā)布了新一代加速芯片Gaudi 3。表示正在準(zhǔn)備為中國市場推出特制版的Gaudi 3。這包括兩種硬件版本:HL-328 OAM兼容的夾層卡和HL-388 PCIe加速器卡。HL-328定于6月24日發(fā)布,而HL-388則定于9月24日發(fā)布。

在規(guī)格方面,中國特制版與原版共享相同的特性,包括96MB片上SRAM內(nèi)存、128GB HBM2e高帶寬內(nèi)存(帶寬為每秒3.7TB)、PCIe 5.0X16接口和解碼標(biāo)準(zhǔn)。

不過,由于美國對芯片的出口限制,高性能AI的綜合計(jì)算性能(TPP)必須低于4800才能出口到中國。這意味著中國特制版的16位性能不能超過150 TFLOPS。

相比之下,原版Gaudi 3在FP16/BF16下可實(shí)現(xiàn)1835 TFLOPS。這與的H100相比,在大模型訓(xùn)練方面大約慢40%,在推理任務(wù)方面效率低50%。

因此,為中國市場打造的特制版將需要大幅減少內(nèi)核數(shù)量(原版擁有8個(gè)矩陣乘法引擎(MME)和64個(gè)張量處理器核心(TPC)引擎)和工作頻率。最終,這可能導(dǎo)致其AI性能降低約92%,以符合美國的出口管制要求。英特爾為中國市場推出的特制版AI性能將與為中國市場定制的H20 AI加速器卡相當(dāng)。

英特爾Gaudi 3的中國特制版在FP16/BF16下性能達(dá)到148 TFLOPS,略低于150 TFLOPS的限制。然而,在高帶寬內(nèi)存(HBM)容量和帶寬方面,中國特制版Gaudi 3將低于英偉達(dá)的H20,這可能使其在競爭中處于劣勢。當(dāng)然,價(jià)格也將是決定其是否具有競爭優(yōu)勢的關(guān)鍵因素。

據(jù)報(bào)道,該芯片的價(jià)格被認(rèn)為與其競爭對手華為的產(chǎn)品相當(dāng)。英偉達(dá)H20的訂購價(jià)格在每片12000至15000美元之間。

短期內(nèi)中國企業(yè)仍將繼續(xù)購買現(xiàn)有的AI芯片。除了現(xiàn)有的A800或H800庫存,英偉達(dá)設(shè)計(jì)的專門針對中國市場的GPU AI加速器芯片—包括H20、L20和L2仍然是首要選擇。長期來看,預(yù)計(jì)中國CSP將加速發(fā)展,其中阿里巴巴的T-Head和百度在這一領(lǐng)域尤其活躍,依賴臺(tái)積電和三星等代工廠進(jìn)行生產(chǎn)。同時(shí),華為、百瑞恩等中國主要AI企業(yè)將繼續(xù)開發(fā)通用AI芯片,為本地企業(yè)提供AI解決方案。除了開發(fā)AI芯片外,這些公司還在中國建立國內(nèi)AI服務(wù)器生態(tài)系統(tǒng)。TrendForce認(rèn)為成功的關(guān)鍵因素之一將是中國政府通過本地化項(xiàng)目(如涉及中國電信運(yùn)營商的項(xiàng)目)對國產(chǎn)AI芯片的采用給予支持。

最后,在高端AI芯片開發(fā)受限背景下,TrendForce認(rèn)為中國可在中低端邊緣AI服務(wù)器市場找到機(jī)遇。這些服務(wù)器對AI計(jì)算能力的需求較低,適用于商業(yè)聊天機(jī)器人、視頻流、互聯(lián)網(wǎng)平臺(tái)和汽車輔助系統(tǒng)等應(yīng)用。它們可能不完全受美國限制的影響,因此成為中國企業(yè)在AI市場的一個(gè)潛在增長方向。




關(guān)鍵詞: 英特爾 英偉達(dá) AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉