谷歌迅速成為Nvidia強(qiáng)大的競(jìng)爭(zhēng)對(duì)手
谷歌迅速成為Nvidia強(qiáng)大的競(jìng)爭(zhēng)對(duì)手 —— 驅(qū)動(dòng)其超級(jí)計(jì)算機(jī)的TPU v5p人工智能芯片比以往任何時(shí)候都更快,具有更大的內(nèi)存和帶寬,甚至勝過(guò)強(qiáng)大的H100
本文引用地址:http://m.butianyuan.cn/article/202312/454248.htm谷歌伴隨其Gemini人工智能模型的最新推出,發(fā)布了用于人工智能訓(xùn)練和推理的旗艦張量處理單元(TPU)的最新版本,這似乎是試圖挑戰(zhàn)Nvidia市場(chǎng)領(lǐng)先的GPU。
TPU v5p —— 谷歌最強(qiáng)大的定制設(shè)計(jì)人工智能加速器 —— 已經(jīng)部署以驅(qū)動(dòng)該公司的“AI超級(jí)計(jì)算機(jī)”。這是一個(gè)專(zhuān)門(mén)用于運(yùn)行人工智能應(yīng)用的超級(jí)計(jì)算機(jī)架構(gòu),而不是通常用于運(yùn)行科學(xué)工作負(fù)載的超級(jí)計(jì)算機(jī),因?yàn)門(mén)PU不適用于這種工作負(fù)載。
其TPU的最新版本每個(gè)架構(gòu)(組成系統(tǒng)的一部分)有8960個(gè)芯片,而v4中有4096個(gè),其總浮點(diǎn)運(yùn)算數(shù)(FLOPs)每個(gè)架構(gòu)的可用性方面具有四倍的可伸縮性。這些新的架構(gòu)提供4800Gbps的吞吐量。新的架構(gòu)還配備了95GB的高帶寬內(nèi)存(HBM),而TPU v4中的HBM RAM為32GB。
Nvidia H100 vs 谷歌 TPU v5p:哪個(gè)更快?與Nvidia將其GPU提供給其他公司購(gòu)買(mǎi)不同,谷歌的定制TPU仍然在內(nèi)部使用,用于其自己的產(chǎn)品和服務(wù)。谷歌的TPU長(zhǎng)期以來(lái)一直用于推動(dòng)其服務(wù),包括Gmail、YouTube和Android,而最新版本也用于訓(xùn)練Gemini。
谷歌的v5p TPU比TPU v4在訓(xùn)練大型語(yǔ)言模型方面快2.8倍,性?xún)r(jià)比提高了2.1倍。盡管今年早些時(shí)候發(fā)布的中間版本TPU v5e在所有三者中提供了最高性?xún)r(jià)比,但它只比TPU v4快1.9倍,使TPU v5p成為最強(qiáng)大的版本。
它甚至足夠強(qiáng)大,可以與Nvidia廣受歡迎的H100 GPU媲美,后者是最適用于AI工作負(fù)載的最佳顯卡之一。根據(jù)該公司自己的數(shù)據(jù),該組件在訓(xùn)練工作負(fù)載方面比Nvidia的A100 GPU快四倍。
與此同時(shí),谷歌的TPU v4據(jù)估計(jì)比A100快1.2到1.7倍,根據(jù)其在四月份發(fā)布的研究。因此,極其粗略的計(jì)算表明,TPU v5p相對(duì)于A(yíng)100大約快3.4到4.8倍,使其與H100相當(dāng)或更強(qiáng)大,盡管在得出任何結(jié)論之前需要更詳細(xì)的基準(zhǔn)測(cè)試。
評(píng)論