曾號(hào)稱碾壓英偉達(dá)!壁仞科技:單個(gè)國產(chǎn)AI芯片不強(qiáng)但數(shù)量多、軟件加持就不一樣了
7月10日消息,近日,壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆在談及計(jì)算瓶頸時(shí)表示,解決算力瓶頸問題需要從三個(gè)維度考慮:硬件集群算力、軟件有效算力、異構(gòu)聚合算力。
本文引用地址:http://m.butianyuan.cn/article/202407/460816.htm他認(rèn)為,做好這三個(gè)維度的工作,即使國產(chǎn)AI芯片單個(gè)算力不強(qiáng),也能通過綜合手段提升算力,滿足國內(nèi)大模型訓(xùn)練的需求。
“我們2020年設(shè)計(jì)的第一代產(chǎn)品里就做了chiplet架構(gòu),國外巨頭在今年發(fā)布的產(chǎn)品如英偉達(dá)B100和英特爾Gaudi 3也采用了同樣的思路,他們用最先進(jìn)的制程,但也需要chiplet來突破摩爾定律限制來提升單卡算力。”丁云帆說道。
據(jù)他介紹,壁仞科技用三級(jí)的異步checkpoint技術(shù),結(jié)合GPU的顯存和CPU內(nèi)存,甚至是多節(jié)點(diǎn)內(nèi)存的備份系統(tǒng)去達(dá)到一個(gè)平衡,目前已能夠大幅降低故障恢復(fù)成本。
之前,壁仞科技發(fā)布首款通用GPU芯片BR100,創(chuàng)下全球算力紀(jì)錄,16位浮點(diǎn)算力達(dá)到1000T以上、8位定點(diǎn)算力達(dá)到2000T以上,單芯片峰值算力達(dá)到PFLOPS級(jí)別。
當(dāng)時(shí),壁仞科技給出的數(shù)據(jù)顯示,其首款旗艦產(chǎn)品BR100對(duì)比英偉達(dá)在售的旗艦GPU峰值算力在Int8、BF16、TF32/TF32+、FP32數(shù)據(jù)格式下最少有3.3倍的峰值性能優(yōu)勢,在FP32數(shù)據(jù)格式下性能優(yōu)勢更是達(dá)到了13.1倍。
評(píng)論