IBM和NVIDIA新款人工智能服務(wù)器又把英特爾秒了

作者：時(shí)間：2016-09-12 來(lái)源：雷鋒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

編者按：在傳統(tǒng)服務(wù)器芯片市場(chǎng)，英特爾是個(gè)巨無(wú)霸，無(wú)論是IBM Power還是ARM陣營(yíng)，所占有的份額都微乎其微。但戰(zhàn)線(xiàn)轉(zhuǎn)移到人工智能領(lǐng)域，IBM似乎更有優(yōu)勢(shì)。

　　另外，Tesla P100的半精度浮點(diǎn)運(yùn)算性能達(dá)到了每秒21萬(wàn)億次 —— 比插入現(xiàn)代PCI-E插槽的GPU高出大約14%，這樣的處理能力對(duì)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的重要性不言而喻。

本文引用地址：http://m.butianyuan.cn/article/201609/296831.htm

　　IBM還做了個(gè)縱向?qū)Ρ?，和老款Power S822LC服務(wù)器的Tesla K80 GPU加速器相比，新款服務(wù)器的加速能力提升了兩倍多。

　　預(yù)計(jì)明年問(wèn)世的IBM Power9會(huì)延續(xù)對(duì)CPU+GPU組優(yōu)化。

　　為何是“CPU+GPU”?

　　眾所周知，在人工智能人工智能和深度學(xué)習(xí)等計(jì)算任務(wù)上，CPU早已不堪重任。因此，不少企業(yè)紛紛推出人工智能專(zhuān)用芯片概念，例如谷歌的TPU(Tensor Processing Unit);還有業(yè)內(nèi)人士力挺FPGA更適合深度學(xué)習(xí)的算法，這也是英特爾以高價(jià)收購(gòu)Altera的主要原因。

　　不過(guò)，上述兩個(gè)替代CPU的方案都還未成熟，目前大多數(shù)企業(yè)采用的依然是“CPU+GPU”的組合，或者稱(chēng)為異構(gòu)服務(wù)器。通常來(lái)說(shuō)，在這種異構(gòu)模式下，應(yīng)用程序的串行部分在CPU上運(yùn)行，而GPU作為協(xié)處理器，主要負(fù)責(zé)計(jì)算任務(wù)繁重的部分。

　　因?yàn)楹虲PU相比，GPU的優(yōu)勢(shì)非常明顯：

　　1.CPU主要為串行指令而優(yōu)化，而GPU則是為大規(guī)模的并行運(yùn)算而優(yōu)化。所以，后者在大規(guī)模并行運(yùn)算的速度更快;

　　2.同等面積下，GPU上擁有更多的運(yùn)算單元(整數(shù)、浮點(diǎn)的乘加單元，特殊運(yùn)算單元等等);

　　3.一般情況下，GPU擁有更大帶寬的 Memory，因此在大吞吐量的應(yīng)用中也會(huì)有很好的性能。

　　4.GPU對(duì)能源的需求遠(yuǎn)遠(yuǎn)低于CPU。

　　當(dāng)然，這并不代表人工智能服務(wù)器對(duì)CPU沒(méi)有需求，CPU依然是計(jì)算任務(wù)不可或缺的一部分，在深度學(xué)習(xí)算法處理任務(wù)中還需要高性能的CPU來(lái)執(zhí)行指令并且和GPU進(jìn)行數(shù)據(jù)傳輸，同時(shí)發(fā)揮CPU的通用性和GPU的復(fù)雜任務(wù)處理能力，才能達(dá)到最好的效果，通俗點(diǎn)說(shuō)就是實(shí)現(xiàn)CPU和GPU的協(xié)同計(jì)算。

　　雖然NVIDIA和Intel等芯片商正在為GPU和CPU孰強(qiáng)孰弱陷入了口水戰(zhàn)，但實(shí)際上這些企業(yè)已經(jīng)開(kāi)始在異構(gòu)計(jì)算上加大了研發(fā)力度，至少在近期內(nèi)，CPU和GPU的結(jié)合將繼續(xù)成為人工智能領(lǐng)域最有效的方案。

新聞中心

IBM和NVIDIA新款人工智能服務(wù)器又把英特爾秒了

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)