收購(gòu)Nervana后 Intel在AI芯片上進(jìn)展如何？

作者：時(shí)間：2016-12-08 來(lái)源：數(shù)盟社區(qū)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　8月9日，Intel對(duì)Nervana的收購(gòu)以4.08億美元告終。作為對(duì)比，英特爾財(cái)報(bào)顯示，其今年第三季度的凈利潤(rùn)為34億美元。以如此之高的價(jià)格收購(gòu)一個(gè)僅有48人的團(tuán)隊(duì)，Intel有自己的考量。

本文引用地址：http://m.butianyuan.cn/article/201612/341370.htm

　　當(dāng)年為了追逐IoT的步伐，Intel錯(cuò)失了移動(dòng)芯片市場(chǎng)，現(xiàn)如今其競(jìng)爭(zhēng)對(duì)手NVIDIA已造出Tesla P100，Intel在AI芯片領(lǐng)域還遲遲沒(méi)有動(dòng)靜。此次收購(gòu)Nervana可謂是Intel彎道超車的明智之舉，將Nervana的軟件架構(gòu)部署至Intel的硬件上，此次合作對(duì)Nervana和Intel來(lái)說(shuō)無(wú)疑是雙贏的。

　　收購(gòu)當(dāng)日，Nervana聯(lián)合創(chuàng)始人Naveen Rao便表示：“融資對(duì)我們來(lái)說(shuō)相對(duì)比較容易，但是被英特爾收購(gòu)，就意味著我們能夠接觸到曾經(jīng)對(duì)于我們來(lái)說(shuō)觸不可及的技術(shù)?！?nbsp;此處的“技術(shù)”所指，是硬件層面。

　　Nervana的業(yè)務(wù)著眼于基于云的深度學(xué)習(xí)服務(wù)，其主要深度學(xué)習(xí)框架Neon在主流的深度學(xué)習(xí)網(wǎng)絡(luò)例如AlexNet、VGG、GoogLeNet上均性能優(yōu)異;具備強(qiáng)大的易用性及可擴(kuò)展性，支持CNN、RNN、LSTM、GRU、BatchNorm等模型。Neon在卷積計(jì)算時(shí)采用了Winograd算法，在數(shù)據(jù)載入層面也做了很多優(yōu)化。Nervana表示，Neon的計(jì)算速率是Caffe的兩倍。

　　GPU近年來(lái)被用作深度學(xué)習(xí)處理器，實(shí)為無(wú)奈之舉。如今，有了Intel的加持，Nervana正計(jì)劃推出其針對(duì)深度學(xué)習(xí)算法的定制芯片Nervana Engine。目前的神經(jīng)網(wǎng)絡(luò)訓(xùn)練處在依賴海量數(shù)據(jù)的階段，我們希望用更多的數(shù)據(jù)為系統(tǒng)帶來(lái)更高的準(zhǔn)確性，這使得訓(xùn)練效率至關(guān)重要。單純地通過(guò)增加處理器的數(shù)量來(lái)擴(kuò)展其性能或許可以解一時(shí)之需，但當(dāng)處理器數(shù)量達(dá)到一定程度，I/O能力又成為瓶頸。

　　對(duì)此，英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)表示：“Nervana技術(shù)可以更高效地定義內(nèi)存的訪問(wèn)帶寬和計(jì)算密度，讓它很好地匹配當(dāng)前數(shù)據(jù)量增大的需求。同時(shí)可以讓多個(gè)節(jié)點(diǎn)并行去支持這種大模型的訓(xùn)練，所以我們可以看到近乎一種線性的性能的擴(kuò)展?！?/p>

　　相比GPU，Nervana Engine在訓(xùn)練方面可以提升10倍性能。與Tesla P100類似，該芯片也利用16-bit半精度浮點(diǎn)計(jì)算單元和大容量高帶寬內(nèi)存(HBM，計(jì)劃為32GB，是競(jìng)品P100的兩倍)，摒棄了大量深度學(xué)習(xí)不需要的通用計(jì)算單元。

　　在硬件基礎(chǔ)上，Nervana于今年11月份推出了Intel Nervana Graph平臺(tái)。該框架由三部分組成：用于創(chuàng)建計(jì)算圖的API、用于處理常見深度學(xué)習(xí)工作流的前端API(目前支持TensorFlow和Neon)、以及用于在 CPU/GPU/Nervana Engine上編譯執(zhí)行計(jì)算圖的轉(zhuǎn)換器API。

　　AI發(fā)展的良性閉環(huán)

　　Intel方面，在收購(gòu)Nervana后，Intel正式提出AI發(fā)展的良性閉環(huán)概念。Intel提供從嵌入式端到云端、從底層到應(yīng)用層的完整實(shí)現(xiàn)方案。

　　首先，在硬件層面，Intel處理器能為各種AI硬件提供支持。對(duì)于前端設(shè)備，Intel推出Movidius硬件平臺(tái)，以滿足前端設(shè)備功耗、預(yù)算、尺寸等限制。同時(shí)，在面向硬件優(yōu)化的過(guò)程中，Intel提出相應(yīng)的庫(kù)。具體包括：針對(duì)數(shù)學(xué)運(yùn)算的庫(kù)、針對(duì)數(shù)據(jù)分析的庫(kù)、針對(duì)通訊加速的庫(kù)、以及針對(duì)Python語(yǔ)言的庫(kù)等等。在框架層面，Intel支持所有的開源框架，這意味著開發(fā)者不需要改變使用習(xí)慣，就能使用Intel的各項(xiàng)架構(gòu)支持。更上層的，Intel提供深度學(xué)習(xí)SDK、Nervana等平臺(tái)。

　　在軟件層面，宋繼強(qiáng)表示：“目前的深度神經(jīng)網(wǎng)絡(luò)還有很多技術(shù)點(diǎn)有待突破，神經(jīng)網(wǎng)只是實(shí)現(xiàn)人工智能的一個(gè)工具，但未必是最后的工具?！睂?duì)于AI算法，Intel目前正致力于如何使系統(tǒng)實(shí)現(xiàn)更少的數(shù)據(jù)及人力依賴;如何讓模型更稀疏;如何壓縮模型使之更易存儲(chǔ);如何對(duì)模型剪裁使其運(yùn)算量最少;如何使計(jì)算精度下降，甚至降至一位。

　　對(duì)于Intel的主營(yíng)業(yè)務(wù)，處理器制造來(lái)說(shuō)，用戶有了更多元化的選擇。