AI時代 處理器市場群雄爭霸誰能領(lǐng)跑?
智能時代芯片市場格局一變再變,上周谷歌推出 TPU 引發(fā)新的討論,誰將領(lǐng)跑芯片市場?TPU 僅供谷歌內(nèi)部使用;IBM TrueNorth 離商用還有距離;中國的寒武紀是國際首個深度學(xué)習(xí)專用處理器,市場表現(xiàn)值得期待;概率芯片以微小計算精度為代價實現(xiàn)能耗降低,是芯片市場一匹黑馬;FPGA 憑其性價比有望占領(lǐng)市場;目前 GPU 用戶覆蓋率最廣。
本文引用地址:http://m.butianyuan.cn/article/201605/291817.htm智能時代就要到來,芯片市場格局一變再變。兩個典型例子:引領(lǐng)處理器市場 40 多年的英特爾 2015 年底收購?fù)?Altera,今年 4 月就宣布計劃裁員 1.2 萬;另一方面,GPU 巨頭英偉達今年 3 月推出加速人工智能和深度學(xué)習(xí)芯片 Tesla P100,投入研發(fā)經(jīng)費超過 20 億美元,據(jù)《華爾街日報》報道,5 月英偉達售出的 GPU 比去年同月增長 62%,當前市值 240 億美元。
TPU:始于谷歌,終于谷歌
要說新的芯片,首先不得不提谷歌在剛剛結(jié)束的I/O 大會上披露的 TPU。
有不輿論稱,谷歌自己打造芯片,勢必對芯片制造商產(chǎn)生巨大影響。確實,面向機器學(xué)習(xí)專用的處理器是芯片行業(yè)的發(fā)展趨勢,而且未來其他大公司也很有可能組建芯片團隊,設(shè)計自己專用的芯片。
TPU 團隊主要負責人、計算機體系結(jié)構(gòu)領(lǐng)域大牛 Norm Jouppi 介紹,TPU 專為谷歌機器學(xué)習(xí)應(yīng)用 TensorFlow 打造,能夠降低運算精度,在相同時間內(nèi)處理更復(fù)雜、更強大的機器學(xué)習(xí)模型并將其更快地投入使用。 Jouppi 還表示,谷歌數(shù)據(jù)中心早在一年前就開始使用 TPU,這款谷歌定制芯片從測試到量產(chǎn)不到 22 天,其性能把摩爾定律往前推進到 7 年。
不過,GPU 巨頭、英偉達的 CEO 黃仁勛告訴《華爾街日報》,兩年前谷歌就意識到 GPU 更適合訓(xùn)練,而不善于做訓(xùn)練后的分析決策。由此可知,谷歌打造 TPU 的動機只是想要一款更適合做分析決策的芯片。這一點在谷歌的官方聲明里也得到印證,TPU 只在特定應(yīng)用中作為輔助使用,公司將繼續(xù)使用 CPU 和 GPU。
谷歌云服務(wù)副總裁 Diane Greene 也表示,谷歌并沒有對外銷售 TPU 的打算——拋開 TPU 本來就是為了谷歌自己設(shè)計的這個事實以外,谷歌對外銷售芯片的可能性很低,就像 Facebook 主張全球提供免費互聯(lián)網(wǎng),也并不是自己要做運營商。
因此,TPU 雖好,但僅限谷歌內(nèi)部,而且在近未來即便使用 TPU,也是用作輔助 CPU 和 GPU。
TrueNorth 坐山觀虎斗?
第二個要說的是 IBM TrueNorth。IBM 在 2014 年研發(fā)出脈沖神經(jīng)網(wǎng)絡(luò)芯片 TrueNorth,走的是“類腦計算”路線。類腦計算的假設(shè)是,相似的結(jié)構(gòu)可能會出現(xiàn)相似的功能,所以類腦計算研究者用神經(jīng)電子元件制造與人腦神經(jīng)網(wǎng)絡(luò)相似的電子神經(jīng)網(wǎng)絡(luò),希望其實現(xiàn)人腦功能,并進一步反過來了解人類智能。
TrueNorth 一張郵票大小,有 54 億個晶體管,構(gòu)成的神經(jīng)元陣列包含 100 萬個數(shù)字神經(jīng)元,這些神經(jīng)元之間通過 2.56 億個電突觸彼此通信。由于采用了異步架構(gòu),TrueNorth 的能耗很低,54 億個晶體管僅用 70 毫瓦;而且,只有在特定神經(jīng)元被開啟并和其他神經(jīng)元進行通信時才會產(chǎn)生能耗。TrueNorth 設(shè)計師 Filipp Akopyan 表示,TrueNorth 的目標是 Edge-of-the-Net 和大數(shù)據(jù)解決方案,所以必須要能用超低功耗實時處理大量數(shù)據(jù)。
在此基礎(chǔ)上,2016年 4 月 IBM 推出了用于深度學(xué)習(xí)的類腦超級計算平臺 IBM TrueNorth,含 16 個 TrueNorth 芯片,處理能力相當于 1600 萬個神經(jīng)元和 40 億個神經(jīng)鍵,消耗的能量只需 2.5 瓦。
將低能耗芯片用于深度學(xué)習(xí)無疑是一大重舉,美國 LLNL 數(shù)據(jù)科學(xué)副主任 Jim Brase 表示,類腦計算與未來高性能計算和模擬發(fā)展趨勢一致。但是,新智元芯片群的幾位專家討論后一致認為,TrueNorth 雖然與人腦某些結(jié)構(gòu)和機理較為接近,但智能算法的精度或效果有待進一步提高,離大規(guī)模商業(yè)應(yīng)用還有一段距離。
因此,未來 10 年芯片市場群雄逐鹿,TrueNorth 大概不會有亮相的機會。
寒武紀:中國的智能芯片
寒武紀是國際首個深度學(xué)習(xí)專用處理器,在國際上開創(chuàng)了深度學(xué)習(xí)處理器方向。從寒武紀研究論文產(chǎn)業(yè)化起,新智元一直有跟進報道。寒武紀 CEO 陳天石曾表示寒武紀要成為“支撐起中國智能時代的偉大芯片公司”。
2012 年,還在中科院計算所工作的陳天石和同事提出了國際上首個人工神經(jīng)網(wǎng)絡(luò)硬件的基準測試集 benchNN。這項工作提升了人工神經(jīng)網(wǎng)絡(luò)處理速度,有效加速了通用計算,大大推動了國際體系結(jié)構(gòu)學(xué)術(shù)圈對神經(jīng)網(wǎng)絡(luò)的接納度。此后,陳云霽、陳天石課題組接連推出了一系列不同結(jié)構(gòu)的“寒武紀”神經(jīng)網(wǎng)絡(luò)專用處理器。
2016 年 3 月,陳云霽、陳天石課題組提出的寒武紀深度學(xué)習(xí)處理器指令集 DianNaoYu 被計算機體系結(jié)構(gòu)領(lǐng)域的頂級國際會議 ISCA 2016 接收,在所有近 300 篇投稿中排名第一。指令集是計算機軟硬件生態(tài)體系的核心。英特爾和 ARM 正是通過其指令集控制了 PC 和嵌入式生態(tài)體系。
寒武紀在深度學(xué)習(xí)處理器指令集上的開創(chuàng)性進展,為中國占據(jù)智能產(chǎn)業(yè)生態(tài)的領(lǐng)導(dǎo)性地位提供了技術(shù)支撐。其市場表現(xiàn)如何,值得期待。
評論