詳解人工智能芯片 CPU/GPU/FPGA有何差異?
4.GPU行業(yè)的佼佼者:Nvidia
本文引用地址:http://m.butianyuan.cn/article/201704/346122.htm目前全球GPU行業(yè)的市場份額有超過70%被英偉達(dá)公司占據(jù),而應(yīng)用在人工智能領(lǐng)域的可進(jìn)行通用計(jì)算的GPU市場則基本被英偉達(dá)公司壟斷。
2016年三季度英偉達(dá)營收為20.04億美元,較上年同期的13.05億美元增長54%;凈利潤為5.42億美元,較上年同期的2.46億美元增長120%,營收的超預(yù)期增長推動(dòng)其盤后股價(jià)大幅上漲約16%。以面向的市場平臺(tái)來劃分,游戲業(yè)務(wù)營收12.4億美元,同比增長63%,是創(chuàng)造利潤的核心部門;數(shù)據(jù)中心業(yè)務(wù)營收2.4億美元,同比增長193%,成為增長最快的部門;自動(dòng)駕駛業(yè)務(wù)營收1.27億美元,同比增長61%,正在逐步打開市場。
這樣的業(yè)績創(chuàng)下了英偉達(dá)的歷史最好季度收入,但這并非是其股票暴漲的理由,事實(shí)上,在過去的六年里,英偉達(dá)的業(yè)績基本一直呈現(xiàn)上升趨勢。從2012年財(cái)年至2016財(cái)年,英偉達(dá)的營業(yè)收入實(shí)現(xiàn)了從40億美元到50億美元的跨越,而其凈利潤也從2012財(cái)年的5.8億美元逐步上升到了2016財(cái)年的6.14億美元。但在此期間,英偉達(dá)的股價(jià)并未出現(xiàn)翻番式的增長。
真正促成英偉達(dá)股價(jià)飆升的是人工智能的新市場。在剛剛過去的2016年,英偉達(dá)的股價(jià)上漲了228%,過去的5年內(nèi)累計(jì)上漲500%。500億美元的市值將會(huì)持續(xù)給英偉達(dá)帶來40倍的市場收入,這幾乎是業(yè)內(nèi)擁有最高收益的公司。
5.Nvidia的市場定位:人工智能計(jì)算公司
自1999年發(fā)布第一款GPU以來,GPU就成為了英偉達(dá)最為核心的產(chǎn)品,占到了英偉達(dá)總營業(yè)收入的八成,而英偉達(dá)也以顯卡廠商的身份進(jìn)入人們的視線。這些芯片最初是以板卡的形式出售給游戲玩家的,游戲玩家需要自己動(dòng)手將芯片裝到PC主板上,從而擁有更快的3D圖形處理速度。他們的產(chǎn)品命名也很有講究,用“GeForce”這樣具有超能力的字眼來開辟市場。
今日的英偉達(dá),已經(jīng)不再是一家單純的顯卡技術(shù)廠商,他現(xiàn)在很趕時(shí)髦地稱自己為“人工智能計(jì)算公司”。據(jù)英偉達(dá)官網(wǎng)數(shù)據(jù)顯示,2016年,有近兩萬家機(jī)構(gòu)將英偉達(dá)產(chǎn)品用于深度學(xué)習(xí)加速計(jì)算,相比2014年翻了13倍。醫(yī)療、生命科學(xué)、教育、能源、金融、汽車、制造業(yè)以及娛樂業(yè)等諸多行業(yè)均將得益于海量數(shù)據(jù)的分析。
谷歌、微軟、Facebook 和亞馬遜等技術(shù)巨頭大量購買英偉達(dá)的芯片來擴(kuò)充自己數(shù)據(jù)中心的處理能力;Massachusetts General Hospital等醫(yī)療研究機(jī)構(gòu)用英偉達(dá)的芯片來標(biāo)記CT掃描圖片上的病變點(diǎn);特斯拉將在所有的汽車上安裝英偉達(dá)的芯片來實(shí)現(xiàn)無人駕駛; June等家電公司用英偉達(dá)的芯片制造人工智能驅(qū)動(dòng)的家用電器。在人工智能到來之前,英偉達(dá)從來都沒有處于一個(gè)如此巨大的市場的中心,這也充分表明了一個(gè)事實(shí),那就是英偉達(dá)在GPU的計(jì)算處理技術(shù)上無人能及。
同時(shí),英偉達(dá)還在投資不同領(lǐng)域里新興的、需要借助深度學(xué)習(xí)來構(gòu)建業(yè)務(wù)的公司,使這些公司能夠更好地借助其提供的人工智能平臺(tái)起步,這類似于以前一些初創(chuàng)公司通過微軟Windows來構(gòu)建服務(wù)以及最近通過iTunes來發(fā)布應(yīng)用。
6.Nvidia的核心產(chǎn)品:Pascal家族
英偉達(dá)的傳統(tǒng)強(qiáng)項(xiàng)是桌面和移動(dòng)終端的GPU,但是堅(jiān)定地向著人工智能大步邁進(jìn)的英偉達(dá)顯然已經(jīng)不滿足于僅僅在單一領(lǐng)域做提高GPU性能的事了。相比于傳統(tǒng)的計(jì)算密集型GPU產(chǎn)品來說,英偉達(dá)努力的方向是使得GPU芯片不僅僅只針對訓(xùn)練算法這一項(xiàng)起到作用,更是能處理人工智能服務(wù)的推理工作負(fù)載,從而加速整個(gè)人工智能的開發(fā)流程。目前該公司的核心產(chǎn)品包括基于Pascal架構(gòu)的TeslaP4與Tesla P40深度學(xué)習(xí)芯片,這兩款芯片均已于2016年第四季度開始投入量產(chǎn)。
Tesla P4為資料中心帶來最高的能源效率
其小尺寸及最小50瓦特的低功率設(shè)計(jì)可安裝于任何服務(wù)器內(nèi),讓生產(chǎn)作業(yè)負(fù)載推論的能源效率達(dá)CPU的40倍。在進(jìn)行視頻推論作業(yè)負(fù)載時(shí),單一服務(wù)器裡安裝單顆Tesla P4即可取代13臺(tái)僅采用CPU的服務(wù)器,而包含服務(wù)器及用電量的總持有成本則能節(jié)省達(dá)8倍。
Tesla P40為深度學(xué)習(xí)作業(yè)負(fù)載帶來最大的處理量
一臺(tái)搭載8顆Tesla P40加速器的服務(wù)器擁有每秒47兆次運(yùn)算的推論性能及INT8指令,可取代140臺(tái)以上的CPU服務(wù)器的性能。若以每臺(tái)CPU服務(wù)器約5,000美元計(jì)算,可節(jié)省65萬美元以上的服務(wù)器采購成本。
基于上述兩種人工智能芯片,英偉達(dá)為資料中心提供唯一的端對端深度學(xué)習(xí)平臺(tái),并能夠?qū)⒂?xùn)練時(shí)間從數(shù)天大幅縮短至數(shù)小時(shí),從而實(shí)現(xiàn)資料的立即解析與服務(wù)的及時(shí)回應(yīng)。
7.Nvidia的應(yīng)用布局:自動(dòng)駕駛
不僅僅是底層架構(gòu),英偉達(dá)在應(yīng)用層面上也有非常明確的布局,其中最看重也最有領(lǐng)先優(yōu)勢的就是自動(dòng)駕駛。早在2014年1月,英偉達(dá)就發(fā)布了為移動(dòng)平臺(tái)設(shè)計(jì)的第一代Tegra系列處理器,適用于智能手機(jī)、平板電腦和自動(dòng)駕駛汽車,四個(gè)月后,DRIVE PX自動(dòng)駕駛計(jì)算平臺(tái)發(fā)布,可實(shí)現(xiàn)包括高速公路自動(dòng)駕駛與高清制圖在內(nèi)的自動(dòng)巡航功能。同年10月,搭載了Tegra K1處理器并應(yīng)用了DRIVEPX計(jì)算平臺(tái)的特斯拉新款Model S開始量產(chǎn),英偉達(dá)成為第一個(gè)享受到自動(dòng)駕駛紅利的廠商。
2016年英偉達(dá)在自動(dòng)駕駛領(lǐng)域并沒有什么重大突破,基本只是從技術(shù)升級及廠商合作兩個(gè)方面入手,除了特斯拉這個(gè)老朋友外,百度、沃爾沃也跟英偉達(dá)達(dá)成了合作,他們都將生產(chǎn)搭載DRIVE PX 2的智能駕駛汽車。恰逢此時(shí),AI概念變得更加火熱,智能駕駛也逐漸成熟,這些客觀因素讓英偉達(dá)收割了更多的紅利,也讓公司站在了聚光燈之下。
從整個(gè)自動(dòng)駕駛行業(yè)來看,Google、蘋果、微軟等科技公司都在建立自己的汽車生態(tài)體系,不過智能汽車對于他們來說都不是核心業(yè)務(wù),更為重要的是,他們并沒有真正進(jìn)入汽車供應(yīng)鏈體系。與之相反,英偉達(dá)的Drive PX系列自動(dòng)駕駛解決方案,已經(jīng)進(jìn)入了汽車的上游供應(yīng)鏈中,并創(chuàng)造了利潤,這也意味著英偉達(dá)將在汽車芯片市場與英特爾、高通、恩智浦、瑞薩電子等做CPU的公司正面碰撞,自動(dòng)駕駛的風(fēng)口讓英偉達(dá)在汽車市場從“邊緣人”變成了挑戰(zhàn)者。
隨著特斯拉Model S等備受矚目的車型更加智能化與多媒體化,英偉達(dá)有了彎道超車的機(jī)會(huì),并有望在汽車產(chǎn)業(yè)的上游供應(yīng)鏈占據(jù)更有優(yōu)勢的地位。最新款的Tegra系列處理器功耗只有10瓦,幾乎與同等級的FPGA產(chǎn)品功耗持平甚至更低,這對于車載移動(dòng)芯片來說是巨大的優(yōu)勢。
但同樣的,單移動(dòng)處理器的架構(gòu)和極低的功耗必然無法支撐起超大規(guī)模的運(yùn)算,目前英偉達(dá)計(jì)算平臺(tái)的功能定位僅聚焦于高速公路上的自動(dòng)巡航,而CPU的應(yīng)用可以拓展至車機(jī)娛樂信息系統(tǒng)層面。未來自動(dòng)駕駛的發(fā)展方向必然是整車的控制中心,從目前英偉達(dá)基于Tesla架構(gòu)的主流芯片來看,低功耗、極速運(yùn)算與邏輯控制是可以同時(shí)實(shí)現(xiàn)的,英偉達(dá)公司在自動(dòng)駕駛領(lǐng)域的優(yōu)勢非常明顯。
8.Nvidia的產(chǎn)業(yè)優(yōu)勢:完善的生態(tài)系統(tǒng)
與其它芯片公司相比,帶有CUDA的重點(diǎn)軟件生態(tài)系統(tǒng)是英偉達(dá)占領(lǐng)人工智能市場的關(guān)鍵促成因素。從2006年開始,英偉達(dá)發(fā)布了一個(gè)名叫CUDA的編程工具包,該工具包讓開發(fā)者可以輕松編程屏幕上的每一個(gè)像素。在CUDA發(fā)布之前,給GPU編程對程序員來說是一件極其痛苦的事,因?yàn)檫@涉及到編寫大量低層面的機(jī)器碼以實(shí)現(xiàn)渲染每一個(gè)不同像素的目標(biāo),而這樣的微型計(jì)算操作通常有上萬個(gè)。CUDA在經(jīng)過了英偉達(dá)的多年開發(fā)之后,成功將Java或C++這樣的高級語言開放給了GPU編程,從而讓GPU編程變得更加輕松簡單,研究者也可以更快更便宜地開發(fā)他們的深度學(xué)習(xí)模型。
四、未來市場:半定制芯片FPGA
技術(shù)世界正在邁向一個(gè)全新的軌道,我們對于人工智能的想象已經(jīng)不再局限于圖片識(shí)別與聲音處理,機(jī)器,將在更多領(lǐng)域完成新的探索。不同領(lǐng)域?qū)τ?jì)算的需求是差異的,這就要求深度學(xué)習(xí)的訓(xùn)練愈發(fā)專業(yè)化與區(qū)別化。芯片的發(fā)展趨勢必將是在每一個(gè)細(xì)分領(lǐng)域都可以更加符合我們的專業(yè)需求,但是考慮到硬件產(chǎn)品一旦成型便不可再更改這個(gè)特點(diǎn),我們不禁開始想,是不是可以生產(chǎn)一種芯片,讓它硬件可編程。
也就是說,這一刻我們需要一個(gè)更適合圖像處理的硬件系統(tǒng),下一刻我們需要一個(gè)更適合科學(xué)計(jì)算的硬件系統(tǒng),但是我們又不希望焊兩塊板子,我們希望一塊板子便可以實(shí)現(xiàn)針對每一個(gè)應(yīng)用領(lǐng)域的不同需求。這塊板子便是半定制芯片FPGA,便是未來人工智能硬件市場的發(fā)展方向。
評論