國(guó)內(nèi)AI芯片百家爭(zhēng)鳴,何以抗衡全球技術(shù)寡頭
國(guó)外:技術(shù)寡頭,優(yōu)勢(shì)明顯
本文引用地址:http://m.butianyuan.cn/article/201804/377915.htm由于具有得天獨(dú)厚的技術(shù)和應(yīng)用優(yōu)勢(shì),英偉達(dá)和谷歌幾乎占據(jù)了人工智能處理領(lǐng)域 80% 的市場(chǎng)份額,而且在谷歌宣布其 Cloud TPU 開(kāi)放服務(wù)和英偉達(dá)推出自動(dòng)駕駛處理器 Xavier 之后,這一份額占比在 2018 年有望進(jìn)一步擴(kuò)大。其他廠商,如英特爾、特斯拉、ARM、IBM 以及 Cadence 等,也在人工智能處理器領(lǐng)域占有一席之地。
當(dāng)然,上述這些公司的專(zhuān)注領(lǐng)域卻不盡相同。比如英偉達(dá)主要專(zhuān)注于 GPU 和無(wú)人駕駛領(lǐng)域,而谷歌則主要針對(duì)云端市場(chǎng),英特爾則主要面向計(jì)算機(jī)視覺(jué),Cadence 則以提供加速神經(jīng)網(wǎng)絡(luò)計(jì)算相關(guān) IP 為主。如果說(shuō)前述這些公司還主要偏向處理器設(shè)計(jì)等硬件領(lǐng)域,那么ARM 公司則主要偏向軟件,致力于針對(duì)機(jī)器學(xué)習(xí)和人工智能提供高效算法庫(kù)。
注:上述表格中所給為截止到 2017 年各研制單位公開(kāi)可查的最新數(shù)據(jù)。
獨(dú)占鰲頭——英偉達(dá)
在人工智能領(lǐng)域,英偉達(dá)可以說(shuō)是目前涉及面最廣、市場(chǎng)份額最大的公司,旗下產(chǎn)品線遍布自動(dòng)駕駛汽車(chē)、高性能計(jì)算、機(jī)器人、醫(yī)療保健、云計(jì)算、游戲視頻等眾多領(lǐng)域。其針對(duì)自動(dòng)駕駛汽車(chē)領(lǐng)域的全新人工智能超級(jí)計(jì)算機(jī)Xavier,用 NVIDIA 首席執(zhí)行官黃仁勛的話來(lái)說(shuō)就是 “這是我所知道的 SoC 領(lǐng)域非常了不起的嘗試,我們長(zhǎng)期以來(lái)一直致力于開(kāi)發(fā)芯片?!?/p>
Xavier是一款完整的片上系統(tǒng) (SoC),集成了被稱(chēng)為 Volta 的全新 GPU 架構(gòu)、定制 8 核 CPU 架構(gòu)以及新的計(jì)算機(jī)視覺(jué)加速器。該處理器提供 20 TOPS(萬(wàn)億次運(yùn)算 / 秒)的高性能,而功耗僅為 20 瓦。單個(gè) Xavier 人工智能處理器包含 70 億個(gè)晶體管,采用最前沿的 16nm FinFET 加工技術(shù)進(jìn)行制造,能夠取代目前配置了兩個(gè)移動(dòng) SoC 和兩個(gè)獨(dú)立 GPU 的 DRIVE PX 2,而功耗僅僅是它的一小部分。
而在 2018 年拉斯維加斯 CES 展會(huì)上,NVIDIA 又推出了三款基于 Xavier 的人工智能處理器,包括一款專(zhuān)注于將增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)應(yīng)用于汽車(chē)的產(chǎn)品、一款進(jìn)一步簡(jiǎn)化車(chē)內(nèi)人工智能助手構(gòu)建和部署的 DRIVE IX 和一款對(duì)其現(xiàn)有自主出租車(chē)大腦——Pegasus 的修改,進(jìn)一步擴(kuò)大自己的優(yōu)勢(shì)。
產(chǎn)學(xué)研的集大成者——谷歌
如果你只是知道谷歌的 AlphaGo、無(wú)人駕駛和 TPU 等這些人工智能相關(guān)的產(chǎn)品,那么你還應(yīng)該知道這些產(chǎn)品背后的技術(shù)大牛們:谷歌傳奇芯片工程師 Jeff Dean、谷歌云計(jì)算團(tuán)隊(duì)首席科學(xué)家、斯坦福大學(xué) AI 實(shí)驗(yàn)室主管李飛飛、Alphabet 董事長(zhǎng) John Hennessy 和谷歌杰出工程師 David Patterson。
時(shí)至今日,摩爾定律遇到了技術(shù)和經(jīng)濟(jì)上的雙重瓶頸,處理器性能的增長(zhǎng)速度越來(lái)越慢,然而社會(huì)對(duì)于計(jì)算能力的需求增速卻并未減緩,甚至在移動(dòng)應(yīng)用、大數(shù)據(jù)、人工智能等新的應(yīng)用興起后,對(duì)于計(jì)算能力、計(jì)算功耗和計(jì)算成本等提出了新的要求。與完全依賴(lài)于通用 CPU 及其編程模型的傳統(tǒng)軟件編寫(xiě)模式不同,異構(gòu)計(jì)算的整個(gè)系統(tǒng)包含了多種基于特定領(lǐng)域架構(gòu)(Domain-Specific Architecture, DSA)設(shè)計(jì)的處理單元,每一個(gè) DSA 處理單元都有負(fù)責(zé)的獨(dú)特領(lǐng)域并針對(duì)該領(lǐng)域做優(yōu)化,當(dāng)計(jì)算機(jī)系統(tǒng)遇到相關(guān)計(jì)算時(shí)便由相應(yīng)的 DSA 處理器去負(fù)責(zé)。而谷歌就是異構(gòu)計(jì)算的踐行者,TPU 就是異構(gòu)計(jì)算在人工智能應(yīng)用的一個(gè)很好例子。
2017 年發(fā)布的第二代 TPU 芯片,不僅加深了人工智能在學(xué)習(xí)和推理方面的能力,而且谷歌是認(rèn)真地要將它推向市場(chǎng)。根據(jù)谷歌的內(nèi)部測(cè)試,第二代芯片針對(duì)機(jī)器學(xué)習(xí)的訓(xùn)練速度能比現(xiàn)在市場(chǎng)上的圖形芯片(GPU)節(jié)省一半時(shí)間;第二代 TPU 包括了四個(gè)芯片,每秒可處理 180 萬(wàn)億次浮點(diǎn)運(yùn)算;如果將 64 個(gè) TPU 組合到一起,升級(jí)為所謂的 TPU Pods,則可提供大約 11500 萬(wàn)億次浮點(diǎn)運(yùn)算能力。
評(píng)論