ASIC AI,巨頭才玩得起的游戲?未必
人工智能芯片主要包括GPU、FPGA、ASIC以及類腦芯片。在人工智能時代,它們各自發(fā)揮優(yōu)勢,呈現出百花齊放的狀態(tài)?,F在,人工智能已經不再局限于機器學習上,而且更多可以以更快的速度運行AI系統(tǒng)的新型架構正在被開發(fā)出來。英偉達、高通、英特爾、IBM、谷歌、Facebook和其它公司正在加速涌入這個領域。
本文引用地址:http://m.butianyuan.cn/article/201711/372059.htm實際上,這些器件并不是真正的芯片,而是一種系統(tǒng)級封裝。它們通常包含一顆或者兩顆具有大規(guī)模處理能力的基于最新半導體制造工藝(16nm及以下)的ASIC,和大容量的超高帶寬內存(比如HBM2堆棧),所有這些芯片都通過先進封裝技術集成在一起。
隨著NVIDIA將GPU重新定位成為云端AI引擎角色下,也確定帶動ASIC業(yè)務跟進發(fā)展,如Google如今已推出第二代TPU、英特爾在買下Nervana公司后也取得自有Nervana芯片,另外由多名前Google TPU員工創(chuàng)辦的新創(chuàng)企業(yè)Groq,近日也宣布將在2018年初推出自有下一代AI芯片等等。
Google的TPU,是專門為其深度學習算法Tensor Flow設計的,TPU也用在了AlphaGo系統(tǒng)中。今年發(fā)布的第二代Cloud TPU理論算力達到了180T Flops,能夠對機器學習模型的訓練和運行帶來顯著的加速效果,其實也是一款ASIC芯片。選擇做ASCI定制化研發(fā),一方面是資金不愁,另一方面也是出于Google所需提供的服務考慮。包括Google圖像搜索、照片,云視覺API、Google翻譯等產品和服務都需要用到深度神經網絡。Google有這個需求以及能力去開發(fā)一種專門的芯片并具備規(guī)?;瘧?大量分攤研發(fā)成本)的可能。
Nervana由英特爾購并后,計劃在2017年底前推出第一款AI專用化Nervana神經網絡處理器(NNP)。Nervana NNP也是一款ASIC芯片,能以極高運算效率從事深度學習演算法的訓練與執(zhí)行。英特爾舍棄了CPU上常見的快取,改由特殊軟件負責特定演算法的芯片存儲器管理,希望能借此將芯片的運算密度與性能提升到新的層次。
由前Google TPU員工創(chuàng)辦的新創(chuàng)企業(yè)Groq打算在2018年發(fā)布第一代AI芯片。這款芯片對標英偉達的GPU,是專門為人工智能重新定制一款芯片。官網資料顯示,這款芯片的運算速度將可以達到400萬億次每秒,每瓦特能進行8萬億次的運算。而谷歌最新一代的TPU才達到每秒180萬億次運算,Groq芯片的性能將會是谷歌TPU的兩倍多。
聯發(fā)科也將有所動作。聯發(fā)科共同CEO蔡力行表示,ASIC的布局聯發(fā)科會發(fā)揮既有資源,通過現有團隊實力,配合客戶需求積極開發(fā)ASIC領域。但畢竟才剛開始,現階段不會太挑客戶,還是以整體業(yè)務成長為優(yōu)先考慮。
全球AI芯片首個獨角獸寒武紀,走的也是ASIC路線。
事實上,由于定制化、低功耗等好處,在AI領域ASIC正在被越來越多地采用,帶動了ASIC設計及市場快速增長。根據Semico Research的最新調查報告,在2021年以前,人工智能聲控裝置ASIC的設計預計將以接近20%的年復合成長率成長,幾乎達到2016年至2021年間所有ASIC設計成長率(10.1%)的兩倍,去年全球ASIC出貨量增長為7.7%,明年物聯網ASIC單位出貨量將超過18億個單位。Semico Research指出,ASIC增長主要動力來自于工業(yè)與消費市場的成長,由于市場飽和加上需求減少,許多傳統(tǒng)終端應用的成長速度開始減慢,而與物聯網有關的應用正在起飛。
Semico Research指出,除了物聯網和人工智能以外,與智能電網、穿戴式電子產品、固態(tài)硬盤、無人機、工業(yè)物聯網、先進駕駛輔助系統(tǒng)(ADAS)和5G基礎設施相關的ASIC產品成長率預計也將較廣泛的市場更迅速。在2021年以前,消費電子領域的基礎SoC設計專案將以19%的CAGR成長,而工業(yè)物聯網ASIC設計專案則將成長25%。
ASIC設計研發(fā)成本難以負荷,設計服務浴火重生
盡管如此,ASIC在AI領域的應用還是面臨著不少難題。
ASIC是依照產品需求不同而定制化的集成電路,由特定用戶需求和特定電子系統(tǒng)的需求而設計、制造。一般來說,ASIC在特定功能上進行了專項強化,可以根據需要進行復雜的設計,可實現更高處理速度和更低功耗,相對地,ASIC的設計、制造成本也非常高。一般的IC公司很難承擔為深度學習開發(fā)專門處理器ASIC芯片的成本的風險。首先未來為了性能必須使用最好的半導體工藝制程,而現在用最新的工藝制造芯片一次性成本就要幾百萬美元,非常貴。就算有錢,還需要組建一個團隊從零開始設計,設計周期往往也非常長,可以說time to market時間太長,風險很大。且ASIC芯片還將必須不斷升級以跟上新技術及工藝水平,加上ASIC芯片設計者在開發(fā)過程初期便已固定其邏輯,因此若在AI這類快速演進的領域有新想法出現,ASIC芯片將無法對此快速做出反應。如果無法實現規(guī)?;膽?,就算開發(fā)成功也美元實際應用價值。所以,IC公司一般傾向于采用通用芯片如CPU、GPU,或者半定制化芯片FPGA。
顯然,隨著工藝的不停升級,ASIC的流片費用已經抬高了ASIC保底的最少芯片銷售量,到最后全球也就為數不多的幾家ASIC廠商能夠承受這種巨額的ASIC流片成本和失敗風險。借此,ASIC設計服務再次回到業(yè)界關注焦點。
例如,美國無晶圓廠FinFET級ASIC設計服務企業(yè)eSilicon日前宣布,成功將自有深度學習ASIC送交制造所發(fā)布,eSilicon提到這款ASIC采定制IP、先進2.5D封裝工藝以及為業(yè)界大型芯片之一,并為該公司首款采用臺積電2.5D CoWoS封裝技術的量產芯片。
臺積電業(yè)務發(fā)展副總裁BJ Woo博士指出,臺積電CoWoS封裝技術是針對滿足這類芯片設計深度學習應用的需求,此先進封裝解決方案可實現高性能及整合需求,以達到eSilicon的設計目標。前文中提到的Google TPU、Nervana NNP、Groq即將推出的第一代AI芯片,均是由ASIC公司所送交制造,并交由臺積電制造。
目前,人工智能類ASIC的發(fā)展仍處于早期。其根本原因是,ASIC一旦設計制造完成后電路就固定了,只能微調,無法大改。而硬件的研發(fā)設計與生產成本很高,如果應用場景是否為真市場尚不清晰,企業(yè)很難貿然嘗試。此外,能設計出適用于人工智能芯片的公司必然是要既具備人工智能算法又擅長芯片研發(fā)的公司,進入門檻較高。因此,AI算法+ASIC設計服務+代工的商業(yè)模式的發(fā)展得宜,可以讓愈來愈多AI ASIC得以陸續(xù)問世及開發(fā)。
代工廠這邊,全球有很多代工廠,但是因為難度太高,能做AI系統(tǒng)封裝的廠商并不多,臺積電、三星和格芯都在榜單之列。那么,是哪些廠商在設計AI系統(tǒng)封裝呢?你需要看看哪些廠商真正擅長2.5D集成和擁有設計所需的關鍵IP(比如HBM2物理層接口和高速SerDes)。HBM2 PHY和高速SerDes模塊執(zhí)行該封裝系統(tǒng)內多個組件之間的任務關鍵性通信。這些都是模擬設計中非??量痰奶魬?zhàn),從ASIC供應商那里購買IP可以把風險降至最低。上面提到的三項關鍵技術eSilicon都有涉及。擅長這些領域的ASIC廠商并不多,不過由于人工智能市場可能會出現爆炸性增長,所以這些ASIC廠商將會受益匪淺。
臺灣也有眾多IC設計服務企業(yè),在人工智能市場驅動下,ASIC生意再度好起來,且業(yè)者預期這波榮景可望持續(xù)很久。臺積電大膽預言,2020年高性能計算(HPC)、AI相關芯片業(yè)績將高達150億美元,創(chuàng)意及世芯、智原亦看好來自全球AI客戶對于ASIC芯片的需求熱潮,可望自2017年起延續(xù)好一陣子,尤其是強調先進制程技術、極度復雜芯片設計、高效能與低功耗等,將是IC設計服務業(yè)者的新藍海市場。
評論