華西證券:2022年電子AI芯片行業(yè)研究報告
AI芯片主要承擔推斷任務,通過將終端設備上的傳感器(麥克風陣列、攝像頭等)收集的數(shù)據(jù)代入訓練好的模型推理得出推斷結果。由于終端場景多種多樣各不相同,對于算力和能耗等性能需求也有大有小,應用于終端芯片需要針對特殊場景進行針對性設計以實現(xiàn)最優(yōu)解方案,最終實現(xiàn)有時間關聯(lián)度的三維處理能力,這將實現(xiàn)更深層次的產業(yè)鏈升級,是設計、制造、封測和設備材料,以及軟件環(huán)境的全產業(yè)鏈協(xié)同升級過程。
本文引用地址:http://m.butianyuan.cn/article/202203/432211.htm相比于傳統(tǒng)CPU服務器,在提供相同算力情況下,GPU服務器在成本、空間占用和能耗分別為傳統(tǒng)方案的1/8、1/15和1/8。人工智能服務器是AI算力基礎設施的主要角色,在服務器中滲透率不斷提升。L3自動駕駛算力需求為30-60TOPS,L4需求100TOPS以上,L5需求甚至達1,000TOPS,GPU算力需求提升明顯,芯片主要向著大算力、低功耗和高制程三個方向發(fā)展。
01.
算力時代
GPU開拓新場景
廣義上講只要能夠運行人工智能算法的芯片都叫作 AI 芯片。但是通常意義上的 AI 芯片指的是針對人工智能算法做了特殊加速設計的芯片。
AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中的大量計算任務的模塊(其他非計算任務仍由CPU負責)。到目前位置,AI芯片算力發(fā)展走過了三個階段:
第一階段:因為芯片算力不足,所以神經(jīng)網(wǎng)絡沒有受到重視;
第二階段:通用芯片CPU的算力大幅提升,但仍然無法 滿足神經(jīng)網(wǎng)絡的需求;
第三階段:GPU和和新架構的AI芯片推進人工智能落地。
▲AI芯片算力發(fā)展階段
目前,GPT-3模型已入選了《麻省理工科技評論》2021年“十大突破性技術。GPT-3的模型使用的最大數(shù)據(jù)集在處理前容量達到了45TB。根據(jù) OpenAI的算力統(tǒng)計單位petaflops/s-days,訓練AlphaGoZero需要1800-2000pfs-day,而GPT-3用了3640pfs-day。
▲自然語言模型/會話式AI平臺
AI運算指以“深度學習” 為代表的神經(jīng)網(wǎng)絡算法,需要系統(tǒng)能夠高效處理大量非結構化數(shù)據(jù)(文本、視頻、圖像、語音等) 。需要硬件具有高效的線性代數(shù)運算能力,計算任務具有:單位計算任務簡單,邏輯控制難度要求低,但并行運算量大、參數(shù)多的特點。對于芯片的多核并行運算、片上存儲、帶寬、低延時的訪存等提出了較高的需求。
自2012年以來,人工智能訓練任務所需求的算力每 3.43 個月就會翻倍,大大超越了芯片產業(yè)長期存在的摩爾定律(每 18個月芯片的性能翻一倍)。針對不同應用場景,AI芯片還應滿足:對主流AI算法框架兼容、可編程、可拓展、低功耗、體積及價格等需求。
從技術架構來看,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、類腦芯片四大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,類腦芯片顛覆傳統(tǒng)馮諾依曼架構,是一種模擬人腦神經(jīng)元結構的芯片,類腦芯片的發(fā)展尚處于起步階段。
▲三種技術架構AI芯片類型比較
2019年全球人工智能芯片市場規(guī)模為110億美元。隨著人工智能技術日趨成熟,數(shù)字化基礎設施不斷完善,人工智能商業(yè)化應用將加落地,推動AI芯片市場高速增長,預計2025年全球人工智能芯片市場規(guī)模將達到726億美元。
▲2019-2025年全球人工智能芯片市場規(guī)模及預測(億美元)
02.
三大應用場景
AI是王者
GPU其實是由硬件實現(xiàn)的一組圖形函數(shù)的集合,這些函數(shù)主要用于繪制各種圖形所需要的運算。這些和像素,光影處理,3D坐標變換等相關的運算由GPU硬件加速來實現(xiàn)。圖形運算的特點是大量同類型數(shù)據(jù)的密集運算——如圖形數(shù)據(jù)的矩陣運算,GPU的微架構就是面向適合于矩陣類型的數(shù)值計算而設計的,大量重復設計的計算單元,這類計算可以分成眾多獨立的數(shù)值計算——大量數(shù)值運算的線程,而且數(shù)據(jù)之間沒有像程序執(zhí)行的那種邏輯關聯(lián)性。
GPU微架構的設計研發(fā)是非常重要的,先進優(yōu)秀的微架構對GPU實際性能的提升是至關重要的。目前市面上有非常豐富GPU微架構,比如Pascal、Volta、Turing(圖靈)、Ampere(安培),分別發(fā)布于 2016 年、2017 年、2018 年和2020年,代表著英偉達 GPU 的最高工藝水平。
GPU的API(Application Programming Interface)應用程序接口發(fā)揮著連接應用程序和顯卡驅動的橋梁作用。目前GPU API可以分為2大陣營和若干其他類。2大陣營分別是微軟的DirectX標準和KhronosGroup標準,其他類包括蘋果的Metal API、 AMD的Mantle(地幔) API、英特爾的One API等。
AI芯片(GPU/FPGA/ASIC)在云端同時承擔人工智能 “訓練”和“推斷”過程,在終端主要承擔“推斷”過 程,從性能與成本來看ASIC最優(yōu)。ASIC作為專用芯片,算力與功耗在通用芯片GPU具有絕對優(yōu)勢,但開發(fā)周期較長,落地較慢,需一定規(guī)模后才能體現(xiàn)成本優(yōu)勢。FPGA可以看做從GPU到ASIC重點過渡方案。相對于GPU可深入到硬件級優(yōu)化,相比ASIC在算法不斷迭代演進情況下更具靈活性,且開發(fā)時間更短。
從生態(tài)與落地來看,GPU占據(jù)絕對優(yōu)勢,英偉達處壟斷地位。開發(fā)者能通過英偉達CUDA平臺使用軟件語言很方便地開發(fā)英偉達GPU實現(xiàn)運算加速,已被廣泛認可和普及,積累了良好的編程環(huán)境。以TPU為代表的ASIC目前主要運用在巨頭的閉環(huán)生態(tài),F(xiàn)PGA在數(shù)據(jù)中心業(yè)務中發(fā)展較快。
2020年GPU市場規(guī)模為254.1億美元,預計到2027年將達到1853.1億美元,從2021年到2027年的復合年增長率為32.82%。GPU市場分為獨立,集成和混合市場。2019年集成占據(jù)了GPU市場份額的主導地位,但由于混合處理器同時具有集成和獨立GPU的能力,因此未來混合細分市場預計將實現(xiàn)最高復合年增長率。
市場分為計算機,平板電腦,智能手機,游戲機,電視等。在2019年,智能手機市場占據(jù)了全球GPU市場份額的主導地位,預計在預測期內將繼續(xù)保持這一趨勢。但是,由于對醫(yī)療設備等其他設備中對小型GPU的需求不斷增長,預計其他領域在未來的復合年增長率最高。由于在設計和工程應用中圖形處理器的廣泛使用,預計汽車應用細分市場將在預測期內以最高的復合年增長率增長。
總體來說,GPU有三大應用場景:游戲 、 AI和自動駕駛
1、游戲
IDC數(shù)據(jù)顯示,2020年游戲PC和顯示器的出貨量同比增長26.8%,達到5500萬臺。游戲筆記本電腦在2020年增長了創(chuàng)紀錄的26.9%。與PC并行,游戲顯示器在2020年也達到了新的高度,與2019年相比增長了77%以上,出貨量達到了1430萬臺。
IDC預計2021年游戲顯示器的銷量將首次超過游戲臺式機。即使游戲臺式機逐漸受到青睞,游戲筆記本電腦的顯示器連接率不斷提高也意味著游戲監(jiān)控器市場的五年復合年增長率預計將超過10%。IDC預計2025年全球銷量達到7290萬,復合年增長率為5.8%。
2、AI
移動端AI芯片市場不止于智能手機,潛在市場還包括:智能手環(huán)/手表、 VR/AR眼鏡等市場。
在邊緣計算場景,AI芯片主要承擔推斷任務,通過將終端設備上的傳感器(麥克風陣列、攝像頭等)收集的數(shù)據(jù)代入訓練好的模型推理得出推斷結果。由于邊緣側場景多種多樣、各不相同,對于計算硬件的考量也不盡相同,對于算力和能耗等性能需求也有大有小。因此應用于邊緣側的計算芯片需要針對特殊場景進行針對性設計以實現(xiàn)最優(yōu)的解決方案。
▲不同邊緣計算場景對AI芯片性能要求
安防攝像頭發(fā)展經(jīng)歷了由模擬向數(shù)字化、數(shù)字化高清到現(xiàn)在的數(shù)字化智能方向的發(fā)展,最新的智能攝像頭除了實現(xiàn)簡單的錄、 存功能外,還可以實現(xiàn)結構化圖像數(shù)據(jù)分析。安防攝像頭一天可產生20GB數(shù)據(jù),若將全部數(shù)據(jù)回傳到云數(shù)據(jù)中心將會對網(wǎng)絡帶寬和數(shù)據(jù)中心資源造成極大占用。
通過在攝像頭終端、網(wǎng)絡邊緣側加裝AI芯片,實現(xiàn)對攝像頭數(shù)據(jù)的本地化實時處理,經(jīng)過結構化處理、關鍵信息提取,僅將帶有關鍵信息的數(shù)據(jù)回傳后方,將會大大降低網(wǎng)絡傳輸帶寬壓力。當前主流解決方案分為:前端攝像頭設備內集成AI芯片和在邊緣側采取智能服務器級產品。前端芯片在設計上需要平衡面積、功耗、成本、可靠性等問題,最好采取低功耗、低成本解決方案(如:DSP、 ASIC);邊緣側限制更少,可以采取能夠進行更大規(guī)模數(shù)據(jù)處理任務的服務器級產品(如:GPU、 ASIC)。
▲AI芯片在智能安防攝像頭中的應用
人工智能服務器通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合可以滿足高吞吐量互聯(lián)的需求,為自然語言處理、計算機視覺、語音交互等人工智能應用場景提供強大的算力支持,已經(jīng)成為人工智能發(fā)展的重要支撐力量相比于傳統(tǒng)CPU服務器,在提供相同算力情況下,GPU服務器在成本、空間占用和能耗分別為傳統(tǒng)方案的1/8、1/15和1/8。
當前在云端場景下被最廣泛應用的AI芯片是英偉達的GPU,主要原因是:強大的并行計算能力(相比CPU)、通用性以及成熟的開發(fā)環(huán)境。2020年全球AI服務器市場規(guī)模為122億美元,預計到2025年全球AI智能服務器市場將達到288億美元,5年CAGR達到18.8%。
▲2020-2025年全球AI服務器行業(yè)市場規(guī)模及增速(單位:億美元)
在AI開發(fā)中,由于深度學習模型開發(fā)及部署需要強大算力支持,需要專用的芯片及服務器支持。開發(fā)者如選擇自購AI服務器成本過高。通過云服務模式,采取按需租用超算中心計算資源可極大降低項目期初資本投入同時也省卻了項目開發(fā)期間的硬件運維費用,實現(xiàn)資本配置效率的最大化提升。
3、自動駕駛
全球自動駕駛邁入商用階段,未來可期。IDC最新發(fā)布的《全球自動駕駛汽車預測報告(2020-2024)》數(shù)據(jù)顯示,2024年全球L1-L5級自動駕駛汽車出貨量預計將達到約5425萬輛,2020至2024年的年均復合增長率(CAGR)達到18.3%;L1和L2級自動駕駛在2024年的市場份額預計分別為64.4%和34.0%。盡管目前L3-L5級自動駕駛技術的應用具有開拓性意義,L1-L2級自動駕駛將依然是未來5年內帶動全球自動駕駛汽車出貨量增長的最大細分市場。
我國汽車市場規(guī)模不斷增長,自動駕駛由L2向L3過渡。中汽協(xié)數(shù)據(jù)顯示,2021年1-3月,中國品牌乘用車共銷售210.8萬輛,同比增長81.5%,占乘用車銷售總量的41.5%,占有率比上年同期提升1.4個百分點。2020年1月份至9月份,L2級智能網(wǎng)聯(lián)乘用車銷售量達196萬輛,占乘用車總銷量的14.7%。
更有部分企業(yè)加速研發(fā)L3級自動駕駛車型,多地開展自動泊車、自動駕駛公交車、無人智能重卡等方面的示范應用。到2025年,我國PA(部分自動駕駛)、CA(有條件自動駕駛)級智能網(wǎng)聯(lián)汽車銷量占當年汽車總銷量比例超過50%,C-V2X(以蜂窩通信為基礎的移動車聯(lián)網(wǎng))終端新車裝配率達50%。
隨著傳感器、車載處理器等產品的進一步完善,將會有更多L3級車型出現(xiàn)。而L4、L5級自動駕駛預計將會率先在封閉園區(qū)中的商用車平臺上實現(xiàn)應用落地,更廣泛的乘用車平臺高級別自動駕駛,需要伴隨著技術、政策、基礎設施建設的進一步完善,預計至少在2025年~2030年以后才會出現(xiàn)在一般道路上。
▲2016-2030年全球汽車市場自動駕駛滲透率預測
感知路境,短時處理海量數(shù)據(jù)。行車過程中依賴雷達等傳感器對道理信息進行采集后,處理器每秒需實時數(shù)據(jù)解析幾G量級數(shù)據(jù),每秒可以產生超過 1G 的數(shù)據(jù)。對處理器的計算量要求較高。
自動規(guī)劃,瞬時反應保障安全。處理分析實時數(shù)據(jù)后,需要在毫秒的時間精度下對行車路徑、車速進行規(guī)劃,保障行車過程安全,對處理器的計算速度要求較高。
兼具技術成本優(yōu)勢,GPU為自動駕駛領域主流。
03.
國產AI GPU走上快車道
2020年國內AI芯片行業(yè)投融資金額同比增長了52.8%,2021年1月至4月的投融資事件和金額均已超過去年全年,資本對國內半導體、集成電路領域投資高漲。
從熱門領域來看,人工智能領域是2020年資本青睞度較高的細分賽道之一。2020年資本投資的主要是相對成熟且已獲得1-2輪甚至2輪以上融資的AI芯片企業(yè)。
▲AI芯片行業(yè)公司成立時間、融資歷史及估值
AI芯片行業(yè)市場預期逐漸趨于理性,創(chuàng)業(yè)進入市場檢驗期。大量AI芯片公司在15~17年成立。未來1-2年,市場將會對各廠商的產品和技術進行實際檢驗。市場期待更高算力、更低功耗、成本更低的AI芯片。
▲不同公司的芯片介紹
1、沐曦集成電路:多場景高性能GPU
沐曦集成電路專注于設計具有完全自主知識產權,針對異構計算等各類應用的高性能通用GPU芯片。公司致力于打造國內最強商用GPU芯片,產品主要應用方向包含傳統(tǒng)GPU及移動應用,人工智能、云計算、數(shù)據(jù)中心等高性能異構計算領域,是今后面向社會各個方面通用信息產業(yè)提升算力水平的重要基礎產品。
擬采用業(yè)界最先進的5nm工藝技術,專注研發(fā)全兼容CUDA及ROCm生態(tài)的國產高性能GPU芯片,滿足HPC、數(shù)據(jù)中心及AI等方面的計算需求。致力于研發(fā)生產擁有自主知識產權的、安全可靠的高性能GPU芯片,服務數(shù)據(jù)中心、云游戲、人工智能等需要高算力的諸多重要領域。
2、壁仞科技:推出云端AI芯片
壁仞科技創(chuàng)立于2019年,公司在GPU和DSA(專用加速器)等領域具備豐富的技術儲備聚焦于云端通用智能計算,逐步在AI訓練和推理、圖形渲染、高性能通用計算等多個領域趕超現(xiàn)有解決方案,以實現(xiàn)國產高端通用智能計算芯片的突破。
▲壁仞科技發(fā)展歷程
3、燧原科技:推中國最大AI計算芯片
在2021世界人工智能大會期間,上海燧原科技推出第二代云端AI訓練芯片邃思2.0及訓練產品云燧T20/T21,以及全新升級的馭算Topsrider 2.0軟件平臺。
邃思2.0是迄今中國最大的AI計算芯片,采用日月光2.5D封裝的極限,在國內率先支持TF32精度,單精度張量TF32算力可達160TFLOPS。同時,邃思2.0也是首個支持最先進內存HBM2E的產品。公司主要服務為面向消費電子、汽車電子、計算機及周邊、工業(yè)、數(shù)據(jù)處理、物聯(lián)網(wǎng)等廣泛應用市場所提供的一站式芯片定制服務和半導體IP 授權服務。
燧原科技成立于2018年03月19日,成立至今連續(xù)獲得過5輪融資,累計融資額近32億元人民幣。其最新一筆融資為今年1月完成的18億元C輪融資,由中信產業(yè)基金、中金資本旗下基金、春華資本領投。
4、地平線:智能駕駛及 AI 應用領域服務
基于創(chuàng)新的人工智能專用計算架構 BPU,地平線已成功流片量產了中國首款邊緣人工智能芯片——專注于智能駕駛的征程1 和專注于 AIoT 的旭日1 ;2019 年,地平線又推出了中國首款車規(guī)級 AI 芯片征程 2 和新一代AIoT智能應用加速引擎旭日2 ;2020年,地平線進一步加速AI芯片迭代,推出新一代高效能汽車智能芯片征程 3 和全新一代 AIoT 邊緣 AI 芯片平臺旭日 3。
▲地平線發(fā)展歷程
智能物聯(lián)網(wǎng)需求將使云端計算的負荷成倍增長。智能物聯(lián)網(wǎng)是未來的趨勢所向,海量的碎片化場景與計算旭日處理器強大的邊緣計算能力,幫助設備高效處理本地數(shù)據(jù)。
面向AIoT,地平線推出旭日系列邊緣 AI 芯片。旭日2采用 BPU 伯努利1.0 架構,可提供 4TOPS 等效算力,旭日3 采用伯努利2.0 ,可提供 5TOPS 的等效算力。
地平線已成為唯一覆蓋 L2 到 L4 的全場景整車智能芯片方案提供商。從 2019 年量產中國首款車規(guī)級 AI 芯片征程 2,到 2020 年推出第二代車規(guī)級芯片征程3。目前,征程 2 、征程 3 已在長安、長城、東風嵐圖、廣汽、江淮、理想、奇瑞、上汽等多家自主品牌車企的多款主力爆款車型上實現(xiàn)前裝量產。
地平線 Matrix由征程2 架構加速的車規(guī)級計算平臺,結合深度學習感知技術,為高級別自動駕駛提供了穩(wěn)定可靠的高性能感知系統(tǒng)。
▲地平線征程系列芯片
5、黑芝麻:智能駕駛系統(tǒng)解決方案
黑芝麻智能科技是一家專注于視覺感知技術與自主IP芯片開發(fā)的企業(yè)。公司主攻領域為嵌入式圖像和計算機視覺,提供基于光控技術、圖像處理、計算圖像以及人工智能的嵌入式視覺感知芯片計算平臺,為ADAS及自動駕駛提供完整的商業(yè)落地方案。
基于華山二號 A1000 芯片,黑芝麻提供了四種智能駕駛解決方案。單顆 A1000L 芯片適用于 ADAS 輔助駕駛;單顆 A1000 芯片適用于 L2+ 自動駕駛;雙 A1000 芯片互聯(lián)可達 140TOPS 算力,支持 L3 等級自動駕駛;四顆 A1000 芯片則可以支持 L4 甚至以上的自動駕駛需求。另外,黑芝麻還可以根據(jù)不同的客戶需求,提供定制化服務。
黑芝麻智能首款芯片與上汽的合作已實現(xiàn)量產,第二款芯片A1000正在量產過程中,預計今年下半年在商用車領域實現(xiàn)10萬片量級以上的量產,明年將在乘用車領域量產落地。黑芝麻智能已與一汽、蔚來、上汽、比亞迪、博世、滴滴、中科創(chuàng)達、亞太機電等企業(yè)在L2、L3級自動駕駛感知系統(tǒng)解決方案上均有合作。
黑芝麻智能科技最新的華山二號(A1000)芯片具備 40-70TOPS 的強大算力、小于 8W 的功耗及優(yōu)越的算力利用率,工藝制程16nm,符合 AEC Q-100、單芯片 ASIL B、系統(tǒng) ASIL D 汽車功能安全要求,是目前能支持 L3 及以上級別自動駕駛的唯一國產芯片。為了應對不同的市場需求,黑芝麻同步發(fā)布了華山二號 A1000L。
▲黑芝麻最新產品A1000系列參數(shù)對比
除了以上玩家,摩爾線程等公司最近也有新進展,見下表。
▲國產GPU最新進展
評論