GPGPU國產(chǎn)替代:中國芯片產(chǎn)業(yè)的空白地帶
近日,國務院公布《新時期促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》,開篇指出,集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)是信息產(chǎn)業(yè)的核心,是引領新一輪科技革命和產(chǎn)業(yè)變革的關鍵力量。2020年的國際環(huán)境,讓全社會越來越認識到中國集成電路和軟件產(chǎn)業(yè)的薄弱,越來越堅定要把集成電路和軟件產(chǎn)業(yè)搞上去的決心。
本文引用地址:http://m.butianyuan.cn/article/202008/416835.htm今天,我們來談一談GPGPU市場。
縱觀整個IT系統(tǒng),從CPU、操作系統(tǒng)、辦公套件、整機到服務器,我們都已經(jīng)初步具有一些商用化的可替代產(chǎn)品。唯獨在GPGPU領域,目前還是一片空白。如下圖所示:
GPGPU是什么?
GPGPU全稱是通用圖形處理器(General-Purpose computing on Graphics Processing Units)。它是用專門處理圖形任務的處理器,執(zhí)行原本由中央處理器處理(CPU)完成的通用計算任務。這些通用計算常常與圖形處理沒有任何關系。圖形處理器的特點是,并行處理能力特別強,計算能效比高,并且有很大的存儲帶寬。有些應用,例如人工智能(機器學習)模型訓練與推理、高性能計算,它們往往是大數(shù)據(jù)流應用,這時,用GPGPU解決這類問題就比CPU效率更高。雖然目前機器學習會有遷移到專用硬件的可能,但在編程模型上GPU是圖靈完備的,且對于用傳統(tǒng)語言編寫的、軟件形式的計算有較好的支持,具有高度的靈活性。
因此,GPGPU目前廣泛應用于高性能計算、行業(yè)AI應用、安防與政府項目、互聯(lián)網(wǎng)及云數(shù)據(jù)中心等。其主要應用場景:一是人工智能模型訓練與推理;二是高性能計算。
根據(jù)有關數(shù)據(jù)預測,到2025年,中國GPGPU芯片板卡的市場規(guī)模將達到458億元,是2019年86億元的5倍多,2019年到2025年的年復合增長率高達32%。按行業(yè)來分,互聯(lián)網(wǎng)及云數(shù)據(jù)中心為228億元,安防與政府數(shù)據(jù)中心為142億元,行業(yè)AI應用為37億元,高性能計算為28億元。按應用場景來分,到2025年的預測數(shù)據(jù)是,人工智能推理286億元,人工智能訓練144億元,高性能計算28億元。
可以看來,GPGPU在中國的未來需求量很大,對國民經(jīng)濟的發(fā)展至關重要。
GPGPU國產(chǎn)替代的市場呼喚
一般人對GPGPU沒有什么概念。某頭部供應商的一塊高端GPGPU板卡,其售價接近一輛普通轎車的價格。
當前,人工智能應用的閘門打開了,很多企業(yè)、研究機構(gòu)、研究者希望利用人工智能。首先是要做的是人工智能訓練,根據(jù)現(xiàn)有數(shù)據(jù),反復訓練,得出一個模型。將這個模型部署到業(yè)務應用中,當對這個模型輸入一個新的數(shù)據(jù)時,根據(jù)模型計算出一個結(jié)果,這一過程稱為人工智能推理。例如,一個游戲網(wǎng)站接收到一個新用戶注冊,它想判斷這個用戶是正常用戶,還是競爭對手注冊進來拉人的惡意用戶。它就可以利用過去大量的用戶行為數(shù)據(jù),訓練出一個人工智能模型。這個模型能夠計算出,什么樣的用戶行為就有可能是惡意用戶,從而自動地對這些用戶限制權限,或者交給人工客服來處理。類似的應用特別多,可以訓練機器做很多以前由人工來完成的事情,例如,安防領域的視頻分析,媒體領域的內(nèi)容生產(chǎn)、字幕生成、內(nèi)容審核、分類與標簽,醫(yī)療健康領域的藥物發(fā)現(xiàn)與探索、醫(yī)學影像自動識別、輔助醫(yī)療、自動診療,電商領域的個性化推薦、信用評級,金融交易領域的交易算法、服務管理與推薦、潛在用戶挖掘,客服領域的語音服務、聊天機器人、呼叫中心優(yōu)化,等等。
高性能計算則是國之重器,計算機學科中的明珠,廣泛應用于勘探、天氣、海洋、氣候變化、核能、發(fā)動機、航空航天等領域。
面對日益增長的需求來說,GPGPU的供應是沒有很好地滿足的。當前,全球GPGPU市場供應處于一家獨大的局面,價格昂貴,產(chǎn)品種類單一。以中國的云端AI訓練芯片市場為例,最大的供應商市場份額達到90%,其中,某一款產(chǎn)品就占整個市場的50%,另一款產(chǎn)品占25%。
這樣的局面雖然源自該供應商的技術和實力,但是客戶還是需要更多的選擇。例如在2017年,因為人工智能訓練和數(shù)字貨幣挖礦的需求猛增,GPGPU供不應求,價格高漲,一部分用戶嘗試將原本用作獨立顯卡的消費級GPGPU,替代用于數(shù)據(jù)中心,但是被供應商在軟件驅(qū)動上禁用,當時引起一陣熱議。
從國家的供應鏈安全角度,這兩年,一些重要的企業(yè)和機構(gòu)陸續(xù)被美國列入禁售實體名單。這些用戶除了國產(chǎn)替代,別無選擇。
GPGPU國產(chǎn)替代如何突圍
看到這里,很多人一定會問。第一位的供應商占據(jù)90%的市場,這個市場一定很難攻下,不然全球有那么多芯片公司,早就有別的公司來制衡了。
一方面,前面分析了目前的國際環(huán)境下,我們實現(xiàn)國產(chǎn)替代的必要性和緊迫性。國家也出臺了《若干政策》這樣的鼓勵措施,從財稅、投融資、研究開發(fā)、進出口、人才培養(yǎng)、知識產(chǎn)權、市場應用、國際合作等多個方面,支持相關的企業(yè)發(fā)展壯大。另一方面,從技術難度看,GPGPU也不是可望不可及的。改革開放四十多年來,中國有一大批芯片人才,在國際公司積累了深厚的經(jīng)驗?,F(xiàn)在恰逢中國經(jīng)濟實力增長、下決心發(fā)展半導體產(chǎn)業(yè)的良好時機,他們希望抓住這一機遇,一顯身手,為中國半導體產(chǎn)業(yè)發(fā)展做出一份貢獻。
天數(shù)智芯就是這樣一家公司。天數(shù)智芯的芯片研發(fā)團隊于2018年初組建,數(shù)十名創(chuàng)始團隊主要來自世界知名芯片公司AMD的GPU部門和企業(yè)軟件翹楚Oracle、IBM、英偉達等公司。完整的芯片設計團隊在芯片設計領域平均積累了近十年經(jīng)驗,可以說,這是一支在世界范圍內(nèi)都不可多得的、完善的高端芯片設計隊伍。
公司正在積極研發(fā)針對云端算力提升的訓練及推理芯片。其中,面向人工智能訓練的GPGPU芯片計劃在今年實現(xiàn)批量生產(chǎn),2021年初商業(yè)化投向市場,這將是國內(nèi)首款自研的GPGPU芯片;面向人工智能推理的GPGPU芯片也在研發(fā)之中。
天數(shù)智芯在芯片設計初始,就與服務器廠商合作共同對產(chǎn)品設計進行定義,以實現(xiàn)未來在數(shù)據(jù)中心中的國產(chǎn)替代。目前,天數(shù)智芯已經(jīng)與浪潮、新華三等服務器廠商簽署戰(zhàn)略合作,共同推動服務器領域人工智能和HPC的計算芯片及硬件解決方案發(fā)展。天數(shù)智芯還與國產(chǎn)CPU龍頭中科龍芯等密切對接技術及業(yè)務合作,打造天數(shù)GPGPU+國產(chǎn)CPU的自主可控超算解決方案。
展望未來,我們深知任務艱巨,但我們也有信心、決心和耐力,為國產(chǎn)GPGPU闖出一片天地。也希望有更多的人才、合作伙伴、行業(yè)應用單位加入我們的征程。
作者簡介:
鄭金山,上海天數(shù)智芯半導體有限公司首席科學家,擁有21年芯片設計工作經(jīng)驗,曾先后供職于Trident、XGI、ATI Technologies、AMD超微半導體上海有限公司和酷芯微電子(Artosyn),任高級經(jīng)理、PMTS和架構(gòu)師等職位。專注于GPU IP設計多年,對GPU架構(gòu)與設計有深厚的造詣。他建立與帶領上海芯片設計團隊參與過多個顯卡(從Radeon HD2000到R400)芯片的研發(fā)與產(chǎn)品化。在酷芯微電子參與了機器視覺芯片9201的研發(fā)并成功量產(chǎn)。鄭金山1999年畢業(yè)于復旦大學ASIC與系統(tǒng)國家重點實驗室,獲微電子與固體電子學專業(yè)碩士學位。
評論