異構(gòu)計算帶來AI視覺新突破
作者 王瑩 王金旺 《電子產(chǎn)品世界》編輯
本文引用地址:http://m.butianyuan.cn/article/201706/361120.htm摘要:近年來,隨著圖像處理及識別等關(guān)鍵研究領(lǐng)域的突破,使人工智能在視覺應(yīng)用上獲得了前所未有的進(jìn)步,成為AI大規(guī)模應(yīng)用推廣的第一個場景。為此,筆者采訪了華夏芯(北京)通用處理器技術(shù)有限公司首席執(zhí)行官李科奕先生,并就相關(guān)內(nèi)容進(jìn)行了解答。
視覺成為AI首推應(yīng)用場景
在所有機(jī)器處理的感知系統(tǒng)中,機(jī)器視覺系統(tǒng)包含的信息量最大,也是計算機(jī)應(yīng)用中最復(fù)雜和最具挑戰(zhàn)的研究領(lǐng)域之一。近年來,隨著圖像處理及識別等關(guān)鍵研究領(lǐng)域的突破,包括卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)技術(shù)的成熟,以及大規(guī)模集成電路技術(shù)發(fā)展所帶來的處理性能的大幅度提升,使人工智能(Artificial Intelligence,AI)在視覺應(yīng)用上獲得了前所未有的進(jìn)步,成為AI大規(guī)模應(yīng)用推廣的第一個場景。例如,特定環(huán)境下的人臉識別、車輛識別、場景識別等技術(shù),不管從識別準(zhǔn)確度還是識別速度都已取得了驚人的成就,離理想的商業(yè)應(yīng)用已經(jīng)不遠(yuǎn)了,如廣州的高鐵安檢已經(jīng)開始使用人臉識別與身份證信息對照對乘客進(jìn)行身份確認(rèn)。
由于視覺在人類的生產(chǎn)、生活中扮演著重要的角色,AI視覺的應(yīng)用一直是AI研發(fā)最活躍的領(lǐng)域之一,隨著相關(guān)技術(shù)的突破,未來的AI視覺技術(shù)將會在安防監(jiān)控、汽車輔助/自動駕駛、無人機(jī)/機(jī)器人視覺領(lǐng)域得到廣泛應(yīng)用。
AI視覺面臨的挑戰(zhàn)
AI視覺當(dāng)下面臨著眾多挑戰(zhàn),從技術(shù)角度來看包括視頻圖像識別與處理算法、大數(shù)據(jù)分析、更先進(jìn)的傳感器、通訊網(wǎng)絡(luò)與覆蓋、存儲及軟硬件平臺等。同時,針對大規(guī)模公眾性AI視覺應(yīng)用,還需要解決包括信息安全、個人隱私、運營與服務(wù)品質(zhì)等一系列問題。假如上述問題陸續(xù)得到解決,可以預(yù)期在未來數(shù)年中,AI視覺產(chǎn)品與應(yīng)用將無所不在。
另外,華夏芯首席執(zhí)行官李科奕還特別指出,芯片設(shè)計架構(gòu)上的創(chuàng)新和集成電路制造工藝的快速進(jìn)步為AI視覺的推廣奠定了堅實的硬件基礎(chǔ)。
AI視覺的訓(xùn)練與推理
在有關(guān)AI視覺處理芯片的選擇上,華夏芯認(rèn)為是由應(yīng)用場景來決定。
而從目標(biāo)和任務(wù)角度來看,AI在視頻應(yīng)用領(lǐng)域的工作可以劃分為訓(xùn)練與推理兩大類。
高性能CPU/GPU集群或其它高性能計算平臺處理訓(xùn)練
通常情況下,訓(xùn)練工作適合在運維平臺(云端)來做,目前業(yè)界一般采用英偉達(dá)的GPU與賽靈思的FPGA來實現(xiàn)計算加速,也有采用基于Intel的CPU集群來實現(xiàn)的。主要原因在于在典型的訓(xùn)練場景中,功耗、計算復(fù)雜度、實時性響應(yīng)等指標(biāo)雖然也很重要,但都不是要考量的第一要素。最重要的是必須確保算法在各種情況下都能獲得滿意的性能效果,包括動態(tài)范圍好,收斂性好,適應(yīng)性好等。為此而耗費較多的計算資源、功耗和時間對AI的參數(shù)進(jìn)行迭代與訓(xùn)練,都是非常值得的。
所以,對于基于大數(shù)據(jù)的AI學(xué)習(xí)與訓(xùn)練來說,李科奕表示,很多廠家采用GPU、FPGA、配置矢量處理單元的CPU計算集群、甚至于針對特定應(yīng)用更為優(yōu)化設(shè)計的神經(jīng)網(wǎng)絡(luò)加速器等,這些都不失為良好的學(xué)習(xí)和訓(xùn)練平臺。盡管如此,每種平臺都有局限性,存在改進(jìn)和優(yōu)化的空間。
異構(gòu)計算完成推理
對于前端嵌入式視頻圖像AI推理芯片主要從以下幾個方面考慮。第一,從算法角度講,AI推理的結(jié)構(gòu)特性極不規(guī)則,例如,不等長的、不同維度的、稀疏的矢量計算、矩陣計算等,傳統(tǒng)架構(gòu)的CPU、DSP、GPU處理效率不高;第二,前端場景變化多端,圖像質(zhì)量屬性不一,如果要取得AI推理的良好性能,不能僅僅依靠AI算法自身,還需要輔助以更多手段與方法;第三,嵌入式的前端應(yīng)用對于成本、性能、功耗、編程、生態(tài)、標(biāo)準(zhǔn)化的要求更高,而且同時存在著控制與加速計算的需求。這些巨大的挑戰(zhàn)正是為什么目前市場上前端AI視頻芯片方案還非常少、即使已有芯片方案也還存在相當(dāng)局限性的原因。
解決AI視頻前端推理的最好的芯片設(shè)計理念是新一代的異構(gòu)計算架構(gòu)。異構(gòu)計算可以很好地支撐龐大而繁雜的前端智能的廣泛應(yīng)用,并實現(xiàn)視頻應(yīng)用相關(guān)的人工智能產(chǎn)業(yè)的標(biāo)準(zhǔn)化與規(guī)范化發(fā)展,創(chuàng)建健康的應(yīng)用生態(tài)系統(tǒng)。而現(xiàn)有市場出現(xiàn)的前端智能推理芯片還不能很好地適應(yīng)不規(guī)則的人工智能算法的架構(gòu)特性,同時滿足高性能、低功耗、易編程優(yōu)化等需求。因此,基于新一代異構(gòu)計算架構(gòu)的CPU+DSP+硬件加速器的SoC芯片平臺有可能成為AI視頻的主流方案之一。因為這一方案很好地利用了DSP并行計算能力突出的特點:在大部分視頻應(yīng)用場景中,新一代DSP的計算能力不亞于GPU與FPGA,但功耗更低、實時性更強,與單純的神經(jīng)網(wǎng)絡(luò)加速器相比則靈活性更強。
華夏芯獨特的異構(gòu)計算架構(gòu)理念
按照傳統(tǒng)理念進(jìn)行分類的處理器產(chǎn)品在未來的芯片應(yīng)用領(lǐng)域的空間會越來越小,取而代之的是多種計算單元融合的異構(gòu)計算設(shè)計理念。針對這一發(fā)展趨勢,華夏芯在業(yè)界提出了“三合一”體系架構(gòu),推出滿足異構(gòu)計算應(yīng)用的新一代處理器IP,包括指令集、工具鏈以及在單一內(nèi)核中實現(xiàn)同時滿足CPU、DSP與GPU的應(yīng)用需求與計算特征的微架構(gòu)。這樣的異構(gòu)計算SoC設(shè)計既降低了用戶二次開發(fā)與應(yīng)用實現(xiàn)的門檻,又顯著提升了產(chǎn)品的性能、功耗等核心指標(biāo),大幅度降低了用戶在研發(fā)投入方面的成本與規(guī)模。
針對AI領(lǐng)域的特殊需求,華夏芯研發(fā)了完全自主知識產(chǎn)權(quán)的處理器IP核,包括獨特、先進(jìn)的微架構(gòu),并推出了可變長矢量(矩陣)處理單元,從而很好地滿足了AI算法處理中常出現(xiàn)的多維度、可變長、高并發(fā)的計算特征的普遍需求。我們的技術(shù)較傳統(tǒng)的并行計算架構(gòu)來說,不僅僅在時延、性能、功耗等關(guān)鍵指標(biāo)上顯著提升,更重要的是用戶的編程門檻大幅度下降。
目前,華夏芯正和本地AI視覺算法廠商、系統(tǒng)廠商密切合作,即將推出一款基于異構(gòu)計算融合概念的AI視覺專用SoC。這款產(chǎn)品既有通用、又有專用處理單元,主要用于對AI視覺性能要求很高的安防監(jiān)控、汽車輔助駕駛、機(jī)器視覺等應(yīng)用領(lǐng)域,它的定義和開發(fā)是完全基于合作伙伴及應(yīng)用廠商的定制化需求,李科奕自信地表示,我們相信這款SoC及配套開發(fā)工具將成為理想的國產(chǎn)AI視覺開發(fā)平臺。
另外,李科奕稱,下一步,華夏芯將積極參與推動相關(guān)產(chǎn)業(yè)聯(lián)盟的發(fā)展,共建國產(chǎn)AI處理器推廣應(yīng)用平臺,與業(yè)界同仁一道,加速推動我國AI相關(guān)產(chǎn)業(yè)的發(fā)展。
參考文獻(xiàn):
[1]李韜,網(wǎng)絡(luò)處理器芯片的國產(chǎn)化之路[J].電子產(chǎn)品世界,2015(1):25-25.
[2]鄭小龍,國產(chǎn)嵌入式微處理器的探索與開拓[J].電子產(chǎn)品世界,2015(8):20-21.
[3]王瑩,“CPU+”異構(gòu)計算時代,華夏芯通過HSA搶占高地[J].電子產(chǎn)品世界, 2016 (9):15-17.
[4]陳俊穎,周順風(fēng),閔華清.基于CAPI FPGA的醫(yī)學(xué)超聲成像算法異構(gòu)加速[J].電子產(chǎn)品世界,2016(10):41-44.
本文來源于《電子產(chǎn)品世界》2017年第7期第28頁,歡迎您寫論文時引用,并注明出處。
評論