AI在邊緣設備上的發(fā)展機會
智能設備對語音技術和視覺技術的需求
本文引用地址:http://m.butianyuan.cn/article/201804/379031.htm今天,智能設備主要依賴于基于語音的用戶接口,但是我們將看到它們越來越多地引入視覺技術成分。同時,人們已經(jīng)意識到AI不只適用于高端產(chǎn)品,現(xiàn)在越來越多的中檔產(chǎn)品也在采用AI。因此,需要在性能與差異化之間發(fā)掘出合理的平衡,同時還要提供高效率。對于神經(jīng)網(wǎng)絡,存儲帶寬是一個關鍵問題,因此,中檔設備需要更加高效。而隨著消費者對AI走向低端產(chǎn)品的期待不斷高漲,我們也應該給予更多關注。
我們現(xiàn)在正在看到更多具備AI功能的應用在沖擊市場,如汽車、無人機、安防系統(tǒng)和增強現(xiàn)實/虛擬現(xiàn)實(AR/VR);以機頂盒和數(shù)字電視為例,諸如自動提供字幕、圖像增強以及用戶體驗提升等功能將被進一步挖掘。
視覺技術在智能設備上的應用得到關注
智能設備主要依賴于基于語音的用戶接口,但是我們可以看到它們將開始越來越多地引入視覺技術成分。
從語音的角度來看,設備需要一直處于開啟狀態(tài),因此需要一種低功耗的解決方案。而從視覺的角度來看,由于需要處理大量的數(shù)據(jù),它的挑戰(zhàn)在于需要高性能。消費者期望無論是其智能手機還是冰箱,這些技術進步都應該以標準的形式進入設備。因此,支撐AI需求的解決方案應當是高效的,從而引出了對專用硬件的需求。
PowerVR Series2NX神經(jīng)網(wǎng)絡加速器
我們設計了自己全新的PowerVR Series2NX神經(jīng)網(wǎng)絡加速器,在非常低的功耗和極小芯片面積占用的前提下提供高性能的神經(jīng)網(wǎng)絡計算,其高度可擴展的架構可支撐它基于多樣化的、各種廣為采用的神經(jīng)網(wǎng)絡框架來承擔深度神經(jīng)網(wǎng)絡推算任務。隨著深度神經(jīng)網(wǎng)絡持續(xù)在很多行業(yè)中推動技術爆發(fā)式進步,神經(jīng)網(wǎng)絡加速器注定會成為一種基礎性的處理器種類,和CPU及GPU一樣極為重要。
嵌入式神經(jīng)引擎和專用智能處理器將AI引入前端設備
嵌入式神經(jīng)引擎和專用智能處理器將AI引入前端設備,消除了對云的依賴。前端處理的好處包括縮短延遲、全網(wǎng)覆蓋、提高隱私和安全性,并且減少與云的通信,從而降低成本。這些特性使得移動設備可以利用AI的力量去實現(xiàn)以往人們認為是天方夜譚的功能。
前端處理的兩大挑戰(zhàn)
雖然前端處理的好處很明顯,但它也帶來諸多挑戰(zhàn)。首先是如何在細小的掌上型設備上執(zhí)行來在大型服務器上的數(shù)據(jù)分析(data-crunching),還要考慮到這個掌上設備的電池也要應對許多其他任務。因此,專用AI處理器對于成功的在前端實現(xiàn)AI是至關重要的。
另外,將現(xiàn)有的神經(jīng)網(wǎng)絡移植到嵌入式環(huán)境中,這可能需要大量的開發(fā)時間并且成本非常高。但是,自動工具可以實現(xiàn)一鍵式輕易轉(zhuǎn)換,針對嵌入式環(huán)境來分析和優(yōu)化網(wǎng)絡。對于這樣的工具來說,重要的是要覆蓋大量先進的網(wǎng)絡,以確保任何網(wǎng)絡都可以輕松優(yōu)化,以便在前端嵌入式設備上運行。
NeuPro AI處理器
CEVA公司的NeuPro AI處理器包含用于矩陣乘法、完全連接層、激活層和池化層的專用引擎。這款專用AI引擎與完全可編程的NeuPro VPU配合使用,后者可支持所有其他層類型和NN拓撲。這些模塊之間的直接連接實現(xiàn)了無縫連接,無需寫入內(nèi)部存儲器。此外,DDR BW和DMA控制器可實現(xiàn)即時流水線處理,進一步提升速度,同時降低功耗。
支持廣泛神經(jīng)網(wǎng)絡架構的VIP8000處理器
機器學習和神經(jīng)網(wǎng)絡處理技術承載著嵌入式處理器下一個主要的市場機會。國際數(shù)據(jù)公司(IDC)預測,全球在AI和機器學習方面的支出將從2016年的80億美元增長到2020年的470億美元。AI爆發(fā)式增長的背后有三個主要的驅(qū)動力:算法的快速演進、強大的技術平臺以及大數(shù)據(jù)。AI日益無處不在,這就要求消費電子、汽車電子、工業(yè)4.0等終端產(chǎn)品具備實時神經(jīng)網(wǎng)絡推理、可靈活升級至最新、最優(yōu)算法,以及從持續(xù)學習中收集有用信息的能力。
作為芯片設計平臺及服務提供商,芯原為包含移動互聯(lián)設備、數(shù)據(jù)中心、IoT、汽車、工業(yè)和醫(yī)療設備在內(nèi)的廣泛終端市場提供全面的系統(tǒng)級芯片和系統(tǒng)級封裝解決方案。隨著最新的分級壓縮、適配的平鋪/緩存、裁剪、獲取、跳過以及圖像融合技術的引用,VIP8000為與其相關的處理器架構進一步降低了內(nèi)存帶寬需求。
VIP8000處理器
VIP8000支持寬泛的神經(jīng)網(wǎng)絡架構,如TensorFlow、Caffe、AndroidNN、RNN和LSTM等,此外,還提供大量軟件和硬件解決方案以幫助開發(fā)者創(chuàng)建高性能神經(jīng)網(wǎng)絡模型和基于機器學習的應用。由于與Vivante GPU架構相同,VIP8000繼承了其OpenCL可編程性,硬件直接存儲器存取和時序安排,以及多環(huán)境并行處理的長處。
對于終端設備來說,有些AI應用并不是孤立的應用,而是可以同時增強現(xiàn)有許多不同應用。作為芯原Vivante IP產(chǎn)品系列的一部分,VIP8000處理器可以在兼顧芯片尺寸和功耗的情況下,輕松地與其他芯原處理器IP相集成。例如,基于共同的架構,VIP8000神經(jīng)網(wǎng)絡引擎可以和任何Vivante GPU直接集成,以面向AR/VR等應用;還可以與芯原的ZSP音頻DSP集成,以面向智能音箱的應用;或是與ISP Nano集成,實現(xiàn)低延遲機器視覺攝像頭的設計;又或是與Hantro視屏編碼相結(jié)合,以實現(xiàn)更好的視頻內(nèi)容壓縮。
AI從云端擴到邊緣端,對話式平臺得到廣泛應用
我們注意到AI有兩個顯著加速的趨勢:
1)AI的部署和應用逐步從云端擴展至邊緣端,也就是直接部署運行在客戶端或IoT終端,滿足了一定的實時性和安全性等要求。例如:Apple的Face ID、Andriod離線版人臉識別等,這主要歸功于AI芯片(或神經(jīng)處理單元NPU)在手機上的深度整合及場景落地。它解決了性能和功耗的平衡問題,同時也強調(diào)了軟硬件結(jié)合來完成場景的落地。
2)對話式平臺的廣泛應用。對話式平臺將改變?nèi)藗兣c技術進行交互的方式。用戶通過語音發(fā)出命令或者問題,對話式平臺進行響應并執(zhí)行一系列相應的功能。這其中包括語音識別、NLP等當下熱門的AI技術,同時也體現(xiàn)了AI時代更加自然和人性化的交互方式。
AI在邊緣端的部署和應用給終端CPU或者SoC帶來了特定任務,例如圖像識別等更大的計算壓力。這種壓力也導致了AI芯片產(chǎn)生,華為的麒麟 970芯片就是一個標志性的事件。它搭載了寒武紀的一款NPU,這款NPU在特定任務計算時的能效是手機CPU的50倍。我們有理由相信,隨著更多AI場景的落地,AI架構的芯片會逐漸成為主流。當然,AI算法也會不斷地優(yōu)化,不斷在系統(tǒng)層面進行融入。如何將芯片、系統(tǒng)與算法高效地融合則是AI場景能否落地的一個關鍵因素。
對話式平臺的廣泛應用開啟新的交互革命
隨著語音識別和NLP(自然語言處理)技術的大熱,聲紋識別技術也逐漸進入大眾的視野,它將與人臉識別等生物認證技術一起在安全和個性化服務領域得到越來越多的普及。目前的語音識別和聲紋識別等語音技術受背景噪音、多人同時說話等環(huán)境因素影響,準確度依然有很大的提升空間。
君林科技的麥克風陣列技術(遠場拾音技術)、去噪聲和混響算法以及高精度、高魯棒性的聲紋識別算法從軟硬件結(jié)合方式優(yōu)化了整條鏈路,在一定程度上消除了環(huán)境因素的影響,大幅提高了聲紋識別的準確度,從而加速了聲紋識別技術在智能硬件、銀行保險和公共安防等行業(yè)的場景落地。
參考文獻:
[1]胡郁.人工智能與語音識別技術[J].電子產(chǎn)品世界, 2016(4):23-25.
[2]王瑩.“CPU+”異構計算時代,華夏芯通過HSA搶占高地[J].電子產(chǎn)品世界, 2016(9):15-17.
[3]王瑩.人工智能的進展及發(fā)展建議[J].電子產(chǎn)品世界, 2017(2-3):23-26.
[4]王瑩,王金旺.異構計算帶來AI視覺新突破[J].電子產(chǎn)品世界, 2017(7):28-29.
[5]任澤坤.芯片廠商引領廣電的人工智能化[J].電子產(chǎn)品世界, 2017(10):23-24.
本文來源于《電子產(chǎn)品世界》2018年第5期第13頁,歡迎您寫論文時引用,并注明出處。
評論