降低MCU運(yùn)行AI算法的門檻！恩智浦Nano.AI工具鏈解讀

發(fā)布人：芯東西時(shí)間：2021-05-21 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

破解MCU部署AI難題，恩智浦技術(shù)專家分享軟件妙招。

編譯 | 心緣
編輯 | 漠影
5月25日，覆蓋輕量級(jí)神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì)、模型壓縮、AI推理引擎、AI芯片架構(gòu)創(chuàng)新等主題的GTIC 2021嵌入式AI創(chuàng)新峰會(huì)將在北京舉行。屆時(shí)，嵌入式AI產(chǎn)業(yè)鏈10+位技術(shù)大牛及業(yè)界專家齊聚，探討物聯(lián)網(wǎng)與AI融合賽道的核心議題。峰會(huì)前夕，我們與多位嘉賓進(jìn)行系列深度訪談，提前一睹他們對(duì)產(chǎn)業(yè)的真知灼見。本期訪談嘉賓為恩智浦半導(dǎo)體IoT解決方案高級(jí)經(jīng)理秦建峰，他將帶來主題為《如何設(shè)計(jì)高效率MCU AI工具鏈》的演講。秦建峰擁有中國科學(xué)技術(shù)大學(xué)碩士學(xué)位，負(fù)責(zé)AI/ML技術(shù)在恩智浦的MCU及MPU上的應(yīng)用開發(fā)，曾帶領(lǐng)團(tuán)隊(duì)獨(dú)立研發(fā)并發(fā)布了全球第一款基于MCU RT106F的低功耗、低成本的人臉識(shí)別方案，基于雙目活體算法的方案廣泛應(yīng)用于門鎖及門禁等產(chǎn)品。他帶領(lǐng)團(tuán)隊(duì)獨(dú)立研發(fā)的Nano.AI工具鏈，能快速準(zhǔn)確地將客戶的算法模型從MPU平臺(tái)部署到MCU平臺(tái)，達(dá)到降功耗和降成本的目的。就MCU部署AI應(yīng)用的痛點(diǎn)、現(xiàn)有AI開源工具鏈的局限性、恩智浦打磨軟件工具的經(jīng)驗(yàn)與解法等話題，我們與秦建峰進(jìn)行了深入交流。

AI跑在MCU上，存在哪些技術(shù)挑戰(zhàn)和痛點(diǎn)？

在物聯(lián)網(wǎng)與AI交匯之處，技術(shù)創(chuàng)新的火苗正逾燃逾旺，從芯片大廠到創(chuàng)業(yè)公司都在積極涌入嵌入式AI新浪潮，恩智浦正是其中的代表玩家之一。在理解物聯(lián)網(wǎng)客戶需求方面，很少有公司能有像恩智浦這樣的深度和廣度。一方面，它是MCU（微控制單元）、應(yīng)用處理器領(lǐng)域的資深玩家；另一方面，它的物聯(lián)網(wǎng)布局還覆蓋到各種無線連接產(chǎn)品、安全功能芯片、超寬帶（UWB）芯片及相應(yīng)軟件和方案。從與客戶的交流中，秦建鋒發(fā)現(xiàn)恩智浦的物聯(lián)網(wǎng)客戶有一些共性需求，除了關(guān)注成本外，也越來越看重MCU的算力、豐富的AI功能，以及尋求產(chǎn)品的差異化。MCU在低功耗、低成本的物聯(lián)網(wǎng)應(yīng)用中落地廣泛，比如智能門鎖、基于電池的手持端設(shè)備，它們不像安防監(jiān)控設(shè)備需要高分辨率、快響應(yīng)速度，更在乎是否足夠便宜、耐用性好。相比初創(chuàng)公司，恩智浦手中握著沉甸甸的數(shù)十年MCU產(chǎn)品經(jīng)驗(yàn)，這是它獨(dú)有的技術(shù)財(cái)富。除了持續(xù)加固自身技術(shù)壁壘外，恩智浦也在思考著怎么解決客戶最棘手的問題。不過，當(dāng)AI應(yīng)用逐漸遍及MCU領(lǐng)域，新的挑戰(zhàn)開始出現(xiàn)。第一道難關(guān)即是硬件算力的受限和運(yùn)行內(nèi)存空間大小的挑戰(zhàn)。囿于低功耗、低成本，有些中低端MCU不支持外擴(kuò)SDRAM，僅支持內(nèi)部幾百KB的SRAM和受限到幾十兆空間的Flash。大部分廠商的AP處理器采用基于Arm Cortex-A系列的多核、高主頻CPU，對(duì)于浮點(diǎn)數(shù)跟定點(diǎn)數(shù)的處理能力都非常強(qiáng)，功耗和成本也相對(duì)偏高。功耗和成本較低的MCU則往往是單核的，主頻幾百M(fèi)Hz，恩智浦目前主流的是600MHz，1GHz剛剛推出，即便這樣，Arm Cortex-M MCU處理器面向低功耗設(shè)計(jì)，對(duì)于浮點(diǎn)數(shù)的處理能力較弱。這些MCU需要設(shè)計(jì)輕量化的模型，并進(jìn)行一些量化、裁剪、融合等優(yōu)化操作。這就帶來第二個(gè)難關(guān)——目前MCU轉(zhuǎn)化及量化缺乏成熟且統(tǒng)一的標(biāo)準(zhǔn)。如果廠商可以針對(duì)MCU的特點(diǎn)開發(fā)一些好工具鏈，就能在MCU上得到相應(yīng)非常好的性能。而關(guān)鍵的難題在于，盡管各開源大廠對(duì)自身的訓(xùn)練框架、引擎級(jí)模型支持較好，但對(duì)于一些相對(duì)復(fù)雜或特殊的模型，大概率無法成功地轉(zhuǎn)化，或者是看似成功，實(shí)際上精度丟失比較嚴(yán)重。有些推理引擎為了實(shí)現(xiàn)跨平臺(tái)和兼容性，一定程度上犧牲了性能；有些開源推理引擎因追求大而全，致使體量過于龐大，內(nèi)存空間浪費(fèi)嚴(yán)重。如果客戶并未深度掌握AI機(jī)器學(xué)習(xí)技術(shù)，一旦工具鏈出問題，就無法繼續(xù)在MCU上部署AI模型。因此，開源工具鏈?zhǔn)且环N選擇，但存在很大的技術(shù)風(fēng)險(xiǎn)和不確定性。這也是恩智浦嗅到機(jī)會(huì)的地方——針對(duì)AI在MCU上的部署，客戶需要依賴一些商用工具的支持。
AI工具鏈已打磨三年降低MCU部署AI門檻

從2018年底啟動(dòng)研發(fā)至今，恩智浦的Nano.AI工具鏈已經(jīng)打磨了將近三年，目前已到試用階段。傳統(tǒng)AI機(jī)器學(xué)習(xí)模型如果直接在MCU上運(yùn)行，運(yùn)行效率非常低，可能與優(yōu)化后的性能大概相差10倍以上。因此這些模型需要通過開源工具鏈或是廠商自己開發(fā)的工具鏈來做轉(zhuǎn)換。借助AI工具鏈，客戶無需在原始AI模型轉(zhuǎn)換方面做過多投入，即便缺乏應(yīng)用經(jīng)驗(yàn)，也能比較省力地將其原始算法模型轉(zhuǎn)換成在MCU上能直接使用的算法庫。在MPU領(lǐng)域，開源標(biāo)準(zhǔn)已經(jīng)發(fā)展的相對(duì)成熟，支持范圍較廣，出現(xiàn)問題的可能性較低。但在MCU領(lǐng)域，還沒出現(xiàn)一款足夠成熟好用的AI工具鏈。發(fā)現(xiàn)這一空白后，恩智浦決定綜合各類方案的優(yōu)缺點(diǎn)，打造一個(gè)適用于MCU的AI工具鏈，起名為Nano.AI工具鏈，并基于自研工具開發(fā)出一些完整解決方案，交予客戶商用。

恩智浦的AI工具鏈主要包含兩部分，一部分是將原始算法模型轉(zhuǎn)換成MCU上能夠快速運(yùn)行的數(shù)據(jù)和庫，另一部分包含一個(gè)輕量級(jí)推理引擎，能做出一個(gè)能跑在MCU上、只需幾兆Flash甚至幾兆SDRAM的方案。同時(shí)，恩智浦也可以將具體的優(yōu)化措施反饋給客戶，包括從算法、算法、模型本身和源頭上如何做優(yōu)化從而實(shí)現(xiàn)一個(gè)更適合在MCU上跑的算法模型。這需要一個(gè)相互支持的合作模式。要做出這樣一套AI工具鏈，首先MCU技術(shù)團(tuán)隊(duì)需對(duì)自家產(chǎn)品的架構(gòu)優(yōu)勢(shì)等各方面有深入了解。比如，恩智浦之所以能在MCU上實(shí)現(xiàn)很多視覺與語音AI應(yīng)用，是因?yàn)槎髦瞧謱?duì)自身在總線架構(gòu)設(shè)計(jì)上的優(yōu)勢(shì)有信心，像大尺寸cache、大TCM內(nèi)存，天然就能在MCU上得到很好的AI性能。另外，一些終端方案的大廠會(huì)推出自家的工具鏈、算法，但它們主要是服務(wù)于自身，同時(shí)在對(duì)MCU的理解深度方面通常不如芯片廠商。相對(duì)而言，恩智浦不是AI軟件公司，而是一家芯片供應(yīng)商，天然就有幫助客戶解決技術(shù)壁壘的意愿，會(huì)通過合作幫助客戶解決基于MCU的AI方案的種種技術(shù)壁壘。
恩智浦IoT半導(dǎo)體的競(jìng)爭力：深入客戶、車規(guī)標(biāo)準(zhǔn)、供貨穩(wěn)定、交鑰匙方案

AI工具鏈只是恩智浦強(qiáng)化其IoT半導(dǎo)體業(yè)務(wù)實(shí)力的一個(gè)能力分支。在交流過程中，秦建峰總結(jié)了恩智浦IoT半導(dǎo)體方案的4項(xiàng)競(jìng)爭力。第一，恩智浦有幾十年的微控制器和應(yīng)用處理器的產(chǎn)品經(jīng)驗(yàn)，在芯片架構(gòu)積累了一些獨(dú)到的能力，并對(duì)客戶應(yīng)用有深入理解，能從廣泛的客戶群中挖掘出很多共性的需求。第二，作為一個(gè)領(lǐng)先的汽車芯片供應(yīng)商，恩智浦在非汽車芯片的很多設(shè)計(jì)也遵循車規(guī)的要求，因此產(chǎn)品質(zhì)量本身過硬。第三，恩智浦堅(jiān)持長期供貨，在芯片設(shè)計(jì)界有優(yōu)良口碑，能幫客戶降低很多風(fēng)險(xiǎn)。第四，恩智浦長期大量投入軟件和方案，像秦建峰所在的解決方案部門一直幫助客戶基于恩智浦的芯片、算法及工具鏈做交鑰匙方案，進(jìn)而降低方案開發(fā)門檻、減少研發(fā)投入，并能及時(shí)支持一些定制化需求，使客戶的方案快速投入到市場(chǎng)。例如，恩智浦近兩年已成功推出基于MCU的亞馬遜Alexa方案，其中包含多類算法。如果沒有像恩智浦這樣廠商去牽頭去做，普通客戶很難得到亞馬遜的認(rèn)證。恩智浦把整個(gè)交鑰匙方案做好之后，客戶就能快速出產(chǎn)品。
下一代MCU將集成更豐富的AI特性

在秦建峰看來，要衡量一個(gè)IoT芯片產(chǎn)品的優(yōu)劣，首先要找到整體成本和性能表現(xiàn)的一個(gè)最佳平衡點(diǎn)，除此以外，還有幾點(diǎn)還需要綜合考慮：一是整體的功耗和方案的可擴(kuò)展性，二是否引入了太多的第三方，導(dǎo)致開發(fā)進(jìn)度、靈活度受到限制，三是有沒有一個(gè)長期路線圖，能確保方案設(shè)計(jì)存在延續(xù)性，可以持續(xù)地迭代更新。目前，恩智浦正在規(guī)劃的下一代MCU和AP平臺(tái)，將集成更豐富的AI功能和無線連接特性，并基于這些芯片路線圖推出更多交鑰匙解決方案，進(jìn)一步覆蓋語音和視覺AI的一些高性價(jià)比應(yīng)用方案。談及后續(xù)計(jì)劃，他透露說，恩智浦會(huì)在邊緣設(shè)備的AI方面持續(xù)投入，包括帶有神經(jīng)網(wǎng)絡(luò)加速器的全系列微控制器和應(yīng)用處理器、完整的機(jī)器學(xué)習(xí)工具鏈，以及基于機(jī)器的視覺、聽覺和健康運(yùn)動(dòng)數(shù)據(jù)分析處理等各種AI解決方案。在MCU上運(yùn)行視覺AI方面，恩智浦已推出基于MCU的語音及人臉識(shí)別的一系列完整方案，后續(xù)還將推出更多的姿態(tài)識(shí)別、手勢(shì)識(shí)別等方案。
結(jié)語：AIoT的核心挑戰(zhàn)：找到AI殺手級(jí)應(yīng)用

長期來看，如果谷歌、Arm等各大軟硬件廠商持續(xù)合作，應(yīng)該能慢慢形成一些基于MCU的標(biāo)準(zhǔn)，并隨著時(shí)間的積淀而做得越來越完備?！昂芏嗫蛻羧孕枰蕾囎罱K的芯片廠商，來得到一個(gè)最優(yōu)化的MCU部署AI的工具鏈支持。”秦建峰說。在他看來，AIoT芯片領(lǐng)域仍將面臨的挑戰(zhàn)是真正找到AI機(jī)器學(xué)習(xí)的殺手級(jí)應(yīng)用，光有技術(shù)是不夠的，最終要跟客戶需求相匹配，找到一些共性的應(yīng)用來持續(xù)推動(dòng)技術(shù)前進(jìn)。在5月25日（下周二）舉辦的GTIC 2021嵌入式AI創(chuàng)新峰會(huì)上，秦建峰將帶來圍繞MCU部署AI應(yīng)用的主要痛點(diǎn)、如何提升MCU邊緣端AI運(yùn)算性能和精度等方面的分享，并對(duì)恩智浦Nano.AI工具鏈系統(tǒng)框架設(shè)計(jì)做更詳細(xì)地解讀。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

降低MCU運(yùn)行AI算法的門檻！恩智浦Nano.AI工具鏈解讀

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

降低MCU運(yùn)行AI算法的門檻！恩智浦Nano.AI工具鏈解讀

相關(guān)推薦

技術(shù)專區(qū)

降低MCU運(yùn)行AI算法的門檻！恩智浦Nano.AI工具鏈解讀