Ceva擴(kuò)展智能邊緣IP領(lǐng)導(dǎo)地位增添用于AIoT設(shè)備的全新TinyML優(yōu)化NPU
● 小巧的Ceva-NeuPro-Nano NPU帶來了超低功耗與最佳性能的優(yōu)化平衡,可在消費(fèi)、工業(yè)和通用 AIoT 產(chǎn)品中高效執(zhí)行 TinyML 工作負(fù)載
● 用于Ceva-NeuPro NPU系列的Ceva-NeuPro Studio完善了AI SDK,支持包括TensorFlow Lite for Microcontrollers和microTVM的開放式AI框架,可加快開發(fā)TinyML應(yīng)用
● Ceva憑借在物聯(lián)網(wǎng)連接方面的市場領(lǐng)導(dǎo)地位以及在音頻和視覺傳感方面的強(qiáng)大專業(yè)知識,開發(fā)針對嵌入式設(shè)備的優(yōu)化 NPU,幫助半導(dǎo)體企業(yè)和OEM廠商發(fā)揮邊緣人工智能的潛力
幫助智能邊緣設(shè)備更可靠、更高效地連接、感知和推斷數(shù)據(jù)的全球領(lǐng)先半導(dǎo)體產(chǎn)品和軟件IP授權(quán)許可廠商Ceva公司近日宣布推出Ceva-NeuPro-Nano NPU以擴(kuò)展其Ceva-NeuPro Edge AI NPU產(chǎn)品系列。這些自給自足的高效NPU可為半導(dǎo)體企業(yè)和OEM廠商提供所需的功耗、性能和成本效益,以便在用于消費(fèi)、工業(yè)和通用 AIoT 產(chǎn)品的SoC 中集成TinyML模型。
TinyML是指在低功耗、資源受限的設(shè)備上部署機(jī)器學(xué)習(xí)模型,從而將人工智能引入物聯(lián)網(wǎng) (IoT)。物聯(lián)網(wǎng)設(shè)備對高效、專業(yè)的人工智能解決方案的需求日益增加,推動了TinyML市場快速增長。根據(jù)研究機(jī)構(gòu)ABI Research預(yù)測,到 2030 年,超過40% 的TinyML出貨量將采用專用 TinyML 硬件,而非由通用MCU驅(qū)動。Ceva-NeuPro-Nano NPU解決了TinyML所面臨的特定性能難題,以實(shí)現(xiàn)無處不在和經(jīng)濟(jì)實(shí)用的人工智能,廣泛應(yīng)用于消費(fèi)和工業(yè)物聯(lián)網(wǎng)應(yīng)用中的語音、視覺、預(yù)測性維護(hù)和健康感知等領(lǐng)域。
新型Ceva-NeuPro-Nano嵌入式AI NPU架構(gòu)完全可編程,可高效執(zhí)行神經(jīng)網(wǎng)絡(luò)、特征提取、控制代碼和 DSP 代碼,并支持最先進(jìn)的機(jī)器學(xué)習(xí)數(shù)據(jù)類型和運(yùn)算符,包括原生變換器計算、稀疏性加速和快速量化。與需要結(jié)合CPU或DSP并且基于 AI 加速器架構(gòu)的現(xiàn)有TinyML 工作負(fù)載處理器解決方案相比,這種優(yōu)化的自給自足架構(gòu)使得Ceva-NeuPro-Nano NPU具有更高的能效、更小的硅片尺寸以及更佳性能。此外,Ceva-NetSqueeze AI壓縮技術(shù)可直接處理壓縮模型權(quán)重,省去中間的解壓縮階段,這減少了80%的Ceva-NeuPro-Nano NPU內(nèi)存占用,從而解決了阻礙AIoT處理器廣泛應(yīng)用的關(guān)鍵瓶頸問題。
Ceva副總裁兼?zhèn)鞲衅骱鸵纛l業(yè)務(wù)部門總經(jīng)理Chad Lucien表示:“Ceva-NeuPro-Nano將TinyML應(yīng)用集成到低功耗物聯(lián)網(wǎng)SoC和MCU中,并且以我們的企業(yè)戰(zhàn)略為基礎(chǔ),通過先進(jìn)的連接、傳感和推理能力為智能邊緣設(shè)備賦能,為企業(yè)開創(chuàng)了難能可貴的機(jī)會。Ceva-NeuPro-Nano系列NPU使得更多公司能夠?qū)⑷斯ぶ悄軒脒吘墤?yīng)用,從而制造具有先進(jìn)功能集的智能物聯(lián)網(wǎng)設(shè)備,為客戶創(chuàng)造更多的價值。我們在無線物聯(lián)網(wǎng)連接方面具有行業(yè)領(lǐng)先地位,在音頻和視覺傳感方面亦擁有強(qiáng)大專業(yè)技術(shù),具備獨(dú)一無二的市場條件,能夠幫助客戶發(fā)揮TinyML的巨大潛力,實(shí)現(xiàn)創(chuàng)新的解決方案,從而增強(qiáng)用戶體驗(yàn)、提高效率,并為建設(shè)更智能、更互聯(lián)的世界做出貢獻(xiàn)?!?/p>
ABI Research行業(yè)分析師Paul Schell表示:“對于在智能邊緣物聯(lián)網(wǎng)設(shè)備上實(shí)現(xiàn)人工智能,Ceva-NeuPro-Nano可以滿足電池供電設(shè)備對功耗、性能和成本的要求,實(shí)現(xiàn)語音、視覺和傳感用例在廣泛終端市場的始終在線應(yīng)用,令人刮目相看。從 TWS 耳機(jī)、耳塞、可穿戴設(shè)備和智能揚(yáng)聲器到工業(yè)傳感器、智能電器、家居自動化設(shè)備、攝像頭等,Ceva-NeuPro-Nano可以在能源受限的 AIoT 設(shè)備中實(shí)施 TinyML。”
Ceva-NeuPro-Nano NPU提供兩款配置,包括配備32個int8 MAC的Ceva-NPN32和配備64個int8 MAC的Ceva-NPN64,兩種配置都通過Ceva-NetSqueeze獲得直接處理壓縮模型權(quán)重功能。Ceva-NPN32 針對語音、音頻、物品檢測和異常檢測用例的大多數(shù) TinyML工作負(fù)載進(jìn)行了高度優(yōu)化;Ceva-NPN64則利用權(quán)重稀疏性、更大內(nèi)存帶寬、更多MAC和4位權(quán)重支持提供2倍性能加速,從而提供更強(qiáng)大的性能,在設(shè)備上實(shí)現(xiàn)更復(fù)雜的人工智能用例 (如物品分類、人臉檢測、語音識別和健康監(jiān)測等) 。
這些NPU隨附完整的人工智能SDK - Ceva-NeuPro Studio,這是為整個Ceva-NeuPro NPU系列提供一套通用工具的統(tǒng)一人工智能堆棧,支持包括TensorFlow Lite for Microcontrollers (TFLM) 和 microTVM (μTVM)的開放式人工智能框架。
Ceva-NeuPro-Nano主要特性
靈活的可擴(kuò)展NPU架構(gòu)
● 完全可編程,高效執(zhí)行神經(jīng)網(wǎng)絡(luò)、特征提取、控制代碼和 DSP 代碼
● 設(shè)計具備可擴(kuò)展性能,滿足廣泛用例需求
o 具有每周期最多 64 個 int8 MAC的MAC 配置
● 面向未來的架構(gòu),支持最先進(jìn)的 ML 數(shù)據(jù)類型和運(yùn)算符
o 支持 4 位至 32 位整數(shù)
o 原生變換器計算
● 利用先進(jìn)的機(jī)制為所有用例提供終極 ML 性能
o 稀疏性加速
o 非線性激活類型加速
o 快速量化
超低內(nèi)存需求邊緣NPU
● 用于NN計算、特征提取、控制代碼和DSP代碼的高效單核設(shè)計,可讓這些計算密集型任務(wù)省去配套MCU
● 通過 Ceva-NetSqueeze 直接處理壓縮模型權(quán)重,省去中間的解壓縮階段,最多可減少 80% 的內(nèi)存占用
通過創(chuàng)新能源優(yōu)化技術(shù)實(shí)現(xiàn)超低能耗
● 自動化的即時能源調(diào)整
● 通過使用權(quán)重稀疏性加速對計算進(jìn)行提煉,大幅降低能耗和帶寬需求
易于使用的完備人工智能SDK
● Ceva-NeuPro Studio為所有Ceva-NeuPro NPU (從全新Ceva-NeuPro-Nano到功能強(qiáng)大的Ceva-NeuPro-M) 提供統(tǒng)一的人工智能堆棧,具有簡便的點(diǎn)擊運(yùn)行使用體驗(yàn)
● 加速軟件的開發(fā)和部署,從而縮短產(chǎn)品上市時間
● 經(jīng)過優(yōu)化,可與包括 TFLM 和 μTVM 在內(nèi)的領(lǐng)先開放式人工智能推理框架無縫協(xié)作
● Model Zoo包含預(yù)訓(xùn)練和優(yōu)化的TinyML 模型,涵蓋語音、視覺和傳感用例
● 靈活適應(yīng)新的模型、應(yīng)用和市場需求
● 全面的優(yōu)化運(yùn)行時間程序庫和現(xiàn)成的特定應(yīng)用軟件組合
評論