邊緣視覺 AI 的理想平臺(tái)
Kria K26 SOM 旨在讓數(shù)百萬(wàn)開發(fā)者在他們最擅長(zhǎng)的環(huán)境下,用開箱即用的低成本開發(fā)套件入門,以更快的速度部署他們的智能視覺應(yīng)用。
本文引用地址:http://m.butianyuan.cn/article/202106/426416.htm概要
隨著人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 算法取得一系列新的進(jìn)展,眾多高計(jì)算強(qiáng)度的應(yīng)用現(xiàn)在正在被部署到邊緣設(shè)備上。因此我們需要一種高效率的硬件,既能高效率地執(zhí)行復(fù)雜算法,又能適應(yīng)這種技術(shù)的快速演進(jìn)。賽靈思 Kria? K26 SOM 的設(shè)計(jì)初衷,是用于滿足在邊緣設(shè)備上高效率執(zhí)行 ML 應(yīng)用的需求。本白皮書對(duì)各種 ML 模型和實(shí)時(shí)應(yīng)用的性能開展研究并與英偉達(dá) Jetson Nano 和英偉達(dá) Jetson TX2 進(jìn)行對(duì)比。賽靈思的研究結(jié)果表明,K26 SOM 提供了比英偉達(dá) Jetson Nano高出大約 3 倍的性能。此外,它的單位功耗性能比英偉達(dá) Jetson TX2 提升 2 倍。對(duì)于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò),K26 SOM 的低時(shí)延高性能深度學(xué)習(xí)處理單元 (DPU)提供了比 Nano 高出 4 倍,甚至更高的性能,這使得 Kria SOM 成為ML 邊緣應(yīng)用開發(fā)的理想選擇。
計(jì)算視覺的發(fā)展
在過(guò)去十年,人工智能和機(jī)器學(xué)習(xí)算法有了長(zhǎng)足發(fā)展。這些發(fā)展主要體現(xiàn)在視覺相關(guān)的應(yīng)用上。2012 年,AlexNet(Krizhevsky 等[參考資料 1])從 ImageNet 大規(guī)模視覺識(shí)別挑戰(zhàn)賽勝出 (ILSVRC),成為首個(gè)使用反向傳播算法完成訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的淺網(wǎng)絡(luò)相比,性能發(fā)生了前所未有的近 10% 的飛躍, 預(yù)測(cè)精度躋身前 5 位。這個(gè)重大發(fā)展是一個(gè)轉(zhuǎn)折點(diǎn)。從那時(shí)起,深度神經(jīng)網(wǎng)絡(luò)在性能和精度兩個(gè)方面不斷迎來(lái)巨大進(jìn)展。2015 年 ResNet(Kaiming 等[參考資料 2])超越了單個(gè)人類的分類能力。參見圖1。就各種目的和用途而言,今天的神經(jīng)網(wǎng)絡(luò)的錯(cuò)誤率已經(jīng)可以與貝葉斯錯(cuò)誤率相媲美,可以視為已經(jīng)解決了計(jì)算機(jī)視覺應(yīng)用中的圖像分類問題。
圖1 前5位預(yù)測(cè)精度
鑒于如此令人振奮的結(jié)果,半導(dǎo)體制造商爭(zhēng)相開發(fā)器件,支持深度學(xué)習(xí)部署的高度復(fù)雜的計(jì)算需求。在未來(lái)十年,推斷功能的商業(yè)化,特別是用深度學(xué)習(xí)實(shí)現(xiàn)的計(jì)算機(jī)視覺的商業(yè)化,將繼續(xù)高速增長(zhǎng)。計(jì)算機(jī)視覺市場(chǎng)規(guī)模預(yù)計(jì)將以 30% 的年均復(fù)合增長(zhǎng)率 (CAGR) 增長(zhǎng),到 2025 年將達(dá)到 262 億美元 [參考資料 3]。用深度學(xué)習(xí)實(shí)現(xiàn)的計(jì)算機(jī)視覺可以廣泛地應(yīng)用到各類行業(yè)市場(chǎng),包括零售分析、智慧城市、執(zhí)法、邊境安全、機(jī)器人、醫(yī)療成像、作物收獲優(yōu)化、符號(hào)語(yǔ)言識(shí)別等。在不遠(yuǎn)的未來(lái),AI 將成為日常生活的內(nèi)在組成部分。而且有部分人認(rèn)為如今這樣的未來(lái)近在咫尺。
隨著新穎的網(wǎng)絡(luò)、層和量化技術(shù)被開發(fā)出來(lái),采用固定存儲(chǔ)器架構(gòu)的硬化Tensor 加速器,不再能夠滿足未來(lái)的需求。這種狀況已經(jīng)在 MobileNets(Howard 等)的發(fā)展中表露無(wú)遺[參考資料 4]。在 MobileNet 骨干網(wǎng)絡(luò)中使用深度卷積能大幅降低計(jì)算-存儲(chǔ)器比。這對(duì)于通用 CPU 這樣的器件來(lái)說(shuō)非常理想。CPU 一般受計(jì)算約束,但在若因架構(gòu)受存儲(chǔ)器所限而導(dǎo)致效率有限,在某種程度上等于浪費(fèi)了寶貴的計(jì)算周期,
就像數(shù)據(jù)中心中的空閑服務(wù)器消耗能量一樣。這種計(jì)算-存儲(chǔ)器比影響著部署網(wǎng)絡(luò)[參考資料 5]時(shí)具體 Tensor 加速器架構(gòu)的總效率。不幸的是,ASIC 和 ASSP Tensor 加速器架構(gòu)一般在器件流片前至少一年就已凍結(jié)。但在使用賽靈思推斷技術(shù)時(shí)則不會(huì)發(fā)生這種情況。賽靈思技術(shù)能隨時(shí)間推移進(jìn)行調(diào)整和優(yōu)化,以支持神經(jīng)網(wǎng)絡(luò)架構(gòu)的快速演進(jìn)發(fā)展,從而確保低功耗、高效率。
本白皮書介紹了賽靈思產(chǎn)品組合中的最新成員 Kria? K26 SOM,及其在嵌入式視覺應(yīng)用中的的主要優(yōu)勢(shì)。
評(píng)論