博客專欄

EEPW首頁 > 博客 > YOffleNet | YOLO V4 基于嵌入式設(shè)備的輕量化改進設(shè)計

YOffleNet | YOLO V4 基于嵌入式設(shè)備的輕量化改進設(shè)計

發(fā)布人:計算機視覺工坊 時間:2021-08-16 來源:工程師 發(fā)布文章

以下文章來源于集智書童 ,作者ChaucerG

1.png

1簡介

最新的基于CNN的目標檢測模型相當精確,但需要高性能GPU實時運行。對于內(nèi)存空間有限的嵌入式系統(tǒng)來說,它們在內(nèi)存大小和速度方面依舊不是很好。

由于目標檢測是在嵌入式處理器上進行的,因此在保證檢測精度的同時,最好盡可能地壓縮檢測網(wǎng)絡(luò)。有幾個流行的輕量級檢測模型,但它們的準確性太低。因此,本文提出了一種新的目標檢測模型 YOffleNet,該模型在壓縮率高的同時,將精度損失降到最小,可用于自動駕駛系統(tǒng)上的實時安全駕駛應(yīng)用。該模型的Backbone架構(gòu)是基于YOLOv4實現(xiàn),但是可以用ShuffleNet的輕量級模塊代替CSP的高計算負荷的DenseNet,從而大大壓縮網(wǎng)絡(luò)。

在KITTI數(shù)據(jù)集上的實驗表明,提出的YOffleNet比YOLOv4-s壓縮了4.7倍,在嵌入式GPU系統(tǒng)(NVIDIA Jetson AGX Xavier)上可以達到46FPS的速度。與高壓縮比相比,精度略有降低,為85.8% mAP,僅比YOLOv4-s低2.6%。因此,提出的網(wǎng)絡(luò)具有很高的潛力部署在嵌入式系統(tǒng)。

2YOLO V4簡述

在YOLOv4的主干網(wǎng)絡(luò)CSPDarknet-53中,CSP將特征卷積一定次數(shù)后復(fù)制使用與前一層特征cat起來,然后利用DenseNet模塊。

2.png

在Neck中,輸入特征圖有3種大小。SPP最大池化后concat技術(shù)提高了各種尺寸輸入的準確性。此外,它通過自底向上的路徑增強技術(shù)平滑特征。

YOLOv4引入PANet以促進信息流和它彌補了權(quán)重帶來的精度損失問題。

YOLO v4的Head依舊采用YOLOv3的物體檢測方法。

3YOLO V4輕量化設(shè)計

3.png

YOffleNet

YOLOv4中使用的主要模塊是下圖中的CSP DenseNet;此外為了防止初始特征圖中的信息丟失的問題,作者還設(shè)計了PANet結(jié)構(gòu),其是通過自下而上的路徑增強特征表達的。它促進信息的流動的同時也增加了特征圖中的通道數(shù)、增加參數(shù)的數(shù)量,這也是YOffleNet模型為它改進了上述YOLOv4模型的缺點。

4.png

CSP DenseNet

改進點 1

主干層CSP DenseNet是一種隨著深度增加而不可避免地增加計算量的結(jié)構(gòu)。在本研究中,主干網(wǎng)絡(luò)層被配置為ShuffleNet模塊。

5.png

ShuffleNet模塊

改進點 2

YOLOv4網(wǎng)絡(luò)中使用的SPP+PANet結(jié)構(gòu)簡化和減輕模型的大小?,F(xiàn)有YOLOv4模型的PANet從主干網(wǎng)絡(luò)分為3層作為輸入的。然而,常見對象檢測情況與自動駕駛環(huán)境不同,有限類別中的物體檢測(汽車、行人等,更小的目標也就少了)。

6.png7.png

基于這個原因,改進PANet可以接收來自backbone網(wǎng)絡(luò)的只有2層的輸入。Upsample, Downsample層的位置和數(shù)量變少了。計算量相對也就減少了。

4實驗

8.png9.png

沒啥好評價的,確實變快了,但是這個改進確實有點。。。。你懂的!??!

5參考

[1].Developing a Compressed Object Detection Model based on YOLOv4 for Deployment on Embedded GPU Platform of Autonomous System

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。

電能表相關(guān)文章:電能表原理


關(guān)鍵詞: 深度學(xué)習(xí)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉