博客專欄

EEPW首頁 > 博客 > MobileOne: 移動端僅需1ms的高性能骨干,你值得擁有!

MobileOne: 移動端僅需1ms的高性能骨干,你值得擁有!

發(fā)布人:計算機視覺工坊 時間:2022-06-16 來源:工程師 發(fā)布文章
作者丨Happy

來源AIWalker圖片

一句話總結

MobileOne(≈MobileNetV1+RepVGG+訓練Trick)是由Apple公司提出的一種基于iPhone12優(yōu)化的超輕量型架構,在ImageNet數(shù)據(jù)集上以<1ms的速度取得了75.9%的Top1精度

圖片

出發(fā)點

高效率網(wǎng)絡具有更強的實用價值,但學術界的研究往往聚焦于FLOPs或者參數(shù)量的降低,而這兩者與推理效率之間并不存在嚴格的一致性。比如,F(xiàn)LOPs并未考慮訪存消耗與計算并行度,像無參操作(如跳過連接導致的Add、Concat等)會帶來顯著的訪存消耗,導致更長推理耗時。

圖片

為更好的分析高效率網(wǎng)絡的瓶頸所在,作者以iPhone12平臺為基準,從不同維度進行了"瓶頸"分析,見上圖。從中可以看到:

  • 具有高參數(shù)量的模型也可以擁有低延遲,比如ShuffleNetV2;

  • 具有高FLOPs的模型也可以擁有低延遲,比如MobileNetV1和ShuffleNetV2;

圖片

上表從SRCC角度進行了分析,可以看到:

  • 在移動端,延遲與FLOPs和參數(shù)量的相關性較弱;

  • 在PC-CPU端,該相關性進一步弱化。

具體方案

基于上述洞察,作者從先兩個主要效率"瓶頸"維度上進行了對比,然后對性能"瓶頸"進行了分析并提出相應方案。

圖片

  • Activation Functions:上表對比了不同激活函數(shù)對于延遲的影響,可以看到:盡管具有相同的架構,但不同激活函數(shù)導致的延遲差異極大。本文默認選擇ReLU激活函數(shù)。

圖片

  • Architectural Block:上表對影響延遲的兩個主要因素(訪存消耗與計算并行度)進行了分析,見上表,可以看到:當采用單分支結構時,模型具有更快的速度。此外,為改善效率,作者在大模型配置方面有限的實用了SE模塊。

圖片

基于上述分析,MobileOne的核心模塊基于MobileNetV1而設計,同時吸收了重參數(shù)思想,得到上圖所示的結構。注:這里的重參數(shù)機制還存在一個超參k用于控制重參數(shù)分支的數(shù)量(實驗表明:對于小模型來說,該變種收益更大)。

圖片

在Model Scaling方面類似MobileNetV2,上表給出了MobileOne不同配置的參數(shù)信息。

圖片

在訓練優(yōu)化方面,小模型需要更少的正則,因此作者提出了Annealing的正則調(diào)整機制(可帶來0.5%指標提升);此外,作者還引入漸進式學習機制(可帶來0.4%指標提升);最后,作者還采用EMA機制,最終MobileOne-S2模型達到了77.4%的指標。

實驗結果

圖片

上表給出了ImageNet數(shù)據(jù)集上不同輕量型方案的性能與效率對比,可以看到:

  • 哪怕最輕量的Transformer也需要至少4ms,而MobileOne-S4僅需1.86ms即可達到79.4%的精度;

  • 相比EfficientNet-B0,MobileOne-S3不僅具有指標高1%,同時具有更快的推理速度;

  • 相比其他方案,在PC-CPU端,MobileOne仍具有非常明顯的優(yōu)勢。

圖片

上表為MS-COCO檢測、VOC分割以及ADE20K分割任務上的性能對比,很明顯:

  • 在MC-COCO任務上,MobileOne-S4比MNASNet指標高27.8%,比MobileViT高6.1%;

  • 在VOC分割任務上,所提方案比MobileViT高1.3%,比MobileNetV2高5.8%;

  • 在ADE20K任務上,所提最佳方案比MobileNetV2高12%,而MobileOne-S1仍比MobileNetV2高2.9%。

圖片

在文章最后,作者俏皮的提了一句:"Although, our models are state-of-the art within the regime of efficient architectures, the accuracy lags large models ConvNeXt and Swin Transformer"。筆者想說的是:看上圖。

本文僅做學術分享,如有侵權,請聯(lián)系刪文。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區(qū)

關閉