安全隱患：神經(jīng)網(wǎng)絡(luò)可以隱藏惡意軟件

發(fā)布人：AI科技大本營(yíng) 時(shí)間：2022-03-12 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編譯 | 禾木木

出品 | AI科技大本營(yíng)（ID:rgznai100）

憑借數(shù)百萬和數(shù)十億的數(shù)值參數(shù)，深度學(xué)習(xí)模型可以做到很多的事情，例如，檢測(cè)照片中的對(duì)象、識(shí)別語(yǔ)音、生成文本以及隱藏惡意軟件。加州大學(xué)圣地亞哥分校和伊利諾伊大學(xué)的研究人員發(fā)現(xiàn)，神經(jīng)網(wǎng)絡(luò)可以在不觸發(fā)反惡意軟件的情況下嵌入惡意負(fù)載。

惡意軟件隱藏技術(shù) EvilModel 揭示了深度學(xué)習(xí)的安全問題，這已成為機(jī)器學(xué)習(xí)和網(wǎng)絡(luò)安全會(huì)議討論的熱門話題。隨著深度學(xué)習(xí)逐漸與我們的應(yīng)用中變得必不可分，安全社區(qū)需要考慮新的方法來保護(hù)用戶免受這類新興的威脅。

深度學(xué)習(xí)模型中隱藏的惡意軟件

每個(gè)深度學(xué)習(xí)模型都是由多層人工神經(jīng)元組成，根據(jù)層的類型，每個(gè)神經(jīng)元與其上一層和下一層中的所有或部分神經(jīng)元有所連接。根據(jù)深度學(xué)習(xí)模型在針對(duì)任務(wù)訓(xùn)練時(shí)使用的參數(shù)數(shù)值不同，神經(jīng)元間連接的強(qiáng)度也會(huì)不同，大型的神經(jīng)網(wǎng)絡(luò)甚至可以擁有數(shù)億乃至數(shù)十億的參數(shù)。EvilModel 背后的主要思想是將惡意軟件嵌入到神經(jīng)網(wǎng)絡(luò)的參數(shù)中，使其對(duì)惡意軟件掃描儀不可見。這是隱寫術(shù)的一種形式，將一條信息隱藏在另一條信息中的做法。同時(shí)，攜帶惡意病毒的深度學(xué)習(xí)模型還必須執(zhí)行其主要任務(wù)（例如，圖像分類）做到和正常模型一樣號(hào)，以避免引起懷疑或使其對(duì)受害者無用。最后，攻擊者必須有一種機(jī)制將受感染的模型傳遞給目標(biāo)設(shè)備，并從模型參數(shù)中提取惡意軟件。

更改參數(shù)值

多數(shù)深度學(xué)習(xí)模型都會(huì)使用 32 位（4 個(gè)字節(jié)）的浮點(diǎn)數(shù)來存儲(chǔ)參數(shù)值。據(jù)研究者實(shí)驗(yàn)，黑客可以在不顯著提升其中數(shù)值的前提下，每個(gè)參數(shù)中存儲(chǔ)最多存儲(chǔ) 3 字節(jié)的病毒。大多數(shù)深度學(xué)習(xí)模型使用 32 位（4字節(jié)）浮點(diǎn)數(shù)來存儲(chǔ)參數(shù)值。根據(jù)研究，在不顯著提升其數(shù)值的前提下，最多有三字節(jié)可用于嵌入惡意代碼。在感染深度學(xué)習(xí)模型時(shí)，攻擊者會(huì)將病毒打散至 3 字節(jié)，并將數(shù)據(jù)嵌入到模型的參數(shù)之中。為了將惡意軟件傳輸至目標(biāo)的手段，攻擊者可以將感染后的模型發(fā)布至 GitHub 或 TorchHub 等任意托管神經(jīng)模型的網(wǎng)站。或是通過更復(fù)雜的供應(yīng)鏈攻擊形式，讓目標(biāo)設(shè)備上軟件的自動(dòng)更新來傳播受感染的模型。一旦受感染后的模型交付給受害者，一個(gè)小小的軟件就可提取并執(zhí)行負(fù)載。

在卷積神經(jīng)網(wǎng)絡(luò)中隱藏的惡意軟件

為了驗(yàn)證 EvilModel 的可行性，研究人員在多個(gè)卷積神經(jīng)網(wǎng)絡(luò)（CNN）中進(jìn)行了測(cè)試。CNN 是個(gè)很好的測(cè)試環(huán)境，首先，CNN 的體積都很大，通常會(huì)有幾十層和數(shù)百萬的參數(shù)；其次，CNN 包含各類架構(gòu)，有不同類型的層（全連接層、卷積層）、不同的泛化技術(shù)（批歸一化、棄權(quán)、池化等等），這些多樣化讓評(píng)估各類病毒嵌入設(shè)定變得可能；第三，CNN 通常用于計(jì)算機(jī)視覺類的應(yīng)用，這些都是惡意因素的主要攻擊對(duì)象；最后，很多經(jīng)過預(yù)訓(xùn)練的 CNN 可以在不經(jīng)任何改動(dòng)的情況下直接集成到新的應(yīng)用程序中，而多數(shù)在應(yīng)用中使用預(yù)訓(xùn)練 CNN 的開發(fā)人員并不一定知道深度學(xué)習(xí)的具體應(yīng)用原理。研究人員首先嘗試進(jìn)行病毒嵌入的神經(jīng)網(wǎng)路是AlexNet，一款曾在 2012 年重新激起人們對(duì)深度學(xué)習(xí)興趣的流行軟件，擁有 178 兆字節(jié)、五個(gè)卷積層和三個(gè)密集層或全連接層。在用批量標(biāo)準(zhǔn)化（Batch Normalization，一種先分組標(biāo)準(zhǔn)化訓(xùn)練樣本，再進(jìn)入深度模型訓(xùn)練的技術(shù)）訓(xùn)練 AlexNet 時(shí)，研究者們成功將 26.8 M 的惡意軟件嵌入到了模型之中，并同時(shí)確保了其與正常模型預(yù)測(cè)的準(zhǔn)確率相差不超過 1%。但如果增加惡意軟件的數(shù)據(jù)量，準(zhǔn)確率將大幅下降。下一步的實(shí)驗(yàn)是重新訓(xùn)練感染后模型。通過凍結(jié)受感染神經(jīng)元避免其在額外訓(xùn)練周期中被修改，再加上批量標(biāo)準(zhǔn)化和再訓(xùn)練，研究人員成功將惡意病毒的數(shù)據(jù)量提升至 36.9MB，并同時(shí)保證了模型的準(zhǔn)確率在 90% 以上。研究中實(shí)驗(yàn)用的八個(gè)樣本病毒都是可以被線上病毒掃描網(wǎng)站 VirusTotal 識(shí)別為惡意軟件的，一旦樣本成功嵌入神經(jīng)網(wǎng)絡(luò)，研究人員就會(huì)將模型上傳至 VirusTotal 中進(jìn)行掃描。而病毒掃描結(jié)果卻顯示這些模型“安全”，意味著惡意軟件的偽裝并未暴露。研究人員又在其他幾個(gè) CNN 架構(gòu)上進(jìn)行了相同的測(cè)試，包括 VGG、ResNet、Inception，以及 Mobilenet。實(shí)驗(yàn)結(jié)果類似，惡意軟件都未被成功檢測(cè)。這些隱匿的惡意軟件將會(huì)是所有大型神經(jīng)網(wǎng)絡(luò)都需要面對(duì)的威脅。

保護(hù)機(jī)器學(xué)習(xí)管道

考慮到潛藏在深度學(xué)習(xí)模型中的惡意負(fù)載可以避過病毒掃描的檢測(cè)，對(duì)抗 EvilModel 的唯一手段恐怕就只有直接銷毀病毒本身了。這類病毒只有在所有字節(jié)都完好無損才能保證感染成功。因此，如果收到 EvilModel 的受害者可以在不凍結(jié)受感染層的情況下重新訓(xùn)練模型，改變參數(shù)數(shù)值，便可讓病毒數(shù)據(jù)直接被銷毀。這樣，即使只有一輪的訓(xùn)練也足以摧毀任何隱藏在深度學(xué)習(xí)模型中的惡意病毒。但是，大多數(shù)開發(fā)人員都按原樣使用預(yù)訓(xùn)練模型，除非他們想要針對(duì)其他應(yīng)用做更細(xì)致的調(diào)整。而很多的細(xì)調(diào)都會(huì)凍結(jié)網(wǎng)絡(luò)中絕大多數(shù)的層，這些層里很大可能包含了受感染的那些。這就意味著，除了對(duì)抗攻擊，數(shù)據(jù)中毒、成員推理等其他已知的安全問題之外，受惡意軟件感染的神經(jīng)網(wǎng)絡(luò)也將成為深度學(xué)習(xí)的未來中真正的威脅之一。機(jī)器學(xué)習(xí)模型與經(jīng)典的、基于規(guī)則的軟件之間的差別意味著我們需要新的方法來應(yīng)對(duì)安全威脅。2021 年上半年的時(shí)候，不少組織都提出了對(duì)抗性機(jī)器學(xué)習(xí)威脅矩陣，一個(gè)可協(xié)助開發(fā)者們發(fā)現(xiàn)機(jī)器學(xué)習(xí)管道弱點(diǎn)并修補(bǔ)安全漏洞的框架。雖然威脅矩陣更側(cè)重于對(duì)抗性攻擊，但其所提出的方法也適用于 EvilModels 等威脅。在研究人員找到更可靠的手段來檢測(cè)并阻止深度學(xué)習(xí)網(wǎng)絡(luò)中的惡意軟件之前，我們必須確立機(jī)器學(xué)習(xí)管道中的信任鏈。既然病毒掃描和其他靜態(tài)分析工具無法檢測(cè)到受感染模型，開發(fā)者們必須確保他們所使用的模型是來自可信任的渠道，并且訓(xùn)練數(shù)據(jù)和學(xué)習(xí)參數(shù)未受到損害。隨著我們?cè)谏疃葘W(xué)習(xí)安全問題方面更深一步的研究，我們也必須對(duì)那些用于分析圖片或識(shí)別語(yǔ)音的、數(shù)量龐雜的數(shù)據(jù)背后所隱藏的東西保持警惕。參考鏈接：https://bdtechtalks.com/2021/12/09/evilmodel-neural-networks-malware

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

安全隱患：神經(jīng)網(wǎng)絡(luò)可以隱藏惡意軟件

相關(guān)推薦

技術(shù)專區(qū)