為了保障公共監(jiān)視的隱私，MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù)，分析誤差范圍控制在2%

發(fā)布人：大數(shù)據(jù)文摘時(shí)間：2022-04-20 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

公共攝像頭的邊界在哪？

相信大家還記得2017年的“水滴直播”，當(dāng)時(shí)該視頻直播平臺(tái)上出現(xiàn)了全國(guó)多地校園視頻監(jiān)控的直播畫(huà)面，被直播的場(chǎng)景包括教室、食堂、操場(chǎng)甚至宿舍，清晰的畫(huà)面和聲音讓人仿佛置身校園中。

據(jù)了解，用戶只要購(gòu)買了某公司的視頻監(jiān)控?cái)z像頭產(chǎn)品，就可以主動(dòng)選擇把監(jiān)控內(nèi)容分享到該平臺(tái)上。

對(duì)于此，有看到自己的身影出現(xiàn)在直播畫(huà)面中的網(wǎng)友直說(shuō)“太可怕了”，也有網(wǎng)友表示，“如果完全不知道自己被直播了，這肯定侵犯了隱私權(quán)”。

中國(guó)傳媒大學(xué)法律系副教授劉文杰評(píng)論到，“在不影響社會(huì)秩序的前提下，個(gè)人在公共場(chǎng)所仍然有權(quán)保持一定的行動(dòng)自由和安寧”。

但如今面對(duì)越來(lái)越多的公共監(jiān)控?cái)z像頭，人們的隱私又應(yīng)該如何才能得到保證呢？

最近，MIT的研究人員就開(kāi)發(fā)出了一個(gè)系統(tǒng)，能夠允許分析師提交視頻數(shù)據(jù)查詢，并在最終結(jié)果中添加一些額外數(shù)據(jù)，也就是噪音，以確保個(gè)人不會(huì)被識(shí)別。

據(jù)了解，該系統(tǒng)建立在對(duì)隱私的正式定義之上，也即“差異隱私（differential privacy），這允許系統(tǒng)在不泄露個(gè)人身份信息的情況下訪問(wèn)有關(guān)私人數(shù)據(jù)的匯總統(tǒng)計(jì)數(shù)據(jù)。

該研究已經(jīng)以論文的形式進(jìn)行了發(fā)表。

論文鏈接：

https://arxiv.org/abs/2106.12083

保護(hù)隱私的監(jiān)控視頻分析系統(tǒng)，誤差僅2%

目前，安裝公共攝像頭的目的更多還是為了安全考慮，這些攝像頭已經(jīng)變得比過(guò)去那些帶顆粒狀的照片要成熟得多了。

而自疫情爆發(fā)以來(lái)，視頻監(jiān)控還可以幫助衛(wèi)生人員測(cè)量戴口罩的人員比例，以及幫助交通部門(mén)監(jiān)測(cè)車輛、自行車和行人的密度和流量，同時(shí)為企業(yè)提供對(duì)購(gòu)物行為的更好理解。

但是在這一切的便利之下，為什么隱私會(huì)是最后才來(lái)思考的因素呢？

現(xiàn)在已經(jīng)有一些公司會(huì)在視頻中模糊人臉，但這樣類似的做法不僅使分析師無(wú)法驗(yàn)證研究問(wèn)題，比如他們是否按要求佩戴了口罩，而且這樣的方式并不總是奏效，因?yàn)橄到y(tǒng)可能會(huì)跟丟一些人臉數(shù)據(jù)。

針對(duì)這一現(xiàn)狀，麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室（CSAIL）的研究人員與其他機(jī)構(gòu)合作，共同開(kāi)發(fā)了一個(gè)系統(tǒng)Privid。Privid能夠讓分析師提交視頻數(shù)據(jù)查詢，并在最終結(jié)果中加入噪音數(shù)據(jù)，以確保個(gè)人身份無(wú)法被識(shí)別，以此更好地保證出現(xiàn)在監(jiān)控視頻片段的人的隱私。

通常情況下，分析師需要訪問(wèn)整個(gè)視頻，才能得到要實(shí)現(xiàn)或者驗(yàn)證的目的，但Privid的出現(xiàn)改變了這一情況。

對(duì)于分析師而言，他們?nèi)匀豢梢垣@得需要的信息，但訪問(wèn)權(quán)得到了限制，這對(duì)一些惡意的分析師來(lái)說(shuō)更是如此。為了實(shí)現(xiàn)這一點(diǎn)，Privid不再一次性在整個(gè)視頻上運(yùn)行代碼，而是將視頻分成小塊，在每塊上運(yùn)行處理代碼。

同時(shí)最終的結(jié)果并不是直接從每個(gè)片段中獲得，而是需要將這些片段聚合起來(lái)，這其中就包括一些額外添加的噪音。也正是因?yàn)樵胍魯?shù)據(jù)的加入，最終結(jié)果的信息大概會(huì)存在2%左右的誤差。

例如，代碼可能會(huì)輸出在每個(gè)視頻片段中觀察到的人數(shù)，聚合之后得到“總和”，以計(jì)算戴口罩的總?cè)藬?shù)，或一個(gè)“平均值”，以估計(jì)人群密度。

好在，Privid允許分析師使用自己的深度神經(jīng)網(wǎng)絡(luò)，這讓分析師可以更加靈活地提出Privid設(shè)計(jì)者所沒(méi)有預(yù)料到的問(wèn)題。在各種視頻和查詢中，Privid的準(zhǔn)確率在非私有系統(tǒng)的79%-99%之間。

麻省理工學(xué)院CSAIL博士生、Privid論文的主要作者Frank Cangialosi說(shuō)，“我們處于一個(gè)攝像頭幾乎無(wú)處不在的時(shí)代。試想每個(gè)街角都有攝像頭，你去的每個(gè)地方都有攝像頭，那如果有人獲取到了這些數(shù)據(jù)，他們就能建立起某個(gè)人出現(xiàn)在某些地點(diǎn)的時(shí)間線。人們已經(jīng)在擔(dān)心GPS的位置隱私問(wèn)題，而視頻數(shù)據(jù)的匯總不僅可以捕捉到你的位置歷史，還可以捕捉到你在這些地點(diǎn)的情緒和行為等等”。

添加噪音也是一門(mén)學(xué)問(wèn)

除此之外，還值得注意的一點(diǎn)是，論文引入了一個(gè)新的關(guān)于隱私的概念。

“基于期限的隱私”（duration-based privacy）將隱私的定義與隱私的執(zhí)行脫鉤。在二者混為一談的情況下，如果隱私目標(biāo)是保護(hù)所有人，那么執(zhí)行機(jī)制需要去找到要保護(hù)的人，但并不能保證效果。有了這個(gè)機(jī)制，就不再需要指定所有的東西，也無(wú)需隱藏更多的信息。

比方說(shuō)，我們現(xiàn)在有一段俯瞰一條街道的視頻。Alice和Bob兩個(gè)分析師都表示他們想計(jì)算每小時(shí)經(jīng)過(guò)街道的人數(shù)，于是他們提交了一個(gè)視頻處理模塊，并要求進(jìn)行匯總。

第一個(gè)分析師Alice是來(lái)自城市規(guī)劃部門(mén)，他們希望利用這些信息來(lái)了解人流模式，為城市規(guī)劃人行道。他們的模型會(huì)對(duì)人進(jìn)行計(jì)數(shù)，并為每個(gè)視頻片段輸出這個(gè)計(jì)數(shù)。

另一個(gè)分析員Bob則是惡意的。他們只希望識(shí)別每一次某個(gè)人經(jīng)過(guò)攝像頭的時(shí)間。他們提交的模型就只是在尋找這個(gè)人的臉，如果這個(gè)人在場(chǎng)系統(tǒng)會(huì)輸出一個(gè)大數(shù)字，否則就是零。他們希望如果這個(gè)人在場(chǎng)，總和會(huì)是非零的。

從Privid的角度來(lái)看，這兩個(gè)查詢看起來(lái)是一樣的。很難可靠地確定他們的模型內(nèi)部可能在做什么，或者分析員希望將數(shù)據(jù)用于什么。這就需要噪音登場(chǎng)了。

Privid執(zhí)行了這兩個(gè)查詢，并為每個(gè)查詢添加了相同數(shù)量的噪聲。在第一種情況下，因?yàn)锳lice是在計(jì)算所有的人，這個(gè)噪音只會(huì)對(duì)結(jié)果產(chǎn)生很小的影響，但很可能不會(huì)影響到有用性。

但是在第二種情況下，因?yàn)锽ob尋找的是一個(gè)特定的信號(hào)，那么額外添加的噪音就足以使他們無(wú)法確定這個(gè)人的具體位置。如果他們看到了一個(gè)非零的結(jié)果，可能是因?yàn)檫@個(gè)人確實(shí)在那里，或者是因?yàn)槟Ｐ洼敵隽恕傲恪?，但噪聲使其成為非零。Privid不需要知道任何關(guān)于這個(gè)人出現(xiàn)的時(shí)間或地點(diǎn)的信息，系統(tǒng)只需要知道這個(gè)人可能出現(xiàn)的時(shí)間的一個(gè)粗略的上限，這比弄清楚確切的位置更容易說(shuō)明，而這是先前的方法所依賴的。

不過(guò)還存在一個(gè)問(wèn)題，那就是要添加多少噪音。

最理想的情況當(dāng)然是，添加的噪音恰好足以隱藏每個(gè)人，但又不至于多到對(duì)分析人員毫無(wú)用處。向數(shù)據(jù)添加噪音并堅(jiān)持在時(shí)間窗口上進(jìn)行查詢，意味著結(jié)果不會(huì)那樣準(zhǔn)確，但并不影響實(shí)際參考價(jià)值，同時(shí)保障更好的隱私。

正如研究人員所總結(jié)的，“在建立Privid時(shí)，我們不主張?jiān)黾庸惨曨l監(jiān)控和分析，但無(wú)法否認(rèn)的是這類研究已經(jīng)相當(dāng)普遍”，因此，在這類分析繼續(xù)保持主流增長(zhǎng)之勢(shì)時(shí)，如何改善公共監(jiān)視的隱私環(huán)境，將會(huì)成為未來(lái)的一大主流課題。

相關(guān)報(bào)道：

https://www.csail.mit.edu/news/security-tool-guarantees-privacy-surveillance-footagehttp://www.xinhuanet.com/info/2017-05/11/c_136273243.htm

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

為了保障公共監(jiān)視的隱私，MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù)，分析誤差范圍控制在2%

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

為了保障公共監(jiān)視的隱私，MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù)，分析誤差范圍控制在2%

相關(guān)推薦

技術(shù)專區(qū)

為了保障公共監(jiān)視的隱私，MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù)，分析誤差范圍控制在2%