博客專欄

EEPW首頁(yè) > 博客 > 為了保障公共監(jiān)視的隱私,MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù),分析誤差范圍控制在2%

為了保障公共監(jiān)視的隱私,MIT科學(xué)家主動(dòng)添加噪音數(shù)據(jù),分析誤差范圍控制在2%

發(fā)布人:大數(shù)據(jù)文摘 時(shí)間:2022-04-20 來(lái)源:工程師 發(fā)布文章

公共攝像頭的邊界在哪?


相信大家還記得2017年的“水滴直播”,當(dāng)時(shí)該視頻直播平臺(tái)上出現(xiàn)了全國(guó)多地校園視頻監(jiān)控的直播畫(huà)面,被直播的場(chǎng)景包括教室、食堂、操場(chǎng)甚至宿舍,清晰的畫(huà)面和聲音讓人仿佛置身校園中。


據(jù)了解,用戶只要購(gòu)買了某公司的視頻監(jiān)控?cái)z像頭產(chǎn)品,就可以主動(dòng)選擇把監(jiān)控內(nèi)容分享到該平臺(tái)上。


對(duì)于此,有看到自己的身影出現(xiàn)在直播畫(huà)面中的網(wǎng)友直說(shuō)“太可怕了”,也有網(wǎng)友表示,“如果完全不知道自己被直播了,這肯定侵犯了隱私權(quán)”。


中國(guó)傳媒大學(xué)法律系副教授劉文杰評(píng)論到,“在不影響社會(huì)秩序的前提下,個(gè)人在公共場(chǎng)所仍然有權(quán)保持一定的行動(dòng)自由和安寧”。


圖片


但如今面對(duì)越來(lái)越多的公共監(jiān)控?cái)z像頭,人們的隱私又應(yīng)該如何才能得到保證呢?


最近,MIT的研究人員就開(kāi)發(fā)出了一個(gè)系統(tǒng),能夠允許分析師提交視頻數(shù)據(jù)查詢,并在最終結(jié)果中添加一些額外數(shù)據(jù),也就是噪音,以確保個(gè)人不會(huì)被識(shí)別。


據(jù)了解,該系統(tǒng)建立在對(duì)隱私的正式定義之上,也即“差異隱私(differential privacy),這允許系統(tǒng)在不泄露個(gè)人身份信息的情況下訪問(wèn)有關(guān)私人數(shù)據(jù)的匯總統(tǒng)計(jì)數(shù)據(jù)。


該研究已經(jīng)以論文的形式進(jìn)行了發(fā)表。


圖片

論文鏈接:

https://arxiv.org/abs/2106.12083


保護(hù)隱私的監(jiān)控視頻分析系統(tǒng),誤差僅2%


目前,安裝公共攝像頭的目的更多還是為了安全考慮,這些攝像頭已經(jīng)變得比過(guò)去那些帶顆粒狀的照片要成熟得多了。


而自疫情爆發(fā)以來(lái),視頻監(jiān)控還可以幫助衛(wèi)生人員測(cè)量戴口罩的人員比例,以及幫助交通部門(mén)監(jiān)測(cè)車輛、自行車和行人的密度和流量,同時(shí)為企業(yè)提供對(duì)購(gòu)物行為的更好理解。


圖片


但是在這一切的便利之下,為什么隱私會(huì)是最后才來(lái)思考的因素呢?


現(xiàn)在已經(jīng)有一些公司會(huì)在視頻中模糊人臉,但這樣類似的做法不僅使分析師無(wú)法驗(yàn)證研究問(wèn)題,比如他們是否按要求佩戴了口罩,而且這樣的方式并不總是奏效,因?yàn)橄到y(tǒng)可能會(huì)跟丟一些人臉數(shù)據(jù)。


針對(duì)這一現(xiàn)狀,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員與其他機(jī)構(gòu)合作,共同開(kāi)發(fā)了一個(gè)系統(tǒng)Privid。Privid能夠讓分析師提交視頻數(shù)據(jù)查詢,并在最終結(jié)果中加入噪音數(shù)據(jù),以確保個(gè)人身份無(wú)法被識(shí)別,以此更好地保證出現(xiàn)在監(jiān)控視頻片段的人的隱私。


通常情況下,分析師需要訪問(wèn)整個(gè)視頻,才能得到要實(shí)現(xiàn)或者驗(yàn)證的目的,但Privid的出現(xiàn)改變了這一情況。


對(duì)于分析師而言,他們?nèi)匀豢梢垣@得需要的信息,但訪問(wèn)權(quán)得到了限制,這對(duì)一些惡意的分析師來(lái)說(shuō)更是如此。為了實(shí)現(xiàn)這一點(diǎn),Privid不再一次性在整個(gè)視頻上運(yùn)行代碼,而是將視頻分成小塊,在每塊上運(yùn)行處理代碼。


同時(shí)最終的結(jié)果并不是直接從每個(gè)片段中獲得,而是需要將這些片段聚合起來(lái),這其中就包括一些額外添加的噪音。也正是因?yàn)樵胍魯?shù)據(jù)的加入,最終結(jié)果的信息大概會(huì)存在2%左右的誤差。


例如,代碼可能會(huì)輸出在每個(gè)視頻片段中觀察到的人數(shù),聚合之后得到“總和”,以計(jì)算戴口罩的總?cè)藬?shù),或一個(gè)“平均值”,以估計(jì)人群密度。


圖片

好在,Privid允許分析師使用自己的深度神經(jīng)網(wǎng)絡(luò),這讓分析師可以更加靈活地提出Privid設(shè)計(jì)者所沒(méi)有預(yù)料到的問(wèn)題。在各種視頻和查詢中,Privid的準(zhǔn)確率在非私有系統(tǒng)的79%-99%之間。


麻省理工學(xué)院CSAIL博士生、Privid論文的主要作者Frank Cangialosi說(shuō),“我們處于一個(gè)攝像頭幾乎無(wú)處不在的時(shí)代。試想每個(gè)街角都有攝像頭,你去的每個(gè)地方都有攝像頭,那如果有人獲取到了這些數(shù)據(jù),他們就能建立起某個(gè)人出現(xiàn)在某些地點(diǎn)的時(shí)間線。人們已經(jīng)在擔(dān)心GPS的位置隱私問(wèn)題,而視頻數(shù)據(jù)的匯總不僅可以捕捉到你的位置歷史,還可以捕捉到你在這些地點(diǎn)的情緒和行為等等”。 


添加噪音也是一門(mén)學(xué)問(wèn)


除此之外,還值得注意的一點(diǎn)是,論文引入了一個(gè)新的關(guān)于隱私的概念。


“基于期限的隱私”(duration-based privacy)將隱私的定義與隱私的執(zhí)行脫鉤。在二者混為一談的情況下,如果隱私目標(biāo)是保護(hù)所有人,那么執(zhí)行機(jī)制需要去找到要保護(hù)的人,但并不能保證效果。有了這個(gè)機(jī)制,就不再需要指定所有的東西,也無(wú)需隱藏更多的信息。


比方說(shuō),我們現(xiàn)在有一段俯瞰一條街道的視頻。Alice和Bob兩個(gè)分析師都表示他們想計(jì)算每小時(shí)經(jīng)過(guò)街道的人數(shù),于是他們提交了一個(gè)視頻處理模塊,并要求進(jìn)行匯總。


第一個(gè)分析師Alice是來(lái)自城市規(guī)劃部門(mén),他們希望利用這些信息來(lái)了解人流模式,為城市規(guī)劃人行道。他們的模型會(huì)對(duì)人進(jìn)行計(jì)數(shù),并為每個(gè)視頻片段輸出這個(gè)計(jì)數(shù)。


另一個(gè)分析員Bob則是惡意的。他們只希望識(shí)別每一次某個(gè)人經(jīng)過(guò)攝像頭的時(shí)間。他們提交的模型就只是在尋找這個(gè)人的臉,如果這個(gè)人在場(chǎng)系統(tǒng)會(huì)輸出一個(gè)大數(shù)字,否則就是零。他們希望如果這個(gè)人在場(chǎng),總和會(huì)是非零的。


從Privid的角度來(lái)看,這兩個(gè)查詢看起來(lái)是一樣的。很難可靠地確定他們的模型內(nèi)部可能在做什么,或者分析員希望將數(shù)據(jù)用于什么。這就需要噪音登場(chǎng)了。


Privid執(zhí)行了這兩個(gè)查詢,并為每個(gè)查詢添加了相同數(shù)量的噪聲。在第一種情況下,因?yàn)锳lice是在計(jì)算所有的人,這個(gè)噪音只會(huì)對(duì)結(jié)果產(chǎn)生很小的影響,但很可能不會(huì)影響到有用性。


但是在第二種情況下,因?yàn)锽ob尋找的是一個(gè)特定的信號(hào),那么額外添加的噪音就足以使他們無(wú)法確定這個(gè)人的具體位置。如果他們看到了一個(gè)非零的結(jié)果,可能是因?yàn)檫@個(gè)人確實(shí)在那里,或者是因?yàn)槟P洼敵隽恕傲恪?,但噪聲使其成為非零。Privid不需要知道任何關(guān)于這個(gè)人出現(xiàn)的時(shí)間或地點(diǎn)的信息,系統(tǒng)只需要知道這個(gè)人可能出現(xiàn)的時(shí)間的一個(gè)粗略的上限,這比弄清楚確切的位置更容易說(shuō)明,而這是先前的方法所依賴的。


不過(guò)還存在一個(gè)問(wèn)題,那就是要添加多少噪音。


最理想的情況當(dāng)然是,添加的噪音恰好足以隱藏每個(gè)人,但又不至于多到對(duì)分析人員毫無(wú)用處。向數(shù)據(jù)添加噪音并堅(jiān)持在時(shí)間窗口上進(jìn)行查詢,意味著結(jié)果不會(huì)那樣準(zhǔn)確,但并不影響實(shí)際參考價(jià)值,同時(shí)保障更好的隱私。


正如研究人員所總結(jié)的,“在建立Privid時(shí),我們不主張?jiān)黾庸惨曨l監(jiān)控和分析,但無(wú)法否認(rèn)的是這類研究已經(jīng)相當(dāng)普遍”,因此,在這類分析繼續(xù)保持主流增長(zhǎng)之勢(shì)時(shí),如何改善公共監(jiān)視的隱私環(huán)境,將會(huì)成為未來(lái)的一大主流課題。


相關(guān)報(bào)道:

https://www.csail.mit.edu/news/security-tool-guarantees-privacy-surveillance-footagehttp://www.xinhuanet.com/info/2017-05/11/c_136273243.htm

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉