這是一個(gè)好問(wèn)題:既然機(jī)器可以學(xué)習(xí),它們能忘掉嗎?
很多公司都使用機(jī)器學(xué)習(xí)來(lái)分析人們的欲望、厭惡或面孔。研究人員提出了一個(gè)不同的問(wèn)題:我們?nèi)绾巫寵C(jī)器忘記學(xué)習(xí)?
機(jī)器學(xué)習(xí)正在尋找如何在人工智能軟件中誘發(fā)選擇性失憶的方法。目標(biāo)是從機(jī)器學(xué)習(xí)系統(tǒng)中刪除特定人員或數(shù)據(jù)點(diǎn)的所有痕跡,而不影響其性能。
如果該功能可以實(shí)現(xiàn),這個(gè)概念可以更好地讓人們控制他們的數(shù)據(jù)和產(chǎn)生的價(jià)值。盡管用戶已經(jīng)可以要求一些公司刪除個(gè)人數(shù)據(jù),但他們并不清楚算法是如何調(diào)整這些信息。機(jī)器忘掉學(xué)習(xí)卻有可能讓一個(gè)人撤回他們的數(shù)據(jù)和公司獲利的方法。
該方法對(duì)于那些想刪除網(wǎng)上分享的內(nèi)容來(lái)說(shuō)很直觀,但人工健忘癥的概念需要計(jì)算機(jī)科學(xué)方面的一些新想法。
你認(rèn)為這個(gè)想法可以實(shí)現(xiàn)嗎?
這些公司花費(fèi)數(shù)百萬(wàn)美元訓(xùn)練機(jī)器學(xué)習(xí)算法來(lái)識(shí)別面孔或?qū)ι缃惶舆M(jìn)行排名,算法比手動(dòng)編碼人員可以更快地解決問(wèn)題。但一旦經(jīng)過(guò)訓(xùn)練,機(jī)器學(xué)習(xí)系統(tǒng)就不會(huì)輕易改變,甚至不會(huì)被理解。消除特定數(shù)據(jù)點(diǎn)影響的傳統(tǒng)方法是從頭開(kāi)始重建系統(tǒng),這是一項(xiàng)代價(jià)高昂的工作。
賓夕法尼亞大學(xué)機(jī)器學(xué)習(xí)的教授亞倫羅斯表示“這項(xiàng)研究旨在找到一些中間立場(chǎng),當(dāng)他們要求刪除數(shù)據(jù)時(shí),我們能否消除他們數(shù)據(jù)的所有影響,同時(shí)避免從頭開(kāi)始重新訓(xùn)練的全部成本?”
機(jī)器取消學(xué)習(xí)的工作部分是由于人們關(guān)注到人工智能可能侵犯隱私的方式。長(zhǎng)期以來(lái),世界各地的數(shù)據(jù)監(jiān)管機(jī)構(gòu)都有權(quán)強(qiáng)制公司刪除不良信息。例如歐盟和加利福尼亞州的公民,如果他們對(duì)披露的內(nèi)容改變了主意,他們有權(quán)要求公司刪除他們的數(shù)據(jù)。最近,美國(guó)和歐洲的監(jiān)管機(jī)構(gòu)表示,人工智能系統(tǒng)有時(shí)必須更進(jìn)一步:刪除針對(duì)敏感數(shù)據(jù)進(jìn)行訓(xùn)練的系統(tǒng)。
“當(dāng)他們要求刪除數(shù)據(jù)時(shí),我們能否消除他們數(shù)據(jù)的所有影響,同時(shí)避免從頭開(kāi)始重新訓(xùn)練的全部成本?”
去年,英國(guó)數(shù)據(jù)監(jiān)管機(jī)構(gòu)警告,一些機(jī)器學(xué)習(xí)軟件可能會(huì)受到 GDPR 權(quán)利的約束,例如數(shù)據(jù)刪除,因?yàn)?AI 系統(tǒng)可能包含個(gè)人數(shù)據(jù)。安全研究人員已經(jīng)表明,算法有時(shí)會(huì)被迫泄露其創(chuàng)建中使用的敏感數(shù)據(jù)。今年年初,美國(guó)聯(lián)邦貿(mào)易委員會(huì)迫使面部識(shí)別公司 Paravision 刪除了一系列以不當(dāng)方式獲取的面部照片和用它們訓(xùn)練的機(jī)器學(xué)習(xí)算法。FTC 專員 Rohit Chopra 稱贊這種新的執(zhí)法策略是一種迫使違反數(shù)據(jù)規(guī)則的公司“喪失其欺騙成果”的方式。
取消機(jī)器學(xué)習(xí)研究的小領(lǐng)域正在努力解決這些監(jiān)管轉(zhuǎn)變帶來(lái)的一些實(shí)際和數(shù)學(xué)問(wèn)題。研究人員已經(jīng)表明,他們可以讓機(jī)器學(xué)習(xí)算法在某些條件下忘記,但該技術(shù)尚未準(zhǔn)備好。
“對(duì)于一個(gè)年輕的領(lǐng)域來(lái)說(shuō)很常見(jiàn),這個(gè)領(lǐng)域渴望做的事情與我們現(xiàn)在知道如何做的事情之間存在差距,”羅斯說(shuō)。
多倫多大學(xué)和威斯康星大學(xué)麥迪遜分校的研究人員在 2019 年時(shí),提出了一種很有前景的方法是將新機(jī)器學(xué)習(xí)項(xiàng)目的源數(shù)據(jù)分成多個(gè)部分。單獨(dú)處理每個(gè),然后將結(jié)果組合到最終的機(jī)器學(xué)習(xí)模型中。如果需要忘記一個(gè)數(shù)據(jù)點(diǎn),則只需重新處理原始輸入數(shù)據(jù)的一小部分。該方法被證明適用于在線購(gòu)買數(shù)據(jù)和超過(guò)一百萬(wàn)張照片的集合。
Roth 和來(lái)自賓夕法尼亞大學(xué)、哈佛大學(xué)和斯坦福大學(xué)的合作者最近證明了這種方法的一個(gè)缺陷,表明如果提交的刪除請(qǐng)求以特定的順序出現(xiàn),無(wú)論是偶然的還是來(lái)自惡意行為者,學(xué)習(xí)系統(tǒng)都會(huì)崩潰。并且他們還展示了如何緩解這個(gè)問(wèn)題。
滑鐵盧大學(xué)教授 Gautam Kamath 也致力于取消學(xué)習(xí),他說(shuō)該項(xiàng)目發(fā)現(xiàn)并解決的問(wèn)題是,關(guān)于如何使機(jī)器取消學(xué)習(xí)不僅僅是實(shí)驗(yàn)室好奇心的許多懸而未決的問(wèn)題的一個(gè)例子。他自己的研究小組一直在探索通過(guò)連續(xù)取消學(xué)習(xí)多個(gè)數(shù)據(jù)點(diǎn)來(lái)降低系統(tǒng)準(zhǔn)確性的程度。
Kamath 還對(duì)尋找方法讓公司證明——或監(jiān)管機(jī)構(gòu)來(lái)檢查——系統(tǒng)真的忘記了它應(yīng)該忘記的東西?!案杏X(jué)好像還有一段路要走,但也許他們最終會(huì)為這類事情配備審計(jì)員,”他說(shuō)。
隨著 FTC 和其他機(jī)構(gòu)仔細(xì)研究算法的力量,調(diào)查解除機(jī)器學(xué)習(xí)可能性的監(jiān)管理由可能會(huì)增加。牛津大學(xué)研究數(shù)據(jù)保護(hù)的教授魯本·賓斯 (Reuben Binns) 表示,近年來(lái)在美國(guó)和歐洲,個(gè)人應(yīng)該對(duì)其數(shù)據(jù)的命運(yùn)和成果有發(fā)言權(quán)的觀念越來(lái)越多。
在科技公司真正實(shí)施機(jī)器學(xué)習(xí)之前,需要精湛的技術(shù)工作,讓人們更好地控制其數(shù)據(jù)的算法命運(yùn)。即便如此,該技術(shù)可能不會(huì)對(duì)人工智能時(shí)代的隱私風(fēng)險(xiǎn)產(chǎn)生太大影響。
差分隱私是一種巧妙的技術(shù),可以對(duì)系統(tǒng)泄漏的個(gè)人信息進(jìn)行數(shù)學(xué)限制,提供了有用的比較。蘋果、谷歌和微軟都對(duì)這項(xiàng)技術(shù)贊不絕口,但使用相對(duì)較少,隱私風(fēng)險(xiǎn)仍然很多。
Binns 說(shuō),雖然它確實(shí)很有用,但“在其他情況下,它更像是一家公司所做的事情,以表明它正在創(chuàng)新?!彼麘岩蓹C(jī)器取消學(xué)習(xí)可能會(huì)證明是相似的,與其說(shuō)是數(shù)據(jù)保護(hù)的重大轉(zhuǎn)變,不如說(shuō)是對(duì)技術(shù)敏銳度的展示。即使機(jī)器學(xué)會(huì)忘記,用戶也必須記住要小心與誰(shuí)共享數(shù)據(jù)。
參考鏈接:
https://www.wired.com/story/machines-can-learn-can-they-unlearn/
本文由AI科技大本營(yíng)翻譯,轉(zhuǎn)載請(qǐng)注明出處。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
濾波器相關(guān)文章:濾波器原理
濾波器相關(guān)文章:濾波器原理