干貨 | 互聯(lián)網(wǎng)廣告數(shù)據(jù)的匿名化方案研究
第一部分:背景介紹一、匿名化必要性
互聯(lián)網(wǎng)廣告具有非常重要的商業(yè)價(jià)值,同時(shí)也是涉及數(shù)據(jù)處理十分密集的行業(yè),出現(xiàn)了操作規(guī)范化、個(gè)人信息保護(hù)和商業(yè)數(shù)據(jù)安全等一系列問(wèn)題和挑戰(zhàn),而個(gè)保法中規(guī)定個(gè)人信息匿密化后不再屬于個(gè)人信息,則為平衡個(gè)人信息保護(hù)和數(shù)據(jù)利用提供了一個(gè)窗口。二、匿名化困境
匿密化的概念已經(jīng)被廣泛提及,但是有關(guān)匿密化的標(biāo)準(zhǔn)仍然存在很多爭(zhēng)議,甚至有學(xué)者認(rèn)為應(yīng)當(dāng)廢除匿名化的概念。網(wǎng)安法和個(gè)保法中以法律的形式確立了匿密化制度,真正有意的討論應(yīng)該是如何將匿名化制度落實(shí)到個(gè)人信息保護(hù)實(shí)踐中去。為此,我們的方案首先從法律法規(guī)、司法實(shí)踐理論等多個(gè)維度進(jìn)行調(diào)研來(lái)試圖回應(yīng)這個(gè)問(wèn)題,然后再針對(duì)互聯(lián)網(wǎng)廣告領(lǐng)域的數(shù)據(jù)利用的困境來(lái)提出匿密化的方案。第二部分:匿名化現(xiàn)狀調(diào)研一、法律法規(guī)國(guó)家標(biāo)準(zhǔn)
在法律法規(guī)標(biāo)準(zhǔn)方面,不同國(guó)家采用不同的概念,我國(guó)相對(duì)折中,對(duì)于“去標(biāo)識(shí)化”和“匿名化”進(jìn)行了區(qū)分,其中操作性更強(qiáng)的去標(biāo)識(shí)化已經(jīng)有了實(shí)施或者將要實(shí)施的國(guó)家標(biāo)準(zhǔn)。二、匿名化技術(shù)
在匿名化技術(shù)方面,我們認(rèn)為匿密化可以視為去標(biāo)識(shí)化的一種極端形態(tài),所以二者采用的技術(shù)是相通的。三、司法實(shí)踐
在司法實(shí)踐方面,個(gè)保法實(shí)施剛滿一年,有關(guān)匿名化直接的指導(dǎo)案例還沒(méi)有,從中有兩處發(fā)現(xiàn):其一,可以以間接識(shí)別性為匿名化處理提供指引,是否達(dá)到了匿名化程度,處理后的信息是否具有可識(shí)別性;其二,法院通常會(huì)結(jié)合場(chǎng)景對(duì)于可識(shí)別性進(jìn)行動(dòng)態(tài)的判斷。四、法律實(shí)證研究
在法律實(shí)證研究方面,匿名化具有動(dòng)態(tài)性的特征,學(xué)者們也試圖提出匿名化的方案或者標(biāo)準(zhǔn)。第三部分:互聯(lián)網(wǎng)廣告調(diào)研一、法規(guī)與標(biāo)準(zhǔn)
國(guó)家目前已經(jīng)明確平臺(tái)可以通過(guò)用戶個(gè)人信息來(lái)進(jìn)行用戶畫像,并進(jìn)行定向的廣告投放。在標(biāo)準(zhǔn)方面,《移動(dòng)互聯(lián)網(wǎng)應(yīng)用程序(App)收集個(gè)人信息基本要求》中提出了App收集個(gè)人信息的基本要求,并給出常見(jiàn)服務(wù)類型必要個(gè)人信息范圍以及使用要求,有較大的參考價(jià)值。同時(shí),在互聯(lián)網(wǎng)廣告領(lǐng)域也有一批標(biāo)準(zhǔn)已經(jīng)發(fā)布或正在制定,其中與我們選題直接相關(guān)的是《互聯(lián)網(wǎng)廣告數(shù)據(jù)匿名化實(shí)施指南》,該行業(yè)標(biāo)準(zhǔn)目前處于報(bào)批稿的狀態(tài)。二、企業(yè)案例
三、數(shù)據(jù)采集與個(gè)性化推送
不同平臺(tái)的用戶畫像因?yàn)榉?wù)類型不同,收集的數(shù)據(jù)也存在差異。數(shù)據(jù)量和數(shù)據(jù)類型十分廣泛,甚至存在在設(shè)備應(yīng)用程序間追蹤用戶行為的代碼,這些雖然有利于提高用戶畫像的精確度,廣告投放的準(zhǔn)確度,同時(shí)也帶來(lái)了正當(dāng)性、合法性的問(wèn)題,Twitter因此收到了巨額的罰款。四、匿名化積極嘗試
在匿名化方向上,互聯(lián)網(wǎng)企業(yè)也在采用積極的策略,比如多方安全計(jì)算、差分隱私等技術(shù)來(lái)提高廣告數(shù)據(jù)的安全性。第四部分:匿名化方案一、數(shù)據(jù)類型化研究數(shù)據(jù)收集使用限制
互聯(lián)網(wǎng)廣告投放業(yè)務(wù)一般屬于“定向推送”類擴(kuò)展功能服務(wù),收集的數(shù)據(jù)可以分為用戶數(shù)據(jù)類和業(yè)務(wù)數(shù)據(jù)類兩類。前者是指用戶直接向平臺(tái)提供的數(shù)據(jù),后者可以進(jìn)一步分為業(yè)務(wù)觀測(cè)數(shù)據(jù)和業(yè)務(wù)推測(cè)數(shù)據(jù)。
在明確數(shù)據(jù)類型的基礎(chǔ)上,需要對(duì)數(shù)據(jù)收集、使用進(jìn)行限制,具體可以分為原則性的要求、個(gè)人敏感信息的限制、用戶同意以及用戶畫像屬性的限制。二、匿名化應(yīng)用選擇指引匿名化評(píng)估標(biāo)準(zhǔn)
我們的匿名化方案基于場(chǎng)景動(dòng)態(tài)的匿名化策略,首先根據(jù)前面提到的數(shù)據(jù)類型,以及是否與第三方共享形成表中所示的映射關(guān)系,例如與第三方共享的數(shù)據(jù)采用的標(biāo)準(zhǔn)更為嚴(yán)格。具體這些標(biāo)準(zhǔn)如何確定,還與匿密化模型選擇有關(guān),如K模型和差分隱私模型的評(píng)價(jià)指標(biāo)不同。我們還建議平臺(tái)對(duì)匿密化方案至少每半年進(jìn)行一次重新評(píng)估,根據(jù)政策法規(guī)要求和技術(shù)發(fā)展變化來(lái)規(guī)劃相關(guān)的策略,以實(shí)現(xiàn)數(shù)據(jù)合規(guī),并控制實(shí)際損害和可能風(fēng)險(xiǎn)。右邊是具體的匿名化流程,以技術(shù)保障評(píng)估規(guī)制過(guò)程控制,來(lái)確保匿名化過(guò)程的有序進(jìn)行。
我們的目的并不在于證明數(shù)據(jù)完全是不可識(shí)別的,而在于通過(guò)定期的動(dòng)態(tài)評(píng)估模式來(lái)確保數(shù)據(jù)風(fēng)險(xiǎn),評(píng)估工作主要從技術(shù)和合規(guī)兩個(gè)維度展開(kāi),在技術(shù)評(píng)估方面包含靜態(tài)基于重標(biāo)識(shí)風(fēng)險(xiǎn)的分級(jí)的評(píng)估和動(dòng)態(tài)基于攻擊者攻擊測(cè)試評(píng)估。以上就是我們整個(gè)報(bào)告的內(nèi)容!
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。