程序員注意了!正確率高達(dá)83%,AI技術(shù)可準(zhǔn)確識別代碼的真實(shí)作者
Engadget最新報(bào)道稱,研究人員開發(fā)出的一種新的算法,這種算法可以識別出一個(gè)程序的作者是誰。
本文引用地址:http://m.butianyuan.cn/article/201808/390493.htm程序員在寫程序時(shí)往往有著自己獨(dú)特的風(fēng)格,但是在尋找關(guān)于一個(gè)程序的作者時(shí),查看所有的代碼并不現(xiàn)實(shí)?,F(xiàn)在,也許沒有那個(gè)必要了。
研究人員已經(jīng)開發(fā)出一種機(jī)器學(xué)習(xí)系統(tǒng),可以通過原始源代碼或編譯的二進(jìn)制文件對程序員進(jìn)行“去匿名化”。研究人員稱,該方法是訓(xùn)練一個(gè)算法來識別程序員的編碼結(jié)構(gòu),并基于它們的工作實(shí)例,使用這些算法來確定代碼樣本中的共同特征。
在使用Google's Code Jam結(jié)果的測試中,用這種AI識別的結(jié)果相對準(zhǔn)確,但并不是萬無一失的,每個(gè)系統(tǒng)有600名程序員和8個(gè)樣本,該系統(tǒng)的正確率達(dá)到了83%。
這項(xiàng)技術(shù)對調(diào)查人員來說可能是一個(gè)福音。這對識別惡意代碼或軟件的創(chuàng)建者時(shí)很有用,特別是當(dāng)肇事者試圖嫁禍其他人時(shí)。它也可能對抄襲代碼或者程序的案件有所幫助。
當(dāng)然,這個(gè)系統(tǒng)也可能是一種麻煩。雖然掩蓋代碼的真實(shí)來源是可行的,但這就可能難以實(shí)現(xiàn)真正的匿名代碼,利用這種AI技術(shù)就可以找到真正寫代碼的人。
評論