AI 幫忙找 Bug ,英特爾開源代碼編程工具 ControlFlag
整理 | 孫勝
出品 | CSDN
近日,英特爾開源了自動代碼調(diào)試工具 ControlFlag 源代碼,ControlFlag 源碼現(xiàn)在可通過 GitHub 獲得。
據(jù)了解,ControlFlag 可用來幫助更多開發(fā)者自主檢測代碼錯誤,主要利用 AI 自動識別軟件和固件代碼中的錯誤,為開發(fā)人員節(jié)省手動調(diào)試時間。
據(jù)悉,英特爾于去年年底首次宣布 ControlFlag,目前該系統(tǒng)只有英特爾內(nèi)部人員使用,用來自動檢測軟件開發(fā)過程中的異常情況。
來源于網(wǎng)絡(luò)
減少代碼調(diào)試時間與成本支出
由于代碼調(diào)試對于程序開發(fā)至關(guān)重要,幾乎所有的大型軟件都需要調(diào)試,才能最大程度上避免軟件出錯。
但是對于絕大多數(shù)開發(fā)人員來說,這個過程不僅非常耗時,而且大部分調(diào)試只能手工作業(yè)。因為修復(fù)一個軟件缺陷可能需要幾天、幾周甚至幾個月的時間,據(jù)估計,多達(dá) 50% 的軟件開發(fā)時間浪費(fèi)在調(diào)試程序上。這是因為大多數(shù)錯誤都需要語義分析來識別、評估根本原因,即使是最先進(jìn)的調(diào)試系統(tǒng)也無法有效地執(zhí)行這種分析。
英特爾實驗室首席人工智能科學(xué)家 Justin Gottschlich 也表示:“盡管在過去的幾十年里,研究自動化調(diào)試方面取得了部分進(jìn)展,但現(xiàn)有工具仍無法完美發(fā)現(xiàn)日益復(fù)雜的軟件錯誤。這也是調(diào)試仍然主要由人為驅(qū)動的過程的一個關(guān)鍵原因?!?/p>
除此之外,調(diào)試代碼的預(yù)算支出也很高。據(jù)英特爾官方介紹,2020 年 IT 行業(yè)在與調(diào)試代碼相關(guān)的環(huán)節(jié)上大約花費(fèi)了 2 萬億美元,約占 IT 平均預(yù)算的一半。
“超能的” ControlFlag
據(jù)悉,該系統(tǒng)是英特爾機(jī)器編程研究 (MPR) 項目的一部分,該項目的總體目標(biāo)是通過自動化有望將開發(fā)軟件所需的時間減少 1,000 倍。例如,Gottschlich 的團(tuán)隊正在研究的領(lǐng)域之一是最終擴(kuò)展 ControlFlag 的能力,以自動修復(fù)它檢測到的錯誤。
自去年推出以來,英特爾已在各種軟件系統(tǒng)上測試了該機(jī)器學(xué)習(xí)工具,并取得了可喜的成果?!爱?dāng)我們最初設(shè)計系統(tǒng)時,我們沒有預(yù)料到它能夠發(fā)現(xiàn)高度復(fù)雜的缺陷,”英特爾實驗室首席人工智能科學(xué)家 Justin Gottschlich 表示?!叭欢?,鑒于其自我監(jiān)督的設(shè)計,ControlFlag 能夠發(fā)現(xiàn)高度復(fù)雜、細(xì)微的軟件缺陷,甚至連我們這些構(gòu)建它的人都感到震驚?!?/p>
英特爾的團(tuán)隊通過使用一種“無監(jiān)督”的學(xué)習(xí)方法,以允許 ControlFlag 檢測更廣泛的存儲庫中的錯誤。該系統(tǒng)從超過 10 億行未標(biāo)記的源代碼中學(xué)習(xí)編碼模式,使其能夠達(dá)到很高的準(zhǔn)確性,甚至可以適應(yīng)開發(fā)人員的風(fēng)格,以區(qū)分軟件異常和編程語言的風(fēng)格變化。
ControlFlag 適用于任何包含控制結(jié)構(gòu)的編程語言(如 C/C++),而且ControlFlag 能夠不斷地從未標(biāo)記的源代碼中學(xué)習(xí),隨著新數(shù)據(jù)的引入而 “進(jìn)化”,使自己變得更好。雖然它還不能自動解決它所發(fā)現(xiàn)的代碼錯誤,但該工具可以為開發(fā)人員提供了潛在的修改建議。
Justin Gottschlich 還表示,目前為止僅在兩個專有軟件存儲庫上使用 ControlFlag,就發(fā)現(xiàn)了生產(chǎn)質(zhì)量、已部署程序中的 300 多個缺陷。例如,去年 ControlFlag 在名為 Client URL (cURL) 的計算機(jī)軟件項目中檢測到代碼異常,該項目每天使用各種網(wǎng)絡(luò)協(xié)議傳輸數(shù)據(jù)超過 10 億次。在向 cURL 團(tuán)隊報告異常后,他們同意 ControlFlag 的發(fā)現(xiàn)并重新設(shè)計代碼以修補(bǔ)問題。
不斷進(jìn)步的 ControlFlag
隨著英特爾團(tuán)隊致力于開發(fā) ControlFlag,過去的一年也帶來了相當(dāng)多的學(xué)習(xí)點。Gottschlich 認(rèn)為,需要改進(jìn)的兩個關(guān)鍵領(lǐng)域是減少該工具報告的誤報數(shù)量,以及將更先進(jìn)的語義分析器集成到 ControlFlag 的推理中。
然而,作為一個將成為英特爾機(jī)器編程工具套件之一的系統(tǒng),ControlFlag 將繼續(xù)發(fā)展?!癈ontrolFlag 的進(jìn)步不太可能停止,”Gottschlich 強(qiáng)調(diào)?!斑@主要是因為隨著軟件編程語言、硬件描述語言和計算設(shè)備的發(fā)展,ControlFlag 也需要發(fā)展以跟上它們的步伐?!?/p>
與此同時,英特爾的 MPR 團(tuán)隊正在開展一些專注于簡化軟件開發(fā)的項目。例如,去年該公司還發(fā)布了一款與麻省理工學(xué)院實驗室共同開發(fā)的工具,該工具可以研究代碼片段以了解軟件打算做什么。該系統(tǒng)稱為 MISIM(機(jī)器推斷代碼相似性),它使用預(yù)先存在的代碼目錄來理解新算法背后的意圖,并通過建議其他編程方法或提供使代碼更高效的選項來幫助工程師開發(fā)軟件。
Gottschlich 預(yù)計 MISIM 有一天會與 ControlFlag 一起工作?!爱?dāng)正確想法融合在一起時,我們設(shè)想了一個更強(qiáng)大的新系統(tǒng),該系統(tǒng)將能夠檢測 ControlFlag 目前可以檢測到的所有缺陷,以及由于潛在的復(fù)雜性而目前無法檢測到的數(shù)百種缺陷?!盙ottschlich表示。
對此,你怎么看,歡迎留言評論。
參考鏈接:
https://www.zdnet.com/article/developers-intels-automated-debugging-tool-controlflag-is-now-open-source/
GitHub地址:
https://github.com/IntelLabs/control-flag
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。