準(zhǔn)確率遠(yuǎn)超人類專家 谷歌用深度學(xué)習(xí)算法檢測(cè)癌癥
在檢查患者的生物組織樣品后, 病理學(xué)家的報(bào)告通常是許多疾病的黃金診斷標(biāo)準(zhǔn)。特別是對(duì)于癌癥,病理學(xué)家的診斷對(duì)患者的治療具有深遠(yuǎn)的影響。病理切片審查是一個(gè)非常復(fù)雜的任務(wù),需要多年的培訓(xùn)才能做好,豐富的專業(yè)知識(shí)和經(jīng)驗(yàn)也是必不可少的。盡管都經(jīng)過(guò)培訓(xùn),但不同病理學(xué)家對(duì)同一患者給出的診斷結(jié)果,可能存在實(shí)質(zhì)性的差異,而這可能導(dǎo)致誤診。例如,在某些類型的乳腺癌診斷中,診斷結(jié)論一致性竟低至48%,前列腺癌診斷的一致性也同樣很低。
本文引用地址:http://m.butianyuan.cn/article/201703/344889.htm診斷缺乏一致性低并不少見(jiàn),因?yàn)槿绻胱龀鰷?zhǔn)確的診斷,必須檢查大量的信息。病理學(xué)家通常只負(fù)責(zé)審查一張切片上所有可見(jiàn)的生物組織。然而,每個(gè)患者可能有許多病理切片,假設(shè)以40倍的放大倍數(shù)進(jìn)行數(shù)字化切片圖像,每個(gè)患者的圖像數(shù)據(jù)都超過(guò)10億個(gè)像素點(diǎn)。想象一下,要遍歷1張1千萬(wàn)像素的照片,并且必須對(duì)每個(gè)像素的判斷結(jié)果負(fù)責(zé)。不用說(shuō)了,這里有太多的數(shù)據(jù)需要檢查,而時(shí)間往往是有限的。
為了解決診斷時(shí)間有限和診斷結(jié)果不一致的問(wèn)題,我們正在研究如何讓深度學(xué)習(xí)數(shù)字病理學(xué)領(lǐng)域發(fā)揮作用,通過(guò)創(chuàng)建一個(gè)自動(dòng)檢測(cè)算法,在病理學(xué)家的工作流中提供輔助工具。谷歌研究院使用由Radboud大學(xué)醫(yī)學(xué)中心提供圖像數(shù)據(jù)來(lái)訓(xùn)練診斷算法,這些圖片也在2016 ISBI Camelyon Challenge中使用,目前該算法已被優(yōu)化,用于定位出乳腺癌向乳房相鄰的淋巴結(jié)擴(kuò)散。
在乳腺癌擴(kuò)散定位任務(wù)中,使用現(xiàn)成的標(biāo)準(zhǔn)深度學(xué)習(xí)方法如Inception(也稱為GoogLeNet),表現(xiàn)也是相當(dāng)不錯(cuò),雖然生成的腫瘤概率預(yù)測(cè)熱圖還是存在噪點(diǎn)。我們對(duì)這個(gè)訓(xùn)練網(wǎng)絡(luò)做了增強(qiáng)定制,包括用不同的放大倍數(shù)的圖片來(lái)訓(xùn)練模型(非常像病理學(xué)家所做的),從訓(xùn)練結(jié)果來(lái)看,我們有可能訓(xùn)練出一個(gè)系統(tǒng),它的能力可以相當(dāng)于一個(gè)病理學(xué)家,甚至有可能超過(guò)病理學(xué)家的表現(xiàn),并且它擁有無(wú)限的時(shí)間來(lái)檢查病理切片。
圖1左圖是來(lái)自兩個(gè)淋巴結(jié)活檢的圖像,中圖是早期深度學(xué)習(xí)算法檢測(cè)腫瘤的結(jié)果,右圖是我們當(dāng)前的成果,注意第二個(gè)版本的可見(jiàn)噪聲(潛在誤判)已降低。
事實(shí)上,由該算法產(chǎn)生的預(yù)測(cè)熱圖已經(jīng)改善了很多,該算法的定位得分(FROC)達(dá)到89%,明顯超過(guò)沒(méi)有時(shí)間約束的病理學(xué)家,他們的得分僅為73%。我們不是唯一一組認(rèn)為這種方法是有希望的,其他組別的算法模型在同一數(shù)據(jù)集中獲得了高達(dá)81%的分?jǐn)?shù)。對(duì)我們來(lái)說(shuō)更令人興奮的是,我們的模型魯棒性非常強(qiáng),從不同的醫(yī)院使用不同的掃描儀獲得的圖像都可以識(shí)別。相關(guān)的詳細(xì)信息,請(qǐng)參閱谷歌研究院的相關(guān)文章“在千兆像素病理圖像上檢測(cè)癌癥轉(zhuǎn)移”。
圖2 淋巴結(jié)活檢的特寫(xiě)鏡頭。組織包含乳腺癌轉(zhuǎn)移以及巨噬細(xì)胞,其看起來(lái)與腫瘤相似,但是是良性正常組織。我們的算法成功識(shí)別腫瘤區(qū)域(亮綠色),不會(huì)被巨噬細(xì)胞干擾。
雖然這些結(jié)果看來(lái)振奮人心,但有幾個(gè)重要的注意事項(xiàng)需要考慮:
· 像大多數(shù)指標(biāo)一樣,本地化的FROC分?jǐn)?shù)并不是完美的。在這里,F(xiàn)ROC分?jǐn)?shù)定義是預(yù)設(shè)帶有少量假陽(yáng)性的靈敏度,假陽(yáng)性是指將正常組織錯(cuò)判為腫瘤,靈敏度則是每個(gè)載玻片所檢測(cè)到腫瘤的百分比。但病理學(xué)家很少做假陽(yáng)性的誤判,例如上述73%的得分對(duì)應(yīng)于73%的靈敏度和零假陽(yáng)性。相比之下,假設(shè)允許更多的假陽(yáng)性個(gè)數(shù),我們的算法的靈敏度可以提升。如果每個(gè)載玻片允許有8個(gè)假陽(yáng)性,我們的算法的靈敏度可達(dá)到92%。
· 這些算法在執(zhí)行訓(xùn)練過(guò)的任務(wù)時(shí)表現(xiàn)良好,但相比人類病理學(xué)家,還是缺少豐富的知識(shí)和經(jīng)驗(yàn)。人類病理學(xué)家可以檢測(cè)出模型還沒(méi)有訓(xùn)練的異常分類,例如炎癥過(guò)程、自身免疫疾病或其他類型的癌癥。
· 為了確?;颊叩玫阶罴训呐R床結(jié)果,這些算法需要作為病理學(xué)家的輔助工具,融入到他們的工作流中。我們?cè)O(shè)想我們的算法可以提高病理學(xué)家的診斷效率和診斷結(jié)果的一致性。例如,病理學(xué)家可以通過(guò)重點(diǎn)排查最靠前的腫瘤預(yù)測(cè)區(qū)域,以及每個(gè)載玻片多達(dá)8個(gè)假陽(yáng)性區(qū)域,來(lái)降低其假陰性率,假陰性是指未檢出腫瘤的百分比。另外,這些算法可以讓病理學(xué)家準(zhǔn)確地測(cè)量腫瘤大小,這與腫瘤預(yù)測(cè)的結(jié)果相關(guān)。
訓(xùn)練模型只是將有趣的研究轉(zhuǎn)化為真實(shí)產(chǎn)品的第一步。 從臨床驗(yàn)證到監(jiān)管批準(zhǔn),還有很多困難需要征服。但我們已經(jīng)起了一個(gè)非常有希望的開(kāi)頭,我們希望通過(guò)分享我們的工作,能夠加快在這個(gè)領(lǐng)域的進(jìn)步。
評(píng)論