博客專欄

EEPW首頁(yè) > 博客 > Nature子刊重磅:騰訊AI Lab與鐘南山團(tuán)隊(duì)發(fā)布新冠危重癥預(yù)測(cè)模型

Nature子刊重磅:騰訊AI Lab與鐘南山團(tuán)隊(duì)發(fā)布新冠危重癥預(yù)測(cè)模型

發(fā)布人:騰訊AI實(shí)驗(yàn)室 時(shí)間:2020-09-14 來(lái)源:工程師 發(fā)布文章

當(dāng)前,新冠肺炎疫情仍在蔓延,全球已確診病例數(shù)突破1437萬(wàn),死亡數(shù)超過(guò)60萬(wàn),并存在進(jìn)一步爆發(fā)的風(fēng)險(xiǎn)。在感染COVID-19的患者中,大多數(shù)呈輕度至中度癥狀,但也有一部分患者的病情初期表現(xiàn)平穩(wěn),但會(huì)以很快的速度惡化,遭遇更高的健康風(fēng)險(xiǎn)。因此,快速識(shí)別出這類有潛在重癥風(fēng)險(xiǎn)的患者,對(duì)于抗擊疫情意義重大。

7月21日,騰訊對(duì)外披露了其在醫(yī)療健康領(lǐng)域的最新進(jìn)展。鐘南山院士團(tuán)隊(duì)與騰訊AI Lab聯(lián)合發(fā)布了一項(xiàng)利用AI預(yù)測(cè)COVID-19患者病情發(fā)展至危重概率的研究成果,可分別預(yù)測(cè)5天、10天和30天內(nèi)病情危重的概率,有助合理地為病人進(jìn)行早期分診。

相比傳統(tǒng)衡量肺炎嚴(yán)重程度的CURB-6模型和未進(jìn)行深度學(xué)習(xí)的經(jīng)典Cox模型,此次聯(lián)合研究團(tuán)隊(duì)提出的深度學(xué)習(xí)生存Cox模型具有更高的預(yù)測(cè)準(zhǔn)確性。通過(guò)回溯1393例外部患者的檢驗(yàn)數(shù)據(jù),該模型的預(yù)測(cè)性能也得到了實(shí)踐驗(yàn)證,證明了模型的可靠性與有效性。

這項(xiàng)研究已在2020年7月15日發(fā)布于國(guó)際頂級(jí)期刊 Nature 子刊 Nature Communications。研究成果也已通過(guò)網(wǎng)站服務(wù)與微信小程序的形式全面開(kāi)放,相關(guān)機(jī)構(gòu)可免費(fèi)、快速調(diào)用。同時(shí),模型代碼也在Github面向全球開(kāi)源,以幫助全世界共同戰(zhàn)勝新冠疫情。

1600068788876346.png

這項(xiàng)名為《深度學(xué)習(xí)在新冠肺炎危重患者早期分診中的應(yīng)用》(Early Triage of Critically-Ill COVID-19 Patients Using Deep Learning)的研究,是鐘南山院士團(tuán)隊(duì)與騰訊公司共同成立的大數(shù)據(jù)及人工智能聯(lián)合實(shí)驗(yàn)室的成果之一,第一作者分別是廣州呼吸健康研究院院長(zhǎng)助理梁文華博士,以及騰訊AI Lab醫(yī)療中心首席科學(xué)家姚建華博士,鐘南山院士、廣州呼吸健康研究院院長(zhǎng)何建行、騰訊AI Lab醫(yī)療中心負(fù)責(zé)人黃俊洲均為共同作者。

在該研究項(xiàng)目中,聯(lián)合研究團(tuán)隊(duì)首先結(jié)合 Cox 生存分析算法與 LASSO 算法,對(duì)來(lái)自全國(guó) 575 家醫(yī)院的 1590 名患者的脫敏入院數(shù)據(jù)進(jìn)行了分析建模,并從中確定了 10 項(xiàng)能很好預(yù)測(cè)重癥風(fēng)險(xiǎn)的患者特征,即年齡、是否氣促、是否有惡性腫瘤病史、是否有慢性肺阻、合并癥數(shù)量、是否有 X 光平片異常、血液中性粒細(xì)胞與淋巴細(xì)胞比例、血液乳酸脫氫酶含量、血液直接膽紅素含量、血液肌酸激酶含量。這 10 項(xiàng)特征都是可以通過(guò)常規(guī)的醫(yī)學(xué)檢測(cè)手段在合理的時(shí)間內(nèi)有效獲取的,因此可用于在早期快速預(yù)測(cè)患者的重癥風(fēng)險(xiǎn)。

1600068836753588.png

訓(xùn)練隊(duì)列中 10 項(xiàng)所選特征的單因素分析,可以看到年齡是新冠肺炎重癥最顯著的風(fēng)險(xiǎn)因素之一;事實(shí)上超過(guò) 60 歲的患者的重癥概率明顯更高。

為了更精確地建模這 10 項(xiàng)特征與重癥風(fēng)險(xiǎn)的關(guān)系,研究團(tuán)隊(duì)采用了最新的深度學(xué)習(xí)技術(shù)來(lái)挖掘數(shù)據(jù)之中的隱含聯(lián)系,進(jìn)而計(jì)算病人的重癥風(fēng)險(xiǎn)系數(shù)。具體來(lái)說(shuō),研究團(tuán)隊(duì)采用了基于深度學(xué)習(xí)的生存分析 Cox 算法對(duì)這 10 項(xiàng)指標(biāo)進(jìn)行建模。相比于傳統(tǒng)經(jīng)典方法,深度學(xué)習(xí)的優(yōu)勢(shì)是可通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)特征進(jìn)行高階非線性組合,從而更深層次地建立特征與目標(biāo)函數(shù)之間的映射。經(jīng)過(guò)訓(xùn)練,所設(shè)計(jì)的模型在驗(yàn)證集上的 C-index (即一致性指數(shù)(index of concordance),通過(guò)評(píng)估模型預(yù)測(cè)結(jié)果與實(shí)際觀察結(jié)果的符合程度,以評(píng)價(jià)模型的預(yù)測(cè)準(zhǔn)確性,值越接近1,準(zhǔn)確率越高)從0.876(線性模型)提升到了 0.894,AUC (指受試者工作特征曲線下面積,值在1.0和0.5之間,在AUC>0.5的情況下,AUC越接近于1,說(shuō)明診斷效果越好)從 0.889 提升到了 0.911。

此外,使用該模型對(duì)另外 1393 例外部檢驗(yàn)患者的回溯數(shù)據(jù)分析也獲得了令人滿意的預(yù)測(cè)性能。外部測(cè)試集中 106 例發(fā)展成重癥的患者中,只有 2 例存在數(shù)據(jù)異常的患者被錯(cuò)誤劃分到了低風(fēng)險(xiǎn)組。同時(shí),該模型在不同中心的數(shù)據(jù)上獲得的 C-index 均高于0.85,證明了模型的可靠性與有效性。

不僅如此,研究團(tuán)隊(duì)還考慮到了實(shí)踐中數(shù)據(jù)不完整的情況,即模型所需的 10 項(xiàng)特征中可能有一部分并未得到測(cè)量,原因可能包括接診醫(yī)院不具備測(cè)試條件或相關(guān)醫(yī)療資源極度緊張。針對(duì)這一問(wèn)題,研究團(tuán)隊(duì)在系統(tǒng)中加入了多變量數(shù)據(jù)插補(bǔ)模塊,其基于可觀察到的變量來(lái)找到相似的樣本作為參考,通過(guò)擬合算法來(lái)插補(bǔ)缺失的數(shù)值。另一方面,為了提升模型的魯棒性,研究團(tuán)隊(duì)還在訓(xùn)練深度模型的過(guò)程中采用了隨機(jī)丟棄數(shù)據(jù)并添加數(shù)據(jù)噪音的實(shí)踐方法?;谶@些數(shù)據(jù)增強(qiáng)策略,最終得到的模型在僅觀測(cè)到 7 項(xiàng)特征時(shí)依然能取得相當(dāng)好的表現(xiàn)。

當(dāng)然,一項(xiàng)技術(shù)只有得到實(shí)際應(yīng)用才能發(fā)揮出真正的價(jià)值。研究團(tuán)隊(duì)在深度 Cox 模型的基礎(chǔ)上又加了一層線性 Cox 模型,以便產(chǎn)生可供醫(yī)生解讀的最終結(jié)果。該線性模型會(huì)按重要性分別對(duì)深度學(xué)習(xí)模型的預(yù)測(cè)值與 10 項(xiàng)特征的值賦予不同的權(quán)重,然后通過(guò)求和得到最終風(fēng)險(xiǎn)系數(shù)。該線性模型可以通過(guò)諾模圖進(jìn)行手動(dòng)計(jì)算,因其便利性在臨床上經(jīng)常被用來(lái)綜合各項(xiàng)數(shù)值換算最終評(píng)估分?jǐn)?shù)。通過(guò)諾模圖,醫(yī)生可以很直觀地了解各項(xiàng)觀察值與風(fēng)險(xiǎn)系數(shù)之間的關(guān)系,同時(shí)也可以在沒(méi)有電腦的情況下手動(dòng)計(jì)算風(fēng)險(xiǎn)系數(shù)。

1600068872134347.png

基于深度學(xué)習(xí)的生存分析 Cox 算法為一位新冠肺炎患者所得到的諾模圖??梢钥吹皆摶颊叩目傮w諾模圖分?jǐn)?shù)為 209,未來(lái) 5、10、30 天的總體重癥概率分別為 0.58、0.62、0.69,因此該患者被歸類為具有較高的重癥風(fēng)險(xiǎn)。

為了惠及患者,讓一線醫(yī)生盡快可以在臨床研究中使用到相關(guān)成果,研究團(tuán)隊(duì)快速開(kāi)發(fā)部署了網(wǎng)站服務(wù)與微信小程序,使用者只要通過(guò)平臺(tái)提交對(duì)應(yīng)特征的測(cè)量數(shù)值就可以立馬獲得分析結(jié)果。為了助力全球共同戰(zhàn)疫,團(tuán)隊(duì)公開(kāi)了相關(guān)論文,并將模型在Github開(kāi)源。

1600068904300715.png

騰訊 AI Lab 與廣州呼吸健康研究院聯(lián)合發(fā)布的新冠肺炎重癥概率計(jì)算工具截圖。該工具用法簡(jiǎn)單,幾乎無(wú)使用成本,同時(shí)也提供了英文版助力全球(尤其是醫(yī)療資源緊張的地區(qū))戰(zhàn)疫。

科技的力量在此次全球抗疫的行動(dòng)中不斷彰顯,基于數(shù)據(jù)分析和人工智能的技術(shù)方法更是在疫情預(yù)測(cè)與防控、風(fēng)險(xiǎn)人群評(píng)估、相關(guān)****物開(kāi)發(fā)、疫苗研發(fā)等應(yīng)用中發(fā)揮了重要作用。騰訊 AI Lab 與廣州呼吸健康研究院等多家研究機(jī)構(gòu)與醫(yī)院聯(lián)合開(kāi)發(fā)的這套新冠肺炎重癥風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng)是探索科技戰(zhàn)疫的又一成果??梢灶A(yù)期,數(shù)據(jù)分析和人工智能未來(lái)也必將在醫(yī)療實(shí)踐(尤其是對(duì)突發(fā)疫情的防控)中發(fā)揮更大的作用。

騰訊 AI Lab 于2017年開(kāi)始AI+醫(yī)療探索,不斷拓展和深化研究與應(yīng)用,涵蓋影像篩查、病理診斷、****物研發(fā)多個(gè)領(lǐng)域。在研究領(lǐng)域,騰訊AI Lab論文多次入選 MICCAI、RSNA等頂級(jí)學(xué)術(shù)會(huì)議,自研算法獲得國(guó)際級(jí)權(quán)威測(cè)試平臺(tái)冠軍等。在應(yīng)用領(lǐng)域,騰訊AI Lab深度參與并主導(dǎo)推動(dòng)多項(xiàng)應(yīng)用落地,包括為騰訊的國(guó)家級(jí)影像產(chǎn)品「騰訊覓影」與輔診導(dǎo)診產(chǎn)品醫(yī)療科普平臺(tái)「騰訊醫(yī)典」提供了支持,聯(lián)合合作伙伴研發(fā)的中國(guó)首款智能顯微鏡獲****監(jiān)局批準(zhǔn)進(jìn)入臨床應(yīng)用,發(fā)布AI驅(qū)動(dòng)的****物研發(fā)平臺(tái)「云深智****」等。在國(guó)家新基建的背景下,騰訊AI Lab發(fā)揮大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等先進(jìn)技術(shù)優(yōu)勢(shì),推動(dòng)AI與醫(yī)療產(chǎn)業(yè)的深度結(jié)合,助力社會(huì)整體醫(yī)療健康水平提升。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

功分器相關(guān)文章:功分器原理


關(guān)鍵詞:

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉