博客專欄

EEPW首頁 > 博客 > Nature子刊重磅:騰訊AI Lab與鐘南山團隊發(fā)布新冠危重癥預測模型

Nature子刊重磅:騰訊AI Lab與鐘南山團隊發(fā)布新冠危重癥預測模型

發(fā)布人:騰訊AI實驗室 時間:2020-09-14 來源:工程師 發(fā)布文章

當前,新冠肺炎疫情仍在蔓延,全球已確診病例數突破1437萬,死亡數超過60萬,并存在進一步爆發(fā)的風險。在感染COVID-19的患者中,大多數呈輕度至中度癥狀,但也有一部分患者的病情初期表現(xiàn)平穩(wěn),但會以很快的速度惡化,遭遇更高的健康風險。因此,快速識別出這類有潛在重癥風險的患者,對于抗擊疫情意義重大。

7月21日,騰訊對外披露了其在醫(yī)療健康領域的最新進展。鐘南山院士團隊與騰訊AI Lab聯(lián)合發(fā)布了一項利用AI預測COVID-19患者病情發(fā)展至危重概率的研究成果,可分別預測5天、10天和30天內病情危重的概率,有助合理地為病人進行早期分診。

相比傳統(tǒng)衡量肺炎嚴重程度的CURB-6模型和未進行深度學習的經典Cox模型,此次聯(lián)合研究團隊提出的深度學習生存Cox模型具有更高的預測準確性。通過回溯1393例外部患者的檢驗數據,該模型的預測性能也得到了實踐驗證,證明了模型的可靠性與有效性。

這項研究已在2020年7月15日發(fā)布于國際頂級期刊 Nature 子刊 Nature Communications。研究成果也已通過網站服務與微信小程序的形式全面開放,相關機構可免費、快速調用。同時,模型代碼也在Github面向全球開源,以幫助全世界共同戰(zhàn)勝新冠疫情。

1600068788876346.png

這項名為《深度學習在新冠肺炎危重患者早期分診中的應用》(Early Triage of Critically-Ill COVID-19 Patients Using Deep Learning)的研究,是鐘南山院士團隊與騰訊公司共同成立的大數據及人工智能聯(lián)合實驗室的成果之一,第一作者分別是廣州呼吸健康研究院院長助理梁文華博士,以及騰訊AI Lab醫(yī)療中心首席科學家姚建華博士,鐘南山院士、廣州呼吸健康研究院院長何建行、騰訊AI Lab醫(yī)療中心負責人黃俊洲均為共同作者。

在該研究項目中,聯(lián)合研究團隊首先結合 Cox 生存分析算法與 LASSO 算法,對來自全國 575 家醫(yī)院的 1590 名患者的脫敏入院數據進行了分析建模,并從中確定了 10 項能很好預測重癥風險的患者特征,即年齡、是否氣促、是否有惡性腫瘤病史、是否有慢性肺阻、合并癥數量、是否有 X 光平片異常、血液中性粒細胞與淋巴細胞比例、血液乳酸脫氫酶含量、血液直接膽紅素含量、血液肌酸激酶含量。這 10 項特征都是可以通過常規(guī)的醫(yī)學檢測手段在合理的時間內有效獲取的,因此可用于在早期快速預測患者的重癥風險。

1600068836753588.png

訓練隊列中 10 項所選特征的單因素分析,可以看到年齡是新冠肺炎重癥最顯著的風險因素之一;事實上超過 60 歲的患者的重癥概率明顯更高。

為了更精確地建模這 10 項特征與重癥風險的關系,研究團隊采用了最新的深度學習技術來挖掘數據之中的隱含聯(lián)系,進而計算病人的重癥風險系數。具體來說,研究團隊采用了基于深度學習的生存分析 Cox 算法對這 10 項指標進行建模。相比于傳統(tǒng)經典方法,深度學習的優(yōu)勢是可通過神經網絡對特征進行高階非線性組合,從而更深層次地建立特征與目標函數之間的映射。經過訓練,所設計的模型在驗證集上的 C-index (即一致性指數(index of concordance),通過評估模型預測結果與實際觀察結果的符合程度,以評價模型的預測準確性,值越接近1,準確率越高)從0.876(線性模型)提升到了 0.894,AUC (指受試者工作特征曲線下面積,值在1.0和0.5之間,在AUC>0.5的情況下,AUC越接近于1,說明診斷效果越好)從 0.889 提升到了 0.911。

此外,使用該模型對另外 1393 例外部檢驗患者的回溯數據分析也獲得了令人滿意的預測性能。外部測試集中 106 例發(fā)展成重癥的患者中,只有 2 例存在數據異常的患者被錯誤劃分到了低風險組。同時,該模型在不同中心的數據上獲得的 C-index 均高于0.85,證明了模型的可靠性與有效性。

不僅如此,研究團隊還考慮到了實踐中數據不完整的情況,即模型所需的 10 項特征中可能有一部分并未得到測量,原因可能包括接診醫(yī)院不具備測試條件或相關醫(yī)療資源極度緊張。針對這一問題,研究團隊在系統(tǒng)中加入了多變量數據插補模塊,其基于可觀察到的變量來找到相似的樣本作為參考,通過擬合算法來插補缺失的數值。另一方面,為了提升模型的魯棒性,研究團隊還在訓練深度模型的過程中采用了隨機丟棄數據并添加數據噪音的實踐方法。基于這些數據增強策略,最終得到的模型在僅觀測到 7 項特征時依然能取得相當好的表現(xiàn)。

當然,一項技術只有得到實際應用才能發(fā)揮出真正的價值。研究團隊在深度 Cox 模型的基礎上又加了一層線性 Cox 模型,以便產生可供醫(yī)生解讀的最終結果。該線性模型會按重要性分別對深度學習模型的預測值與 10 項特征的值賦予不同的權重,然后通過求和得到最終風險系數。該線性模型可以通過諾模圖進行手動計算,因其便利性在臨床上經常被用來綜合各項數值換算最終評估分數。通過諾模圖,醫(yī)生可以很直觀地了解各項觀察值與風險系數之間的關系,同時也可以在沒有電腦的情況下手動計算風險系數。

1600068872134347.png

基于深度學習的生存分析 Cox 算法為一位新冠肺炎患者所得到的諾模圖??梢钥吹皆摶颊叩目傮w諾模圖分數為 209,未來 5、10、30 天的總體重癥概率分別為 0.58、0.62、0.69,因此該患者被歸類為具有較高的重癥風險。

為了惠及患者,讓一線醫(yī)生盡快可以在臨床研究中使用到相關成果,研究團隊快速開發(fā)部署了網站服務與微信小程序,使用者只要通過平臺提交對應特征的測量數值就可以立馬獲得分析結果。為了助力全球共同戰(zhàn)疫,團隊公開了相關論文,并將模型在Github開源。

1600068904300715.png

騰訊 AI Lab 與廣州呼吸健康研究院聯(lián)合發(fā)布的新冠肺炎重癥概率計算工具截圖。該工具用法簡單,幾乎無使用成本,同時也提供了英文版助力全球(尤其是醫(yī)療資源緊張的地區(qū))戰(zhàn)疫。

科技的力量在此次全球抗疫的行動中不斷彰顯,基于數據分析和人工智能的技術方法更是在疫情預測與防控、風險人群評估、相關****物開發(fā)、疫苗研發(fā)等應用中發(fā)揮了重要作用。騰訊 AI Lab 與廣州呼吸健康研究院等多家研究機構與醫(yī)院聯(lián)合開發(fā)的這套新冠肺炎重癥風險預測系統(tǒng)是探索科技戰(zhàn)疫的又一成果。可以預期,數據分析和人工智能未來也必將在醫(yī)療實踐(尤其是對突發(fā)疫情的防控)中發(fā)揮更大的作用。

騰訊 AI Lab 于2017年開始AI+醫(yī)療探索,不斷拓展和深化研究與應用,涵蓋影像篩查、病理診斷、****物研發(fā)多個領域。在研究領域,騰訊AI Lab論文多次入選 MICCAI、RSNA等頂級學術會議,自研算法獲得國際級權威測試平臺冠軍等。在應用領域,騰訊AI Lab深度參與并主導推動多項應用落地,包括為騰訊的國家級影像產品「騰訊覓影」與輔診導診產品醫(yī)療科普平臺「騰訊醫(yī)典」提供了支持,聯(lián)合合作伙伴研發(fā)的中國首款智能顯微鏡獲****監(jiān)局批準進入臨床應用,發(fā)布AI驅動的****物研發(fā)平臺「云深智****」等。在國家新基建的背景下,騰訊AI Lab發(fā)揮大數據挖掘與機器學習等先進技術優(yōu)勢,推動AI與醫(yī)療產業(yè)的深度結合,助力社會整體醫(yī)療健康水平提升。


*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。

功分器相關文章:功分器原理


關鍵詞:

相關推薦

技術專區(qū)

關閉