準(zhǔn)確率遠超人類專家 谷歌用深度學(xué)習(xí)算法檢測癌癥
在檢查患者的生物組織樣品后, 病理學(xué)家的報告通常是許多疾病的黃金診斷標(biāo)準(zhǔn)。特別是對于癌癥,病理學(xué)家的診斷對患者的治療具有深遠的影響。病理切片審查是一個非常復(fù)雜的任務(wù),需要多年的培訓(xùn)才能做好,豐富的專業(yè)知識和經(jīng)驗也是必不可少的。盡管都經(jīng)過培訓(xùn),但不同病理學(xué)家對同一患者給出的診斷結(jié)果,可能存在實質(zhì)性的差異,而這可能導(dǎo)致誤診。例如,在某些類型的乳腺癌診斷中,診斷結(jié)論一致性竟低至48%,前列腺癌診斷的一致性也同樣很低。
本文引用地址:http://2s4d.com/article/201703/344889.htm診斷缺乏一致性低并不少見,因為如果想做出準(zhǔn)確的診斷,必須檢查大量的信息。病理學(xué)家通常只負責(zé)審查一張切片上所有可見的生物組織。然而,每個患者可能有許多病理切片,假設(shè)以40倍的放大倍數(shù)進行數(shù)字化切片圖像,每個患者的圖像數(shù)據(jù)都超過10億個像素點。想象一下,要遍歷1張1千萬像素的照片,并且必須對每個像素的判斷結(jié)果負責(zé)。不用說了,這里有太多的數(shù)據(jù)需要檢查,而時間往往是有限的。
為了解決診斷時間有限和診斷結(jié)果不一致的問題,我們正在研究如何讓深度學(xué)習(xí)數(shù)字病理學(xué)領(lǐng)域發(fā)揮作用,通過創(chuàng)建一個自動檢測算法,在病理學(xué)家的工作流中提供輔助工具。谷歌研究院使用由Radboud大學(xué)醫(yī)學(xué)中心提供圖像數(shù)據(jù)來訓(xùn)練診斷算法,這些圖片也在2016 ISBI Camelyon Challenge中使用,目前該算法已被優(yōu)化,用于定位出乳腺癌向乳房相鄰的淋巴結(jié)擴散。
在乳腺癌擴散定位任務(wù)中,使用現(xiàn)成的標(biāo)準(zhǔn)深度學(xué)習(xí)方法如Inception(也稱為GoogLeNet),表現(xiàn)也是相當(dāng)不錯,雖然生成的腫瘤概率預(yù)測熱圖還是存在噪點。我們對這個訓(xùn)練網(wǎng)絡(luò)做了增強定制,包括用不同的放大倍數(shù)的圖片來訓(xùn)練模型(非常像病理學(xué)家所做的),從訓(xùn)練結(jié)果來看,我們有可能訓(xùn)練出一個系統(tǒng),它的能力可以相當(dāng)于一個病理學(xué)家,甚至有可能超過病理學(xué)家的表現(xiàn),并且它擁有無限的時間來檢查病理切片。
圖1左圖是來自兩個淋巴結(jié)活檢的圖像,中圖是早期深度學(xué)習(xí)算法檢測腫瘤的結(jié)果,右圖是我們當(dāng)前的成果,注意第二個版本的可見噪聲(潛在誤判)已降低。
事實上,由該算法產(chǎn)生的預(yù)測熱圖已經(jīng)改善了很多,該算法的定位得分(FROC)達到89%,明顯超過沒有時間約束的病理學(xué)家,他們的得分僅為73%。我們不是唯一一組認為這種方法是有希望的,其他組別的算法模型在同一數(shù)據(jù)集中獲得了高達81%的分數(shù)。對我們來說更令人興奮的是,我們的模型魯棒性非常強,從不同的醫(yī)院使用不同的掃描儀獲得的圖像都可以識別。相關(guān)的詳細信息,請參閱谷歌研究院的相關(guān)文章“在千兆像素病理圖像上檢測癌癥轉(zhuǎn)移”。
圖2 淋巴結(jié)活檢的特寫鏡頭。組織包含乳腺癌轉(zhuǎn)移以及巨噬細胞,其看起來與腫瘤相似,但是是良性正常組織。我們的算法成功識別腫瘤區(qū)域(亮綠色),不會被巨噬細胞干擾。
雖然這些結(jié)果看來振奮人心,但有幾個重要的注意事項需要考慮:
· 像大多數(shù)指標(biāo)一樣,本地化的FROC分數(shù)并不是完美的。在這里,F(xiàn)ROC分數(shù)定義是預(yù)設(shè)帶有少量假陽性的靈敏度,假陽性是指將正常組織錯判為腫瘤,靈敏度則是每個載玻片所檢測到腫瘤的百分比。但病理學(xué)家很少做假陽性的誤判,例如上述73%的得分對應(yīng)于73%的靈敏度和零假陽性。相比之下,假設(shè)允許更多的假陽性個數(shù),我們的算法的靈敏度可以提升。如果每個載玻片允許有8個假陽性,我們的算法的靈敏度可達到92%。
· 這些算法在執(zhí)行訓(xùn)練過的任務(wù)時表現(xiàn)良好,但相比人類病理學(xué)家,還是缺少豐富的知識和經(jīng)驗。人類病理學(xué)家可以檢測出模型還沒有訓(xùn)練的異常分類,例如炎癥過程、自身免疫疾病或其他類型的癌癥。
· 為了確?;颊叩玫阶罴训呐R床結(jié)果,這些算法需要作為病理學(xué)家的輔助工具,融入到他們的工作流中。我們設(shè)想我們的算法可以提高病理學(xué)家的診斷效率和診斷結(jié)果的一致性。例如,病理學(xué)家可以通過重點排查最靠前的腫瘤預(yù)測區(qū)域,以及每個載玻片多達8個假陽性區(qū)域,來降低其假陰性率,假陰性是指未檢出腫瘤的百分比。另外,這些算法可以讓病理學(xué)家準(zhǔn)確地測量腫瘤大小,這與腫瘤預(yù)測的結(jié)果相關(guān)。
訓(xùn)練模型只是將有趣的研究轉(zhuǎn)化為真實產(chǎn)品的第一步。 從臨床驗證到監(jiān)管批準(zhǔn),還有很多困難需要征服。但我們已經(jīng)起了一個非常有希望的開頭,我們希望通過分享我們的工作,能夠加快在這個領(lǐng)域的進步。
評論