博客專欄

EEPW首頁 > 博客 > 《科學(xué)》:媲美AlphaFold2的蛋白質(zhì)結(jié)構(gòu)預(yù)測新工具問世,一臺(tái)游戲計(jì)算機(jī)十分鐘出結(jié)果,完全免費(fèi)

《科學(xué)》:媲美AlphaFold2的蛋白質(zhì)結(jié)構(gòu)預(yù)測新工具問世,一臺(tái)游戲計(jì)算機(jī)十分鐘出結(jié)果,完全免費(fèi)

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2021-08-07 來源:工程師 發(fā)布文章

以下文章來源于學(xué)術(shù)頭條 ,作者學(xué)術(shù)頭條

如今,人工智能已經(jīng)滲透到人們生活的方方面面,各種深度學(xué)習(xí)算法也越來越多地應(yīng)用于各個(gè)領(lǐng)域。尤其在生物和醫(yī)學(xué)領(lǐng)域,人工智能技術(shù)可以說大放異彩,極大加速了有關(guān)生物、病理等科學(xué)的發(fā)展,而其中一項(xiàng)重要的應(yīng)用,就是預(yù)測蛋白質(zhì)結(jié)構(gòu)。

蛋白質(zhì)作為構(gòu)成人體組織器官的支架和主要物質(zhì),在人體生命活動(dòng)中起著重要作用。2020 年,DeepMind 在第 14 屆 “蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評(píng)估”(CASP14)大賽中展示了轟動(dòng)一時(shí)的相關(guān)成果 ——AlphaFold2,當(dāng)時(shí),該技術(shù)預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度排名第一。

現(xiàn)在,西雅圖華盛頓大學(xué)醫(yī)學(xué)院蛋白質(zhì)設(shè)計(jì)研究所的研究人員,研發(fā)出一款新的深度學(xué)習(xí)工具 RoseTTAFold,不僅擁有媲美 AlphaFold2 的蛋白質(zhì)結(jié)構(gòu)預(yù)測超高準(zhǔn)確度,而且更快、所需計(jì)算機(jī)處理能力更低,更重要的是,RoseTTAFold 完全免費(fèi)!

1.png

相關(guān)論文發(fā)表在最新一期的 Science 雜志上。

AlphaFold2:聲名大噪的 “前浪”

蛋白質(zhì)是一切生命的物質(zhì)基礎(chǔ),由無數(shù)氨基酸鏈組成,它們按照特定方式折疊結(jié)合成復(fù)雜的微觀形狀,這些獨(dú)特的結(jié)構(gòu)反過來又引發(fā)了生物體內(nèi)幾乎所有的化學(xué)過程。因此,通過更好地了解蛋白質(zhì)內(nèi)部結(jié)構(gòu),科學(xué)家們可以加快開發(fā)針對(duì)癌癥、COVID-19 和數(shù)千種其它健康疾病的新療法。

2.png

圖 | 蛋白質(zhì) 3D 結(jié)構(gòu)(來源:Nat Commun)

Science 雜志曾指出,蛋白質(zhì)折疊問題是人類在 21 世紀(jì)需要解決的 125 個(gè)科學(xué)前沿問題之一。通過蛋白質(zhì)結(jié)構(gòu)預(yù)測破譯 “第二遺傳密碼”,是生物學(xué)中心法則尚未揭示的奧妙之一,也是目前結(jié)構(gòu)生物學(xué)面臨的一項(xiàng)具有挑戰(zhàn)性的重大基礎(chǔ)性研究課題。

然而,確定蛋白質(zhì)的 3D 結(jié)構(gòu)一直是一個(gè)難題。在過去的幾十年中,人類已經(jīng)能夠利用冷凍電子顯微鏡、核磁共振或 X 射線晶體學(xué)等實(shí)驗(yàn)技術(shù)確定蛋白質(zhì)的基本結(jié)構(gòu),但這些技術(shù)基于大量試錯(cuò),往往需要花費(fèi)數(shù)年時(shí)間,成本也非常高。

近年來,隨著人工智能技術(shù)的不斷發(fā)展,有關(guān)預(yù)測蛋白質(zhì)結(jié)構(gòu)的 AI 工具也越來越成熟。其中,性能最強(qiáng)、準(zhǔn)確度最高的就是去年 DeepMind 在 CASP14 蛋白質(zhì)結(jié)構(gòu)預(yù)測評(píng)估會(huì)議上展示的 AlphaFold2。在去年的比賽中,AlphaFold2 預(yù)測的大部分結(jié)構(gòu)達(dá)到了空前的準(zhǔn)確度,不僅與實(shí)驗(yàn)方法得出的結(jié)果不相上下,還遠(yuǎn)超解析新蛋白質(zhì)結(jié)構(gòu)的其他方法。

3.gif

圖 | AlphaFold2 預(yù)測的蛋白結(jié)構(gòu)與實(shí)驗(yàn)結(jié)果幾乎一致。(來源:DeepMind)

AlphaFold2 的高性能令世人矚目,然而人們也開始思考一個(gè)問題:除了 DeepMind 這種在世界領(lǐng)先的深度學(xué)習(xí)公司以外,其他機(jī)構(gòu)或科研團(tuán)隊(duì)開發(fā)的系統(tǒng)中是否也可以實(shí)現(xiàn)這種準(zhǔn)確性呢?

RoseTTAFold:公開免費(fèi)的 “后浪”

現(xiàn)在,肯定的答案浮出水面。

在此次的新研究中,華盛頓大學(xué)醫(yī)學(xué)院生物化學(xué)系教授、蛋白質(zhì)設(shè)計(jì)研究所所長 David Baker 領(lǐng)導(dǎo)一支計(jì)算生物學(xué)家團(tuán)隊(duì),成功開發(fā)一款名為 RoseTTAFold 的工具,基于深度學(xué)習(xí),能夠根據(jù)有限的信息快速準(zhǔn)確地預(yù)測出目標(biāo)蛋白質(zhì)的結(jié)構(gòu),達(dá)到與 AlphaFold2 不相上下的準(zhǔn)確度。

4.jpg

圖 | David Baker(來源:UW)

不僅如此,RoseTTAFold 所需的計(jì)算耗能與計(jì)算時(shí)間均比 AlphaFold2 還要低:僅用一臺(tái)游戲計(jì)算機(jī),在短短十分鐘內(nèi)就可以可靠地計(jì)算出蛋白質(zhì)結(jié)構(gòu)。更值得注意的是,RoseTTAFold 的代碼和服務(wù)器完全免費(fèi)提供給科學(xué)界!自 7 月以來,相關(guān)程序已被 140 多個(gè)獨(dú)立科研團(tuán)隊(duì)從 GitHub 免費(fèi)下載,來自世界各地的科學(xué)家現(xiàn)在正在使用 RoseTTAFold 來構(gòu)建蛋白質(zhì)模型,以加速相關(guān)領(lǐng)域的研究。

因此可以說,RoseTTAFold 不僅僅是 “免費(fèi)版” 的 AlphaFold2,更是該技術(shù)領(lǐng)域推翻 “前浪” 的那一股 “后浪”。

整個(gè)研究學(xué)界都將受益

實(shí)際上,RoseTTAFold 是一個(gè) “三軌” 神經(jīng)網(wǎng)絡(luò)("three-track" neural network),這意味著它同時(shí)考慮一維蛋白質(zhì)中的氨基酸序列、二維蛋白質(zhì)的氨基酸如何相互作用以及蛋白質(zhì)可能的三維結(jié)構(gòu)。在這種架構(gòu)中,一維、二維和三維信息來回流動(dòng),從而使神經(jīng)網(wǎng)絡(luò)能夠共同推理出蛋白質(zhì)的化學(xué)部分與其折疊結(jié)構(gòu)之間的關(guān)系。

目前,該團(tuán)隊(duì)已經(jīng)使用 RoseTTAFold 計(jì)算了數(shù)百種新的蛋白質(zhì)結(jié)構(gòu),其中包括許多來自人類基因組的知之甚少的蛋白質(zhì)。研究人員還生成了與人類健康直接相關(guān)的蛋白質(zhì)結(jié)構(gòu),包括與非正常脂質(zhì)代謝、炎癥障礙和癌細(xì)胞生長相關(guān)的蛋白質(zhì)結(jié)構(gòu)。這些成果都表明,RoseTTAFold 可以僅用從前所需時(shí)間的很小一部分,構(gòu)建出復(fù)雜生物組件的模型。

5.jpg

圖 | 研究人員使用 RoseTTAFold 生成了數(shù)百種新的蛋白質(zhì)結(jié)構(gòu),包括人類白細(xì)胞介素 12 與其受體結(jié)合的 3D 視圖(來源:UW Medicine Institute for Protein Design)

當(dāng)然,看似 “小小” 的一步,背后支撐的是整個(gè)研究團(tuán)隊(duì)的努力。作為團(tuán)隊(duì)主要負(fù)責(zé)人,Baker 說:“在蛋白質(zhì)設(shè)計(jì)研究所這忙碌的一年中,我們?cè)O(shè)計(jì) COVID-19 療法和疫苗并將其投入臨床試驗(yàn),同時(shí)開發(fā)出用于高精度蛋白質(zhì)結(jié)構(gòu)預(yù)測的 RoseTTAFold 工具。我很高興科學(xué)界已經(jīng)在使用 RoseTTAFold 服務(wù)器來解決突出的生物學(xué)問題?!?/p>

可以想見的是,如此一款便捷免費(fèi)、高準(zhǔn)確度、低成本的工具必然會(huì)受到世界各地的科研人員的歡迎。團(tuán)隊(duì)成員之一、博士后學(xué)者 Minkyung Baek 也表示:“我們希望 RoseTTAFold 新工具在今后,繼續(xù)使整個(gè)研究學(xué)界受益?!?/p>

參考資料:

https://science.sciencemag.org/content/early/2021/07/14/science.abj8754

https://science.sciencemag.org/content/373/6552/262

https://newsroom.uw.edu/news/accurate-protein-structure-prediction-now-accessible-all

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉