博客專欄

EEPW首頁 > 博客 > 以大模型加速新藥研發(fā),成本降低70%:一家大廠的「云端」實(shí)戰(zhàn)(2)

以大模型加速新藥研發(fā),成本降低70%:一家大廠的「云端」實(shí)戰(zhàn)(2)

發(fā)布人:機(jī)器之心 時間:2023-05-20 來源:工程師 發(fā)布文章
打造新藥研發(fā)領(lǐng)域的「EDA 軟件」


不只有面向藥物分子設(shè)計(jì)的行業(yè)大模型,一直以來,華為云還在做一件更長期主義的事:打造新藥研發(fā)領(lǐng)域的「EDA 軟件」。
業(yè)內(nèi)有一個判斷:「未來的 AI 制藥,正從以算法為中心(Model-centric)朝著以數(shù)據(jù)為中心(Data-centric)的競爭趨勢演進(jìn),而高質(zhì)量大數(shù)據(jù)是醫(yī)藥研發(fā)的競爭關(guān)鍵?!?/span>
新藥研發(fā)的核心高質(zhì)量數(shù)據(jù)通常掌握在藥企手中,然而大部分藥企特別是中小企業(yè)仍處于傳統(tǒng)醫(yī)藥研發(fā)階段,缺乏人工智能及大數(shù)據(jù)分析手段的支撐。海量的原始數(shù)據(jù)未經(jīng)過系統(tǒng)化的清洗整理,大多不能產(chǎn)生良好的預(yù)測效果。
數(shù)據(jù)的價值需要使用算法去發(fā)現(xiàn),同時結(jié)合 AI 新藥研發(fā)公司成熟的算法,而算法需要運(yùn)行在算力平臺上。在這種情況下,就需要一個高效的企業(yè)級 AI 輔助藥物研發(fā)平臺將三大要素有機(jī)結(jié)合起來。
如此一來,不僅能夠提高藥物研發(fā)的效率、節(jié)約成本,還能大大降低藥物研發(fā)的門檻,讓每一家藥企都能高效轉(zhuǎn)型。
為此,華為云在醫(yī)藥領(lǐng)域自下而上構(gòu)建了 IaaS、PaaS、SaaS 三層服務(wù):基于分布式云基礎(chǔ)設(shè)施,在藥物研發(fā)環(huán)節(jié)為藥企提供融合大數(shù)據(jù)、AI 能力的一站式 AI 輔助藥物研發(fā)平臺,并且根據(jù)多樣性的數(shù)據(jù)治理和 AI 開發(fā)需求,提供全鏈路藥物研發(fā)數(shù)據(jù)治理能力和全流程藥物研發(fā) AI 開發(fā)能力,幫助眾多藥企降低 AI 開發(fā)門檻和提升研發(fā)效率  。

圖片


具體來說,在 SaaS 層,華為云的一站式 AI 輔助藥物研發(fā)平臺涵蓋了「靶點(diǎn)發(fā)現(xiàn)」、「藥物篩選」、「分子優(yōu)化」三大核心服務(wù),覆蓋新藥研發(fā)全流程,支持從靶點(diǎn)發(fā)現(xiàn)、虛擬篩選、先導(dǎo)化合物優(yōu)化到獲取可合成先導(dǎo)化合物的全業(yè)務(wù)流程,真正做到了「無功能斷點(diǎn)」。
例如,傳統(tǒng)的靶點(diǎn)發(fā)現(xiàn)需要做大量的科研工作,對靶點(diǎn)做大量的生物學(xué)假設(shè),并設(shè)計(jì)一系列的實(shí)驗(yàn)進(jìn)行驗(yàn)證,需要漫長的周期。在這一環(huán)節(jié),華為云發(fā)布了 AutoGenome 單組學(xué)自動 AI 建模、AutoOmics 多組學(xué)自動 AI 建模、AutoGGN 調(diào)控網(wǎng)絡(luò)自動 AI 建模三個框架,即使是沒有機(jī)器學(xué)習(xí)背景的研究人員,也可以借助這些自動化調(diào)優(yōu)的方法和策略對自己研究的問題和數(shù)據(jù)進(jìn)行建模。

圖片


再談到藥物篩選,傳統(tǒng)方法通常是借助實(shí)驗(yàn)手段或采用高通量實(shí)驗(yàn)篩選平臺進(jìn)行篩選,不僅耗時、耗錢,而且多樣性差。華為云的一站式 AI 輔助藥物研發(fā)平臺則大大加速了這一早期篩選過程:平臺預(yù)置了藥物虛擬篩選流程和分子庫,依托于華為云彈性擴(kuò)容算力,支持并行化地完成海量的藥物虛擬篩選,同時支持小分子和多肽分子對接,提供了打分矩陣、集成可視化。

圖片

藥物虛擬篩選結(jié)果案例展示。
一個具備代表性的案例是,新冠疫情爆發(fā)之后,由于沒有實(shí)驗(yàn)提出新冠病毒相關(guān)靶點(diǎn),研究人員很難進(jìn)行相關(guān)業(yè)務(wù)設(shè)計(jì)。當(dāng)時,華為云和國內(nèi)幾所高校積極開展新冠肺炎藥物篩選工作,基于華為云 15000 核超大算力,完成了新冠 21 個蛋白質(zhì)靶點(diǎn)與 8500 個已上市藥物的篩選工作。原本耗時一個月的藥物虛擬篩選,最終縮短到一天完成。
對于分子優(yōu)化環(huán)節(jié),傳統(tǒng)方法更加依賴資深的藥化專家在漫長職業(yè)生涯中積累的經(jīng)驗(yàn),對化合物進(jìn)行改造,并需要進(jìn)行實(shí)驗(yàn)驗(yàn)證,項(xiàng)目的成功極其依賴藥化專家的經(jīng)驗(yàn)和運(yùn)氣,而華為云提供的盤古藥物分子大模型將這一階段的工作進(jìn)行了拆解,提供了多種自動化工具。
模型以參考化合物為起點(diǎn),使得從參考化合物到改造化合物的類藥性質(zhì)一覽無余,更方便地迭代優(yōu)化,得到性質(zhì)更優(yōu)、結(jié)構(gòu)新穎的化合物。這些豐富的功能意味著,如果一位藥企的研究人員積累了大量關(guān)于某種毒性的試驗(yàn)數(shù)據(jù),就可將試驗(yàn)數(shù)據(jù)上傳并通過盤古藥物分子大模型基于它的試驗(yàn)數(shù)據(jù)進(jìn)行 Fine-tune 調(diào)優(yōu),直接可以在八十多種分子屬性里面再加上新的自定義分子屬性。
「算法只是一種技術(shù)的架構(gòu),一方面算法需要數(shù)據(jù)的訓(xùn)練來實(shí)現(xiàn)真正的業(yè)務(wù)需要,另一方面,就像 ChatGPT 一樣,只有足夠多的數(shù)據(jù)輸入才能實(shí)現(xiàn)算法的最好性能,最后,算法的領(lǐng)先性需要持續(xù)的數(shù)據(jù)輸入和迭代。所以未來 AI 制藥的競爭是 AI 算法和藥企數(shù)據(jù)的深度結(jié)合,實(shí)現(xiàn)干(計(jì)算,Dry Lab)濕(實(shí)驗(yàn),Wet Lab)結(jié)合,循環(huán)迭代的大模型?!?/span>
SaaS 化服務(wù)的好處在于,藥企只需訂閱這一平臺,就可以立即將其應(yīng)用到自身的業(yè)務(wù)中,不用考慮他要雇多少人去開發(fā)、維護(hù)平臺,也不需要考慮怎么引入新的技術(shù)方法。這種模式對于藥企來是最直接、最快速的提升,意味著可以將重心、核心、精力聚焦于自身的業(yè)務(wù)層。
在將最新的技術(shù)和方法引入到平臺的同時,華為云團(tuán)隊(duì)也特別注重將客戶需求和建議融入平臺。為了應(yīng)對不斷變化的需求,「AI 輔助藥物研發(fā)平臺」每年平均迭代、更新幾十次,華為云派出專業(yè)的研發(fā)團(tuán)隊(duì)讓藥企的算法模型服務(wù)持續(xù)從業(yè)務(wù)中獲得反饋以進(jìn)行更新,確保藥企可以方便快捷地將最新的技術(shù)應(yīng)用起來,最終加速創(chuàng)新藥的研發(fā)。
數(shù)據(jù)、算法、算力,構(gòu)成了 AI 技術(shù)發(fā)展的三大要素,三者之間密不可分。例如,還有一些挑戰(zhàn)依舊是藥企最擔(dān)心的:比如藥物設(shè)計(jì)階段產(chǎn)生的大量數(shù)據(jù)如何存、怎么用?算力資源的局限如何突破?
面向客戶在「數(shù)據(jù)」和「算力」兩塊的升級需求,華為云也給到了專門的解決方案:通過全鏈路藥研數(shù)據(jù)治理服務(wù),在集成、存儲、轉(zhuǎn)換、分析、治理等全生命周期幫助醫(yī)藥企業(yè)進(jìn)行自動化、智能化的數(shù)據(jù)治理,實(shí)現(xiàn)外采數(shù)據(jù)統(tǒng)一管控、干實(shí)驗(yàn)數(shù)據(jù)跨團(tuán)隊(duì)共享、干 / 濕實(shí)驗(yàn)數(shù)據(jù)整合閉環(huán),并以中心化數(shù)據(jù)安全策略覆蓋全鏈路,為藥物研發(fā)提供高質(zhì)量、高可信數(shù)據(jù);此外,在算力方面,華為云提供醫(yī)藥行業(yè)分布式云基礎(chǔ)設(shè)施,為藥物研發(fā)提供最強(qiáng)算力底座和極致算力性能,通過高安全、高可用、高性能、國產(chǎn)化、大算力的云計(jì)算資源,保障生物醫(yī)藥企業(yè)數(shù)字化建設(shè)的數(shù)據(jù)安全性、系統(tǒng)合規(guī)性、研發(fā)穩(wěn)定性、資源彈性。
讓「AI for Industries」走到千行百業(yè)的深處
從目前的階段來看,AI 制藥對于制藥行業(yè)仍是一門顛覆式的創(chuàng)新技術(shù)。長遠(yuǎn)來看,AI 技術(shù)廣泛應(yīng)用于制藥行業(yè)的是必然趨勢,以傳統(tǒng)實(shí)驗(yàn)為唯一的藥物發(fā)現(xiàn)過程必將逐漸過渡為以數(shù)據(jù)驅(qū)動的范式。
中國的制藥行業(yè)是一個飽和的市場,對于每一家藥企來說,創(chuàng)新藥的研發(fā)將成為下一階段取勝的關(guān)鍵。接下來的路怎么走,仍然值得探討。
在取得一系列成果之后,華為云已成為 AI 新藥研發(fā)賽道的「實(shí)力玩家」,越來越受到行業(yè)伙伴的關(guān)注?;诖?,多方機(jī)構(gòu)聯(lián)合起來探索一種科研機(jī)構(gòu)、醫(yī)藥產(chǎn)業(yè)鏈、華為云等「產(chǎn)學(xué)研用」緊密結(jié)合的模式,成為了眾望所歸。
在近日舉辦的華為云 AI 新藥研發(fā)論壇中,由昌平區(qū)管委會、昌發(fā)展、華為云共同建設(shè)的「生命谷健康云創(chuàng)新中心」正式揭牌。

圖片


該中心投入運(yùn)營后,華為云也將基于人工智能等云計(jì)算能力持續(xù)匯聚各方力量,更有效地服務(wù)藥企,幫助京津冀 TOP 藥企實(shí)現(xiàn)突破性創(chuàng)新,提升京津冀生物醫(yī)藥產(chǎn)業(yè)在全國的知名度,并將合作模式輻射至全國各生物醫(yī)藥產(chǎn)業(yè)園區(qū)。
華為云 EI 服務(wù)產(chǎn)品部部長尤鵬表示,AI制藥技術(shù)使得漫長的「馬拉松」轉(zhuǎn)向「加速跑」,華為希望以自身數(shù)據(jù)、算法、算力三方面的積累,以生命谷健康云創(chuàng)新中心為起點(diǎn),未來服務(wù)于全國100+生物醫(yī)藥產(chǎn)業(yè)基地,推動中國新藥研發(fā)高質(zhì)量高速發(fā)展。
在新藥研發(fā)領(lǐng)域的歷史性變革中,像華為云這樣的頭部企業(yè),正在對中國 AI 新藥研發(fā)事業(yè)起到重要的推動作用。在我國生物醫(yī)藥產(chǎn)業(yè)鏈和產(chǎn)業(yè)集聚的形成過程中,「生命谷健康云創(chuàng)新中心」模式也將成為一種值得關(guān)注的創(chuàng)新路徑。
最后,當(dāng)大模型成為全新的風(fēng)口,我們更需要思考的是,動輒十億、百億參數(shù)的大模型能在何種程度上改變社會,實(shí)現(xiàn)路徑又是怎樣的。
作為國內(nèi)率先投入大模型研發(fā)及落地的機(jī)構(gòu),華為云認(rèn)為,未來的三年將會是大模型是風(fēng)起云涌的三年,AI 將會和各行各業(yè)深度結(jié)合,「AI for Industries」將是主要方向。
基于盤古基礎(chǔ)大模型,華為云正在向各行各業(yè)提供盤古行業(yè)大模型服務(wù),陸續(xù)推出了礦山、藥物分子、電力、氣象、海浪等盤古行業(yè)大模型,為業(yè)界貢獻(xiàn)先進(jìn)的算法和解決方案。

圖片


未來,參照已經(jīng)實(shí)踐的大模型服務(wù)模式,華為云希望繼續(xù)將最前沿的一批 AI 技術(shù)復(fù)制到千行百業(yè)之中去,推動人工智能開發(fā)實(shí)現(xiàn)從「作坊式」到「工業(yè)化」升級。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉