以大模型加速新藥研發(fā),成本降低70%:一家大廠的「云端」實(shí)戰(zhàn)(2)
不只有面向藥物分子設(shè)計(jì)的行業(yè)大模型,一直以來(lái),華為云還在做一件更長(zhǎng)期主義的事:打造新藥研發(fā)領(lǐng)域的「EDA 軟件」。
業(yè)內(nèi)有一個(gè)判斷:「未來(lái)的 AI 制藥,正從以算法為中心(Model-centric)朝著以數(shù)據(jù)為中心(Data-centric)的競(jìng)爭(zhēng)趨勢(shì)演進(jìn),而高質(zhì)量大數(shù)據(jù)是醫(yī)藥研發(fā)的競(jìng)爭(zhēng)關(guān)鍵?!?/span>
新藥研發(fā)的核心高質(zhì)量數(shù)據(jù)通常掌握在藥企手中,然而大部分藥企特別是中小企業(yè)仍處于傳統(tǒng)醫(yī)藥研發(fā)階段,缺乏人工智能及大數(shù)據(jù)分析手段的支撐。海量的原始數(shù)據(jù)未經(jīng)過(guò)系統(tǒng)化的清洗整理,大多不能產(chǎn)生良好的預(yù)測(cè)效果。
數(shù)據(jù)的價(jià)值需要使用算法去發(fā)現(xiàn),同時(shí)結(jié)合 AI 新藥研發(fā)公司成熟的算法,而算法需要運(yùn)行在算力平臺(tái)上。在這種情況下,就需要一個(gè)高效的企業(yè)級(jí) AI 輔助藥物研發(fā)平臺(tái)將三大要素有機(jī)結(jié)合起來(lái)。
如此一來(lái),不僅能夠提高藥物研發(fā)的效率、節(jié)約成本,還能大大降低藥物研發(fā)的門(mén)檻,讓每一家藥企都能高效轉(zhuǎn)型。
為此,華為云在醫(yī)藥領(lǐng)域自下而上構(gòu)建了 IaaS、PaaS、SaaS 三層服務(wù):基于分布式云基礎(chǔ)設(shè)施,在藥物研發(fā)環(huán)節(jié)為藥企提供融合大數(shù)據(jù)、AI 能力的一站式 AI 輔助藥物研發(fā)平臺(tái),并且根據(jù)多樣性的數(shù)據(jù)治理和 AI 開(kāi)發(fā)需求,提供全鏈路藥物研發(fā)數(shù)據(jù)治理能力和全流程藥物研發(fā) AI 開(kāi)發(fā)能力,幫助眾多藥企降低 AI 開(kāi)發(fā)門(mén)檻和提升研發(fā)效率 。
具體來(lái)說(shuō),在 SaaS 層,華為云的一站式 AI 輔助藥物研發(fā)平臺(tái)涵蓋了「靶點(diǎn)發(fā)現(xiàn)」、「藥物篩選」、「分子優(yōu)化」三大核心服務(wù),覆蓋新藥研發(fā)全流程,支持從靶點(diǎn)發(fā)現(xiàn)、虛擬篩選、先導(dǎo)化合物優(yōu)化到獲取可合成先導(dǎo)化合物的全業(yè)務(wù)流程,真正做到了「無(wú)功能斷點(diǎn)」。
例如,傳統(tǒng)的靶點(diǎn)發(fā)現(xiàn)需要做大量的科研工作,對(duì)靶點(diǎn)做大量的生物學(xué)假設(shè),并設(shè)計(jì)一系列的實(shí)驗(yàn)進(jìn)行驗(yàn)證,需要漫長(zhǎng)的周期。在這一環(huán)節(jié),華為云發(fā)布了 AutoGenome 單組學(xué)自動(dòng) AI 建模、AutoOmics 多組學(xué)自動(dòng) AI 建模、AutoGGN 調(diào)控網(wǎng)絡(luò)自動(dòng) AI 建模三個(gè)框架,即使是沒(méi)有機(jī)器學(xué)習(xí)背景的研究人員,也可以借助這些自動(dòng)化調(diào)優(yōu)的方法和策略對(duì)自己研究的問(wèn)題和數(shù)據(jù)進(jìn)行建模。
再談到藥物篩選,傳統(tǒng)方法通常是借助實(shí)驗(yàn)手段或采用高通量實(shí)驗(yàn)篩選平臺(tái)進(jìn)行篩選,不僅耗時(shí)、耗錢(qián),而且多樣性差。華為云的一站式 AI 輔助藥物研發(fā)平臺(tái)則大大加速了這一早期篩選過(guò)程:平臺(tái)預(yù)置了藥物虛擬篩選流程和分子庫(kù),依托于華為云彈性擴(kuò)容算力,支持并行化地完成海量的藥物虛擬篩選,同時(shí)支持小分子和多肽分子對(duì)接,提供了打分矩陣、集成可視化。
藥物虛擬篩選結(jié)果案例展示。
一個(gè)具備代表性的案例是,新冠疫情爆發(fā)之后,由于沒(méi)有實(shí)驗(yàn)提出新冠病毒相關(guān)靶點(diǎn),研究人員很難進(jìn)行相關(guān)業(yè)務(wù)設(shè)計(jì)。當(dāng)時(shí),華為云和國(guó)內(nèi)幾所高校積極開(kāi)展新冠肺炎藥物篩選工作,基于華為云 15000 核超大算力,完成了新冠 21 個(gè)蛋白質(zhì)靶點(diǎn)與 8500 個(gè)已上市藥物的篩選工作。原本耗時(shí)一個(gè)月的藥物虛擬篩選,最終縮短到一天完成。
對(duì)于分子優(yōu)化環(huán)節(jié),傳統(tǒng)方法更加依賴資深的藥化專家在漫長(zhǎng)職業(yè)生涯中積累的經(jīng)驗(yàn),對(duì)化合物進(jìn)行改造,并需要進(jìn)行實(shí)驗(yàn)驗(yàn)證,項(xiàng)目的成功極其依賴藥化專家的經(jīng)驗(yàn)和運(yùn)氣,而華為云提供的盤(pán)古藥物分子大模型將這一階段的工作進(jìn)行了拆解,提供了多種自動(dòng)化工具。
模型以參考化合物為起點(diǎn),使得從參考化合物到改造化合物的類(lèi)藥性質(zhì)一覽無(wú)余,更方便地迭代優(yōu)化,得到性質(zhì)更優(yōu)、結(jié)構(gòu)新穎的化合物。這些豐富的功能意味著,如果一位藥企的研究人員積累了大量關(guān)于某種毒性的試驗(yàn)數(shù)據(jù),就可將試驗(yàn)數(shù)據(jù)上傳并通過(guò)盤(pán)古藥物分子大模型基于它的試驗(yàn)數(shù)據(jù)進(jìn)行 Fine-tune 調(diào)優(yōu),直接可以在八十多種分子屬性里面再加上新的自定義分子屬性。
「算法只是一種技術(shù)的架構(gòu),一方面算法需要數(shù)據(jù)的訓(xùn)練來(lái)實(shí)現(xiàn)真正的業(yè)務(wù)需要,另一方面,就像 ChatGPT 一樣,只有足夠多的數(shù)據(jù)輸入才能實(shí)現(xiàn)算法的最好性能,最后,算法的領(lǐng)先性需要持續(xù)的數(shù)據(jù)輸入和迭代。所以未來(lái) AI 制藥的競(jìng)爭(zhēng)是 AI 算法和藥企數(shù)據(jù)的深度結(jié)合,實(shí)現(xiàn)干(計(jì)算,Dry Lab)濕(實(shí)驗(yàn),Wet Lab)結(jié)合,循環(huán)迭代的大模型?!?/span>
SaaS 化服務(wù)的好處在于,藥企只需訂閱這一平臺(tái),就可以立即將其應(yīng)用到自身的業(yè)務(wù)中,不用考慮他要雇多少人去開(kāi)發(fā)、維護(hù)平臺(tái),也不需要考慮怎么引入新的技術(shù)方法。這種模式對(duì)于藥企來(lái)是最直接、最快速的提升,意味著可以將重心、核心、精力聚焦于自身的業(yè)務(wù)層。
在將最新的技術(shù)和方法引入到平臺(tái)的同時(shí),華為云團(tuán)隊(duì)也特別注重將客戶需求和建議融入平臺(tái)。為了應(yīng)對(duì)不斷變化的需求,「AI 輔助藥物研發(fā)平臺(tái)」每年平均迭代、更新幾十次,華為云派出專業(yè)的研發(fā)團(tuán)隊(duì)讓藥企的算法模型服務(wù)持續(xù)從業(yè)務(wù)中獲得反饋以進(jìn)行更新,確保藥企可以方便快捷地將最新的技術(shù)應(yīng)用起來(lái),最終加速創(chuàng)新藥的研發(fā)。
數(shù)據(jù)、算法、算力,構(gòu)成了 AI 技術(shù)發(fā)展的三大要素,三者之間密不可分。例如,還有一些挑戰(zhàn)依舊是藥企最擔(dān)心的:比如藥物設(shè)計(jì)階段產(chǎn)生的大量數(shù)據(jù)如何存、怎么用?算力資源的局限如何突破?
面向客戶在「數(shù)據(jù)」和「算力」兩塊的升級(jí)需求,華為云也給到了專門(mén)的解決方案:通過(guò)全鏈路藥研數(shù)據(jù)治理服務(wù),在集成、存儲(chǔ)、轉(zhuǎn)換、分析、治理等全生命周期幫助醫(yī)藥企業(yè)進(jìn)行自動(dòng)化、智能化的數(shù)據(jù)治理,實(shí)現(xiàn)外采數(shù)據(jù)統(tǒng)一管控、干實(shí)驗(yàn)數(shù)據(jù)跨團(tuán)隊(duì)共享、干 / 濕實(shí)驗(yàn)數(shù)據(jù)整合閉環(huán),并以中心化數(shù)據(jù)安全策略覆蓋全鏈路,為藥物研發(fā)提供高質(zhì)量、高可信數(shù)據(jù);此外,在算力方面,華為云提供醫(yī)藥行業(yè)分布式云基礎(chǔ)設(shè)施,為藥物研發(fā)提供最強(qiáng)算力底座和極致算力性能,通過(guò)高安全、高可用、高性能、國(guó)產(chǎn)化、大算力的云計(jì)算資源,保障生物醫(yī)藥企業(yè)數(shù)字化建設(shè)的數(shù)據(jù)安全性、系統(tǒng)合規(guī)性、研發(fā)穩(wěn)定性、資源彈性。
讓「AI for Industries」走到千行百業(yè)的深處
從目前的階段來(lái)看,AI 制藥對(duì)于制藥行業(yè)仍是一門(mén)顛覆式的創(chuàng)新技術(shù)。長(zhǎng)遠(yuǎn)來(lái)看,AI 技術(shù)廣泛應(yīng)用于制藥行業(yè)的是必然趨勢(shì),以傳統(tǒng)實(shí)驗(yàn)為唯一的藥物發(fā)現(xiàn)過(guò)程必將逐漸過(guò)渡為以數(shù)據(jù)驅(qū)動(dòng)的范式。
中國(guó)的制藥行業(yè)是一個(gè)飽和的市場(chǎng),對(duì)于每一家藥企來(lái)說(shuō),創(chuàng)新藥的研發(fā)將成為下一階段取勝的關(guān)鍵。接下來(lái)的路怎么走,仍然值得探討。
在取得一系列成果之后,華為云已成為 AI 新藥研發(fā)賽道的「實(shí)力玩家」,越來(lái)越受到行業(yè)伙伴的關(guān)注?;诖?,多方機(jī)構(gòu)聯(lián)合起來(lái)探索一種科研機(jī)構(gòu)、醫(yī)藥產(chǎn)業(yè)鏈、華為云等「產(chǎn)學(xué)研用」緊密結(jié)合的模式,成為了眾望所歸。
在近日舉辦的華為云 AI 新藥研發(fā)論壇中,由昌平區(qū)管委會(huì)、昌發(fā)展、華為云共同建設(shè)的「生命谷健康云創(chuàng)新中心」正式揭牌。
該中心投入運(yùn)營(yíng)后,華為云也將基于人工智能等云計(jì)算能力持續(xù)匯聚各方力量,更有效地服務(wù)藥企,幫助京津冀 TOP 藥企實(shí)現(xiàn)突破性創(chuàng)新,提升京津冀生物醫(yī)藥產(chǎn)業(yè)在全國(guó)的知名度,并將合作模式輻射至全國(guó)各生物醫(yī)藥產(chǎn)業(yè)園區(qū)。
華為云 EI 服務(wù)產(chǎn)品部部長(zhǎng)尤鵬表示,AI制藥技術(shù)使得漫長(zhǎng)的「馬拉松」轉(zhuǎn)向「加速跑」,華為希望以自身數(shù)據(jù)、算法、算力三方面的積累,以生命谷健康云創(chuàng)新中心為起點(diǎn),未來(lái)服務(wù)于全國(guó)100+生物醫(yī)藥產(chǎn)業(yè)基地,推動(dòng)中國(guó)新藥研發(fā)高質(zhì)量高速發(fā)展。
在新藥研發(fā)領(lǐng)域的歷史性變革中,像華為云這樣的頭部企業(yè),正在對(duì)中國(guó) AI 新藥研發(fā)事業(yè)起到重要的推動(dòng)作用。在我國(guó)生物醫(yī)藥產(chǎn)業(yè)鏈和產(chǎn)業(yè)集聚的形成過(guò)程中,「生命谷健康云創(chuàng)新中心」模式也將成為一種值得關(guān)注的創(chuàng)新路徑。
最后,當(dāng)大模型成為全新的風(fēng)口,我們更需要思考的是,動(dòng)輒十億、百億參數(shù)的大模型能在何種程度上改變社會(huì),實(shí)現(xiàn)路徑又是怎樣的。
作為國(guó)內(nèi)率先投入大模型研發(fā)及落地的機(jī)構(gòu),華為云認(rèn)為,未來(lái)的三年將會(huì)是大模型是風(fēng)起云涌的三年,AI 將會(huì)和各行各業(yè)深度結(jié)合,「AI for Industries」將是主要方向。
基于盤(pán)古基礎(chǔ)大模型,華為云正在向各行各業(yè)提供盤(pán)古行業(yè)大模型服務(wù),陸續(xù)推出了礦山、藥物分子、電力、氣象、海浪等盤(pán)古行業(yè)大模型,為業(yè)界貢獻(xiàn)先進(jìn)的算法和解決方案。
未來(lái),參照已經(jīng)實(shí)踐的大模型服務(wù)模式,華為云希望繼續(xù)將最前沿的一批 AI 技術(shù)復(fù)制到千行百業(yè)之中去,推動(dòng)人工智能開(kāi)發(fā)實(shí)現(xiàn)從「作坊式」到「工業(yè)化」升級(jí)。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。