照亮整個蛋白質(zhì)宇宙:DeepMind“順手”放的大招,要一舉攻克漸凍人癥
漸凍人癥,這個陪伴了傳奇物理學家史蒂芬·霍金終生的罕見病,也已經(jīng)困擾了醫(yī)生和生物科學家數(shù)十年的時間。
而答案可能就在核孔蛋白 (neucleoporins) 上。具體來說,學者們認為漸凍人癥和核孔蛋白組成的核孔復合體有著極強的關聯(lián),而這個復合體控制著細胞核與細胞質(zhì)之間的物質(zhì)傳遞。如果能夠進一步了解核孔蛋白,我們就有可能找到根治漸凍人癥的答案。
然而想得到這個答案并不容易:核孔復合體由超過1000條30多種不同的核孔蛋白組成,這些蛋白質(zhì)以極其復雜的方式相互交錯在一起;更別提單條蛋白的大小可能只有數(shù)納米,即便通過最先進的顯微鏡技術也很難進行有效的觀察,給生物學者造成了極大的障礙。
2019年,剛加入哈佛大學吳皓實驗室的 Pietro Fontana,就領到了核孔蛋白這個天文級難題。
他不是第一個嘗試吃螃蟹的人,前人在這件事上已經(jīng)用盡了各種研究手段,付諸數(shù)十年的心血。但是 Fontana 有強援在手:AlphaFold,由英國人工智能科研公司 DeepMind 開發(fā)的蛋白質(zhì)預測模型。
沒過多久,在 AlphaFold 的幫助下,F(xiàn)ontana 的研究就取得了關鍵性的進展:他們不僅成功預測出了之前沒有被探究清楚的一批核孔蛋白的結(jié)構(gòu),還首次繪制出了核孔復合體的胞質(zhì)環(huán) (cytoplasmic ring) 的模型圖。這一研究在今年剛剛獲得《科學》期刊刊登。
AlphaFold 協(xié)助預測的核孔蛋白組成的胞質(zhì)環(huán) 圖片來源:DOI: 10.1126/science.abm9326
這一歷史性的生物信息學突破,為攻克像漸凍人癥等罕見、難治的神經(jīng)退行性疾病疾病,重新點亮了希望。
“我認為 AlphaFold 已經(jīng)完全改變了結(jié)構(gòu)生物學,” Fontana 表示。
有意思的是,這么個如此重要的發(fā)現(xiàn)和研究,其實對于 AlphaFold 來說倒像是一件“順手”的事。
| 蛋白質(zhì)數(shù)據(jù)庫實現(xiàn)千倍擴容,成為“蛋白質(zhì)宇宙”
這么說是因為:截至目前地球上已知的所有生物總共2.14億種蛋白質(zhì),其結(jié)構(gòu)都已經(jīng)被 AlphaFold 預測出來了。
值得一提的是,DeepMind 的研究進展速度之快,AlphaFold 的效果之好,已經(jīng)遠超“令人震驚”的水平。
首先,去年該公司首次發(fā)布并開源了 AlphaFold 模型,當時它只預測出了人類的98%,以及其它大約1萬種生物的部分蛋白質(zhì),條數(shù)只有100萬左右——當時這一研究已經(jīng)入選了《自然》年度十大科學事件。
僅一年后,這個數(shù)據(jù)庫就實現(xiàn)了200倍擴容:
圖片來源:DeepMind
更厲害的是,現(xiàn)在這個數(shù)據(jù)庫已經(jīng)覆蓋了動物、植物、細菌、真菌等幾乎所有已經(jīng)被科學記錄的物種,總計大約100萬種。其中80%的的預測結(jié)構(gòu)結(jié)果的置信度已經(jīng)足以支持研究實驗的水平,更是有35%的結(jié)果置信度為高。
圖片來源:DeepMind
此次 AlphaFold 放出的“全量蛋白質(zhì)結(jié)構(gòu)預測數(shù)據(jù)庫”,和之前人類手工測量的數(shù)據(jù)庫相比,更是實現(xiàn)了1000倍的擴容。在此之前通過標準實驗方式測量出的蛋白質(zhì)結(jié)構(gòu),都存放在“蛋白質(zhì)數(shù)據(jù)****” (PDB) 計劃的數(shù)據(jù)庫里,今天這個數(shù)據(jù)庫的條目只有19萬條。
這簡直是為結(jié)構(gòu)生物學,生物信息學、醫(yī)****開發(fā)等領域,送上了一份驚天大禮包——更別提數(shù)據(jù)庫還是完全免費、開放、可搜索的:
這一最新版的 AlphaFold 數(shù)據(jù)庫,可以說其中超過99%的蛋白質(zhì)結(jié)構(gòu)在此之前都是未知的。而現(xiàn)在人類對于蛋白質(zhì)結(jié)構(gòu)的知識突然獲得了200倍的增長,可想而知未來的更多生物學和醫(yī)學進展將會更加頻繁,許多肆虐幾百年的疾病有望得到“根治",許多存在了幾十年的生物學難題也將得到破解。斯克里普斯研究所(世界頂級醫(yī)學研究機構(gòu))創(chuàng)始人 Eric Topol 直言:
“AlphaFold 照亮了幾乎整個蛋白質(zhì)宇宙。”
| 幾分鐘破解世界級生物難題
很多細菌都能引發(fā)人類疾病,為了壓制細菌人類發(fā)明了抗生素。然而作為一種微生物,細菌自己能通過自然選擇進化的方式獲得抵抗抗生素的能力。結(jié)果就是一些人們以為“無害”的,已經(jīng)被攻克的病原體,突然就重新成為了人類的大敵。比如麻風病,接種疫苗只有有限預防效果,現(xiàn)在仍然在全球傳播,感染數(shù)十萬人,且需要長期服****治療。
而兩位來自美國科羅拉多大學博爾德分校的生物學家,希望通過最“治本”的方式試圖解決抗生素抗****性。該校生物化學系教授 Marcelo Sousa 透露,他們的研究目標是定位到那些促使產(chǎn)生抗****性的酶鏈,了解這些酶的蛋白質(zhì)結(jié)構(gòu),然后進行“定點精確打擊”。
然而分離和提純這些酶已經(jīng)非常艱難,就算提純出來,研究者發(fā)現(xiàn)想要了解它們的結(jié)構(gòu)更是難上加難。
由于預測蛋白質(zhì)結(jié)構(gòu)的工作,在過去需要通過X射線晶體衍射、冷凍電鏡等實驗室技術,基本上只能人工進行,Sousa 等人在這一研究上已經(jīng)花了十年的時間,不知道還要多久——如果不是因為 AlphaFold 的出現(xiàn)。
研究團隊成員 Marcelo Sousa 和 Megan Mitchel 圖片來源:DeepMind
通過 AlphaFold 提供的基準預測模型,結(jié)合團隊已經(jīng)從提純的酶晶體上獲得的數(shù)據(jù),團隊在這些酶的序列和結(jié)構(gòu)預測上大獲成功。在 AlphaFold 的幫助下,不僅預測速度有了極大提升,預測結(jié)果的準確程度更是十分準確。
“這個難題花了我們10年的時間都沒有做到,現(xiàn)在居然只用30分鐘就解決了,”Sousa 對 AlphaFold 贊嘆不已。接下來,團隊可以繼續(xù)通過 AlphaFold 預測出的結(jié)果,進一步研究這條酶鏈在抗****性形成中所扮演的角色,并且找到突破口。
“我們已經(jīng)了解了這個鏈條當中的各種酶,現(xiàn)在我們只要能夠打破其中一環(huán),就可以破解整個抗****性的難題,”研究人員 Megan Mitchel 表示。
Sousa 則表示,AlphaFold 將對新****發(fā)現(xiàn)帶來巨大的積極效果。
Marcelo Sousa 展示 AlphaFold 預測出的目標酶蛋白質(zhì)結(jié)構(gòu) 圖片來源:DeepMind
這只是 AlphaFold 將要幫助解決的一件“小事”。據(jù) DeepMind 透露,目前全球已經(jīng)有超過50萬研究人員在使用 AlphaFold 數(shù)據(jù)庫,這些前所未有的蛋白質(zhì)結(jié)構(gòu)預測數(shù)據(jù),已經(jīng)被用于尋找包括漸凍人等不治之癥的治療方案、徹底解決麻風病和血吸蟲病的肆虐、發(fā)現(xiàn)新****、保護種植業(yè)、開發(fā)高效降解塑料垃圾的殺手锏等。
“我們希望這個數(shù)據(jù)庫能夠幫助無數(shù)更多的科學家,并且在科學探索上開啟全新的道路,”DeepMind 創(chuàng)始人兼 CEO Demis Hassabis 表示,
“就像數(shù)學是物理學的完美解釋語言一樣,我們相信 AI 是應對生物學復雜動態(tài)問題的完美工具。”
| 附錄:AlphaFold 大事記以下內(nèi)容均來自于 DeepMind 網(wǎng)站:
2016年:一個隊伍成為明星,另一個隊伍開始組建
當年,DeepMind 的圍棋 AI 程序 AlphaGo 在首爾的一場挑戰(zhàn)賽中,擊敗了傳奇的圍棋選手李世乭。在 DeepMind 公司內(nèi)部,這一關鍵性事件證明了該公司的 AI 技術已經(jīng)足夠先進,有可能應用到解決其它科學挑戰(zhàn)當中,比如蛋白質(zhì)折疊這一存在了50年的挑戰(zhàn)當中。
不久之后,DeepMind 就在內(nèi)部建立了一個小型團隊,開始嘗試使用深度神經(jīng)網(wǎng)絡技術進行蛋白質(zhì)結(jié)構(gòu)預測。
圖片來源:DeepMind
2018年:AlphaFold 性能的首次公開測試
AlphaFold 的性能在 CASP13 蛋白質(zhì)結(jié)構(gòu)預測比賽中排名第一,相關的方法隨后發(fā)表在《自然》期刊上。DeepMind 在內(nèi)部擴充了 AlphaFold 團隊,正式開始了打造這個創(chuàng)新的新系統(tǒng)。
圖片來源:DeepMind
2020年:解決了生物學50年難題
AlphaFold 在 CASP14 蛋白質(zhì)結(jié)構(gòu)預測比賽中再次以三倍的巨大優(yōu)勢勝出,并且準確性已經(jīng)接近于X射線晶體衍射、冷凍電鏡等標準實驗方法。更厲害的是,在這次比賽上,AlphaFold 得到 CASP 舉辦方認定,破解了50年都未曾解開的蛋白質(zhì)折疊難題?!蹲匀弧菲诳苯釉u價這一事件“改變了一切”。
同年12月,Demis Hassabis 和 AlphaFold 項目主管 John Jumper 公開承諾,將對外開放 AlphaFold。
圖片來源:CASP
2021年:一邊創(chuàng)造歷史,一邊全面開源
DeepMind 在去年兌現(xiàn)了開放 AlphaFold 的承諾。該公司在《自然》發(fā)表論文,公開了 AlphaFold 研發(fā)過程中采用的詳細方法,并且開源了相關代碼,提供了60頁詳細補充資料。
去年7月, DeepMind 再次發(fā)表論文,展示 AlphaFold 已經(jīng)成功預測了整個人類蛋白質(zhì)組。這一發(fā)表讓已知的高置信度人類蛋白質(zhì)結(jié)構(gòu)數(shù)量翻了一倍。該公司和歐洲分子生物學實驗室 (EMBL-EBI) 合作公開了數(shù)據(jù)庫,包括人類蛋白質(zhì)組以及另外20種模式生物(受到廣泛研究的生物)的蛋白質(zhì)組,總共超過35萬條。
圖片來源:DeepMind
去年10月,DeepMind 發(fā)布了一個修改版的子模型,名為“AlphaFold-Multimer”,專門用于蛋白質(zhì)復合物的結(jié)構(gòu)預測。隨后在11月,該公司將相關子模型代碼整合到 AlphaFold 二代代碼當中,顯著提高了多鏈蛋白質(zhì)結(jié)構(gòu)的預測準確度。
同年12月,DeepMind 向 AlphaFold數(shù)據(jù)庫當中增加了超過40萬條蛋白質(zhì)結(jié)構(gòu)。
2022年:數(shù)據(jù)庫持續(xù)幾何級增長
今年1月,DeepMind 宣布已經(jīng)有超過30萬研究者使用了 AlphaFold數(shù)據(jù)庫,并且添加了超過27個蛋白質(zhì)組,總計超過19萬條蛋白質(zhì)結(jié)構(gòu)預測數(shù)據(jù)。這次添加的重要性在于其中17個蛋白質(zhì)組都和被忽視熱帶疾病有關,影響全球十多億人。
7月(本次),DeepMind 將 AlphaFold 數(shù)據(jù)庫從近100萬條擴展到2.14億條,覆蓋了人類已知的絕大多數(shù)蛋白質(zhì)(也即 UniProt 蛋白質(zhì)數(shù)據(jù)庫的大部分內(nèi)容)
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。
物聯(lián)網(wǎng)相關文章:物聯(lián)網(wǎng)是什么