清華學(xué)者主導(dǎo)干濕結(jié)合“下一代細(xì)胞工廠”開源使能平臺(tái)問世!數(shù)據(jù)驅(qū)動(dòng)全基因組基因型-工業(yè)表型關(guān)聯(lián)技術(shù),賦能合成生物學(xué)高效底盤細(xì)胞設(shè)計(jì)
1976 年 1 月的一天,一位年輕的風(fēng)險(xiǎn)投資人和一位微生物學(xué)教授走進(jìn)了加州大學(xué)舊金山分校(UCSF)附近的酒吧,原定十分鐘的會(huì)面時(shí)間延長(zhǎng)到了三個(gè)小時(shí)。從那一刻起,一家改變生物技術(shù)史的公司就此誕生。他們使用 GENetic ENgineering TECHnology 的縮寫命名了這家公司——Gen-en-tech(基因泰克)。
圖丨Genentech 的聯(lián)合創(chuàng)始人赫伯特·博耶(Herbert Boyer)博士(左)和風(fēng)險(xiǎn)投資人羅伯特·斯萬(wàn)森(Robert A.Swanson)先生(右)(來(lái)源:資料圖)
Genentech 公司首次成功地將人胰島素的 DNA 重組到大腸桿菌細(xì)胞內(nèi)的質(zhì)粒上,讓大腸桿菌作為細(xì)胞工廠生產(chǎn)出重組人胰島素,并將其產(chǎn)品化。從此,正式拉開了基因工程的序幕。
然而,四十多年過(guò)去了,人們?cè)诩夹g(shù)層面上重組表達(dá)胰島素,幾乎只做了一件事——把外源的 DNA 放進(jìn)細(xì)胞,讓這個(gè)基因轉(zhuǎn)錄成 RNA,翻譯成蛋白質(zhì),然后再圍繞著該外源 DNA 的表達(dá)翻譯效率做些工程化改造。
蛋白要在宿主細(xì)胞中高效表達(dá),其實(shí)不僅是信息傳遞。原料供應(yīng)、肽鏈延長(zhǎng)、翻譯后修飾,折疊、分泌乃至應(yīng)急修復(fù)等,諸多環(huán)節(jié)都有可能影響到蛋白表達(dá)的效率。
“要讓細(xì)胞這臺(tái)精巧的蛋白質(zhì)‘3D 打印機(jī)’高效率運(yùn)轉(zhuǎn),在全基因組層面有大量的基因發(fā)揮著不可或缺作用。然而,盡管我們?cè)诨A(chǔ)研究的層面認(rèn)識(shí)到這件事,但是,到工程層面上,還很難做到全基因組層面的工程化以提升細(xì)胞的蛋白表達(dá)效率,我們目前的認(rèn)識(shí)還很淺。”清華大學(xué)張翀教授表示。
張翀是清華大學(xué)長(zhǎng)聘副教授,國(guó)家級(jí)青年人才計(jì)劃獲得者,主要研究方向?yàn)槲⑸镏悄苤圃?,開展高通量基因型-表型關(guān)聯(lián)原創(chuàng)技術(shù)與裝備的研究,包括微生物工業(yè)表型高通量表征與連續(xù)進(jìn)化,全基因組規(guī)模基因及位點(diǎn)功能挖掘,基因型與工業(yè)表型關(guān)聯(lián)研究裝備等。
圖丨張翀(來(lái)源:張翀)
迄今為止,細(xì)胞工廠已能夠生產(chǎn)抗生素、氨基酸、重組蛋白、生物能源、生物塑料乃至“人造肉”,被廣泛地應(yīng)用在生物制造、制****、食品、能源和農(nóng)業(yè)等領(lǐng)域。
但是,與重組胰島素合成的案例一樣,目前人們對(duì)外源途徑改造較多,但對(duì)全基因組層面底盤細(xì)胞本身了解較少,進(jìn)而制約了對(duì)其系統(tǒng)化工程改造的能力,細(xì)胞底盤自身的潛能還沒有被系統(tǒng)地挖掘。
如果把外源途徑的基因序列比作圖紙,把細(xì)胞比作車間,那么,現(xiàn)有的努力大多是在“圖紙”上下功夫,但是仍然十分缺乏對(duì)“車間”全局的系統(tǒng)認(rèn)知和工程化改造的能力。
從隨機(jī)誘變到全基因組定制,多項(xiàng)技術(shù)催生底盤細(xì)胞“發(fā)現(xiàn)新大陸”
合成生物學(xué)細(xì)胞工廠構(gòu)建的核心是如何通過(guò)設(shè)計(jì)合適的基因型,從而得到人們想要的工業(yè)表型。張翀教授認(rèn)為,在基因組時(shí)代,科學(xué)家可通過(guò)各類公開生物學(xué)數(shù)據(jù)庫(kù)得到大量的基因型相關(guān)的測(cè)試數(shù)據(jù),但是,真正有價(jià)值的是能得到與工業(yè)表型關(guān)聯(lián)的基因型數(shù)據(jù)。
圖丨合成生物學(xué)常關(guān)注的工業(yè)表型(來(lái)源:該團(tuán)隊(duì))
隨著分子生物學(xué)和基因工程研究方法的不斷發(fā)展,細(xì)胞工廠的構(gòu)建策略經(jīng)歷了不同的歷史階段。相較于早期主要通過(guò)非理性誘變育種技術(shù)獲得目標(biāo)產(chǎn)物高產(chǎn)菌株的方式,20 世紀(jì) 90 年代以來(lái),隨著分子生物學(xué)、基因工程技術(shù)的逐步引入,代謝工程學(xué)科正式創(chuàng)立。
代謝工程利用重組 DNA 技術(shù)對(duì)生物體中已知的代謝途徑進(jìn)行有目的的設(shè)計(jì),并對(duì)細(xì)胞內(nèi)的基因網(wǎng)絡(luò)進(jìn)行調(diào)控和優(yōu)化,構(gòu)建具有特定功能的細(xì)胞工廠,例如提高目的產(chǎn)物的產(chǎn)率。
然而,代謝工程指導(dǎo)的設(shè)計(jì)方法大多都基于已知的生物學(xué)知識(shí),由于微生物代謝網(wǎng)絡(luò)中存在諸多可能對(duì)目標(biāo)產(chǎn)物工業(yè)表型產(chǎn)生影響的未知因素,或稱為“生命暗物質(zhì)”。這一手段獲取新知識(shí)的效率不高,細(xì)胞工廠改造過(guò)程仍然需要耗費(fèi)大量的時(shí)間和精力。
圖丨細(xì)胞工廠設(shè)計(jì)和構(gòu)建發(fā)展歷程與展望 (來(lái)源:該團(tuán)隊(duì))
那么,為了讓讓細(xì)胞工廠的設(shè)計(jì)更高效,如何去解析這些“生命暗物質(zhì)”呢?
“通過(guò)自有的技術(shù)平臺(tái)從全基因組層次并行研究微生物特定工業(yè)表型與基因型的關(guān)系,從而獲得大規(guī)模的基因型-工業(yè)表型關(guān)聯(lián)(genotype phenotype associations,GPA)數(shù)據(jù)集?!睆埩埍硎?。
“近年來(lái),高通量 DNA 合成成本的降低、基因編輯技術(shù)和二代測(cè)序技術(shù)的飛躍、高通量檢測(cè)技術(shù)的成熟等多項(xiàng)技術(shù)的發(fā)展讓大規(guī)模的 GPA 數(shù)據(jù)集的挖掘成為可能。這些新挖掘的數(shù)據(jù)將成為基因組層面的‘新大陸’。”他說(shuō)。
“新大陸”指的是新發(fā)現(xiàn)的跟目的工業(yè)表型相關(guān)聯(lián)的基因位點(diǎn),例如他們發(fā)現(xiàn)很多意外的、和蛋白質(zhì)合成有關(guān)系的位點(diǎn),比如氧化應(yīng)激(Oxidative Stress)對(duì)蛋白質(zhì)合成有積極的幫助等。
“基于全基因組規(guī)模關(guān)聯(lián)圖譜獲取新知識(shí)并驗(yàn)證其工業(yè)價(jià)值后,再在底盤上進(jìn)行系統(tǒng)工程改造,將為系統(tǒng)提升細(xì)胞工廠效率提供一條‘發(fā)現(xiàn)-工程’相結(jié)合的全新路徑。”張翀說(shuō)。
通過(guò)超高通量、快速、低成本的技術(shù)“三部曲”、實(shí)現(xiàn)全基因組規(guī)?;蛐?工業(yè)表型關(guān)聯(lián)位點(diǎn)挖掘
張翀團(tuán)隊(duì)已經(jīng)成熟打造了一套技術(shù)平臺(tái),通過(guò)該平臺(tái),可進(jìn)行超高通量、快速、低成本地對(duì)全基因組規(guī)模進(jìn)行 GPA 數(shù)據(jù)集的挖掘。
該平臺(tái)的背后有三個(gè)核心技術(shù)的支撐,分別為:CRISPR 全基因組編輯技術(shù)、超高通量液滴微流控單克隆培養(yǎng)篩選一體化技術(shù)和合成生物傳感技術(shù)。
圖丨全基因組規(guī)模 CRISPR 基因干擾文庫(kù)(來(lái)源:該團(tuán)隊(duì))
第一,CRISPR 全基因組編輯技術(shù)。該團(tuán)隊(duì)針對(duì)典型的工業(yè)宿主建立了細(xì)胞全基因組規(guī)模可達(dá)百萬(wàn)量級(jí) CRISPR 基因干擾文庫(kù)。這里的“干擾”,指的是把底盤細(xì)胞的基因敲低或激活,甚至進(jìn)行基因編輯[1,2,3]。
張翀表示,在該平臺(tái)通過(guò) CRISPR 編輯技術(shù)實(shí)現(xiàn)了“高版本”的基因型突變。這里的“高版本”是因其具備可定制、可追蹤兩大特點(diǎn)。也就是說(shuō),科學(xué)家可在任意位點(diǎn)設(shè)計(jì) sgRNA 的干擾或編輯,并且,在表型變化后,不用測(cè)全基因組即可追蹤 sgRNA 的具體位置。
據(jù)悉,目前該團(tuán)隊(duì)已有多種成熟工業(yè)底盤細(xì)胞全基因組編輯細(xì)胞文庫(kù),并獨(dú)立開發(fā)了全基因組 sgRNA 文庫(kù)設(shè)計(jì)軟件與 web 應(yīng)用程序。
圖丨全基因組 sRNA 文庫(kù)設(shè)計(jì)軟件工具開發(fā)流程(來(lái)源:該團(tuán)隊(duì))
第二,自主研發(fā)具有百萬(wàn)通量級(jí)篩選能力的液滴微流控細(xì)胞培養(yǎng)及篩選一體化技術(shù)。張翀團(tuán)隊(duì)結(jié)合微流控技術(shù)和光電傳感與控制及自動(dòng)化技術(shù)開發(fā)的“微生物微液滴培養(yǎng)技術(shù) ”,可實(shí)現(xiàn)皮升、納升、微升級(jí)多種體積規(guī)模下的微生物液滴平行培養(yǎng)、生長(zhǎng)曲線測(cè)定和適應(yīng)性進(jìn)化。
該平臺(tái)采用集成式單克隆培養(yǎng),單次單克隆數(shù)量可超 106 個(gè),與傳統(tǒng)方法相比,培養(yǎng)成本降低約 1000 倍 。并且,該平臺(tái)可自動(dòng)換液,細(xì)胞生長(zhǎng)狀態(tài)高度均一 ,適宜多種成熟工業(yè)微生物生長(zhǎng)[4]。
張翀指出,通過(guò)環(huán)境條件的控制,液滴內(nèi)微生物可能實(shí)現(xiàn)“工業(yè)相似性”培養(yǎng)?!斑@相當(dāng)于實(shí)現(xiàn)了文庫(kù)獨(dú)立的基因型轉(zhuǎn)變?yōu)楠?dú)立的反應(yīng)器,讓它生長(zhǎng)出可獲取的目標(biāo)表型?!?/span>
圖丨超高通量液滴微流控單克隆培養(yǎng)篩選一體化平臺(tái)(來(lái)源:該團(tuán)隊(duì))
第三,自主研發(fā)的高靈敏、毫秒級(jí)響應(yīng)合成生物傳感器。通常,對(duì)百萬(wàn)個(gè)皮升級(jí)液滴的表型進(jìn)行測(cè)試,會(huì)采用定向的光學(xué)技術(shù),尤其是熒光技術(shù)。為此,該團(tuán)隊(duì)建立了一系列針對(duì)蛋白質(zhì)、小分子濃度定量測(cè)試的合成生物熒光傳感技術(shù)[5,6,7]。
通過(guò)該技術(shù),可將目標(biāo)分子濃度定量地轉(zhuǎn)化成熒光信號(hào),其靈敏度高、響應(yīng)速度快,與百萬(wàn)量級(jí)通量的液滴微流控系統(tǒng)完全兼容,為目的代謝物表型-基因型關(guān)聯(lián)圖譜的繪制奠定基礎(chǔ)。
圖丨蛋白產(chǎn)量與折疊生物傳感器模型(來(lái)源:該團(tuán)隊(duì))
干濕結(jié)合的中心化實(shí)驗(yàn)室,整合數(shù)據(jù)孤島,打造國(guó)內(nèi)首個(gè)合成生物學(xué)數(shù)據(jù)開源使能平臺(tái)
目前,生物科學(xué)領(lǐng)域所使用的數(shù)據(jù)庫(kù),例如 NCBI、KEGG、PDB 等,都是靠科學(xué)家團(tuán)隊(duì)供應(yīng)離散式數(shù)據(jù)集成形成的,其主要還是科學(xué)屬性的數(shù)據(jù)庫(kù)?!?strong style=";padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important">設(shè)想如果我們手頭擁有海量工業(yè)需求驅(qū)動(dòng)的 GPA 數(shù)據(jù)庫(kù),這樣就掌握著設(shè)計(jì)高效細(xì)胞工廠的核心原始數(shù)據(jù)。”張翀說(shuō)。
他指出,從行業(yè)內(nèi)部來(lái)看,合成生物學(xué)雖然潛力巨大,但是技術(shù)發(fā)展得很早期,還有很多問題需要解決。合成生物學(xué)是個(gè)兼具科學(xué)屬性與工程屬性的交叉學(xué)科,但是現(xiàn)階段,科學(xué)屬性仍然較重,工程化較弱。尤其是學(xué)術(shù)界,很多研發(fā)的方式還停留在“手工作坊”階段。
張翀認(rèn)為,通過(guò)自動(dòng)化和高通量技術(shù)讓科學(xué)家做實(shí)驗(yàn)的過(guò)程變成中心平臺(tái)化的形式,以此來(lái)促進(jìn)合成生物學(xué)從科學(xué)屬性向工程屬性轉(zhuǎn)移。一旦把這個(gè)鏈條打通,未來(lái)合成生物學(xué)就變成了純粹的信息科學(xué)和數(shù)據(jù)科學(xué)的問題。
從生物制造領(lǐng)域來(lái)看,細(xì)胞工廠設(shè)計(jì)是未來(lái)的發(fā)展趨勢(shì),從現(xiàn)在離散式的個(gè)人實(shí)驗(yàn)室變成中心化實(shí)驗(yàn)室平臺(tái),從分布式的數(shù)據(jù)向集成的大規(guī)模數(shù)據(jù)生產(chǎn),這種高度標(biāo)準(zhǔn)化、高質(zhì)量的數(shù)據(jù)為最后演變?yōu)锳I驅(qū)動(dòng)的設(shè)計(jì)提供了極大的可能性。
如果能夠利用大規(guī)模 GPA 數(shù)據(jù)集,基于數(shù)據(jù)科學(xué)手段從全基因組范圍深度挖掘傳統(tǒng)分子生物學(xué)手段無(wú)法發(fā)現(xiàn)的未知關(guān)聯(lián)基因及其位點(diǎn),將有可能從數(shù)據(jù)學(xué)習(xí)的角度繞開理性設(shè)計(jì)的知識(shí)瓶頸,為提高細(xì)胞工廠設(shè)計(jì)和創(chuàng)建效率提供全新的研究范式。
此外,由于大規(guī)模 GPA 數(shù)據(jù)集搜索范圍更寬(全基因組),不依賴于現(xiàn)有知識(shí),將有可能探索之前理性/半理性所無(wú)法達(dá)到的表型“高地”,獲得生產(chǎn)效率更為高效、生產(chǎn)性能更加優(yōu)越的下一代定制化細(xì)胞工廠。
對(duì)于該平臺(tái),張翀團(tuán)隊(duì)對(duì)其規(guī)劃不僅限于對(duì)科學(xué)家的單點(diǎn)服務(wù),還計(jì)劃逐漸實(shí)行學(xué)術(shù)端開源,助力多維度合成生物學(xué)的數(shù)據(jù)標(biāo)準(zhǔn)化。以高通量基因型-工業(yè)表型關(guān)聯(lián)圖譜數(shù)據(jù)驅(qū)動(dòng) AI 解析細(xì)胞工廠,打造合成生物數(shù)據(jù)使能平臺(tái)。
該平臺(tái)用工程手段推進(jìn)科學(xué)研究升級(jí),將輔助科學(xué)家實(shí)現(xiàn)技術(shù)轉(zhuǎn)化,并銜接行業(yè)上下游。當(dāng)平臺(tái)發(fā)展到一定程度,便會(huì)積累較高的產(chǎn)業(yè)化勢(shì)能,將來(lái)會(huì)有多種產(chǎn)業(yè)化的可能性。
“科學(xué)家通過(guò)提需求,確認(rèn)想要做的菌株以及表型后,我們來(lái)幫他做實(shí)驗(yàn),再將結(jié)果反饋給科學(xué)家。同時(shí),我們希望把數(shù)據(jù)沉淀到平臺(tái),同時(shí)開放地讓學(xué)術(shù)貢獻(xiàn)共同獲取,并驗(yàn)證它的應(yīng)用價(jià)值。未來(lái),這會(huì)成為若干工業(yè)表型圖設(shè)計(jì)的核心驅(qū)動(dòng)力。”張翀說(shuō)。
據(jù)悉,該團(tuán)隊(duì)已與國(guó)內(nèi)重點(diǎn)高校相關(guān)實(shí)驗(yàn)室建立廣泛合作,如清華大學(xué)、天津大學(xué)、華東理工大學(xué)、上海交通大學(xué)、江南大學(xué)、中科院上海植生所等。同時(shí),張翀正在為該平臺(tái)進(jìn)行技術(shù)授權(quán)及產(chǎn)業(yè)化落地,目前已在籌備成立相關(guān)公司并組建技術(shù)研發(fā)團(tuán)隊(duì),張翀教授出任首席科學(xué)家。
對(duì)該平臺(tái)的未來(lái)發(fā)展,張翀充滿期待,他稱:“我相信擁有數(shù)據(jù)的核心資源,也就掌握了細(xì)胞工廠設(shè)計(jì)的核心信息,我們希望這類關(guān)鍵數(shù)據(jù)庫(kù)生根在中國(guó),并服務(wù)于中國(guó)本土的科研與產(chǎn)業(yè)?!?/span>
-End-
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)