博客專欄

EEPW首頁 > 博客 > 德州農工大學團隊結合AI釋放「破紀錄」藍藻生產潛力,可再生燃料原料成本或可媲美玉米,商業(yè)化在即丨專訪袁戎華

德州農工大學團隊結合AI釋放「破紀錄」藍藻生產潛力,可再生燃料原料成本或可媲美玉米,商業(yè)化在即丨專訪袁戎華

發(fā)布人:深科技 時間:2022-03-28 來源:工程師 發(fā)布文章

早在 20 世紀 80 年代,美國國立生物技術信息中心(NCBI)數據庫、歐洲生物信息學研究所(EBI)數據庫和日本 DNA 數據庫(DDBJ)的相繼成立,就明示了生物信息學已經成為了生命科學研究的重要工具。


《中國科學院院刊》的 “融合科學與開放數據” 專題中指出,信息技術的深度融入,使得現(xiàn)代生命科學研究范式發(fā)展成為集人工智能驅動的生物設計和生物模擬(“干實驗”)、自動化驅使的實驗研究(“濕實驗”)于一體的計算機輔助生物學范式。


在產業(yè)界,美國麻省理工學院已與安進、巴斯夫、拜耳、禮來、Sunovion 制****等醫(yī)****公司開展機器學習方法的合作;半導體設備龍頭企業(yè)泛林(Lam Research)公司已成立投資機構加速半導體合成生物學研究……


在學術界,人工智能在合成生物學領域的應用,正在讓它朝著可定量、可計算、可調控和可預測的方向躍升。


今年 1 月,德州農工大學合成系統(tǒng)生物學創(chuàng)研中心袁戎華團隊公布了一項新成果,相關文章以題為 “Machine learning-informed and synthetic biology-enabled semi-continuous algal cultivation to unleash renewable fuel productivity” 發(fā)表在 Nature Communications 期刊上。據文章介紹,該團隊基于機器學習的培養(yǎng)設計和合成生物學的平臺,突破了藻類生產中 “相互遮蔭” 和 “高收獲成本” 的限制,實現(xiàn) 43.3 克 / 平方米 / 天的生物質產量,使最低生物質銷售價格降至每噸約 281 美元。


本次,生輝 SynBio 邀請到了袁戎華博士來與我們分享其所在的合成系統(tǒng)生物學創(chuàng)研中心的研究進展。


圖片

圖丨袁戎華 (來源:受訪者提供)


1997 年,袁戎華從復旦大學生物系畢業(yè)后,就前往美國亞利桑那大學繼續(xù)學習。在大家云集的植物學系,師從 David William Galbraith 教授(現(xiàn)任河南大學生命科學學院名譽院長),并接觸到彼時剛剛出現(xiàn)的基因芯片技術。


碩士畢業(yè)后,他曾在巴斯夫公司植物分部任職,心向往之,最后還是回歸學術界發(fā)展,并加盟知名的加州大學舊金山分校從事基因芯片和系統(tǒng)生物學的研究。2004~2007 年,他在田納西大學一邊工作一邊讀博士,畢業(yè)后進入德州農工大學工作,恰逢合成生物學開始興起。


袁戎華說,“基于對生物系統(tǒng)的了解,自然想要再進一步去設計,所以從系統(tǒng)生物學轉向合成生物學研究,幾乎是順理成章的事。”


2016 年,在袁戎華聯(lián)合多位教授的推動下,德州農工大學的合成系統(tǒng)生物學創(chuàng)研中心正式成立。兩年后,袁戎華被任命為合成生物學和可再生產品首席教授,開始領導團隊的研究。


圖片

“自發(fā)聚集沉降” 大幅度降低藻類生產成本


據袁戎華介紹,目前,團隊的研究方向主要有四個,分別是可再生材料、生物煉制、合成生物學以及碳捕捉和利用。


其中,碳捕捉和利用是在 “碳中和” 和 “碳達峰” 的大背景下,衍生出來的新方向。團隊致力于將高度頑固的木質纖維素廢物轉化為可替代的生物產品,例如用于生物柴油的脂質或用于生物塑料的 PHA(聚羥基鏈烷酸酯),同時還集中于第二代的和第三代生物燃料的生物煉制,并利用合成生物學打造平臺,不斷地優(yōu)化可再生材料的生產和生物煉制。目前,已有相應的技術轉化公司—— SynShark LLC ,正在進行 “用煙草生產角鯊烯” 的產業(yè)化工作。


1 月份發(fā)布的這項新研究,正是基于合成生物學平臺,結合機器學習,釋放了可再生燃料的生產力?!?/span>該項研究達到的生物質產量,不僅是美國能源部 2022 年目標(25 克 / 平方米 / 天)的 1.7 倍,也是目前世界上最高的戶外藍藻和藻類單位平方米生產產量。” 袁戎華說道。


而這項研究的開始,可以追溯到 2016 年。


2016 年時,袁戎華曾和中國科學院上海生命科學研究院計算生物學研究所的朱新廣教授(同時任職于上海植生所)合作,相關論文 “Enhanced limonene production in cyanobacteria reveals photosynthesis limitations” 發(fā)表在《美國國家科學院院刊》上。在這項研究中,通過建模指導,對藍藻細長聚球藻 PCC 7942 進行設計,獲得高產菌株,實現(xiàn)了超過 100 倍的檸檬烯產量增長。其中所做的菌株改造,是將從植物中獲得的人工啟動子轉入藍藻細長聚球藻 PCC 7942 菌株。


而在這項工作,袁戎華等人選中的菌株是聚球藻 UTEX2973,他們認為這種藻類高度活躍,具有高產檸檬烯的潛力。將人工啟動子和檸檬烯合成基因轉入 UTEX2973 后,發(fā)生了一個有趣的現(xiàn)象,那就是在一些特定的條件下,出現(xiàn)了自動沉降的現(xiàn)象,而且速度很快,絕大多數的細胞沉降至底部,上清液中剩余很少。


這是一個讓袁戎華激動的發(fā)現(xiàn)。眾所周知,藻類從水中的分離采收過程是一個大量耗能、成本增加的階段,甚至達到總成本的 30% 和總能耗的 50% 占比,這也意味著,若能實現(xiàn)藻類從水中自動沉降,則可以極大程度上降低成本。


今年 1 月發(fā)布的文章,正是基于工程化的 UTEX 2973 所進行的研究,改造后的菌株被命名為 L524,它能產生檸檬烯,可從藍藻細胞中排出,從而產生疏水表面相互作用并觸發(fā)細胞聚集以實現(xiàn)沉淀。檸檬烯是作為一種增值產品,此外,該菌株能夠同時生產生物質,作為潛在的航空燃料前體。


圖片

“機器學習算法” 精準預測光可用性和生長速率


除了簡化收集降低成本外,藻類生產中另一個有待解決的難題是 “相互遮蔭” 的限制。在培養(yǎng)過程中,當藻類細胞增殖至一定高密度時,光通路受到影響,細胞生長開始受到相互遮蔽的抑制,因此無法獲得高生物質產量。


對此,文章第一作者龍彬想到了結合機器學習算法打造預測模型的好辦法。他們建立了兩套機器學習算法,首先,將機器學習作為一種有效的 LDP (光路預測模型) 預測工具來評估藻類培養(yǎng)物中的光可用性;其次,這種光可用性用于通過第二種機器學習模型 GRM(生長速率預測模型)來預測藍藻的生長速率。


據文章介紹,預測的 LDP(光路) 和實際測量的 LDP 之間 R^2 分數高達 0.993,足以證明機器學習模型的準確性,此外,與只能預測一維光路的傳統(tǒng)數學模型不同,機器學習預測的 LDP 可以是二維甚至是三維的。


“目前,我們團隊做到了二維的水平,更重要的是,這種 LDP 預測方法可以轉移到任何現(xiàn)有的藻類培養(yǎng)系統(tǒng),例如室內 / 室外 PBR(光生物反應器) 或池塘系統(tǒng)?!?袁戎華說道。


圖片

圖丨數據處理和機器學習(來源:論文)


通過 LDP 預測工具獲得有效數據后,輸入第二個模型 GRM 來預測藍藻的生長速率。文章中指出,這種整合在以前的研究中尚未實現(xiàn)。預測值和實際測量值之間的 R^2 值為 0.992。


袁戎華等人利用兩個預測模型,模擬藍藻生產的動態(tài),得到最佳生長光密度(OD730)——2.3,并基于這一數據打造了半連續(xù)培養(yǎng)的模式(SAC)。具體來說,當光密度值超過 2.3 時,會開始收集藍藻,然后使藍藻生長再逐漸升至 2.3,始終保持在最佳光生長條件。在這樣的培養(yǎng)模式下,檸檬烯和生物質的產量均得到了顯著提升,在光生物反應器中,生物質生產率為 0.1 克 / 升 / 小時,檸檬烯生產率為 0.2 毫克 / 升 / 小時;通過室外池塘系統(tǒng)擴大 SAC 的規(guī)模,實現(xiàn)了 43.3 克 / 平方米 / 天的生物質產量,使最低生物質銷售價格下降到約 281 美元 / 噸。


僅比玉米貴一點,通常用于生產乙醇的低成本生物質原料是玉米,大約為 260 美元 / 噸。” 袁戎華說道。


圖片

圖丨生長速率預測、生長模擬和半連續(xù)藻類培養(yǎng) (SAC)(來源:論文)


圖片

人工智能與合成生物學結合具有巨大商業(yè)價值


針對這項研究,袁戎華表示還將有進一步的工作。


“基于機器學習的生長模擬非常靈活,可以擴展以整合其他生長影響因素,如溫度和營養(yǎng),這也是傳統(tǒng)的數學模型無法做到的。目前,團隊已經在開展相關工作。”


袁戎華還透露,這項研究的商業(yè)價值也受到了極大的關注。文章發(fā)布以后,學校負責商業(yè)轉化的機構決定立刻申請專利,一些公司也表達了合作的意愿。“不過目前商業(yè)轉化還處于一個早期階段,預計這項技術將在藻類生產以及碳捕捉和利用方面有很大的市場應用前景?!?/span>


最近,袁戎華團隊主要集中于運用這套體系來做碳捕捉和利用,并且已經得到了美國能源部的支持,目前已經與知名的圣路易斯華盛頓大學,南方公司,和清潔碳利用聯(lián)盟建立了合作。


作為德州農工大學合成系統(tǒng)生物學創(chuàng)研中心的領導人,對于中心的發(fā)展布局,袁戎華早有規(guī)劃。大體分為四個部分。


“第一部分是生物設計,主要是基于計算機科學進行設計,包括人工智能和其他方面;第二部分是高通量的工程發(fā)酵;第三部分是擴大規(guī)模;第四部分是系統(tǒng)生物學,利用液相色譜 - 質譜聯(lián)用儀(LC-MS)、液相色譜與串聯(lián)質譜(LC-MS-MS)等,進行蛋白組學、代謝組學的相關研究?!?袁戎華介紹道。


“這樣一來,合成系統(tǒng)生物學創(chuàng)研中心能夠實現(xiàn) “設計 — 構建 — 驗證 — 學習 — 設計” 的反饋循環(huán),比如,當我們發(fā)現(xiàn)一個好的菌株,能夠深入探究其機理,從而實現(xiàn)再設計升級。這種布局也將推動信息架構設計、信息科學理論、信息技術開發(fā)的躍遷?!?/span>


采訪最后,袁戎華表示,人工智能與合成生物學的結合會有非常好的前景?!皩嶋H上,若干年前,人工智能就已經廣泛地應用于生物學領域,很多平臺已經完全商業(yè)化了。從我們實驗室來說,除了通過人工智能進行過程控制外,也用它進行蛋白的預測。”


未來人工智能將更好地服務于合成生物學的發(fā)展?!昂铣缮飳W的設計部分本身就具有很大的挑戰(zhàn)性,我本身是系統(tǒng)生物學出身,對于數據量和數據的能力更是有非常深刻的理解”,他說,“我們現(xiàn)在已經積累了數目非常龐大的生物學數據,如果能夠對這些數據進行有效的挖掘,就能夠提高我們科研的效率,讓整個合成生物學有更快的進展?!?/span>


*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。

pwm相關文章:pwm是什么


霍爾傳感器相關文章:霍爾傳感器工作原理


霍爾傳感器相關文章:霍爾傳感器原理


關鍵詞: 專訪袁戎華

技術專區(qū)

關閉