新基因挖掘不用查找海量文獻了,這個數(shù)據(jù)庫幫你一步到位(不是KEGG)
2023年9月份,邁維代謝發(fā)布了第一版本MetMapTM通路數(shù)據(jù)庫,2024年7月份2.0版MetMapTM正式上線。MetMapTM到底是什么?從哪里能得到MetMapTM數(shù)據(jù)信息,以及MetMapTM對于科研工作者有沒有用,有多大用?這篇文章將一次給大家講清楚。
一.什么是MetMapTM
MetMapTM ,是在KEGG數(shù)據(jù)庫基礎(chǔ)上延伸而來的新的基因及代謝物通路注釋數(shù)據(jù)庫,彌補了KEGG數(shù)據(jù)庫基因及代謝物不完善的情況。
有了KEGG數(shù)據(jù)庫,為什么還要MetMapTM數(shù)據(jù)庫?
KEGG是目前在基因研究中最常見的一個數(shù)據(jù)庫,整合了基因組、化學和系統(tǒng)功能信息的綜合性數(shù)據(jù),KEGG最大的優(yōu)點是以通路圖的形式展示了
酶,化合物的調(diào)控關(guān)系,以及代謝通路的上下游關(guān)系。KEGG數(shù)據(jù)庫的信息是以文獻報道的基因功能為基礎(chǔ),在通路上不斷更新。在過去的一年里,KEGG數(shù)據(jù)庫內(nèi)物質(zhì)數(shù)量增加248個物質(zhì),但從下圖可知,真正反應(yīng)到植物上的通路只有兩條,也僅僅是做了更名。
那么植物中每年大量驗證出來的基因及代謝物信息,其實并沒有被KEGG收錄,當我們做完轉(zhuǎn)錄組及代謝組的數(shù)據(jù)之后,這些沒有被注釋的基因和代謝物信息,一部分老師就把他舍棄了,另一部分老師可能需要耗費巨大的精力進行文獻調(diào)研,找到這些基因已經(jīng)報道過的注釋信息及功能。因為這些KEGG沒收錄的信息,往往是比較新的驗證結(jié)果,甚至對一些物種來講,是一些沒有報道的新基因,對于后續(xù)數(shù)據(jù)的挖掘至關(guān)重要。
那么是否有一個額外補充的數(shù)據(jù)庫,補充了KEGG缺乏的基因及代謝物的功能信息,并且又不需要自己查找文獻呢?
答案當然是有,那就是MetMap?數(shù)據(jù)庫。
二.MetMapTM數(shù)據(jù)庫介紹
邁維2023年10月份首次發(fā)布了自主開發(fā)的MetMap??通路數(shù)據(jù)庫,在過去的9個月里,基因及代謝物的數(shù)量一直在不斷擴充。今年7月,邁維對MetMap??通路數(shù)據(jù)庫再次升級,通路由30條增加到現(xiàn)在的60條。新增黃酮、萜類、生物堿、香豆素通路的相關(guān)基因及代謝物信息。下圖為MetMap?通路圖展示效果。
MetMap?通路圖展示
MetMap?核心要素解釋
三 結(jié)題報告里MetMapTM數(shù)據(jù)怎么看
1.轉(zhuǎn)錄組
轉(zhuǎn)錄組結(jié)題報告的分析是單獨交付,包括網(wǎng)頁版結(jié)題報告和結(jié)果文件。
分析內(nèi)容包括MetMap?通路注釋分析,以及富集分析。分析展示與KEGG類似,MetMap?通路注釋結(jié)果,富集柱狀圖,富集氣泡圖等等都有提供。如下圖展示。
MetMap?通路注釋圖
MetMap?通路富集氣泡圖
2.代謝組結(jié)題報告/轉(zhuǎn)錄組+代謝組關(guān)聯(lián)分析結(jié)題報告
代謝組結(jié)題報告與轉(zhuǎn)錄組+代謝組關(guān)聯(lián)分析結(jié)題報告里,MetMap?數(shù)據(jù)庫分析結(jié)果與KEGG數(shù)據(jù)庫分析結(jié)果進行了合并。在通路注釋富集表格中,ko_ID 列,若名稱展示為MetMaP***則為MetMap?數(shù)據(jù)庫注釋的結(jié)果,若為ko****展示,則為KEGG通路展示結(jié)果。
KEGG及MetMap?通路注釋結(jié)果(代謝組/轉(zhuǎn)錄組+代謝組結(jié)果)
同樣,通路柱狀圖與通路氣泡圖也同時展示了MetMap?和KEGG兩個數(shù)據(jù)庫富集的結(jié)果。
KEGG及MetMap?通路富集氣泡圖(代謝組/轉(zhuǎn)錄組+代謝組結(jié)果)注:紅框處MetMapTM為數(shù)據(jù)庫富集結(jié)果展示通路
目前,數(shù)據(jù)庫注釋與富集分析已經(jīng)全面上線,凡是在邁維代謝進行植物廣泛靶向代謝組代謝組檢測,轉(zhuǎn)錄組檢測的項目,分析均會交付MetMap?分析內(nèi)容。因為,轉(zhuǎn)錄組+代謝組關(guān)聯(lián)分析基礎(chǔ)是轉(zhuǎn)錄組與代謝組單獨分析結(jié)果上開始的,所以需要兩個組學同時在邁維代謝進行檢測,關(guān)聯(lián)分析交付報告才包含此內(nèi)容。
四 MetMapTM數(shù)據(jù)庫怎么用
MetMapTM是KEGG的擴展和升級,因此可以搭配KEGG數(shù)據(jù)庫來使用。MetMapTM通路會標注KEGG來源通路,以下圖為例,展示了KEGG的異黃酮代謝通路以及MetMapTM其中一個通路。MetMapTM通路上游KEGG通路為異黃酮代謝通路。
KEGG數(shù)據(jù)庫異黃酮通路
MetMap?數(shù)據(jù)庫異黃酮下游補充通路
當我們通過前期的數(shù)據(jù)分析把目標通路鎖定到異黃酮通路時,可以以Genistein物質(zhì)為中間點,把兩個通路聯(lián)系起來。豐富異黃酮通路的代謝物及基因的數(shù)量。另外,異黃酮通路里的大部分結(jié)構(gòu)基因或許已經(jīng)研究的較為充分了,我們可以把MetMap?通路上鎖定的基因和代謝物作為后續(xù)研究的重點,若該基因在本物種中未進行報道,可以作為一個新基因進行后續(xù)實驗驗證工作,大大縮短了挑選新基因的工作量。 另外,除了結(jié)構(gòu)基因,代謝物的信息之外,MetMap?數(shù)據(jù)庫中還提供了有驗證的轉(zhuǎn)錄因子的信息,這也是KEGG數(shù)據(jù)庫里一直缺少的內(nèi)容。目前大家對轉(zhuǎn)錄因子的關(guān)注越來越多,轉(zhuǎn)錄因子往往只能通過相關(guān)性或者與擬南芥等模式植物進行系統(tǒng)進化樹分析進行候選篩選,工作量確實非常大。利用MetMap?數(shù)據(jù)庫,可以省去這一部分的工作量,直接在通路里找到,進行后續(xù)驗證即可。
MetMap?通路轉(zhuǎn)錄因子注釋情況
評論