揭秘GPU在生物科學(xué)方面的應(yīng)用
隨著科學(xué)技術(shù)的快速發(fā)展,人類在生命科學(xué)中不斷研究和探索,從分子結(jié)構(gòu)到原子結(jié)構(gòu),再到納米結(jié)構(gòu)。為了更加了解生命過程中細(xì)胞的物理過程,我們的手段從傳統(tǒng)的顯微鏡,到電子顯微鏡,再到現(xiàn)在的計算顯微鏡,以方便人類更加直觀地觀察和模擬細(xì)胞的物理過程?;趶姶蟮挠嬎隳芰χ系挠嬎闵锟茖W(xué),將給我們帶來生命科學(xué)的新契機。
本文引用地址:http://m.butianyuan.cn/article/199711.htm目前,顯微鏡被廣泛應(yīng)用到生物科學(xué)中,科學(xué)家利用計算顯微鏡來觀察生物細(xì)胞,模擬細(xì)胞的物理化學(xué)過程。這需要具備強大并行計算能力的計算機輔助,因此,計算機的并行計算能力直接影響了生物科學(xué)中的研究能力。目前,GPU被廣泛應(yīng)用到各行各業(yè)中,這也包括生物科學(xué)研究領(lǐng)域。
模擬病毒感染的過程
1.模擬脊髓灰質(zhì)炎病毒感染過程(Polioriurs infection)
脊髓灰質(zhì)炎病毒(Poliovirus,或稱為脊髓灰白質(zhì)炎病毒)是脊髓灰質(zhì)炎(小兒麻痹)的病原,又稱小兒麻痹病毒,是一個沒有外殼的病毒,由一條單股RNA組成。人類和猴子都容易受這種病毒的感染。病毒在感染后的細(xì)胞內(nèi)復(fù)制成熟后,就會在短期內(nèi)一次釋放大量的病毒,使得被感染的細(xì)胞死亡,釋放出來的病毒又會感染其他細(xì)胞,又開始新一輪的感染周期,直到所有容易感染的細(xì)胞都被感染并死亡。如果要弄清楚整個復(fù)雜的物理過程,就需要構(gòu)建一億量級的單位物理模型,并經(jīng)過長時間的模擬運行,才能真正得到這個物理過程。這個模擬過程的計算量是大得驚人的,無疑這適合并行計算能力強大的GPU去運行。
2.病毒衣殼力學(xué)
乙型肝炎病毒(Hepatitis B virus)又被稱作乙肝病毒(HBV),屬于DNA病毒。就目前科學(xué)研究的成果來看,HBV只對人類和猩猩有易感性,容易引發(fā)乙型病毒性肝炎疾病。完整的乙肝病毒成顆粒狀,分為外殼和核心兩部分,直徑約為42納米。灰色菱形為采用原子力顯微鏡得到的物理實驗結(jié)果,綠色圓形為計算機模擬下的結(jié)果。這里通過計算機模擬的方式得到的結(jié)果幾乎和原子力顯微鏡實驗中得到的結(jié)果完全吻合。在這種情況下就可以通過模擬的方式對病毒進(jìn)行分析,從而更加清晰地了解整個病毒物理作用的過程。采用GPU加速的模擬過程可以提高25.5倍的速度,可以節(jié)省10倍的能源。
光合作用過程
這里展示的紫色光合作用細(xì)菌,原理是光轉(zhuǎn)化為電,ADP(二磷酸腺苷)轉(zhuǎn)化為ATP(三磷酸腺苷)。需要采用靜電場計算并且使用多級求和法,這要求具備千萬量級計算能力的單位進(jìn)行模擬,需要進(jìn)行大規(guī)模并行計算,原子越多,模擬的過程和時間越長。在目前主流的CPU上計算大約需要1小時10分鐘。而如果利用具備并行處理計算能力強悍的GPU進(jìn)行運算的話,時間會大大縮小。而且整個三維模型可以很好地跟GPU的三維架構(gòu)的線程模型進(jìn)行匹配,能最大限度利用GPU計算的能力。采用基于G80架構(gòu)的3塊GPU就可以在大約90秒鐘內(nèi)模擬完成,并可以達(dá)到擁有線性時間復(fù)雜度,且比其他方法的有更高的靈活性。利用GPU進(jìn)行運算的話,效率會大大提升。
通過基因藍(lán)圖制造蛋白質(zhì)
制造過程
科學(xué)家通過核糖體從mRNA中解碼基因信息并產(chǎn)生出新的蛋白質(zhì),這是蛋白質(zhì)的制造過程。實現(xiàn)這個過程也是研究抗生素的重要目標(biāo)。其中重要的環(huán)節(jié)就是弄清楚核糖體的結(jié)構(gòu),模擬整個制造過程。2009年的諾貝爾化學(xué)獎就給了揭開蛋白質(zhì)制造過程的三位科學(xué)家。這樣的生物物理過程的研究可以比喻成足球比賽,期望的不只是足球比賽的結(jié)果,而是整個足球比賽的過程。了解生物的物理過程才能更好地了解其中的物理原因,找到問題的根本。傳統(tǒng)的低分辨率的圖像只能得到足球比賽的結(jié)果,而不知道比賽的過程。對于現(xiàn)在基于高性能計算的高分辨率結(jié)構(gòu)圖,可以清晰地看到新生的蛋白質(zhì)。
分子動力學(xué)模擬
通過分子動力學(xué)的方式可以模擬整個新蛋白產(chǎn)生的過程,具體方法是使用計算機來模擬蛋白質(zhì)產(chǎn)生的過程,這差不多需要模擬100萬個單元??梢钥吹较聢D,隨著GPU數(shù)量的逐漸增多,單步的模擬過程時間越來越短,可以達(dá)到很高的性能。通過GPU的加速,整個模擬的過程從以前的兩個月縮短到了兩周。隨著GPU數(shù)量的逐漸增多,計算機的性能也越來越強。
納米孔傳感器
新型納米孔是通過電力場作用驅(qū)動單個分子逐一通過納米孔來實現(xiàn)測序的。由于納米孔的直徑非常細(xì)小,可以偵測通過的單個核酸聚合物,能保持良好的持續(xù)性和高精度地測量基因信息。對于長達(dá)1000個堿基的單鏈DNA分子、RNA分子或者更短的核酸分子而言,也并不需要進(jìn)行擴(kuò)增或標(biāo)記就可以直接使用納米孔來進(jìn)行測試,這使得快速地進(jìn)行DNA測序成為可能。
對于基因的了解,通常情況下大家知道A、T、G、C四種堿基,其實還有第五種堿基——甲基化胞嘧啶。單分子納米孔測序儀能直接分辨出未修飾的胞嘧啶和甲基化胞嘧啶。當(dāng)單鏈DNA通過納米孔的時候,單個堿基落入孔中,它們跟納米孔內(nèi)特定物質(zhì)相互作用,阻礙了穿過孔中的電流同道。A、T、C、G以及甲基胞嘧啶都會有自己特有的電流振幅,因此很容易把這些電流振幅轉(zhuǎn)化成DNA序列。這樣就可以通過納米孔技術(shù)就能直接讀出這第五種堿基。
但是現(xiàn)在的納米孔材料還有很多問題需要解決,例如可以通過模擬的方式來選擇生產(chǎn)更好的高分子納米材料。但現(xiàn)在還沒有一種生物納米孔或者人工合成的納米孔能有一個非常合適的幾何結(jié)構(gòu),并通過模擬的方式分析合成出適合的高分子材料,在這個過程中通常采用徑向分布函數(shù)的方法來進(jìn)行分析沉淀物和流體的情況。下圖模擬了4700萬個單元,如果利用4核心的英特爾Xeon X5550 CPU,需要15個小時,如果利用4臺NVIDIA的Tesla C2050 GPU,只需要10分鐘就可以完成。這里還有一個數(shù)據(jù),利用Fermi架構(gòu)的GPU的性能是采用上一代GT200架構(gòu)GPU性能的3倍以上。
評論