中國超算什么時候能重回第一?一文看懂
11月19日消息 當?shù)貢r間11月18日,由國際超級計算大會(ISC)公布的新一期全球超級計算機500強榜單出爐。中國繼續(xù)擴大數(shù)量上的領先優(yōu)勢,在總算力上與美國的差距進一步縮小。
本文引用地址:http://m.butianyuan.cn/article/201911/407313.htm美國能源部下屬橡樹嶺國家實驗室開發(fā)的Summit(頂點)以每秒14.86億億次的浮點運算速度再次登頂,與半年前的速度相同。美國能源部下屬勞倫斯利弗莫爾國家實驗室開發(fā)的Sierra(山脊)、中國超算神威·太湖之光和天河二號分列二三四位。
全球超算500強榜單每半年發(fā)布一次。本次榜單顯示,中國境內有228臺超算上榜,在上榜數(shù)量上蟬聯(lián)第一,比半年前的榜單增加9臺。美國以117臺位列第二,日本、法國、德國依次位居其后。這是2017年11月以來,中國超算上榜數(shù)量連續(xù)第五次位居第一。榜單顯示,中國企業(yè)繼續(xù)保持上榜數(shù)量優(yōu)勢。聯(lián)想、中科曙光和浪潮位居全球超算制造商前三位。
什么是超算
超級計算機(Super computer),顧名思義,就是具有很強的計算和處理數(shù)據(jù)能力的計算機,主要特點表現(xiàn)為高速度和大容量,配有多種外部和外圍設備及豐富的、高功能的軟件系統(tǒng)。一般來說,超級計算機的運算速度平均每秒1000萬次以上,存貯容量在1000萬位以上。
從結構上看,超級計算機和普通計算機都是大同小異的,但它將大量的處理器集中在一起以處理龐大的數(shù)據(jù)量,同時運算速度比常規(guī)計算機快許多倍,進而影響到各個行業(yè)運行,其意義十分重大。
你認為是科技強國的那些國家,就是超算的強國,這兩個集合是高度重疊的。這也可以反映出超算的重要性,它相當于科技界的一種基礎設施。
從半年前也就是2019年6月開始,超算TOP500的入門門檻超過1PFlops(每秒一千萬億次浮點運算),這是全球超算TOP500榜單26年以來的又一歷史性突破。
超算怎么排名?
TOP500是按照什么來給超算排名的?當然按照計算速度了,用專業(yè)語言來說,是每秒能夠執(zhí)行多少次浮點運算。
當你去看TOP500的榜單時就會發(fā)現(xiàn),對于每臺超算都列出了兩個計算速度,一個叫做Rmax,一個叫做Rpeak。例如對于目前排第一的Summit,Rmax是每秒14.86億億次,Rpeak是每秒20億億次。
Rmax是實測的最高速度,Rpeak是理論上的最高速度??倳行嶋H原因使超算的性能達不到理論上限,所以Rmax總是小于Rpeak。因此,TOP500排名用的是實測的最高速度,也就是Rmax。
超算是不是芯片越多越強悍?
在中國的超算占據(jù)首席的5年中,很多人對此不屑一顧。他們以為超算就是處理器堆出來的,有錢多買些處理器,計算能力就上去了。他們還以為中國的超算都是買的外國的處理器,因此計算能力再高也不值一提。
首先,超級計算機為什么算得那么快,的確是因為超算用了很多個芯片,讓它們同時執(zhí)行任務,也就是高性能計算的基本法則:并行計算。
超算的單個芯片的性能跟個人電腦的芯片差不了太多,而讓多個芯片進行工作,要先給它們劃分好任務,這個任務劃分是要消耗時間的。當各個芯片開始計算之后,還不時地要和其他芯片交換數(shù)據(jù),數(shù)據(jù)通信,這是也是要消耗時間的。
因此,當芯片很多的時候,任務劃分和數(shù)據(jù)通信會變成瓶頸因素,由此可見,芯片并不是越多越好,光靠堆芯片是堆不出超級計算機的,就跟企業(yè)越大,組織層級越多,辦事效率就越低一個道理。
一臺超算能夠容納下多少芯片,并不是取決于你能買到多少芯片,而是取決于系統(tǒng)架構。只有擁有好的系統(tǒng)架構,你才能擁有更多芯片,也就能擁有更大的算力,所以芯片數(shù)增加不是超算升級的原因,而是結果。除了芯片之外,架構同樣也是核心技術。
那么中國超算用的是國產芯片嗎?
其次,來說說國產芯片的問題。TOP500上的第三和第四,也就是神威太湖之光和天河二號,它們現(xiàn)在用的都是國產芯——注意是現(xiàn)在。
神威太湖之光用的是中國自主研發(fā)的「申威26010」眾核處理器。它的出現(xiàn)擊碎了外界對于超算芯片國產化的質疑。
天河二號以前用的是英特爾的Xeon Phi(至強融核)芯片,在它連續(xù)四次奪冠后,2015年4月,美國商務部禁止英特爾公司向中國國家超級計算廣州中心出售至強芯片。長沙中心、廣州中心、天津中心和國防科技大學這四家國家超算中心,均被美國列入了出口管制名單。
面對來自美國的扼殺,天河二號在2017年底用國產的Matrix-2000協(xié)處理器替換了用了五年的Xeon Phi。這次升級把天河二號的每秒計算次數(shù)從3.39億億次提升到了6.14億億次,而功耗只增加了不到4%。所以六年了,天河二號還能在TOP500上排到第四,可以說相當出色。
另外還要說一句,天河二號取得突破的關鍵之一是中國自制的TH Express-2主干拓撲結構網絡連接,這項技術世界領先。所以說,構架也是核心技術就這個道理。
當然你可能又有話要說了,那其他的超算呢?事實上,出于商業(yè)和應用上的考慮,不管是中國還是美國,大多數(shù)企業(yè)部署的超算都趨向于采用成熟的芯片,比如本期TOP500榜單中,94%都使用了英特爾Xeon(至強)或Xeon Phi(至強融核)處理器。這是美國在計算機芯片研制方面的絕對優(yōu)勢,中國短時間內很難打破。
超算到底有什么用
很多人會問超算到底有什么用?;卮鹗钱斎环浅S杏昧?,不然全世界的科技強國紛紛制造超算干嘛呢!
超算在情報收集、破解領域能力領先,可以強行攻破對方的安全系統(tǒng),棱鏡計劃暴露了美國政府對公眾隱私和他國公民個人數(shù)據(jù)的龐大監(jiān)控,這些海量情報需要進行處理,就要用到超算。
說個離老百姓近的例子,現(xiàn)在的天氣預報為什么總那么準,就是超算對云層進行精確的模擬和觀測的結果。通過超算模擬還可以計算未來一段時間內大氣污染物濃度和分布,進行空氣質量報告。
而我們用到的很多先進技術——比如處理器技術、虛擬技術包括未來的量子計算,最早都是超算先用,然后才普及為民用。目前的云計算和大數(shù)據(jù)同樣也需要超算的算力支持。
醫(yī)療領域,超算已經在用于腫瘤研究、DNA測序和藥物研發(fā)等等。此外超算還用于核業(yè)、軍事、航天等高科技領域。
總之,大到模擬宇宙的演變,小到測算一個分子結構,超算發(fā)揮作用的地方可太多了。
超算界有一個最高級榮譽——當然不是這個TOP500排名了——叫做戈登·貝爾獎(Gordon Bell Prize),是授予最杰出的高性能計算應用的,每年頒發(fā)一次。獲得戈登·貝爾獎的應用,一般都在最快的超算上運行。
基于神威·太湖之光的兩項應用「千萬核可擴展全球大氣動力學全隱式模擬」、「非線性地震模擬」分別在2016年和2017年獲得戈登·貝爾獎。其中非線性地震模擬,模擬的就是唐山大地震。
中國超算什么時候能重回第一?
神威太湖之光曾經在從2016年6月到2017年11月的四期TOP500榜單中排在首位,四連冠。
天河二號曾經在2013年6月至2015年10月的六期榜單中六連冠,直到2016年6月讓位給神威太湖之光,然后一直保持亞軍。
而美國重新奪回TOP500的第一名已經是2018年6月的事了,當時外媒鋪天蓋地地報道,國內也有不少人關注。
自從TOP500開始發(fā)布的1993年以來,美國曾經不止一次地失去速度最快的桂冠,但始終保持著上榜數(shù)最多的地位。到了2017年11月,中國第一次在上榜數(shù)目上登頂,美國失去這個第一。在最新的榜單中,中國擴大了上榜數(shù)目的優(yōu)勢,在總算力上接近美國,美國超算占比為37.1%,中國超算占比為32.3%。而半年前,這個數(shù)據(jù)是美國38.4%,中國29.9%。
從這一點看,中國超算已經相當強悍,而且繼續(xù)發(fā)展下去很快會在總算力上超越美國。如果你要問中國超算什么時候拿回TOP500的第一名,機會不久就會到來,那就是世界超算格局的新變化之一:E級超算的出現(xiàn)。
E級超算,即百億億次超算,被公認為超級計算機界的下一頂皇冠。從Summit的每秒近15億億次浮點運算速度到百億億次,這中間有相當大的發(fā)展空間,到E級超算實現(xiàn)時,將會出現(xiàn)全新的榜單。
美國對此高度重視,相繼宣布建造「極光」、「前沿」和「酋長巖」三臺E級超算,交付時間預計為2021年至2023年。
中國也在已經開始E級超算部署三連發(fā),其中E級超算「天河三號」原型機2018年7月已開放應用,「天河三號」有望于2020年研制成功。神威E級原型機和曙光E級原型機系統(tǒng)也已完成交付。
下一個第一,不出意外的話應該就在這幾個名字之間誕生,我們拭目以待。
另外,大家關注第一的時候也應該清楚,科技競爭不等于戰(zhàn)爭,并沒有真正意義的失敗者,只要你參與競爭,就能從中獲得科技進步,分享科技成就。在超算領域,我們已經是國際上數(shù)一數(shù)二的競爭者,這本身就非常了不起。而在超算的競爭中,我們同樣能在高性能芯片、構架系統(tǒng)、軟件應用等眾多方面積累領先的成果,實現(xiàn)最終理想。
評論