E級超算,2020年見
人類對宇宙探索的好奇心以及對問題規(guī)模和精度的追求,決定了人們對超級計算能力的需求“不會止步”。在百P超算實現(xiàn)之后,E級超算,也就是百億億次超級計算機,將成為世界各國爭奪的“下一頂皇冠”。
本文引用地址:http://m.butianyuan.cn/article/201607/293789.htm“新科”全球最快超級計算機“神威·太湖之光”亮相之后,全世界為之一震。“全球第一快”有多快?國家超級計算無錫中心主任楊廣文打了一個比方:“神威·太湖之光”1分鐘的計算能力,相當于全球72億人同時用計算器不間斷計算32年。
這個速度就是93PFlops,浮點運算速度每秒9.3億億次——人類歷史上第一次,將高性能計算機的運轉速度記錄接近至每秒十億億次這個數(shù)量級。
然而,人類對超級計算機性能的追求沒有止境。“超算性能每提高1個數(shù)量級,人類對它們的需求可能提高1000倍,也就是3個數(shù)量級。”中科院計算所研究員、中國計算機學會高性能計算專委會秘書長張云泉在接受《中國科學報》記者采訪時說,人類對宇宙探索的好奇心以及對問題規(guī)模和精度的追求,決定了人們對超級計算能力的需求“不會止步”。
“在百P超算實現(xiàn)之后,E級超算將成為世界各國爭奪的‘下一頂皇冠’,也就是百億億次超級計算機。”張云泉對記者說。
預計2020年左右實現(xiàn)
超算水平是一個國家綜合國力和科技創(chuàng)新能力的重要標志,各國對E級超算的爭奪,無不摻雜著國家戰(zhàn)略的意味。
自“天河二號”于2013年11月正式登頂當時的超算TOP500榜首之后,美國這個頭號超算強國已連續(xù)3年未曾染指這一寶座。然而,種種跡象表明,美國從未在“最快超算梯隊”上掉隊。
全球超算TOP500排行榜發(fā)起人、橡樹嶺國家實驗室及田納西大學教授杰克·唐加拉(JackDongarra)在接受《中國科學報》記者郵件采訪中說道,美國能源部通過國家戰(zhàn)略計算計劃(NSCI)以及與產(chǎn)業(yè)界和學術界的合作,正在推行能進行百億億次計算系統(tǒng)的開發(fā)。“該系統(tǒng)集成了硬件和軟件能力,在一系列代表政府需求的應用中的表現(xiàn)將是目前10千萬億次系統(tǒng)的100倍。”
記者了解到,歐洲、日本也制定了自己的E級超算研發(fā)計劃,并將相應計劃的完成時間表設定在了2020年。
張云泉透露,中國也將百億億次超級計算機及相關技術的研究寫入了國家“十三五”規(guī)劃,同時也希望在2020年左右實現(xiàn)這一宏偉研究計劃。出人意料的,在幾個制定了相關計劃的國家中,只有美國相對“悲觀”,他們預計百億億次超級計算機的建成或許需要到2022年。
業(yè)內(nèi)人士認為,美國此舉或許并非故弄玄虛,因為隨著高性能計算機運算規(guī)模的增加,建造它的難度可能將是幾何級數(shù)的提升。
E級超算的挑戰(zhàn)
張云泉告訴記者,百億億次超級計算機的建造難度并不僅僅在于速度的提升,更在于對大規(guī)模超算設備的功耗要求。按照由美國倡導的國際公認標準,E級超算的功耗應低于20MW。按照這一功耗目標要求,未來的E級超級計算機的能效比要達到50GFlops/W。
這在張云泉看來,是一堵難以逾越的高墻,畢竟排在Green500第三位、創(chuàng)造了大規(guī)模高性能計算機效能比的最好成績的“神威·太湖之光”每瓦性能只有6GFlops,仍相差一個數(shù)量級。
“功耗墻很難逾越,是各國都在面臨的難題。”張云泉對記者說:“現(xiàn)在大家希望采用異構加速或異構綜合的方式來降低功耗的要求,但由此帶來的是編程的困難。因此,可以說研發(fā)E級超算實際上面臨著編程墻、功耗墻、可靠性墻和存儲墻幾個‘大墻’的圍堵,如何越過這幾堵墻,面臨很大的挑戰(zhàn)。”
在被問及這一問題時,杰克·唐加拉給記者列出了一份“沒有特定順序”的百億億次計算實現(xiàn)之前的“TOP10挑戰(zhàn)”名單,具體地描繪出了實現(xiàn)百億億次超級計算機之路上“攔路虎”的樣子。
在這份名單里,關乎計算性能的挑戰(zhàn)有2個,分別是研發(fā)更節(jié)能的電路、電源和冷卻技術和增加數(shù)據(jù)流動的性能和能量效率;關乎計算硬件的更新升級的只有1個:集成先進的內(nèi)存技術以提高容量和帶寬;而關乎軟件和開發(fā)環(huán)境方面的挑戰(zhàn)則有不少,分別是開發(fā)可擴展更強的系統(tǒng)軟件、發(fā)明適于大規(guī)模并行處理的新的編程環(huán)境、創(chuàng)建更優(yōu)化的數(shù)據(jù)管理軟件等。在這份列表中,杰克·唐加拉還提醒計算科學家們需要從系統(tǒng)或更高角度準備迎接E級計算的挑戰(zhàn),比如要重塑百億億次超算系統(tǒng)對科學問題的解決方案、提高用新的軟件工具和環(huán)境的生產(chǎn)力、確保E級超算發(fā)生故障時科學計算的重現(xiàn)性等。
“E級應用”
“每秒執(zhí)行百億億次計算,這可是我們今天所見機器計算速度的數(shù)十上百倍,這些未來的計算機將是一個全新的‘物種’。而且,它們不僅在于快,更在于它們可以以全新的方式處理大數(shù)據(jù)。”杰克·唐加拉說,“這將是非常必要的,E級超算未來將非常有用,比如它們或許能攻克癌癥。”
“為了找到治療癌癥的方法,我們需要找出以前沒有見過的模式。”杰克·唐加拉說,在癌癥治療方面,人們面臨的挑戰(zhàn)不是缺乏相關數(shù)據(jù)——現(xiàn)在比以往更多,而是如何“打開”這些數(shù)據(jù),并找到合理的模式處理它,從而告訴人們到底是什么原因導致癌癥或者如何更有效地對抗它。“超級計算機是用于分析基因組和相關分子數(shù)據(jù)集、患者記錄、家族史和與癌癥相關的其他復雜信息優(yōu)良的工具。隨著超級計算機的發(fā)展,我相信我們可以找到答案。”
張云泉也指出,E級超算如此受“歡迎”,正在于它在解決人類共同面臨的健康危機、能源危機、環(huán)境污染和氣候變化等重大問題上將發(fā)揮巨大作用。“從目前來看,E級超算主要面對一些具有重大計算的需求,如全球氣候變化模擬、天體物理大數(shù)據(jù)的處理、模擬宇宙的演化、新型材料驗證及無庫存核武器仿真等。”
此外,杰克·唐加拉指出,百億億次計算設備除對各個產(chǎn)業(yè)領域提速換擋有貢獻、提高國家競爭力之外,還將“向下流動”促進產(chǎn)業(yè)發(fā)展,比如增強包括從智能手機到相機在內(nèi)的消費電子產(chǎn)品計算系統(tǒng)的軟硬件性能等。
自主實現(xiàn)的曙光
在“神威·太湖之光”以自主芯片和操作系統(tǒng)獲得接近十億億次的計算速度之后,中國看到了自主研發(fā)E級超算的希望和曙光。張云泉認為,“神威·太湖之光”的成功已經(jīng)為我國向E級超算邁進打下了一個堅實的基礎,只要做好人才、資源、經(jīng)費和材料的儲備,沖擊E級超算指日可待。
按照一般科研規(guī)律,在類似大科學裝置正式進入研發(fā)日程之前,原型系統(tǒng)等預研項目非常必要。
“從原型系統(tǒng)到大規(guī)模系統(tǒng),難度是幾何倍數(shù)增加的。所以原型系統(tǒng)不可能暴露所有的問題。”張云泉說,但預研項目可以驗證一些關鍵的技術設想,對一些關鍵技術難點進行測試和改進,“為最后建造全部的系統(tǒng)來掃清障礙,避免出現(xiàn)大的技術錯誤和難題。”
在最新公布的國家“十三五”高性能計算專項課題中可以看到,我國公示出了三個分別由中科曙光、國防科技大學以及江南計算技術研究所牽頭的E級超算的原型系統(tǒng)研制項目。據(jù)消息人士透露,中科曙光牽頭的E級超算原型系統(tǒng)研制項目將于近期舉行的曙光技術創(chuàng)新大會(IDIC2016)上正式啟動。
“我們國家發(fā)展E級超算是‘三頭并進’——這下代表著中國超算“三足鼎立”——三家單位在超算技術領域均具有強大的研發(fā)實力。”張云泉告訴記者,我國在E級超算研制方面采取的是競爭機制,預計兩年之后會對三家單位進行評估,最后吸取最好的方案來整合成最后國家的E級超算研發(fā)體系。
評論