從未如此強大 AMD EPYC處理器將高性能計算推向百億億次時代
在6月的ISC 2020大會上,TOP500官方宣布了新一屆全球最強超算的排名。這次的TOP500榜單有很多亮點,去年發(fā)布的第二代AMDEPYC(霄龍)處理器在前50名中占據(jù)四席,并助力Selene超算斬獲第七名,這也是TOP500中首次使用64核128線程的處理器。
本文引用地址:http://m.butianyuan.cn/article/202007/415948.htm64核EPYC處理器在TOP500超算中初露鋒芒,代表著x86處理器在HPC高性能計算中的新生,這也是AMD超算逆襲的開始。因為過不了多久,基于EPYC處理器的新一代超算將征戰(zhàn)百億億次性能,毫無疑問會成為TOP500超算新冠軍。
泰坦超算退役 從16核到64核 AMD全新高性能計算架構(gòu)接棒
EPYC處理器進入超算位列也頗具歷史意義,因為一年前AMD歷史上最強的超算Titan退役了。位于美國橡樹嶺國家實驗室ORNL的Titan泰坦超算拿下過2012年的TOP500第一,它使用的是AMD皓龍6274處理器,這是x86處理器中首款16核服務(wù)器CPU,助力超算性能登上2.7億億次。
AMD用16核處理器將HPC高性能計算推上了億億次時代,如今超算要挑戰(zhàn)的是百億億次性能,百倍的性能提升同時還要有更高的能效,這對高性能計算提出了嚴(yán)峻的挑戰(zhàn)。不過AMD最終還是交出了滿意的答卷,這就要靠近年來橫空出世的全新EPYC處理器了。
2017年,AMD正式推出第一代EPYC(霄龍)處理器,一下子就做到了32核64線程。不過,32核開只是開胃菜。AMD在2019年又推出了第二代EPYC處理器,做到了64核128線程,并帶來了PCIe 4.0等全新一代技術(shù)。
64核128線程不僅創(chuàng)造了x86多核處理器的新紀(jì)錄,更是一舉將原本擠牙膏式發(fā)展的高性能計算市場往前推了一大步,AMD表示,數(shù)據(jù)中心的性能在2年時間里直接提升了一倍,
在當(dāng)前的時代里,人們對AI人工智能、深度學(xué)習(xí)、生命科學(xué)、藥物合成、石油勘探、天文計算等領(lǐng)域的算力要求已經(jīng)大幅提升,第二代AMD EPYC超過一倍的性能提升使得它在HPC領(lǐng)域大顯身手,開始全面接棒新一代超算平臺。
高性能算力哪里來?AMD創(chuàng)新7nm Zen2/Zen3+IF總線+小芯片設(shè)計
在半導(dǎo)體行業(yè),大家都知道最近十年來摩爾定律一直在放緩。算力提升不是一件簡單的事,那AMD又是如何做到2年間算力翻倍的呢?這還得從第二代EPYC處理器的諸多創(chuàng)新算起。
首先是全新的架構(gòu),第一代EPYC使用了14nm工藝及Zen架構(gòu),做到了32核64線程,這已經(jīng)是x86中的創(chuàng)舉,但當(dāng)前在用的第二代EPYC則是升級到了7nm Zen2架構(gòu),使得IPC性能提升了15%。
與第一代Zen架構(gòu)相比,Zen2架構(gòu)優(yōu)化了L1指令緩存、操作緩存容量翻倍、浮點單元數(shù)據(jù)位寬翻倍,同時L3緩存翻倍到16MB,64核EPYC處理器輕松擁有128MB L3緩存,遠(yuǎn)高于對手標(biāo)準(zhǔn)。
在這樣的改進下,Zen2架構(gòu)的性能相比前代有了明顯提升,同時憑借7nm工藝帶來的高能效優(yōu)勢降低了功耗,同樣在225W TDP下也能做到64核128線程,提高了HPC高性能計算的能效。AMD六年前定下的25x20能效目標(biāo)提前就完成了,7nm Zen2功不可沒。
此外,AMD的CPU路線圖是一以貫之的。2019年是7nm Zen2,今年還會有Zen3架構(gòu),雖然官方還沒公布具體數(shù)據(jù),但性能可期。
在今年5月份的財務(wù)分析師大會上,AMD又正式宣布了Zen4架構(gòu),面向未來的5nm工藝,預(yù)計會在2022年問世,首發(fā)用于第四代EPYC處理器Genoa(熱那亞),這將會是新一代超算的又一個重要選擇。
光是先進的工藝和架構(gòu)也不行,支撐第二代EPYC處理器提升到64核128線程的還有全新的Chiplet小芯片設(shè)計,這也是AMD在x86處理器上的一個創(chuàng)舉——將CPU核心與IO核心分離,前者使用7nm工藝制造,后者使用14nm工藝制造,集成了不同數(shù)量的DDR主控、PCIe主控、IF總線等IO單元。
這樣一來,EPYC處理器就可以擺脫之前的束縛,超多核心極具靈活性,從8核到64核處理器就像是搭積木一樣,1個IO模塊可以連接多個CPU模塊,64核只要1個IO模塊、8個CPU模塊即可。
Zen2架構(gòu)與小芯片設(shè)計完成之后,AMD的高性能EPYC還欠一股東風(fēng),那就是Infinity Fabric總線技術(shù)。它是CPU核心之間、CPU與IO核心之間的關(guān)鍵,從第一代的10.7GT/s速率提升到了18GT/s,4路插槽并行的話可獲得202GB/s的超高帶寬,是64核EPYC處理器發(fā)揮性能的關(guān)鍵之一。就好像高速公路一樣,有了它,超級能裝的EPYC處理器才能跑得更快,運載的“數(shù)據(jù)”越多。
EPYC處理器沖刺新一代超算 搶占2百億億次性能制高點
上面所說的EPYC三大性能改進還只是AMD高性能架構(gòu)中的一部分,其他的還有PCIe 4.0,第二代EPYC是首個面向PCIe 4.0技術(shù)而生的高性能處理器,總計128條PCIe 4.0通道,不論數(shù)量還是帶寬,這賦予了高性能計算極高的擴展性,搭配新一代計算卡、FPGA及網(wǎng)絡(luò)芯片都是如虎添翼。
基于這些全面性的提升,AMD的EPYC處理器很快就獲得了各大超算中心的青睞,這兩年來使用EPYC芯片的超算不下于20多臺,今年進入TOP500的就有10臺,而且這個名單還在不斷地擴大中。
在這些超算中,最強大的兩臺是Frontier及El Capitan,前者是AMD聯(lián)合Cray公司為美國能源部橡樹嶺實驗室打造的超算系統(tǒng),浮點性能可達150億億次,而El Capitan則是AMD聯(lián)合HPE為勞倫斯利弗莫爾國家實驗室(LLNL)打造的,浮點性能可達200億億次。
這兩臺超算的性能都超過了百億億次,El Capitan甚至翻倍到了200億億次,是人類有史以來最強大的超算,它們使用的都是新一代EPYC處理器,前者預(yù)計在2021年問世,El Capitan預(yù)計在2023年問世,屆時無疑會改寫TOP500超算排名。
總之,在HPC高性能計算領(lǐng)域,隨著AI時代的到來,人們對算力的需求是無窮無盡的?,F(xiàn)在的矛盾是如何高效率地提升算力,而AMD EPYC處理器憑借先進的工藝、架構(gòu)、小芯片設(shè)計及PCIe 4.0的領(lǐng)先,已經(jīng)領(lǐng)先業(yè)界一步,將超級計算機的算力推向了百億億次時代。未來在算力提升的道路上,AMD EPYC將如何改寫市場格局,無疑是非常值得期待的。
評論