數(shù)據(jù)中心如何支持高性能計(jì)算?
數(shù)據(jù)中心自1940年代就已存在,第一批計(jì)算機(jī)專用數(shù)據(jù)室被用于軍事目的。隨著計(jì)算和存儲(chǔ)需求在此后的幾十年里呈指數(shù)級(jí)增長(zhǎng),應(yīng)用擴(kuò)展到生活的各個(gè)領(lǐng)域,組織越來越多地尋求專用數(shù)據(jù)中心來容納他們的基礎(chǔ)設(shè)施。
為了降低成本并在競(jìng)爭(zhēng)中脫穎而出,自HPC出現(xiàn)以來,外包數(shù)據(jù)中心基礎(chǔ)設(shè)施幾乎已成為必需。HPC是一種功能強(qiáng)大但在密度、熱量和帶寬方面要求很高的解決方案。這些數(shù)據(jù)中心需要解決許多高性能計(jì)算機(jī)同時(shí)運(yùn)行所需的熱量和功率密度所帶來的挑戰(zhàn)。
哪些行業(yè)使用高性能計(jì)算?由于HPC可以以更快的速度將數(shù)據(jù)分析和人工智能結(jié)合在一起,因此不出所料,采用HPC數(shù)據(jù)中心的頂級(jí)公司都在云計(jì)算和IT行業(yè)中。但其他行業(yè)的公司也可以利用HPC的力量。
這可能包括:
研究實(shí)驗(yàn)室
金融科技
天氣預(yù)報(bào)
媒體和娛樂
衛(wèi)生保健
政府和國(guó)防
支持HPC的數(shù)據(jù)中心可以滿足客戶對(duì)快速網(wǎng)絡(luò)不斷增長(zhǎng)的需求,同時(shí)跟上日益數(shù)字化的格局。
HPC的三個(gè)關(guān)鍵系統(tǒng)要構(gòu)建適應(yīng)HPC的基礎(chǔ)架構(gòu),了解HPC集群的三個(gè)關(guān)鍵系統(tǒng)非常重要:計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)。
計(jì)算高效的HPC系統(tǒng)需要一組計(jì)算機(jī)服務(wù)和軟件程序,它們協(xié)同工作以運(yùn)行算法程序。每個(gè)模塊都需要與集群中的其他模塊保持同步;否則,整個(gè)HPC系統(tǒng)將變得過時(shí)。
HPC的目標(biāo)是執(zhí)行高速計(jì)算,這需要聚合來自不同硬件類型的計(jì)算機(jī)能力。數(shù)據(jù)中心擁有足夠的空間和能力來容納支持HPC操作所需的計(jì)算機(jī)系統(tǒng)和硬件,僅HPC計(jì)算就需要大多數(shù)企業(yè)無法處理的電源和冷卻協(xié)調(diào)。
存儲(chǔ)為了容納HPC處理的海量數(shù)據(jù),其存儲(chǔ)系統(tǒng)應(yīng)盡可能頻繁地從CPU卸載,而不中斷計(jì)算操作。根據(jù)Weka的說法,HPC存儲(chǔ)系統(tǒng)需要滿足以下這些需求:
任何節(jié)點(diǎn)的數(shù)據(jù)隨時(shí)可用
可用數(shù)據(jù)必須是最新的
可以處理任何大小的數(shù)據(jù)請(qǐng)求
支持面向性能的協(xié)議
使用最新的存儲(chǔ)技術(shù)(例如SSD)
擴(kuò)展到毫秒以跟上恒定的延遲
HPC網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)與您的辦公室內(nèi)部網(wǎng)非常不同。除了CPU和存儲(chǔ)之間的持續(xù)數(shù)據(jù)傳輸?shù)臉O端要求外,構(gòu)成HPC環(huán)境的許多不同的計(jì)算組件被視為一臺(tái)計(jì)算機(jī),由“結(jié)構(gòu)”組合在一起。“HPC結(jié)構(gòu)的關(guān)鍵概念是擁有大量可擴(kuò)展帶寬(貫穿),同時(shí)保持超低延遲?!?/p>降溫設(shè)施
鑒于HPC基礎(chǔ)設(shè)施的密度和產(chǎn)生的熱量,冷卻可能是一項(xiàng)重大挑戰(zhàn)?,F(xiàn)代數(shù)據(jù)中心使用的傳統(tǒng)熱通道遏制系統(tǒng)可以有效地冷卻當(dāng)今的50kW HPC機(jī)架。展望未來,HPC集群可能會(huì)增加密度并刺激數(shù)據(jù)中心實(shí)施更普遍可用的液體冷卻。根據(jù)研發(fā)機(jī)構(gòu)國(guó)家可再生能源實(shí)驗(yàn)室的說法,液體冷卻可以提供比空氣冷卻高1,000倍的冷卻能力,而且物理占地面積更小。浸沒式液冷數(shù)據(jù)中心部署靈活性更高,且面向未來的客戶。
以易飛揚(yáng)創(chuàng)新性的液冷互連光模塊和互連解決方案為例。其中液冷高速模塊可在1米深的氟化液和礦物油中穩(wěn)定運(yùn)行(已通過客戶的長(zhǎng)期認(rèn)證),相比傳統(tǒng)制冷方案,具備更高的散熱效率和更低的能耗,可將高性能計(jì)算的算力提升到一個(gè)新的水平。
高性能組件HPC集群的設(shè)備之間需要采用高性能并行互連組件進(jìn)行連接。易飛揚(yáng)是并行光互連計(jì)算的先鋒,自2013年起,易飛揚(yáng)就重點(diǎn)投入高性能并行光模塊和互連線纜的開發(fā),系列產(chǎn)品涵蓋10G、25G、40G、100G、200G、400G和800G等速率,支持INFNIBAND協(xié)議。
基于Intel和NVIDIA的芯片設(shè)計(jì)支持并行互連組件的服務(wù)器光網(wǎng)卡,從10G到200G,并正在向400G/800G延伸;
基于VCSEL激光器、DML激光器或硅光技術(shù)平臺(tái)設(shè)計(jì)的高速并行光模塊,如100G QSFP28 SR4/PSM4,200G QSFP56 SR4/DR4,200G QSFP-DD SR8/PSM8和400G QSFP-DD SR8/DR4等;
基于低功耗設(shè)計(jì)的短距離并行DAC和AOC互連線纜,如400G QSFP-DD DAC/AOC、 800G QSFP-DD DAC/AOC等;
可支持系統(tǒng)設(shè)備自環(huán)測(cè)試的電回環(huán)模塊;
創(chuàng)新性的液冷互連光模塊和互連解決方案。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。