首個(gè)商業(yè)化液冷服務(wù)器推動(dòng)中國HPC生態(tài)圈蓬勃發(fā)展
在近幾年的國際超級(jí)計(jì)算機(jī)展會(huì)上,中國企業(yè)憑借豐碩的成果在國際舞臺(tái)上贏得了業(yè)界的關(guān)注和認(rèn)可。中國的超級(jí)計(jì)算機(jī)也首次在最新的全球超級(jí)計(jì)算機(jī)500強(qiáng)排行榜上以202臺(tái)的總數(shù)反超了美國,并從2013年開始穩(wěn)居全球超算速度之首。除了在計(jì)算速度上取得的矚目成就,國內(nèi)企業(yè)在商用超級(jí)計(jì)算機(jī)環(huán)保節(jié)能方面也大放異彩。其中一款備受矚目的“地球數(shù)值模擬裝置”來自中科曙光:此裝置運(yùn)用了我國首款成功商業(yè)化的冷板式液冷服務(wù)器TC4600E-LP,可以完全模擬地球土壤、海洋和大氣運(yùn)動(dòng)變化,同時(shí)大幅提升速度、降低能耗,是一臺(tái)協(xié)助人工智能更進(jìn)一步的深度學(xué)習(xí)一體機(jī)。該項(xiàng)目在幫助人類社會(huì)進(jìn)一步了解地球環(huán)境的同時(shí)也做到了服務(wù)器全年自然冷卻,可謂在綠色發(fā)展道路上邁出了意義非凡的一步。
本文引用地址:http://m.butianyuan.cn/article/201803/376838.htm引領(lǐng)液冷服務(wù)器商業(yè)化
計(jì)算能力的突飛猛進(jìn)使人工智能在各個(gè)行業(yè)都具備無限的可能性。大量的計(jì)算芯片需要高密度部署,一個(gè)服務(wù)器機(jī)柜的發(fā)熱量也將增至數(shù)十千瓦。CPU作為服務(wù)器的主要驅(qū)動(dòng)力對(duì)電源和散熱有著極高的要求——電源系統(tǒng)需要提供更大的功率,冷卻系統(tǒng)也要做到與之相匹配的散熱能力。這是傳統(tǒng)的風(fēng)冷技術(shù)無法達(dá)到的。因此,能夠精確到CPU的液冷技術(shù)成了曙光節(jié)能技術(shù)(北京)股份有限公司(以下簡(jiǎn)稱曙光節(jié)能)主要的研究方向,也是解決目前數(shù)據(jù)中心節(jié)能問題的必然趨勢(shì)。相較風(fēng)冷,液冷能達(dá)到更低的PUE值、有效降低風(fēng)扇噪音和大幅降低耗電量。
雖然液冷技術(shù)問世已有一段時(shí)間,但囿于技術(shù)成熟度和成本等因素,液冷高性能計(jì)算機(jī)始終未能得到大規(guī)模應(yīng)用。對(duì)于習(xí)慣運(yùn)營風(fēng)冷機(jī)房的用戶來說,從風(fēng)冷到液冷的過度也是一個(gè)充滿挑戰(zhàn)的過程。除了服務(wù)器架構(gòu)搭建上的不同,機(jī)房的維護(hù)方法和程序也需要做出相應(yīng)的改變。
以此為出發(fā)點(diǎn),曙光節(jié)能開始與曙光服務(wù)器事業(yè)部、上下游廠商合作,致力研發(fā)性價(jià)比和用戶接受度高的產(chǎn)品,使其滿足科技商業(yè)化的必要條件。這一研發(fā)項(xiàng)目的成果就是TC4600E-LP冷板式液冷服務(wù)器。它采用風(fēng)冷和液冷混合散熱模式對(duì)服務(wù)器主要部件進(jìn)行冷卻,將液冷散熱占比提高至90%以上,從而降低了風(fēng)機(jī)功耗。TC4600E-LP采用了集成管理模塊設(shè)計(jì),在整箱刀片式液冷服務(wù)器中的CPU芯片和內(nèi)存上安裝固定水冷板,冷媒通過進(jìn)出口循環(huán)流動(dòng)。TC4600E-LP投入市場(chǎng)2年來,先后為中科院大氣所“地球數(shù)值模擬裝置原型系統(tǒng)”和國家電網(wǎng)電力科學(xué)研究院仿真中心超級(jí)計(jì)算系統(tǒng)項(xiàng)目提供了超過2000節(jié)點(diǎn)的計(jì)算能力,整柜密度超過25kW,空調(diào)系統(tǒng)功耗直接降低70%,PUE值始終控制在1.2左右。
冷板式服務(wù)器因其對(duì)計(jì)算機(jī)系統(tǒng)較小的改動(dòng)要求成為液冷技術(shù)商業(yè)化最合適的選擇,只需將原風(fēng)冷散熱片替換為液冷板,并將冷媒管路引出機(jī)箱即可??焖俨灏喂苈愤B接也使運(yùn)行維護(hù)更加接近用戶現(xiàn)有的使用習(xí)慣,安全便捷。
建設(shè)中國HPC生態(tài)圈
據(jù)曙光節(jié)能總經(jīng)理何繼盛介紹,曙光節(jié)能專注于自己的專業(yè)領(lǐng)域,其價(jià)值在于讓其它應(yīng)用液冷技術(shù)的產(chǎn)業(yè)能夠?qū)P你@研自身的工作,取得經(jīng)濟(jì)與資源上的最高效率。這不僅需要曙光節(jié)能本身技術(shù)實(shí)力雄厚,也需要一個(gè)生機(jī)盎然的產(chǎn)業(yè)生態(tài)圈來幫助國內(nèi)高科技企業(yè)實(shí)現(xiàn)更快的技術(shù)應(yīng)用和大項(xiàng)目部署。
近年來,曙光節(jié)能通過研發(fā)制造過程中與上下游合作伙伴的接觸與溝通,將創(chuàng)新鏈與產(chǎn)業(yè)鏈結(jié)合,深度利用特定的應(yīng)用進(jìn)行各類產(chǎn)品的開發(fā)和優(yōu)化。由于國內(nèi)的HPC產(chǎn)業(yè)鏈尚未成熟,曙光節(jié)能十分看重上游廠商的研發(fā)定制能力,在不同的應(yīng)用中與供應(yīng)商進(jìn)行深入的技術(shù)交流,借此希望更多的廠家能在液冷技術(shù)配套原材料和零部件研發(fā)方面投入更多的精力。
對(duì)此,曙光節(jié)能液冷系統(tǒng)研發(fā)總監(jiān)崔新濤強(qiáng)調(diào):“液冷系統(tǒng)各個(gè)部件都是非常關(guān)鍵的,哪個(gè)部件出現(xiàn)問題對(duì)服務(wù)器來說都是致命的影響。正因?yàn)橛辛诉@些關(guān)鍵供應(yīng)商的支持,才促成這個(gè)液冷系統(tǒng)的誕生?!?/p>
上游零部件廠商合作:小部件,大作用
在液冷系統(tǒng)的設(shè)計(jì)中,液冷管路連接是其中重要的一環(huán)。機(jī)房的空間結(jié)構(gòu)、管路的安全性和易維護(hù)性是選擇與設(shè)計(jì)管路接頭關(guān)鍵的考量。崔總監(jiān)解釋道:“管路接頭是水冷模塊中比較核心的部件,需要保證用戶在使用和維護(hù)過程中可以快速插拔,并且冷卻液不泄露。”
在這一環(huán)節(jié)上與曙光節(jié)能合作的上游廠商是快速插拔接頭研發(fā)制造商CPC。早在2010年,CPC由于意識(shí)到無溢漏接頭在液冷系統(tǒng)解決方案中所起到的重要作用開始與曙光節(jié)能進(jìn)行聯(lián)系,并于2013年正式建立合作關(guān)系。曙光節(jié)能也注意到CPC的產(chǎn)品曾多次被應(yīng)用在國際名企的液體傳輸和處理系統(tǒng)中。漂亮的成績(jī)單和不斷的溝通使雙方對(duì)彼此的專業(yè)度都有著極高的信賴。
在研發(fā)初期,服務(wù)器液冷系統(tǒng)技術(shù)尚處摸索階段,項(xiàng)目因此以原型機(jī)的測(cè)試為主導(dǎo)。曙光節(jié)能在全浸沒前置式驗(yàn)證機(jī)上試用了CPC的PMC12塑料接頭,對(duì)其氣密性和安全性進(jìn)行了長(zhǎng)期觀察和測(cè)試。
由于PMC12接頭在各方面表現(xiàn)理想,一年之后,曙光節(jié)能對(duì)CPC要求試用金屬接頭,以滿足用戶對(duì)連接器材質(zhì)的新需求。隨著技術(shù)的進(jìn)步和雙方研發(fā)人員不斷的討論和溝通,曙光節(jié)能開始在冷板式服務(wù)器上對(duì)CPC的LQ6金屬接頭進(jìn)行測(cè)試。這款專為液冷應(yīng)用設(shè)計(jì)的快速插拔接頭采用鍍鉻黃銅、聚砜和不銹鋼材料制造,確保了可信賴的強(qiáng)度以及對(duì)大范圍應(yīng)用的化學(xué)相容性。在保障電子設(shè)備安全方面,接頭具有特殊的斷面和閥門技術(shù),使其在長(zhǎng)時(shí)間保持連接之后還能在斷開時(shí)實(shí)現(xiàn)無滴漏,符合超級(jí)計(jì)算機(jī)的使用維護(hù)特點(diǎn)。除此之外,LQ6還優(yōu)化了流量效率、配備了具有符合人體工程學(xué)的拇指鎖,并運(yùn)用藍(lán)、紅兩種顏色編碼為運(yùn)維人員提供視覺提示,以預(yù)防誤接。預(yù)緊螺紋設(shè)計(jì)也有效避免了設(shè)備在運(yùn)行中由于振動(dòng)所導(dǎo)致接頭松動(dòng)的風(fēng)險(xiǎn)。
在接下來的合作中,曙光節(jié)能根據(jù)客戶反饋和冷板式服務(wù)器的結(jié)構(gòu)提出了盲插設(shè)計(jì)的想法,讓服務(wù)器刀片在有誤差的情形下也能保證接頭順利連接。CPC于2015年為TC4600E-LP冷板式服務(wù)器訂制了RP-LQ2盲插產(chǎn)品, 其獨(dú)特的自對(duì)中設(shè)計(jì)容許刀片和機(jī)架在對(duì)接時(shí)位置發(fā)生少許偏移,以確保其它電子連接準(zhǔn)確無誤為前提自動(dòng)校對(duì)到中心,實(shí)現(xiàn)盲插接頭的無損對(duì)接。盲插使液冷服務(wù)器的維護(hù)方式與風(fēng)冷散熱服務(wù)器基本無差別,加上多層泄漏檢測(cè)和溢流技術(shù),提高了數(shù)據(jù)中心的安全和穩(wěn)定。
研發(fā)總監(jiān)崔新濤如此評(píng)價(jià)與CPC的合作:“CPC具有強(qiáng)大的技術(shù)實(shí)力,并在研發(fā)制造易維護(hù)的快速插拔連接器方面具有豐富的經(jīng)驗(yàn)。因此,曙光節(jié)能樂意與CPC這樣技術(shù)成熟的廠商進(jìn)行合作,選擇它作為曙光節(jié)能液冷模塊接頭的主要供應(yīng)商?!?/p>
對(duì)于CPC 來說,與曙光節(jié)能的技術(shù)交流也是提高自身研發(fā)訂制能力的最佳平臺(tái)。CPC工程經(jīng)理張欣說道:“我相信雙方的合作能促使液體冷卻技術(shù)更加完善,推動(dòng)行業(yè)成長(zhǎng)?!?/p>
未來的推廣與創(chuàng)新之路
為何要大力推廣商業(yè)化?對(duì)此,崔總監(jiān)一針見血地指出:“雖然我們的服務(wù)器在技術(shù)上已經(jīng)是國際水平,但不同的是,在需求上,國外的大用戶在節(jié)能環(huán)保意識(shí)上更為超前,也更為積極地部署液冷系統(tǒng)。相比之下,國內(nèi)的環(huán)保節(jié)能意識(shí)開始得稍微晚一些,但我們產(chǎn)業(yè)的發(fā)展速度卻是超前的。”由此可見,國內(nèi)市場(chǎng)需要依靠高科技企業(yè)的不斷推廣和商業(yè)化研發(fā)來使液冷技術(shù)更為普及,這也包括了對(duì)未來趨勢(shì)的展望和研究。崔總監(jiān)提到,浸沒式服務(wù)器雖然是不可避免的趨勢(shì),但在世界范圍內(nèi)都是一個(gè)應(yīng)用難題,需要控制液體的相變或保證空間壓力。正因如此,現(xiàn)在能實(shí)現(xiàn)真正商用的全浸沒液冷服務(wù)器在世界上也是極為罕見。
這并沒有阻止HPC產(chǎn)業(yè)對(duì)浸沒式商業(yè)化的追求。自2010年起,曙光節(jié)能聯(lián)合曙光服務(wù)器事業(yè)部就在實(shí)驗(yàn)室中同時(shí)開展了冷板式和浸沒式兩種液冷方案的科研。繼2015年曙光TC4600E-LP冷板式液冷服務(wù)器亮相并成功競(jìng)標(biāo)多個(gè)大型項(xiàng)目之后,曙光節(jié)能也在竭力開發(fā)商用浸沒式液冷系統(tǒng)。
為了更好地推動(dòng)這一切的發(fā)展,曙光節(jié)能持續(xù)主動(dòng)地與生態(tài)圈內(nèi)的合作伙伴保持溝通。CPC作為曙光節(jié)能重要的零部件供應(yīng)商之一也在這個(gè)過程中不斷完善液體處理技術(shù)。雙方工程師以更好響應(yīng)液冷發(fā)展趨勢(shì)為目標(biāo),通過不懈的專業(yè)交流讓高性能計(jì)算走出實(shí)驗(yàn)室,攜手研發(fā)開辟未來的創(chuàng)新產(chǎn)品。
評(píng)論