供電系統(tǒng)的模塊化設(shè)計與模塊化UPS
系統(tǒng)模塊化是數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計的重要理念和基本策略,數(shù)據(jù)中心設(shè)計建造中的很多問題都與系統(tǒng)模塊化程度有關(guān)。模塊化以及與之關(guān)系緊密的標(biāo)準(zhǔn)化,為數(shù)據(jù)中心帶來了廣泛的好處,它不僅簡化了從初始規(guī)劃到日常操作的每一個流程,還顯著改進(jìn)了數(shù)據(jù)中心商業(yè)價值的所有三個主要組成部分 – 可用性、適應(yīng)性和總擁有成本。模塊化UPS是可用性級別最高的模塊化系統(tǒng),引領(lǐng)著數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計建造的理念和方向。
一、可修復(fù)和可快速修復(fù)功能是提高系統(tǒng)可用性的關(guān)鍵
現(xiàn)代數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計和運行的一個最基本也是最重要的要求是系統(tǒng)必須能連續(xù)工作。而工作連續(xù)性的程度通常是用系統(tǒng)的可用性來描述的。系統(tǒng)可用性A(t)的定義為:電子系統(tǒng)在使用過程中(尤其在不間斷連續(xù)使用的條件下)可以正常使用的時間與總時間之比。可用性是由可靠性參數(shù)MTBF(平均無故障時間)和故障后平均修復(fù)時間參數(shù)MTTR表示的。
可靠性MTBF愈高,系統(tǒng)的可用性愈高,這是不言而喻的事,但設(shè)備的可靠性是有限的,特別是由若干不同功能不同廠家的設(shè)備組成的復(fù)雜的系統(tǒng),可靠性很難達(dá)到設(shè)計要求的水平,使數(shù)據(jù)中心基礎(chǔ)設(shè)施特別是供電系統(tǒng)變得很脆弱。于是,設(shè)計者和用戶很自然的想到必須從系統(tǒng)的可修復(fù)和可快速修復(fù)上找出路,因為盡管系統(tǒng)和設(shè)備的可靠性達(dá)不到要求的高度,故障隨時都可能發(fā)生,但只要系統(tǒng)中的所有設(shè)備故障后都是可修復(fù)并可快速修復(fù)的,故障后平均修復(fù)時間MTTR數(shù)值很小甚至趨近于零,那末系統(tǒng)的可用性同樣可以很高。
可修復(fù)和可快速修復(fù)成為數(shù)據(jù)中心用戶和設(shè)計者在系統(tǒng)設(shè)計時追求的首要目標(biāo)。只要組成系統(tǒng)的所有具備獨立功能的子系統(tǒng),在系統(tǒng)投入運行后都是可拆卸、可移動、可更換的,那末這個系統(tǒng)必然是可修復(fù)的。
可快速修復(fù)通常指可無工具拆卸和可拔插更換子系統(tǒng)和設(shè)備。但是,如果功能相同的兩個設(shè)備可冗余配置,當(dāng)一個設(shè)備故障停止運行后,另一個與之冗余并機(jī)的設(shè)備可繼續(xù)工作而保證系統(tǒng)正常運行,那末,對于整個系統(tǒng)而言,我們可以認(rèn)為冗余并機(jī)環(huán)節(jié)沒有發(fā)生造成系統(tǒng)宕機(jī)的故障,可靠性很高;也可以認(rèn)為雖然設(shè)備發(fā)生故障,但是在修復(fù)過程中沒有影響整個系統(tǒng)正常運行,修復(fù)時間為零。
以上設(shè)計理念已在數(shù)據(jù)中心基礎(chǔ)設(shè)施用戶和設(shè)計者中取得了最廣泛的共識,并在系統(tǒng)方案設(shè)計和建造中取得了廣泛的應(yīng)用和顯著的效果。
二、“系統(tǒng)模塊化”是可修復(fù)和可快速修復(fù)的根本條件
我們把具有獨立功能,在系統(tǒng)中可整體安裝、拆卸、移動、更換的子系統(tǒng)稱之為模塊,那末上面的設(shè)計理念可概括為以下三句話:
1、現(xiàn)代的數(shù)據(jù)中心要求基礎(chǔ)設(shè)施必須是一個能連續(xù)工作的系統(tǒng);
2、一個能連續(xù)工作的系統(tǒng)必然是可修復(fù)和可快速修復(fù)的系統(tǒng);
3、一個可修復(fù)和可快速修復(fù)的系統(tǒng),組成該系統(tǒng)的所有子系統(tǒng)必然要具備模塊化特征;
模塊化即將完整的產(chǎn)品或流程按功能分成小塊,即模塊。根據(jù)上面講的,模塊的特征應(yīng)該是:
模塊是系統(tǒng)中一個具有獨立功能和可獨立運行的單元;
結(jié)構(gòu)上可整體安裝、拆卸、更換、移動;
相同單元可冗余并機(jī)運行;
在系統(tǒng)中,根據(jù)需要對這些模塊進(jìn)行組裝,以產(chǎn)生原始產(chǎn)品/流程的各種變體。以我們很熟悉的手電筒電池為例:可以將不同數(shù)量的電池(模塊)進(jìn)行組合,從而獲得不同功率的電源。在 IT 設(shè)備中,刀片式服務(wù)器和 RAID 陣列也是模塊化的典型例子 – 將多個設(shè)備組合在一起獲得不同數(shù)量的服務(wù)器或不同大小的存儲容量。模塊無需完全相同:以 Lego? 積木為例,這些模塊在某些方面相同,某些方面卻不同,譬如,其顏色、大小和形狀各不相同,但連接方式和尺寸均采用標(biāo)準(zhǔn)形式,以便可以將積木(模塊)組裝成一個集成系統(tǒng)。不同的模塊化系統(tǒng)可以根據(jù)所需的功能劃分目標(biāo),將不同數(shù)量的相同模塊或不同模塊(表示不同的標(biāo)準(zhǔn)化級別)并入集成的模塊或系統(tǒng)中。
數(shù)據(jù)中心基礎(chǔ)設(shè)施是集成了多種功能的復(fù)雜系統(tǒng),需要進(jìn)行仔細(xì)的工程設(shè)計,以按照在標(biāo)準(zhǔn)化級別與用戶靈活性之間取得最佳平衡的方式進(jìn)行模塊化。系統(tǒng)中存在各種級別的模塊化設(shè)計的可能性。下面是一些示例:
可互換的 UPS 功率模塊和電池模塊:在功率、冗余和運行時間方面均實現(xiàn)了可擴(kuò)展性,而且能夠進(jìn)行熱插拔,從而在不需要停止系統(tǒng)運行的條件下進(jìn)行維修;
標(biāo)準(zhǔn)化的模塊化布線:將房間布線細(xì)分為行級模塊或機(jī)架級模塊。避免了混亂并易于出錯的布線狀態(tài),并簡化和加速了斷開-重新排列-重新連接的流程。模塊化配電系統(tǒng)的方式很多,可以采用為整排負(fù)載供電的機(jī)架大小的模塊化設(shè)備,也可以采用服務(wù)于單個機(jī)架的電源插板(機(jī)架PDU);
機(jī)架級通風(fēng)裝置:將房間氣流細(xì)分為各機(jī)架局部控制,以便對高溫區(qū)域進(jìn)行精確制冷。
高密度機(jī)架系統(tǒng):將機(jī)架、配電系統(tǒng)和制冷系統(tǒng)集成為一個獨立的封閉“空間”,以冷卻和隔離發(fā)熱量密集的 IT 設(shè)備。(此時,“模塊”指集成的整個系統(tǒng));
根據(jù)模塊的特征,在數(shù)據(jù)中心基礎(chǔ)設(shè)施中,一根線纜、一臺整機(jī)UPS或空調(diào)機(jī),都是一個模塊,但是由于設(shè)計時的疏忽,有時它們在系統(tǒng)中卻失去了模塊化功能:一根線纜可能因為數(shù)量多并相互擠壓而無法識別和更換,以至于一個老鼠啃壞一條線纜的絕緣就會使系統(tǒng)癱瘓而且不能迅速恢復(fù);一臺大型UPS或空調(diào)機(jī)因走道空間狹窄或搬運工具進(jìn)不去而不能運出更換;一臺裝入機(jī)柜的變壓器故障后因工具無法在機(jī)柜內(nèi)伸展而無法更換等,這些事例屢見不鮮,使具有這種隱患的系統(tǒng)也就不再具備可修復(fù)或可快速修復(fù)的功能。
這里引伸出的是一個新的概念-系統(tǒng)模塊化概念。在一個復(fù)雜的系統(tǒng)中,盡管組成系統(tǒng)地所有子系統(tǒng)都是模塊化的,但是由于缺乏系統(tǒng)模塊化設(shè)計,使部分模塊失去可更換、可移動的功能,最終使整個系統(tǒng)變成一個不可修復(fù)或不可快速修復(fù)的系統(tǒng),可用性大大降低。
“系統(tǒng)模塊化設(shè)計”已經(jīng)成為數(shù)據(jù)中心設(shè)計建造必須遵守的原則。模塊化使一切事情變得更加便利、更可預(yù)測、更為經(jīng)濟(jì)、更易于理解以及更加安全。“系統(tǒng)模塊化設(shè)計”觀念在行業(yè)中已上升到一個新的高度,成為了一種富有創(chuàng)造性并具突出戰(zhàn)略意義的設(shè)計哲學(xué)。
三、模塊化系統(tǒng)的優(yōu)勢
從上面所述可知,模塊化系統(tǒng)設(shè)計是建造可修復(fù)和可快速修復(fù)系統(tǒng)的基礎(chǔ),采用標(biāo)準(zhǔn)化結(jié)構(gòu)和連接方式的模塊化組件使一切變得更容易、更迅速,且成本更低。從供應(yīng)商的制造與庫存,到設(shè)計與工程規(guī)劃過程,再到客戶現(xiàn)場的安裝與運營,無不如此。以下幾點突顯了模塊化系統(tǒng)的優(yōu)勢:
模塊化系統(tǒng)是可擴(kuò)展的:模塊化的基礎(chǔ)設(shè)施可以根據(jù)當(dāng)前的 IT 需求進(jìn)行部署,并且能在以后根據(jù)需要添加更多組件。這種“系統(tǒng)規(guī)模塊化”能力顯著降低了總擁有成本;
模塊化系統(tǒng)是可更改的:在系統(tǒng)中可通過模塊的重新配置,為滿足不斷變化的 IT 需求提供了極大的靈活性;
模塊化系統(tǒng)是可移植的:在安裝、升級、重新配置或移動模塊化時,獨立組件、標(biāo)準(zhǔn)接口以及易于理解的結(jié)構(gòu)既節(jié)省了時間又節(jié)約了資金;
模塊化組件是可替換的:發(fā)生故障的模塊可以很容易被換下,以便進(jìn)行升級或修理,而且通常無需停止系統(tǒng)運行;
模塊化可提高故障修復(fù)的質(zhì)量:模塊的可移植和可插拔特性使得很多工作可以在工廠進(jìn)行,既包括交貨之前(如配電設(shè)備的預(yù)先布線),也包括交貨之后(如電源模塊的修理)。從統(tǒng)計學(xué)角度上分析,同樣的工作,在工廠內(nèi)完成要比在現(xiàn)場操作的性能降低、降容使用和再故障率低得多,例如,與在現(xiàn)場修復(fù)的 UPS 電源模塊相比,在工廠修復(fù)的模塊在引起斷電、發(fā)生新的故障或無法恢復(fù)到滿負(fù)荷工作狀態(tài)方面的概率要低上千倍。
模塊化是標(biāo)準(zhǔn)化的基礎(chǔ),是標(biāo)準(zhǔn)化不可或缺的基本條件。幾乎所有好處都能以某種方式追溯至標(biāo)準(zhǔn)化的兩個強大的基礎(chǔ)屬性:模塊化構(gòu)件結(jié)構(gòu)和提高的人類學(xué)習(xí)能力,如圖1所示。
正是這兩個特征產(chǎn)生了遍及整個基礎(chǔ)設(shè)施的好處,為基礎(chǔ)設(shè)施的幾乎每個方面帶來了累積的正面影響。
人類學(xué)習(xí)-理解的力量:
模塊化提高了設(shè)備的效率,易于理解性則提高了人的效率。模塊化標(biāo)準(zhǔn)化系統(tǒng)在各個層面上使人類的學(xué)習(xí)更加方便。事物不僅更易于理解,而且可預(yù)測性和可重復(fù)性也更強,因而發(fā)生問題的概率更低,并且當(dāng)發(fā)生問題時更容易識別。
事物越易于理解、可預(yù)測性越強,便越容易解釋、編制文檔、操作、查明問題并修復(fù)。這些效應(yīng)往往互為基礎(chǔ),從而使安裝、維護(hù)工作可以做到:
減少人為錯誤:標(biāo)準(zhǔn)化對于人類學(xué)習(xí)最突出的貢獻(xiàn)莫過于減少了數(shù)據(jù)中心中的人為錯誤,從標(biāo)準(zhǔn)化模塊化組裝流程到系統(tǒng)的故障診斷、文檔編制、培訓(xùn)等都更加簡單、有效,從而使員工更熟練、更不容易出錯;
預(yù)見問題:對工作原理的了解,再加上此類事物的標(biāo)準(zhǔn)化程序(如設(shè)備監(jiān)控和預(yù)測性維護(hù)程序),形成了一個足以應(yīng)對那些“意外”事故的強大防御手段;
提高效率:由于這些學(xué)習(xí)效果相互影響并互相推動,效率得到了全面提高。員工的知識越全面,在相關(guān)問題上所花費時間的利用率就越高。人為錯誤的減少不但減少了在糾正人為引發(fā)問題上所需的時間,而且也減少了答復(fù)與此類問題有關(guān)的電話幫助熱線的時間。使人力資源得到更好地釋放和合理使用;
批量生產(chǎn)的優(yōu)勢:部件和流程的標(biāo)準(zhǔn)化模塊化使批量生產(chǎn)成為可能,批量生產(chǎn)的優(yōu)勢體現(xiàn)在以下幾個方面:成本更低、質(zhì)量更高、更易于維修、產(chǎn)量更大、交貨速度更快。
評論