UPS電源系統(tǒng)的可用性設計
前言
UPS電源是工業(yè)領域用來對負載進行斷電保護的關鍵設備。對于斷電保護,針對不同的負載應用,又有兩種類型。一種是普通的電腦類設備,當斷電發(fā)生時,UPS電源需要為負載提供幾分鐘到十幾分鐘的后備供電時間。在這段后備時間之內,負載設備會進行數(shù)據(jù)存儲等動作以防數(shù)據(jù)丟失,之后負載就會關機。在UPS達到后備時間之后負載仍然會斷電,但這不會導致經濟損失。另外一種是在數(shù)據(jù)中心,以及工業(yè)應用之類的場合,對UPS的要求就是真正的不斷電,UPS系統(tǒng)必須提供整年每天24小時的連續(xù)供電。本文對可靠性與可用性的討論就是針對這種情況。
電源系統(tǒng)的可靠性通??梢允褂肕TBF(平均故障間隔時間,或者平均無故障工作時間,以小時表示)來表示,此外還有一個更加容易理解的指標AFR(年失效率)。AFR和MTBF成反比關系,也就是AFR=8760/MTBF。因此MTBF越長,則年失效率越低。
對于可維修的系統(tǒng)來說,還有一個可用性的指標,其定義是
A = MTBF / (MTBF + MTTR)
其中A是一個百分比指標,MTTR值得是平均故障修復時間。如果系統(tǒng)出現(xiàn)故障時可以非常快速的恢復,那么系統(tǒng)的可用性指標就比較高。對于電網(wǎng)這類對象來說,使用可用性指標可以更加直觀的衡量其可靠程度。而對于在關鍵場合經常使用并聯(lián)冗余配置來說,可用性指標比可靠性指標更具有現(xiàn)實意義。
可靠性/可用性指標都是統(tǒng)計意義上的概念,一個電源系統(tǒng)的可靠性/可用性與構成系統(tǒng)的各個模塊的可靠性/可用性之間也存在統(tǒng)計意義上的關聯(lián)。
假設電源系統(tǒng)中存在兩個電源模塊,而這兩個模塊是并聯(lián)工作的,其中一個和另外一個是互相獨立的,見下面圖中所示
那么考察這兩個模塊組合起來的系統(tǒng)的可用性Asys與每個模塊各自的可用性A1與A2的關系就有
Asys = 1 – (1 – AFR1)×(1 – AFR2)
另外一種可能是系統(tǒng)中這兩個模塊是串聯(lián)的,見下面圖中所示
那么這兩個模塊組合起來的系統(tǒng)的可用性Asys與每個模塊各自的可靠性A1,A2的關系就有
Asys = A1×A2
由于可用性肯定是處于0~1之間的數(shù)值,因此兩個并聯(lián)模塊的總體可用性要高于各自的可用性,而兩個串聯(lián)模塊的可用性要低于各自的可用性。
UPS電源的可靠性
從單個UPS的設計來說,可以把整個產品按照模塊進行劃分,下面圖中是一個典型的UPS系統(tǒng)結構圖
從圖中可以看到,UPS各個模塊之間的依賴關系比較復雜,但是還是可以分出串并聯(lián)的關系如下
輔助電源與所有其他模塊都是串聯(lián)的,因此輔助電源的可用性直接限制了系統(tǒng)能夠達到的最高可用性等級;
控制模塊與除輔助電源之外的其他模塊也都是串聯(lián)的,因此控制模塊的可用性也會直接影響到系統(tǒng)總體可用性設計;
對于負載端來說,能夠直接相連的只有旁路模塊與逆變模塊,而這兩個模塊是并聯(lián)的;
PFC/整流模塊與電池升壓模塊是并聯(lián)的,之后再與逆變模塊串聯(lián);
從能源提供者來講,這里旁路電源與市電電源是兩路獨立的電源,而電池能源是由市電經過充電模塊提供的。如果充電模塊故障的話電池就沒有能量存儲,實際上也無法實現(xiàn)正常的UPS功能,因此市電—充電模塊—電池也是串聯(lián)的。這樣可以畫出整個UPS系統(tǒng)的可用性串并聯(lián)路徑圖
從這一路徑關系里可以看到,總共存在3條并聯(lián)的路徑,而每一條路徑各自又是由數(shù)個模塊串聯(lián)起來的。正與前面分析的一樣,輔助電源與控制模塊的可用性是串聯(lián)在所有通路上的,因此如果這兩者設計有缺陷的話UPS的可用性是無法做的很高的。電池回路串聯(lián)有最多的模塊數(shù)量,也是可用性最低的一條路徑。
要提升系統(tǒng)的可用性首先要提升關鍵路徑的可用性。從路徑圖上可以看到就是控制模塊與輔助電源。輔助電源是整個UPS的關鍵點,如果輔助電源不工作整個UPS都將癱瘓。提升輔助電源可用性的方式可以有很多種方案:一種是改進設計,提升MTBF;一種是對輔助電源也適用并聯(lián)冗余設計,提升可用性;再一種是對UPS的三條可用性路徑分別使用不同的輔助電源,相當于把原來完全串聯(lián)的路徑改成并聯(lián)。在UPS設計中可以混合使用這幾種方式,由于上面三條可用性通路是并聯(lián)的,而旁路通路本身是可用性最高的一條,因此最為推薦的設計就是優(yōu)先提升旁路的可用性,對旁路單獨使用一套輔助電源供電,并且這套電源的盡量采用簡單的設計,以擁有高的MTBF。
控制模塊同樣也是影響到所有路徑的關鍵點,也必須擁有高的可用性。參照輔助電源的處理方法,也可以給相對獨立的旁路路徑配備單獨的控制模塊,并且通過與其余控制功能協(xié)調工作來達到高可用性的目的。同樣,旁路上的控制模塊也要盡量簡單,以提升可靠性。一種推薦的做法是旁路控制模塊不斷的檢測UPS主控制模塊的狀態(tài),如果發(fā)現(xiàn)主控制模塊,則自動切換到旁路方式。此外,對于主控制模塊來說也可以通過冗余的方式來提升可用性,比如采用雙MCU結構,當一個MCU檢測到另外一個MCU發(fā)生故障時可以接管另一個MCU的功能,或者采取緊急措施如轉旁路來保證負載不斷電。
對于UPS來說,電池是保證UPS能夠在市電或者旁路斷電發(fā)生時繼續(xù)維持供電的關鍵,但是串聯(lián)環(huán)節(jié)最多,也恰恰是可用性最為薄弱的環(huán)節(jié)。一般電池規(guī)格書里面會說明充電電流不要超過0.15CC,這就意味著電池在UPS滿載放電放完之后要用數(shù)倍的時間才能重新充滿,從這個意義上講其可用性一般都在20%以下。但是由于電池并不是連續(xù)工作的,只要在電池放完前市電恢復,在重新充電的過程中也沒有再發(fā)生斷電,那么負載仍然不會受到影響。從這方面來看,電池的可用性在只會發(fā)生短時間的斷電情況下還是很高的。
再重新來審視電池回路的可靠性,在電池與市電之間還有一個充電器模塊環(huán)節(jié)。如果充電器損壞則電池在一次放完電之后就無法再充回,導致下一次市電停電時負載斷電。但是充電器只是在電池需要充電時才會工作,因此如果能夠及時對充電器的狀態(tài)進行監(jiān)控,在發(fā)現(xiàn)充電器異常時及時報警,就能夠避免充電器故障帶來的問題,從而提升整個UPS的可用性。對于電池也有一樣的手段。電池在使用多次之后也會面臨容量下降和失效的問題,但是如果能夠通過電池狀態(tài)監(jiān)控發(fā)現(xiàn)電池失效并及時更換,也能夠有效提升UPS的可用性。
UPS系統(tǒng)的可靠性
由于UPS并非一個單獨的應用系統(tǒng),而是要搭配有其他一些環(huán)境因素在里面,所以這些外部因素也是必須考慮進來的。前面提到過,UPS電池的備電時間是有限的,如果斷電時間比較長,導致電池電放完,那么負載就仍然會斷電。因此UPS可用性會受到市電發(fā)生長時間斷電概率的影響。
為了解決這一瓶頸,可以在UPS系統(tǒng)中加入一個特性和電池互補的備用電源:在市電斷電時的不需要很快反應,但是在長時間停電條件下能夠持續(xù)提供電力,燃油發(fā)電機組就是最為合適的一個選擇。因此在UPS系統(tǒng)配置上可以加入一個自動切換裝置,在市電停電后切換到發(fā)電機組。這樣一來能夠極大的提升長時間斷電條件下UPS系統(tǒng)的可用性。如此則UPS系統(tǒng)的可用性路徑就成為
雖然在可用性路徑里面多串聯(lián)了一個市電與發(fā)電機切換用的ATS,增加了單調路徑發(fā)生故障的概率,但是相對長時間斷電帶來的可用性問題來說還是值得的。
 
評論