安徽移動(dòng):云存儲(chǔ)下的容災(zāi)建設(shè)
關(guān)于云計(jì)算的討論在持續(xù)升溫,越來(lái)越多的以運(yùn)營(yíng)商為代表的企業(yè)開(kāi)始對(duì)云計(jì)算進(jìn)行研究和部署。然而,在云存儲(chǔ)環(huán)境中存在著大量的異構(gòu)環(huán)境,而傳統(tǒng)容災(zāi)技術(shù)以同構(gòu)存儲(chǔ)為主,無(wú)法在異構(gòu)環(huán)境中實(shí)現(xiàn)容災(zāi)保護(hù)。中國(guó)移動(dòng)安徽公司(以下簡(jiǎn)稱安徽移動(dòng))就對(duì)云存儲(chǔ)環(huán)境下的異構(gòu)存儲(chǔ)容災(zāi)進(jìn)行了探索。
建設(shè)獨(dú)立、開(kāi)放的容災(zāi)系統(tǒng)
容災(zāi)系統(tǒng)的獨(dú)立性和開(kāi)放性,對(duì)于安徽移動(dòng)現(xiàn)在以及將來(lái)保持系統(tǒng)平臺(tái)和存儲(chǔ)平臺(tái)的靈活性都至關(guān)重要。一個(gè)好的容災(zāi)系統(tǒng)不僅能夠滿足企業(yè)目前的容災(zāi)需要,而且還能夠?yàn)閷?lái)的數(shù)據(jù)平臺(tái)選擇提供更大的靈活性。
容災(zāi)系統(tǒng)的獨(dú)立性、開(kāi)放性表現(xiàn)在以下幾方面:可以支持用戶現(xiàn)有的服務(wù)器平臺(tái)以及將來(lái)可能選擇的主流服務(wù)器平臺(tái),可以支持用戶現(xiàn)有的存儲(chǔ)平臺(tái)以及將來(lái)可能選擇的主流存儲(chǔ)平臺(tái)。對(duì)于安徽移動(dòng)而言,各業(yè)務(wù)系統(tǒng)的核心數(shù)據(jù)涉及多種主要的存儲(chǔ)平臺(tái),這就要求容災(zāi)方案能夠全面支持用戶現(xiàn)有的以及將來(lái)可能采用的各種存儲(chǔ)平臺(tái)。
賽門(mén)鐵克公司提供的容災(zāi)解決方案,能夠全面支持主流的服務(wù)器和存儲(chǔ)平臺(tái),特別是存儲(chǔ)平臺(tái),賽門(mén)鐵克的容災(zāi)解決方案可以幫助用戶實(shí)現(xiàn)存儲(chǔ)平臺(tái)的無(wú)關(guān)性,這為用戶將來(lái)部署新系統(tǒng)提供了更大的選擇空間。
用戶系統(tǒng)環(huán)境現(xiàn)狀
安徽移動(dòng)從BOSS 3.0上線開(kāi)始,就利用云存儲(chǔ)技術(shù)對(duì)原有的存儲(chǔ)系統(tǒng)進(jìn)行了改造,通過(guò)虛擬化技術(shù)、云計(jì)算技術(shù)實(shí)現(xiàn)異構(gòu)環(huán)境下的統(tǒng)一管理,使應(yīng)用逐步擺脫對(duì)硬件基礎(chǔ)架構(gòu)的依賴。在原有的Sun主機(jī)、EMC存儲(chǔ)的基礎(chǔ)上,安徽移動(dòng)逐步引入其他品牌的主機(jī)和存儲(chǔ)設(shè)備(包括惠普、IBM、富士通的主機(jī),惠普、Sun、HDS等品牌的存儲(chǔ)產(chǎn)品),從而有效降低了硬件的采購(gòu)成本。
安徽移動(dòng)使用的存儲(chǔ)虛擬化技術(shù)是通過(guò)部署在主機(jī)上的Symantec Storage Foundation軟件,經(jīng)過(guò)虛擬化的存儲(chǔ)空間,可以跨越多個(gè)異構(gòu)的磁盤(pán)陣列。這種虛擬化功能通常由主機(jī)操作系統(tǒng)下的邏輯卷管理軟件來(lái)實(shí)現(xiàn),其最大優(yōu)點(diǎn)是穩(wěn)定、開(kāi)放,并可實(shí)現(xiàn)在線管理。Storage Foundation的核心包含一個(gè)卷管理器(VxVM)和其上的文件系統(tǒng)(VxFS)。
VxVM增強(qiáng)了對(duì)磁盤(pán)驅(qū)動(dòng)器和LUN的管理。獨(dú)立的多路徑軟件(DMP)能夠屏蔽不同存儲(chǔ)設(shè)備間的差異,從而確保數(shù)據(jù)能在異構(gòu)存儲(chǔ)間在線移動(dòng)。VxVM統(tǒng)一了不同主機(jī)環(huán)境下卷的組織格式,確保數(shù)據(jù)能夠在不同主機(jī)系統(tǒng)間靈活遷移。
遠(yuǎn)距離跨磁盤(pán)陣列鏡像
安徽移動(dòng)原有的容災(zāi)系統(tǒng)采用傳統(tǒng)硬件復(fù)制技術(shù),對(duì)硬件平臺(tái)有很強(qiáng)的依賴性,生產(chǎn)站點(diǎn)和容災(zāi)站點(diǎn)必須使用相同品牌的存儲(chǔ)設(shè)備。改用存儲(chǔ)虛擬化方案后,安徽移動(dòng)的容災(zāi)系統(tǒng)突破了硬件的限制。
利用Storage Foundation軟件和SAN網(wǎng)絡(luò)的遠(yuǎn)距離連接能力,安徽移動(dòng)可以實(shí)現(xiàn)生產(chǎn)中心與容災(zāi)中心之間遠(yuǎn)距離的跨磁盤(pán)陣列的鏡像,從而提高數(shù)據(jù)系統(tǒng)的可靠性。
當(dāng)生產(chǎn)中心的磁盤(pán)系統(tǒng)發(fā)生故障或?yàn)?zāi)難時(shí),由于同城容災(zāi)中心的磁盤(pán)是生產(chǎn)中心磁盤(pán)系統(tǒng)的鏡像,操作系統(tǒng)會(huì)自動(dòng)隔離生產(chǎn)中心的磁盤(pán),轉(zhuǎn)而對(duì)容災(zāi)中心的數(shù)據(jù)進(jìn)行訪問(wèn)。業(yè)務(wù)系統(tǒng)可以通過(guò)城域SAN網(wǎng)絡(luò)直接訪問(wèn)災(zāi)備中心磁盤(pán)系統(tǒng)中的數(shù)據(jù),而不會(huì)影響生產(chǎn)中心的業(yè)務(wù)系統(tǒng)。也就是說(shuō),生產(chǎn)中心磁盤(pán)系統(tǒng)的災(zāi)難對(duì)業(yè)務(wù)系統(tǒng)是透明的,應(yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)樯a(chǎn)中心磁盤(pán)系統(tǒng)的故障而停止。更重要的是,應(yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)闉?zāi)難而中止,從而避免了發(fā)生數(shù)據(jù)損壞的可能性。
生產(chǎn)中心磁盤(pán)系統(tǒng)出現(xiàn)故障后,用戶只要更換損壞的磁盤(pán)系統(tǒng),然后利用Volume Manager重新生成鏡像即可。重新生成鏡像的過(guò)程,實(shí)際上就是將數(shù)據(jù)從災(zāi)備中心的磁盤(pán)系統(tǒng)中復(fù)制到生產(chǎn)中心磁盤(pán)系統(tǒng)中的過(guò)程。值得注意的是,整個(gè)容災(zāi)過(guò)程對(duì)應(yīng)用是完全透明的,不需要也不會(huì)中斷業(yè)務(wù)系統(tǒng)的正常運(yùn)行。這是采用基于磁盤(pán)系統(tǒng)的復(fù)制技術(shù)構(gòu)建的容災(zāi)系統(tǒng)所無(wú)法實(shí)現(xiàn)的。
利用傳統(tǒng)磁盤(pán)系統(tǒng)復(fù)制技術(shù)構(gòu)建容災(zāi)系統(tǒng)需要付出額外的代價(jià),主要包括以下幾方面:生產(chǎn)磁盤(pán)系統(tǒng)出現(xiàn)故障時(shí),會(huì)造成應(yīng)用系統(tǒng)宕機(jī);生產(chǎn)磁盤(pán)系統(tǒng)出現(xiàn)故障時(shí),數(shù)據(jù)系統(tǒng)切換到災(zāi)備系統(tǒng)需要較長(zhǎng)時(shí)間;生產(chǎn)磁盤(pán)系統(tǒng)出現(xiàn)故障時(shí),磁盤(pán)系統(tǒng)的切換過(guò)程很復(fù)雜,需要專家支持;需要支付額外的費(fèi)用。
Storage Foundation軟件不僅可以利用鏡像實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)容災(zāi),而且具有鏡像斷裂后的快速同步功能。在需要遠(yuǎn)程連接的物理環(huán)境中,遠(yuǎn)程鏈路相對(duì)本地連接更容易受損,也更容易引起鏡像斷裂,因此鏡像斷裂后的快速同步功能就顯得非常重要。Storage Foundation軟件可以提供Fast Mirror Resync功能,方便實(shí)現(xiàn)增量數(shù)據(jù)的快速同步。
集群軟件異地切換
在上述容災(zāi)方案中,生產(chǎn)數(shù)據(jù)通過(guò)SAN環(huán)境中的跨陣列鏡像功能得到了很好的保護(hù)。在生產(chǎn)端服務(wù)器上部署集群軟件,在本地進(jìn)行切換,保障了應(yīng)用的連續(xù)性。不過(guò)這樣的容災(zāi)方案還不夠完善,當(dāng)生產(chǎn)機(jī)房出現(xiàn)災(zāi)害時(shí),用戶又應(yīng)如何保障整個(gè)業(yè)務(wù)的連續(xù)性?
用戶需要在容災(zāi)端部署服務(wù)器,并在安裝和生產(chǎn)端同樣部署存儲(chǔ)管理軟件及集群軟件。在生產(chǎn)端發(fā)生災(zāi)害時(shí),上述方案不僅能夠保護(hù)生產(chǎn)端的數(shù)據(jù),而且能將生產(chǎn)端的應(yīng)用切換到容災(zāi)端,使用戶能夠持續(xù)訪問(wèn)應(yīng)用,保障業(yè)務(wù)的連續(xù)性,這也是傳統(tǒng)硬件容災(zāi)方案所無(wú)法實(shí)現(xiàn)的。
容災(zāi)系統(tǒng)應(yīng)用效果顯著
安徽移動(dòng)在BOSS 3.0上線時(shí)就對(duì)容災(zāi)系統(tǒng)進(jìn)行了改進(jìn),不僅實(shí)施了同構(gòu)環(huán)境下的鏡像容災(zāi),而且在結(jié)算數(shù)據(jù)庫(kù)和BI數(shù)據(jù)庫(kù)中進(jìn)行了異構(gòu)存儲(chǔ)容災(zāi)的探索。生產(chǎn)中心采用的存儲(chǔ)設(shè)備為HP XP,容災(zāi)中心采用EMC存儲(chǔ)。新的容災(zāi)系統(tǒng)上線運(yùn)行后,完全能夠滿足應(yīng)用的需求。
在BOSS的核心系統(tǒng)中,安徽移動(dòng)也使用了異構(gòu)容災(zāi)方案。在重要性僅次于CRM的中心資源庫(kù)中,原本計(jì)劃生產(chǎn)端和容災(zāi)端都使用Sun主機(jī)加EMC存儲(chǔ)的方案。在系統(tǒng)上線前兩周,CRM系統(tǒng)要求緊急擴(kuò)容,但是現(xiàn)有的存儲(chǔ)設(shè)備容量不足。因此,安徽移動(dòng)迅速將系統(tǒng)遷移至Sun主機(jī)+惠普存儲(chǔ)(生產(chǎn))+Sun存儲(chǔ)(容災(zāi))的平臺(tái),并使用基于Storage Foundation的鏡像容災(zāi)和快照技術(shù),將存儲(chǔ)資源池化,既提高了資源的利用率,又避免了硬件的鎖定。
與此同時(shí),安徽移動(dòng)新上線的容災(zāi)系統(tǒng),除了能實(shí)現(xiàn)容災(zāi)功能以外,還能提供如下三種功能。
跨存儲(chǔ)的快照
安徽移動(dòng)原來(lái)使用的快照技術(shù)只適用于同構(gòu)存儲(chǔ)環(huán)境。在使用Storage Foundation后,快照技術(shù)不受存儲(chǔ)硬件的限制,能以卷為單位進(jìn)行數(shù)據(jù)快照和復(fù)制,比以LUN為單位的復(fù)制更加靈活,性能也絲毫不遜色。
異構(gòu)存儲(chǔ)數(shù)據(jù)的在線遷移
跨異構(gòu)陣列的鏡像,可以在線遷移生產(chǎn)數(shù)據(jù),從而避免應(yīng)用中止。
實(shí)現(xiàn)存儲(chǔ)集中統(tǒng)一管理
以往的存儲(chǔ)管理、集群管理都是以主機(jī)為出發(fā)點(diǎn),無(wú)法兼顧整個(gè)數(shù)據(jù)的存儲(chǔ)、容災(zāi)及集群的使用情況。在使用Storage Foundation后,安徽移動(dòng)可以通過(guò)一個(gè)管理平臺(tái)VOM,了解異構(gòu)環(huán)境中存儲(chǔ)設(shè)備的使用情況以及容災(zāi)狀態(tài)。統(tǒng)一存儲(chǔ)管理平臺(tái)的使用改變了安徽移動(dòng)的運(yùn)維習(xí)慣,有效提高了運(yùn)維的效率。
Storage Foundation降低容災(zāi)投資
總而言之,Storage Foundation容災(zāi)方案給企業(yè)用戶帶來(lái)了很多價(jià)值?;赟torage Foundation的容災(zāi)方案減少了用戶對(duì)硬件環(huán)境的依賴,從而有效降低了容災(zāi)的投資。如果采用傳統(tǒng)的硬件容災(zāi)方案,生產(chǎn)中心與容災(zāi)中心的存儲(chǔ)設(shè)備必須完全相同。如果采用賽門(mén)鐵克的存儲(chǔ)管理軟件,可以徹底改變這種狀況。賽門(mén)鐵克存儲(chǔ)管理軟件支持異構(gòu)環(huán)境,不僅為用戶提供了選擇硬件設(shè)備的靈活性,而且降低了用戶的投資。
如果采用傳統(tǒng)硬件容災(zāi)方案,用戶必須單獨(dú)購(gòu)買(mǎi)復(fù)制軟件;如果采用基于Storage Foundation的容災(zāi)方案,用戶不必再單獨(dú)購(gòu)買(mǎi)復(fù)制軟件。大多數(shù)主機(jī)存儲(chǔ)管理軟件,在回收存儲(chǔ)空間或進(jìn)行條帶化處理時(shí),通常會(huì)造成應(yīng)用中斷。
賽門(mén)鐵克存儲(chǔ)管理軟件具有強(qiáng)大的在線操作功能,保障了業(yè)務(wù)的連續(xù)性?;赟torage Foundation的容災(zāi)方案具有強(qiáng)大的在線管理功能,可以減少計(jì)劃內(nèi)停機(jī)時(shí)間。
如果采用基于Storage Foundation的容災(zāi)方案,用戶不必再單獨(dú)購(gòu)買(mǎi)硬件廠商提供的動(dòng)態(tài)多路徑軟件。賽門(mén)鐵克存儲(chǔ)管理軟件內(nèi)嵌免費(fèi)的DMP動(dòng)態(tài)多路徑管理功能,可以支持不同廠商的存儲(chǔ)設(shè)備,從而避免在同一主機(jī)上安裝多種動(dòng)態(tài)多路徑軟件時(shí)可能引起的沖突。
基于Storage Foundation的容災(zāi)方案不僅可以實(shí)現(xiàn)數(shù)據(jù)級(jí)容災(zāi),而且支持應(yīng)用級(jí)容災(zāi)。采用傳統(tǒng)的硬件容災(zāi)方案,需要人工進(jìn)行切換,因此會(huì)造成應(yīng)用的中斷。
基于Storage Foundation的容災(zāi)方案可以應(yīng)對(duì)任意的存儲(chǔ)故障,避免應(yīng)用中斷,同時(shí)還可以支持異構(gòu)存儲(chǔ)環(huán)境,實(shí)現(xiàn)快速恢復(fù),與VCS集群軟件配合,還能實(shí)現(xiàn)應(yīng)用級(jí)的切換,保障業(yè)務(wù)連續(xù)性。
評(píng)論