細數(shù)據(jù)隱患解讀 數(shù)據(jù)存哪里更放心?
對于企業(yè)用戶來說,近些年隨著數(shù)據(jù)量呈指數(shù)倍的爆發(fā)式增長態(tài)勢,以及云計算平臺的飛速發(fā)展,使得用戶對于數(shù)據(jù)中心的需求度開始不斷攀升。我們也不難發(fā)現(xiàn),已經(jīng)有越來越多的企業(yè)開始建造自己的數(shù)據(jù)中心,或者有些中小型企業(yè)用戶也開始選擇把自己的數(shù)據(jù)放在數(shù)據(jù)中心當(dāng)中進行存儲和管理。
本文引用地址:http://m.butianyuan.cn/article/201710/368244.htm然而對于數(shù)據(jù)中心的基礎(chǔ)設(shè)施建設(shè)以及一些日常運維管理等多方面的問題,或許不同的用戶有著不同的需求,有些企業(yè)用戶可能只是需要大容量的存儲空間,對于數(shù)據(jù)的提取可能并不頻繁,也就是我們平時所說的冷數(shù)據(jù)占據(jù)了大多數(shù)業(yè)務(wù)模塊,也許有些用戶對于在數(shù)據(jù)中心存儲數(shù)據(jù)的計算能力和運行方式要求的更加敏捷更加靈活,這可能對于數(shù)據(jù)中心管理者們來說又是另外的一套方案了。
綜上所述,當(dāng)今的企業(yè)用戶對于數(shù)據(jù)中心的設(shè)計、建造、管理等很多環(huán)節(jié)仍然還存在把握不準(zhǔn)的地方,尤其是在數(shù)據(jù)中心的設(shè)計和建造過程當(dāng)中,有一些現(xiàn)實存在的困難和問題需要去克服和解決,這些事實存在的問題究竟有哪些?本期筆者就和大家來聊聊。
大功率,散熱就成了問題
我們都知道,在整個數(shù)據(jù)中心運行過程當(dāng)中,基礎(chǔ)當(dāng)中的基礎(chǔ)就是電力運行了,然而只要有電力系統(tǒng)的運行和工作就必然會產(chǎn)生一些熱量,對于這些電能的應(yīng)用現(xiàn)在只有很少一部分得到了充分的應(yīng)用,除非企業(yè)的數(shù)據(jù)中心采用超導(dǎo)體供電,否則你將永遠為這些散失到空間里的熱量付費。
數(shù)據(jù)故障不可避免
宕機是每個數(shù)據(jù)中心管理員們最不希望看到的事情,但是在實際運行當(dāng)中,數(shù)據(jù)中心當(dāng)中的眾多硬件設(shè)備不太可能保證永遠不出故障,這也就意味著用戶永遠也無法將事故發(fā)生概率降低至零。需要注意UPS到負(fù)載之間的路徑以及制冷系統(tǒng)的冗余容錯功能。
電負(fù)載的密度會繼續(xù)增加
若干年前,一個服務(wù)器機架只裝不到十臺服務(wù)器,而現(xiàn)在可容納幾十臺刀片服務(wù)器;若干年前,每個機架的平均功率是1~2kW左右,現(xiàn)在是3kW甚至更高,高密度機架甚至從3~5kW增長至20~25kW。因此,電費將是影響數(shù)據(jù)中心發(fā)展的重要因素之一。
數(shù)據(jù)中心可用性提升
我們前文說到了數(shù)據(jù)中心當(dāng)中設(shè)備的宕機現(xiàn)象,如果一個現(xiàn)實的網(wǎng)站遭遇宕機,那么有可能導(dǎo)致一個潛在用戶在幾秒鐘的時間內(nèi)流失掉,轉(zhuǎn)而去訪問另外一家網(wǎng)站,如果一臺路由器設(shè)備宕機,那么很有可能導(dǎo)致在這個局域網(wǎng)內(nèi)的幾百個用戶無法正常連接網(wǎng)絡(luò),若一個光纖室宕機,就可能有幾千個用戶斷開網(wǎng)絡(luò)連接,損失不可估量。
管理人員的高素質(zhì)培訓(xùn)
對于數(shù)據(jù)中心來說,擁有一支高素質(zhì)高技能的管理人員團隊同樣也是非常重要的,由于人才緊缺、人力成本高昂以及培訓(xùn)機構(gòu)缺位等諸多原因,如今的數(shù)據(jù)中心操作人員,大部分都很少甚至沒有培訓(xùn)。這樣一來,數(shù)據(jù)中心操作人員不得不通過手動操作和不正規(guī)的培訓(xùn)獲得知識,通過犯錯誤、甚至造成代價高昂的宕機獲得知識,這是極為得不償失的。
系統(tǒng)升級當(dāng)中的問題
我們都知道,任何一款硬件設(shè)備都會牽扯到其中應(yīng)用的升級和維護,那么在整個升級過程當(dāng)中就有可能產(chǎn)生故障的可能,比如像UPS中的IGBT器件,也會在開機時因熱沖擊顯示類似的故障模式。同樣道理,冗余和備份系統(tǒng)可能會在切換時出現(xiàn)故障。由于人為因素,系統(tǒng)在狀態(tài)變更之后更容易出現(xiàn)故障,可能是因為系統(tǒng)沒有正確地返回運行狀態(tài)所導(dǎo)致。
編輯的話
數(shù)據(jù)中心作為當(dāng)今這個大數(shù)據(jù)和云計算時代數(shù)據(jù)量的重要載體,在實際運行和管理過程當(dāng)中確實會面臨很多的問題,對于數(shù)據(jù)中心服務(wù)提供商來說,保障用戶數(shù)據(jù)的安全、快速、穩(wěn)定的運行是需要考慮到的首要問題,對于用戶而言,選擇將自己的數(shù)據(jù)托管到哪個平臺上,也是需要深思熟慮的。
評論