實現(xiàn)光纖交換機的最佳管理
以下最佳實踐可以幫助存儲人員更好的管理光纖交換機
一旦確定產(chǎn)品供應商,就不要輕易改變,因為多個品牌的產(chǎn)品混用很容易產(chǎn)生問題。
光纖交換機之間能否正常通信是保證整個網(wǎng)絡穩(wěn)定的關(guān)鍵因素。在此推薦以下三家公司的產(chǎn)品:博科通信有限公司,思科信息系統(tǒng)公司,Qlogic公司。
Gartner公司的分析員Robert Passmore說: 光纖交換機之間通信是有標準的,但僅僅滿足這個標準還是遠遠不夠的。所有的供應商基本上都可以做到這一點。
下面的經(jīng)驗適用于所有的光纖交換環(huán)境:
計劃
做好未來三年內(nèi)存儲區(qū)域網(wǎng)絡的規(guī)劃。根據(jù)過去兩年內(nèi)應用程序、物理服務器、存儲設備的數(shù)量來判斷將來的需求。是否會采用一些新技術(shù)例如虛擬服務器,不同的組件是否會對整個網(wǎng)絡帶來影響,這些問題都需要考慮。Dragon Slayer咨詢公司的總裁Marc Staimer說:“將你未來三年的需求翻倍部署到你的應用中去,雖然暫時的花費比較多,但長期看來還是非常值得的。不經(jīng)過計劃就開始部署存儲區(qū)域網(wǎng)絡,以后的問題會越來越多。 所以計劃的越多,以后的工作就越輕松?!?
根據(jù)應用程序的吞吐量和I/O來設計性價比更高的存儲區(qū)域網(wǎng)絡。前HP公司存儲工程師Dan Iacono說:“很多用戶不清楚他們的應用程序的帶寬和I/O,這個問題可以使用一些操作系統(tǒng)例如Unix,Windows自帶的工具來解決,很多存儲設備供應商也會向客戶提供這種工具。然后根據(jù)吞吐量來確定使用哪種端口,以及如何設計存儲區(qū)域網(wǎng)絡。許多用戶都是采用中心+邊緣的方式,在邊緣使用16口或者32口的光纖交換機,然后通過內(nèi)部ISL鏈接到中心一個大的交換機上。了解邊緣交換機的吞吐量可以確定ISL的數(shù)量?!?
將ISL數(shù)量降至最低,可以空閑出更多的端口,并且可以將更多資金用于存儲區(qū)域網(wǎng)絡內(nèi)部的部署上。
有經(jīng)驗的公司會發(fā)現(xiàn),只需將吞吐量大的應用程序從邊緣移動到中心就可以解決問題,因為這樣應用程序可以更加容易的從存儲設備上取的數(shù)據(jù)。
不要害怕超額限制。光纖交換機大部分時間不會滿載運行,因此額外增加一些負載通常不會影響整體的性能。Howard Goldstein協(xié)會的主席Howard Goldstein說:“大部分的存儲管理員在這個問題上都過于保守,其實平時使用的帶寬只占總體帶寬的1/10”.
提前考慮電源消耗和制冷設備。供應商通常會將產(chǎn)品盡可能的細化,但有時還是不夠。電源消耗就是一個例子。博科數(shù)據(jù)中心基礎架構(gòu)部的產(chǎn)品市場主管Mario Blandini說:“現(xiàn)在有很多的IT環(huán)境都缺少供電設備,大部分的醫(yī)院或者大學樓都建造于75年前,當時他們接入電源時,肯定不會想到在19平方英尺的地方會消耗10,000W(瓦)的電量?!?
設計兩個獨立的存儲區(qū)域網(wǎng)絡來實現(xiàn)冗余。SAN需要7×24小時的正常運行。存儲區(qū)域網(wǎng)絡中的服務器越多,出現(xiàn)故障的機率就越大。為了避免出現(xiàn)故障,通常在服務器和存儲之間有兩條路徑。
如果一條路徑上任意一個部件出現(xiàn)問題,例如HBA、光纖交換機、線纜、端口或者其他的部件,另外的一條路徑就會頂替出現(xiàn)問題的路徑,將服務器和存儲鏈接起來。另外一個好處是,在SAN運行時也可以對其進行升級。
Staimer說:“無論你對系統(tǒng)做什么操作都會影響你的應用程序,為了避免這一點,我們通常是對非正在運行的環(huán)境進行升級。多個光纖網(wǎng)絡可以使SAN更加的安全?!?
管理——技術(shù)方面
部署路徑自動切換軟件,可以保證一條路徑出現(xiàn)問題時,另外一條可以自動切換,不影響正常使用。Passmore說:“一些操作系統(tǒng)提供了這樣的軟件,但功能有限,因此一些廠家也會發(fā)布各自的路徑管理軟件,雖然價格有些高,但提供的功能非常全面,還是物有所值的?!?
配置,調(diào)試和監(jiān)控硬件和性能工具?!acono記得有一家大的咨詢公司每天會得到6,000多條警告,但并不處理他們。有一家設備供應商取消了當SAN的帶寬是0MBps時發(fā)出警告的設置。這樣會引來非常大的麻煩。
通常很小的硬件問題累計起來就會出現(xiàn)大的問題。SAN中大約95%的問題都會發(fā)出警告,但這樣警告并沒有引起重視。如果每天都收到很多的警告信息,你應該重新調(diào)試你的監(jiān)控工具來取消這些警告,或者是這樣問題真的非常嚴重,需要馬上解決。
將SAN的信息備份到硬盤上而非SAN中。SAN通常不會宕機,一旦宕機,將會是一場災難。如果SAN的信息存儲在一個SAN鏈接的硬盤中,那恢復其中的數(shù)據(jù)的難度就可想而知。
Iacono說:“我敢肯定財富500強的公司都是這么做的。”
很多的公司甚至不會更新文檔,通常只是使用一個Excel文檔,里面寫些目標,以后很少會更新它,因為他們覺得這并不重要。如果需要做故障分析時,他們都不清楚每個端口連接的是什么設備。其實每個管理員都有自己的文檔,但其中50%到70%的信息不是最新的。
管理——個人方面
雇傭?qū)I(yè)的存儲團隊并嚴格管理流程。大部分的SAN宕機都是由于人為因素導致的。嚴格的管理流程會減少這種事情的發(fā)生。因此雇傭一個專業(yè)的存儲團隊是必須的。服務器管理員會將自己的需求告知存儲團隊,由他們來進行設計與安排,然后寫下整個流程的處理過程,包括在存儲設備和交換機上做了哪些操作等。這樣,團隊中其他的成員就可以看到這個需求處理的進度。
Gartner公司的Passmore說:“按照這個流程來管理SAN的公司,SAN宕機的機會會大幅降低。”
為每個管理員和第三方的咨詢?nèi)藛T設置不同的用戶名和密碼。Iacono說:“對新交換機的參數(shù)進行了微調(diào)而沒有告訴同事,這種事情也是時有發(fā)生的。”
當發(fā)生這種事情后,想找到當事人是非常麻煩的。所以要為不同的人設置不同的用戶名和密碼,下次再發(fā)生這種事時,就能非常容易的知道是誰修改過配置。
安全
在LUN掩蓋和綁定完成之后創(chuàng)建zone。當服務器跟存儲設備連接時,可以使用一些工具來創(chuàng)建一個帶地址的存儲卷,或者是一個LUN,LUN掩蓋可以將不屬于它的LUN隱藏,LUN綁定可以將LUN和一個具有唯一WWID(worldwide ID)的HBA進行綁定。
在做完LUN掩蓋和LUN綁定之后,存儲管理員應該馬上去光纖交換機上設置zone,來保證特定適配器只能和特定的端口通信。
Passmore說:“交換機通過zone增強了LUN掩蓋和LUN綁定的功能,這樣就可以保證存儲設備上的LUN可以被特定的具有WWID的適配器訪問到?!?
使用SSH(Use Secure Shell)訪問SAN。如果存儲管理員通過Telnet訪問光纖交換機, 密碼是沒有加密的,這樣增加了風險。使用SSH會對所有的操作都進行加密,很多的人在操作系統(tǒng)上會使用SSH,但在存儲設備上還沒有注意這一點。
虛擬服務器
確保整個環(huán)境可以滿足全部應用程序的帶寬。在原來的服務器上安裝多個虛擬機運行多個應用程序,整個帶寬的需求就會提升。用戶在設計SAN時就要考慮到這一點。一個X86的服務器至多可以達到1G/s的帶寬,而現(xiàn)在的雙核的機器則可以達到10G/s。如果你同時運行20個應用程序,帶寬會達到10G/s,原來的機器是肯定無法承受這么大的負載的。
確保所有運行著虛擬機的物理服務器在同一個zone里面。使用虛擬機技術(shù),管理員可以輕松的將一個應用程序從一個物理機器上換到另外一個物理機器上,而且不用停機,但是這些物理機器需要在同一個zone里面才可訪問到存儲設備?!叭绻L問不到存儲設備的話,應用程序就會宕掉。”Staimer說道。
采用支持NPIV的交換機和HBA卡。如果在一個物理機器上運行著五個虛擬機,NPIV可以對HBA卡生成五個不同的識別號,這樣五個虛擬機就可以使用五個不同的LUN。如果使用不支持NPIV的設備,五個虛擬機只能使用一個LUN。NPIV適用于所有的新交換機和HBA卡。用戶可以聯(lián)系供應商來對原來的硬件進行升級以支持NPIV,NPIV在刀片服務器上的運行原理跟在虛擬機上的運行原理基本相同。
交換機相關(guān)文章:交換機工作原理
評論