主動(dòng)式監(jiān)測(cè)動(dòng)力引擎技術(shù)可靠性分析
監(jiān)測(cè)動(dòng)力引擎,作為主動(dòng)式監(jiān)測(cè)的核心它的好壞直接決定整個(gè)監(jiān)控平臺(tái)的質(zhì)量.
對(duì)一個(gè)主動(dòng)式動(dòng)力引擎可以從以下幾個(gè)方面去評(píng)價(jià):
工作的穩(wěn)定性
監(jiān)控平臺(tái)一旦在客戶生產(chǎn)環(huán)境中部署就要擔(dān)負(fù)起率先發(fā)現(xiàn)IT系統(tǒng)中故障的責(zé)任,而IT系統(tǒng)對(duì)于許多客戶的業(yè)務(wù)通常起著至關(guān)重要的作用.客戶在部署監(jiān)控平臺(tái)之初也往往對(duì)其寄于厚望.如果監(jiān)控平臺(tái)自身不能長(zhǎng)期穩(wěn)定的工作,其給客戶帶來的價(jià)值也就會(huì)大打折扣,監(jiān)控平臺(tái)的職責(zé)就是要發(fā)現(xiàn)IT系統(tǒng)中軟硬件的故障如果其本身經(jīng)常出現(xiàn)問題不能穩(wěn)定的工作,那么就更談不上對(duì)其它系統(tǒng)的監(jiān)控了,所以穩(wěn)定性是評(píng)價(jià)一個(gè)監(jiān)測(cè)動(dòng)力引擎的首要指標(biāo)。
監(jiān)測(cè)的可靠性
這里是指監(jiān)測(cè)結(jié)果的可靠性.正確的監(jiān)測(cè)結(jié)果是監(jiān)控平臺(tái)工作的基石.監(jiān)控平臺(tái)能產(chǎn)生的所有事件,報(bào)表,報(bào)警都是以動(dòng)力引擎生成的每一條監(jiān)測(cè)結(jié)果作為基礎(chǔ)的.如果沒有可靠的監(jiān)測(cè)結(jié)果就不會(huì)有正確的事件,報(bào)表,和報(bào)警.不能得到正確的報(bào)表和報(bào)警對(duì)于客戶來說監(jiān)控平臺(tái)就失去存在的意義了.所以監(jiān)測(cè)結(jié)果的可靠性也是衡量一個(gè)監(jiān)測(cè)動(dòng)力引擎的核心指標(biāo)。
性能
一個(gè)好的動(dòng)力引擎除了要具備上述兩個(gè)必要條件其性能的好壞也很重要,如果一個(gè)監(jiān)控平臺(tái)只添加很少數(shù)量的監(jiān)控對(duì)像就把機(jī)器的資源消耗殆盡是很難稱的上是一個(gè)好的監(jiān)控平臺(tái)的.這樣的平臺(tái)不但對(duì)資源是一種浪費(fèi),更增加了客戶的部署成本和管理成本,也不是一種環(huán)保的解決方案.而整個(gè)平臺(tái)性能的好壞很大程度上取決于動(dòng)力引擎的性能。
監(jiān)測(cè)的最小調(diào)度頻率
由于關(guān)鍵業(yè)務(wù)的重要性,客戶對(duì)于某些核心設(shè)備(如:核心路由器、交換機(jī),以及運(yùn)行著關(guān)鍵業(yè)務(wù)的服務(wù)器等)和業(yè)務(wù)的監(jiān)控已經(jīng)不滿足于分鐘級(jí)別的監(jiān)測(cè),客戶需要更加及時(shí)地獲得這些設(shè)備的工作狀態(tài)。好的監(jiān)控平臺(tái)要能做到在最短的時(shí)間發(fā)現(xiàn)問題所在,越早發(fā)現(xiàn)故障就越能為客戶避免重大損失,這就要求動(dòng)力引擎能提供的調(diào)度頻率越快越好。
美信IT業(yè)務(wù)管理軟件采用自主開發(fā)的業(yè)界領(lǐng)先的TaskDispatcher復(fù)雜任務(wù)分發(fā)技術(shù),把監(jiān)測(cè)顆粒度從分鐘級(jí)縮減到秒級(jí),以保證監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)性和精確性。用戶可以設(shè)置監(jiān)測(cè)頻率的間隔為5秒、10秒、15秒到30秒(5秒的倍數(shù)任意設(shè)置)。這樣當(dāng)客戶關(guān)鍵設(shè)備出現(xiàn)異常時(shí)能在第一時(shí)間里發(fā)現(xiàn)問題,發(fā)出報(bào)警,為客戶解決問題贏得寶貴的時(shí)間。
適用范圍:對(duì)故障響應(yīng)實(shí)時(shí)性要求很高的客戶,如運(yùn)營(yíng)商、銀行、加油站、高速公路收費(fèi)站等。
可擴(kuò)展性
客戶實(shí)際環(huán)境中在監(jiān)控平臺(tái)部署完成后IT設(shè)備還會(huì)逐漸增加,系統(tǒng)規(guī)模會(huì)越來越大,監(jiān)控平臺(tái)的壓力自然也會(huì)隨之增加,時(shí)間長(zhǎng)了總會(huì)超過當(dāng)初部署時(shí)監(jiān)控系統(tǒng)的設(shè)計(jì)能力,在這種情況下往往只有兩種選擇,一種是再購買一套新的監(jiān)控系統(tǒng)部署到另一臺(tái)機(jī)器上,形成兩套或多套獨(dú)立并行運(yùn)行的狀況這樣做的結(jié)果是增加了客戶的維護(hù)工作量,每套系統(tǒng)都要單獨(dú)設(shè)置權(quán)限,報(bào)告,報(bào)表,報(bào)警,并且不能從一個(gè)界面進(jìn)行訪問和管理.時(shí)間越長(zhǎng)給客戶帶來的不便就越大.而另一種方案是在原有的系統(tǒng)上擴(kuò)展,這樣做只要多增加硬件監(jiān)測(cè)機(jī)既可,所有的設(shè)置都在同一套系統(tǒng)中進(jìn)行用戶仍然通過同一套界面進(jìn)行訪問和管理絲毫感覺不到后臺(tái)的變化.要想滿足第二種方案就需要監(jiān)測(cè)動(dòng)力引擎具有很好的可擴(kuò)展性。
綜上所述要研發(fā)一個(gè)優(yōu)秀的動(dòng)力引擎就需要在上述五個(gè)指標(biāo)是必須要考慮的
主動(dòng)式監(jiān)測(cè)動(dòng)力引擎-TaskDispatche,在設(shè)計(jì)之初就是按照最大程度滿足上述五個(gè)指標(biāo)進(jìn)行的,并在以后的研發(fā)和測(cè)試中始終以提高這些指標(biāo)為核心目的。事實(shí)證明TaskDispatcher果然不負(fù)重望,在以上各個(gè)指標(biāo)中均取得了優(yōu)異的成績(jī)。它的穩(wěn)定性和可靠性在大量的客戶群中得到證明,贏得客戶的口碑,其性能也在擁有眾多服務(wù)器的中石油總部等大客戶獲得檢驗(yàn);而它的最小調(diào)度頻率更是達(dá)到秒級(jí),這在國(guó)際上同類產(chǎn)品中也不多見,更為難得的是在調(diào)度大量秒級(jí)監(jiān)測(cè)的同時(shí)還能保證資源的最小消耗。美信管理平臺(tái)良好的可擴(kuò)展性達(dá)到了一套系統(tǒng)可監(jiān)測(cè)超過十萬臺(tái)設(shè)備的水平,并且還完美實(shí)現(xiàn)了多機(jī)負(fù)載均衡,智能監(jiān)測(cè)任務(wù)分配,當(dāng)其中一臺(tái)或多臺(tái)機(jī)器宕機(jī)時(shí),其它機(jī)器會(huì)自動(dòng)負(fù)載起它們的監(jiān)測(cè)任務(wù),最大程度上保證被監(jiān)測(cè)設(shè)備始終處于被監(jiān)控狀態(tài),從而為高性能的美信IT管理平臺(tái)的提供了一個(gè)優(yōu)良的心臟。
評(píng)論