電力信息化離不開網(wǎng)絡監(jiān)控
在當前電力事業(yè)信息化應用中,系統(tǒng)運行平臺的網(wǎng)絡環(huán)境日漸復雜,為了充分發(fā)揮IT環(huán)境內所有網(wǎng)元(網(wǎng)絡,設備,計算機系統(tǒng),數(shù)據(jù)庫,中間件,存儲,企業(yè)核心應用等)的作用,企業(yè)需要有一個好的IT管理工具來對網(wǎng)絡和系統(tǒng)進行有效的管理,同時為了形成一套集主機、網(wǎng)絡、服務器以及應用(含數(shù)據(jù)庫)運行監(jiān)控和管理的、面向業(yè)務的綜合系統(tǒng),就必須加強信息網(wǎng)絡管理監(jiān)控系統(tǒng)的建設。
本文引用地址:http://m.butianyuan.cn/article/201521.htm系統(tǒng)平臺及開發(fā)技術
整體來看,管理系統(tǒng)所管理的對象主要包括:主機系統(tǒng)、網(wǎng)絡設備、數(shù)據(jù)庫、中間件、存儲設備、備份設備、企業(yè)核心應用系統(tǒng)等部分。
通過網(wǎng)絡監(jiān)視管理系統(tǒng)對上述管理對象進行集中維護、統(tǒng)一管理。實現(xiàn)對整個業(yè)務支撐系統(tǒng)的統(tǒng)一整體管理。可以通過監(jiān)視屏幕及時了解整個業(yè)務系統(tǒng)、數(shù)據(jù)庫、主機系統(tǒng)、網(wǎng)絡設備的運行狀況包括各項功能指標、性能指標等。系統(tǒng)的整個體系由三大部分構成:數(shù)據(jù)和控制層、處理層、展現(xiàn)層。
數(shù)據(jù)和控制層由各個業(yè)務系統(tǒng)代理組成:代理層是數(shù)據(jù)采集和動作執(zhí)行的核心。Agent是運行在被監(jiān)控目標計算機上的一些小程序,主要功能是負責采集該系統(tǒng)運行狀況、性能等數(shù)據(jù),并發(fā)送到數(shù)據(jù)采集分發(fā)管理器。
處理層是整個管理系統(tǒng)的核心,包含了數(shù)據(jù)管理、核心監(jiān)控、報警、數(shù)據(jù)存儲等部分:數(shù)據(jù)采集分發(fā)管理器的主要功能是從代理收集數(shù)據(jù)、更新和維護被管理對象狀態(tài)、命令代理程序層執(zhí)行相關指令等。并確保把數(shù)據(jù)分發(fā)到數(shù)據(jù)存儲器;數(shù)據(jù)存儲器接收到數(shù)據(jù)采集分發(fā)管理器的數(shù)據(jù)并進行分類,數(shù)據(jù)分割拆分存儲。核心監(jiān)控對采集到的數(shù)據(jù)進行分析處理,分析是否達到報警閥值,是否需要采取處理。
展現(xiàn)層是運維管理系統(tǒng)的用戶界面層,展示業(yè)務系統(tǒng)的功能指標、性能指標。用戶界面把網(wǎng)絡和系統(tǒng)中各種對象的關系、配置、狀態(tài)和故障情況,用圖示化的用戶接口展現(xiàn)出來。報警手段提供聲光、音樂、短信、Email等等多種有效的手段向用戶發(fā)出警示信息。統(tǒng)計分析是對業(yè)務系統(tǒng)進行的業(yè)務指標、性能指標進行分析,發(fā)現(xiàn)業(yè)務系統(tǒng)潛在的問題,防范于未然。
系統(tǒng)主要功能
一般企業(yè)對軟件要求是具有國內先進水平的系統(tǒng)管理軟件,對企業(yè)所有服務器操作系統(tǒng)、系統(tǒng)數(shù)據(jù)庫、網(wǎng)絡交換機、應用系統(tǒng)及應用進程都能進行監(jiān)控。運行人員能夠隨時查看到服務器的CPU、內存、磁盤空間、數(shù)據(jù)庫、進程等方面的詳細數(shù)據(jù);還可以通過對網(wǎng)卡、交換機的監(jiān)控,了解目前網(wǎng)絡的流量;可以實時掌握目前網(wǎng)絡運行的狀況。有全面的服務器監(jiān)測器、網(wǎng)絡監(jiān)測器、WEB應用監(jiān)測器和企業(yè)應用監(jiān)測,可以對企業(yè)信息網(wǎng)進行全面的監(jiān)測。主要分為幾個方面:跨操作系統(tǒng),遠程監(jiān)測管理;服務器、網(wǎng)絡設備監(jiān)測;應用監(jiān)測;方便實用;遠程報警、故障自動恢復;豐富的報告以及方便實用的用戶管理功能。
然而,系統(tǒng)功能主要有幾個方面。首先是跨操作系統(tǒng)遠程監(jiān)測管理。系統(tǒng)支持Windows、NT、Linux、SunSolaris、AIX、HpUnix、Cobalt、True64、OpenServer、Slackware、Digital等在內的所有主流操作系統(tǒng),可以跨路由、跨網(wǎng)段對遠程或異地的服務器機群進行集中監(jiān)測管理。
其次,服務器、網(wǎng)絡設備監(jiān)測:通過使用系統(tǒng)可以7X24監(jiān)測服務器的各種性能參數(shù)(CPU、磁盤空間、內存、服務、進程、網(wǎng)卡流量等)和網(wǎng)絡狀況(Ping、Port、網(wǎng)絡設備接口流量等),同時采用標準的SNMP協(xié)議對各種網(wǎng)絡設備進行監(jiān)測,包括網(wǎng)絡設備接口狀況、CiscoCPU、Cisco配置文件、F5、CheckPoint、Netscreen防火墻等。通過這些監(jiān)測,用戶可以及時發(fā)現(xiàn)問題,快速定位查找解決故障,區(qū)分故障發(fā)生的原因,給客戶抱怨一個合理的解釋;同時系統(tǒng)可將客戶所要求的各種性能監(jiān)測報告自動發(fā)送至客戶指定郵箱。
然后是能對Web網(wǎng)站所有相關應用進行監(jiān)測。需要軟件內置各種Web應用監(jiān)測器,如:WebServer、IIS、Apache、Iplanet、DNS、FTP、URL、URLTransaction、Websphere、Port、F5(LoadBalance)等,可以很好地對Web網(wǎng)站進行監(jiān)測。
同時,實現(xiàn)遠程報警,具有自動恢復功能。系統(tǒng)通過監(jiān)測器在監(jiān)測到故障或者故障隱患時,會通過靈活多樣的報警方式(語音電話、手機短信、電子郵件、),將警報發(fā)送到相關責任人,實現(xiàn)運行維護責任的明確分工;同時,還可以根據(jù)預先定義,對常見故障自動進行相應的故障恢復。
而且自動統(tǒng)計報表。系統(tǒng)提供的強大的報表分析功能和靈活多樣的圖表報告功能,非常方便生成實時的和歷史的報告,并可以打印、導出,為網(wǎng)絡管理和規(guī)劃提供可靠的理論數(shù)據(jù)和依據(jù),能夠自動組合監(jiān)測數(shù)據(jù),生成針對監(jiān)測對象實時的或歷史的報告和報表,幫助管理人員通過歷史數(shù)據(jù)分析設備的運行趨勢,為IT系統(tǒng)管理的長期規(guī)劃提供依據(jù)。
還有就是方便實用的用戶管理功能。管理人員可以為每個用戶設立一個管理帳號,并設置許可規(guī)模、期限以及管理權限。這樣,用戶就如同自己單獨使用該系統(tǒng),通過它來遠程管理自己的服務器及其應用。同時具備完備的安全設置:數(shù)據(jù)采集、傳輸支持HTTPS和SSH加密協(xié)議。用戶登錄系統(tǒng)除需輸入指定的用戶名和密碼外,還可設定只允許指定的IP地址進行遠程登錄。
當然,軟件具有Web界面、遠程管理功能。要求能通過軟件,管理員可以在指定的一臺機器上瀏覽管理界面并進行配置。管理員可以遠程瀏覽管理系統(tǒng)并進行配置,掌握信息網(wǎng)運行情況。
另外,構建服務器、應用拓撲圖。系統(tǒng)能自動生成拓樸圖,用戶可以調整定置圖,通過拓撲圖可以直觀看到整個信息網(wǎng)設備的運行情況,一旦系統(tǒng)或應用出現(xiàn)故障,故障設備立刻會變成紅色、發(fā)出報警,實時直觀地反映整個網(wǎng)絡設備的狀況,而且可以直觀地反映服務器、數(shù)據(jù)庫、應用進程等各種應用的運行情況。
總之,系統(tǒng)特點包括,首先是采用集中非代理式的完全自動化監(jiān)測方式。從一臺監(jiān)測主機可同時監(jiān)測不限點數(shù)的服務器、網(wǎng)絡設備及其應用的各種關鍵參數(shù),在被監(jiān)測對象上無需安裝任何代理軟件,對被監(jiān)測對象的性能影響甚微,系統(tǒng)的維護和升級都十分方便。通過模擬運行維護人員的日常操作行為,實現(xiàn)對網(wǎng)絡狀況的7*24小時不間斷實時監(jiān)測。
其次方便實用的設計理念。系統(tǒng)被監(jiān)測客戶端的安裝不到15分種即可使用,功能強大,操作卻十分方便。采用全中文的界面和幫助,提供本土化的技術支持和服務,只要具備基本網(wǎng)管常識,無需任何專門培訓,就可輕松管理網(wǎng)絡。
還有就是開放式的API接口。系統(tǒng)提供的開放式的API接口,可以讓網(wǎng)絡管理人員十分方便的添加自身系統(tǒng)獨有的特殊監(jiān)測器,從而滿足用戶特有的監(jiān)測需求。
系統(tǒng)的實施效果
一般企業(yè)的技術人員可以通過三個月的時間開發(fā)適合企業(yè)的網(wǎng)絡平臺監(jiān)控系統(tǒng),實現(xiàn)企業(yè)近200臺網(wǎng)絡設備、20臺小型機、70臺PC服務器及相關數(shù)據(jù)庫、中間件的自動化監(jiān)測管理。針對企業(yè)集中式系統(tǒng)運維的需求,系統(tǒng)可以提供具體的解決方案。通過自動生成的拓樸圖全面掌握系統(tǒng)性能。
首先是服務器及相關數(shù)據(jù)庫管理。系統(tǒng)實時地對服務器進行監(jiān)測,定期對服務進行分析,降低服務器故障,不斷提高服務器性能。支持對Windows、Unix、Solaris、AIX等相關操作系統(tǒng)的服務器的CPU使用率、內存使用率、磁盤利用率、服務、進程運行狀況、目錄、文件、日志等進行集中監(jiān)測管理,同時也實時對ORACLE、SQL數(shù)據(jù)庫進行運行監(jiān)測。
其次是網(wǎng)絡設備管理。通過監(jiān)測網(wǎng)絡設備是否可用、各端口流量、性能如何、CPU、內存使用情況、配置文件是否被修改、是否有異常日志及有沒有人非法登陸等,確保網(wǎng)絡系統(tǒng)的正常運行。
還有就是WWW服務管理。系統(tǒng)通過定期登錄指定的URL,驗證這個URL是否能被正常訪問,同時可以對該頁面的內容進行校驗,防止頁面被人惡意修改,從而確保不同WWW服務的質量。
通過系統(tǒng)的實施,不僅能進一步提高企業(yè)各個業(yè)務信息系統(tǒng)的運行質量,為企業(yè)日常管理工作能正常持續(xù)運行提供有力的保障,同時也大大降低了系統(tǒng)監(jiān)控的運行維人力支持。技術支持人員有更多的時間提供應用支持,間接提高了各業(yè)務系統(tǒng)應用的滿意度。
隨著電力信息化的發(fā)展和國網(wǎng)公司“SG186”工程的推進,電力系統(tǒng)的信息安全也日益被重視,一是信息安全,二是網(wǎng)絡安全,其中網(wǎng)絡安全主要從網(wǎng)絡層面考慮,指的是使信息的傳輸和網(wǎng)絡的運行能夠得到安全的保障,內部和外部的非法攻擊得到有效的防范和遏制。信息網(wǎng)絡和信息系統(tǒng)的硬件、軟件、設備、數(shù)據(jù)需要受到可靠的保護,通信和訪問等操作要得到有效保障和合理的控制,不受偶然的或者惡意攻擊的原因而遭受到破壞、更改、泄漏,系統(tǒng)連續(xù)可靠正常的運行,網(wǎng)絡服務不被中斷。在信息系統(tǒng)安全中,人始終是一個重要的角色,由于信息管理部門的技術維護力量遠不如生產(chǎn)線上人員的配備充足,每個人維護的信息設備數(shù)和需要具備的維護知識的要求相對較高,在傳統(tǒng)模式下可能就會出現(xiàn)造成信息系統(tǒng)安全的問題。通過網(wǎng)絡管理監(jiān)控系統(tǒng)的建設,將每個人運行維護知識都在系統(tǒng)中得以體現(xiàn)與固化,并通過系統(tǒng)設置可以交流與確認。通過整合、完善、改建和新建的監(jiān)控方法,統(tǒng)一并規(guī)范的實現(xiàn)各系統(tǒng)及設備監(jiān)控的自動化,也實現(xiàn)了監(jiān)控數(shù)據(jù)共享與交流,也極大提高信息運維工作的質量與效率。將使企業(yè)的信息管理水平在信息系統(tǒng)統(tǒng)一監(jiān)控實現(xiàn)自動化的推動下上了一個新的臺階。
評論