余曼 譚安祖 高正
摘要:隨著信息化技術(shù)發(fā)展,企業(yè)持有的物理服務(wù)器數(shù)量達(dá)到了一個新的高度。面對數(shù)量龐大的服務(wù)器,只靠人力巡查是不可行的,因為這勢必會造成人力資源的浪費和成本的無盡增加。因此為實現(xiàn)數(shù)量龐大的服務(wù)器高性能運行,本文應(yīng)用了一套服務(wù)器監(jiān)控管理系統(tǒng)。經(jīng)實際應(yīng)用,該系統(tǒng)有效地實現(xiàn)了服務(wù)器7*24小時的不間斷監(jiān)控,并提供郵件與短信報警功能。
關(guān)鍵詞:服務(wù)器監(jiān)控;通信協(xié)議;郵件;報警
中圖分類號:TP311 文獻(xiàn)標(biāo)志碼:A 文章編號:1009-3044(2018)13-0057-02
Inpatient Information Inquiry System Based on Android Platform
YU Man, TAN An-zu, GAO Zheng
(The Eye Hospital of Wenzhou Medical University, Wenzhou 325000, China)
Abstract: With the rapid development of information technology,the number of physical servers held by each enterprise has reached a new height. Faced with such a huge number of servers,inspect one by one is not feasible,it will inevitably result in the waste of human resources and the endless increase in cost. Therefore, in order to manage a large number of servers,ensure its high performance,This paper applies a set of server monitoring and management system to realize the uninterrupted monitoring of the server 7*24 hours, and provides the alarm function of mail and SMS.
Key words: server monitoring; communication protocol; mail; alarm
1 概述
隨著我國互聯(lián)網(wǎng)+[1]的理念深入人心,各企事業(yè)單位在信息方面的建設(shè)突飛猛進(jìn),與之伴隨而來的便是服務(wù)器數(shù)量的激增。如何保障數(shù)量眾多的服務(wù)器始終維持在高效性、穩(wěn)定性的狀態(tài),如何及時發(fā)現(xiàn)服務(wù)器故障并解決,是單位服務(wù)器管理工作迫在眉睫的問題。其中服務(wù)器物理層面的主要問題有硬盤故障、內(nèi)存條故障、電源模塊故障、網(wǎng)絡(luò)故障等;邏輯層面的問題則主要有CPU長時間負(fù)載過大、磁盤空間接近飽和、內(nèi)存使用率過高等。這些故障輕則使系統(tǒng)運行卡頓或藍(lán)屏重啟,重則會導(dǎo)致系統(tǒng)宕機(jī)而丟失數(shù)據(jù),對在用業(yè)務(wù)產(chǎn)生巨大影響。
服務(wù)器的性能監(jiān)控是一項需要服務(wù)器管理工作中不容忽視的任務(wù)。本文對在本單位中應(yīng)用的服務(wù)器性能監(jiān)控管理系統(tǒng)進(jìn)行研究評估。該系統(tǒng)采用了無監(jiān)控代理的最新技術(shù),易于部署的Web架構(gòu),可以對不同的業(yè)務(wù)系統(tǒng)、應(yīng)用、網(wǎng)絡(luò)服務(wù)器和操作系統(tǒng)等進(jìn)行全方位、深層次的遠(yuǎn)程監(jiān)控和管理,滿足了信息數(shù)據(jù)中心的監(jiān)控管理需求。
2 關(guān)鍵技術(shù)
2.1 SNMP
SNMP(Simple Network Management Protocol)即簡單網(wǎng)絡(luò)管理協(xié)議,是目前事實上的標(biāo)準(zhǔn)網(wǎng)絡(luò)管理協(xié)議 [2]。該協(xié)議始于1988年,本著簡單性、擴(kuò)展性的原則得到廣泛的應(yīng)用,我們?nèi)粘3R姷母鞣N網(wǎng)絡(luò)設(shè)備上都可以看到默認(rèn)啟用的SNMP服務(wù),從交換機(jī)到路由器,從防火墻到網(wǎng)絡(luò)打印機(jī),無一例外。
SNMP被分成管理者、代理者、管理信息庫這三個結(jié)構(gòu)。只要是支持SNMP的設(shè)備,代理者都能將設(shè)備情況發(fā)送至管理信息庫,因此通過對管理者就可以實現(xiàn)對信息庫內(nèi)容的檢索,從而實現(xiàn)監(jiān)控目的[3]。
2.2 WMI技術(shù)
WMI(Windows Management Instrumentation)是作為Windows平臺下的一個核心管理技術(shù),用戶可以利用WMI技術(shù)便利地管理本地計算機(jī)或遠(yuǎn)程計算機(jī)[4]。WMI作為一種規(guī)范和基礎(chǔ)結(jié)構(gòu),通過它可以訪問、配置、管理和監(jiān)視幾乎所有的Windows資源,比如用戶可以在遠(yuǎn)程計算機(jī)器上啟動一個進(jìn)程;設(shè)定一個在特定日期和時間運行的進(jìn)程;遠(yuǎn)程啟動計算機(jī);獲得本地或遠(yuǎn)程計算機(jī)的已安裝程序列表;查詢本地或遠(yuǎn)程計算機(jī)的Windows事件日志等等。因此,對于Windows平臺的服務(wù)器而言,使用WMI監(jiān)控不失為一個明智的選擇。
3 系統(tǒng)功能
3.1 監(jiān)控模式配置
由于目前市面上存在著各種型號的服務(wù)器、操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備等,為了解決性能監(jiān)控系統(tǒng)和異構(gòu)系統(tǒng)之間的數(shù)據(jù)采集交互,系統(tǒng)采用了SNMP和WMI兩種數(shù)據(jù)采集模式供不同的業(yè)務(wù)系統(tǒng)進(jìn)行選擇。常規(guī)而言,WMI模式一般都用于采集Windows平臺的服務(wù)器數(shù)據(jù),因為它能夠監(jiān)控Windows系統(tǒng)中幾乎所有的服務(wù)。而SNMP可以監(jiān)控的東西相對有限。因此,Windows平臺的服務(wù)器采用的是WMI模式的監(jiān)控,而其他設(shè)備(諸如Linux服務(wù)器,Solaris服務(wù)器,交換機(jī),防火墻等)則采用SNMP模式進(jìn)行監(jiān)控。
用戶通過填寫監(jiān)視設(shè)備的顯示名,主機(jī)名或IP地址,子網(wǎng)掩碼,監(jiān)視方式(Windows下有SNMP、WMI,SUN Solaris和Linux下有Telnet、SSH、SNMP),用戶名,密碼,在測試憑證完成后實現(xiàn)監(jiān)控。系統(tǒng)會在輪詢時間內(nèi)自動監(jiān)測服務(wù)器數(shù)據(jù)(CPU使用率、磁盤使用空間、內(nèi)存使用率等)并發(fā)揮監(jiān)控數(shù)據(jù)。
3.2 報警配置
系統(tǒng)報警分為正常、警告、嚴(yán)重三檔。超過第一閾值會提示警告,繼續(xù)超出設(shè)置的第二個閾值則嚴(yán)重警告,恢復(fù)正常后則提示正常,三個狀態(tài)之間的切換均有發(fā)送到已配置郵箱的郵件報警。
報警人員可以自由配置,用戶通過創(chuàng)建郵件收件人地址、服務(wù)地址、主題以及附帶的消息完成郵件報警功能設(shè)置。用戶也可以在服務(wù)器管理頁面上對服務(wù)器的基本性能情況(CPU使用率、磁盤使用空間、內(nèi)存使用率、網(wǎng)絡(luò)使用負(fù)載等)進(jìn)行配置并關(guān)聯(lián)郵件。
3.3 日志報表
報表模塊主要是為了方便系統(tǒng)管理員獲取一定時間范圍內(nèi)的服務(wù)器性能數(shù)據(jù),并借此分析服務(wù)器的性能走向及潛在問題。
服務(wù)器的具體報表類型有服務(wù)器一覽報表、可用性報表、應(yīng)答時間、CPU使用率、內(nèi)存使用率、磁盤利用率。服務(wù)器一覽報表主要包括服務(wù)器的可用性、應(yīng)答時間、CPU利用率、物理內(nèi)存使用率、空閑物理內(nèi)存、交換內(nèi)存使用率、總的磁盤空間、總的磁盤利用率、總的磁盤空閑空間,通過這個報表可以大致了解所選服務(wù)器的概況,可以以此判斷服務(wù)器性能的大體走向??捎眯詧蟊頌橐慌_服務(wù)器在一段有限的時間內(nèi)所正常提供服務(wù)的時間占總時間的百分比,常規(guī)要求為零宕機(jī)時間,如果一臺服務(wù)器的可用性走向越來越低,則可以判斷該服務(wù)器存在軟硬件方面的故障,需要提高警惕及時維護(hù)。應(yīng)答時間為測試服務(wù)器網(wǎng)絡(luò)響應(yīng)速度的一個標(biāo)準(zhǔn),常規(guī)來說平均響應(yīng)時間為10-50ms為正常,長期超出這個標(biāo)準(zhǔn)就表示服務(wù)器網(wǎng)絡(luò)有擁塞或不穩(wěn)定。而CPU使用率、內(nèi)存使用率、磁盤利用率則也是衡量服務(wù)器是否硬件有故障、軟件運行過多、外部攻擊、文件過多的一個標(biāo)準(zhǔn),對于保證服務(wù)器正常運行具有非常重要的參考價值。
4 結(jié)語
通過SNMP和WMI技術(shù)的綜合應(yīng)用,本文所述的服務(wù)器性能監(jiān)控系統(tǒng)實現(xiàn)了服務(wù)器的遠(yuǎn)程監(jiān)控和管理。系統(tǒng)不僅顯著降低了機(jī)房管理工作的壓力與人力成本,而且有效得提高服務(wù)器的穩(wěn)定性、故障預(yù)見性及定位速度,為單位服務(wù)器科學(xué)管理、醫(yī)院信息化建設(shè)做出了貢獻(xiàn)。
參考文獻(xiàn):
[1] 王興偉, 李婕, 譚振華,等. 面向“互聯(lián)網(wǎng)+"的網(wǎng)絡(luò)技術(shù)發(fā)展現(xiàn)狀與未來趨勢[J]. 計算機(jī)研究與發(fā)展, 2016, 53(4):729-741.
[2] 屈利娟, 郭麗霞, 賀天鶴. 基于SNMP的服務(wù)器性能監(jiān)控技術(shù)[J]. 計算機(jī)時代, 2007(1):16-18.
[3] 張春暉. SNMP協(xié)議的分析與應(yīng)用[J]. 計算機(jī)應(yīng)用研究, 2000, 17(1):55-57.
[4] 王文利. 基于WMI技術(shù)的網(wǎng)絡(luò)監(jiān)視軟件的設(shè)計與實現(xiàn)[J]. 赤峰學(xué)院學(xué)報(自然科學(xué)版), 2011, 27(4):37-39.