宋博文 岳寶成
摘 要:在超級(jí)計(jì)算機(jī)提出后,由于系統(tǒng)性能的不斷完善,如何加強(qiáng)系統(tǒng)的管理已經(jīng)成為超級(jí)計(jì)算機(jī)需要解決的重點(diǎn)問(wèn)題,MMS中文名稱會(huì)員管理系統(tǒng),此系統(tǒng)采取的結(jié)構(gòu)框架,可以有效地提升監(jiān)控管理系統(tǒng)的工作效率,并且由于是對(duì)信息的精細(xì)化處理,使其對(duì)網(wǎng)絡(luò)產(chǎn)生的影響大大降低并提高反應(yīng)所需要的速度。因此本文便以計(jì)算機(jī)監(jiān)控管理系統(tǒng)作為主要的敘述內(nèi)容,對(duì)其中的問(wèn)題進(jìn)行淺薄的分析。
關(guān)鍵詞:大規(guī)模計(jì)算機(jī);監(jiān)控管理系統(tǒng);科學(xué)
在科學(xué)技術(shù)不斷發(fā)展以及進(jìn)步的過(guò)程中,對(duì)于數(shù)據(jù)的分析以及整理提出更高的要求,需要計(jì)算機(jī)具有超快的反應(yīng)速度,并可以承擔(dān)更多的工作負(fù)荷,超級(jí)計(jì)算機(jī)使用的過(guò)程中,其適應(yīng)行業(yè)越來(lái)越廣,例如天氣預(yù)報(bào)、基因分析工程等,為適應(yīng)行業(yè)的發(fā)展,因此計(jì)算機(jī)應(yīng)用系統(tǒng)的各項(xiàng)規(guī)模以及性能需要不斷地提高,在系統(tǒng)實(shí)現(xiàn)這些目標(biāo)后,為系統(tǒng)的可靠性以及實(shí)用性帶來(lái)新的挑戰(zhàn),由于監(jiān)控管理系統(tǒng)的主要作用為實(shí)現(xiàn)大規(guī)模系統(tǒng)的管理以及監(jiān)控,對(duì)系統(tǒng)的可靠性以及功能性有著很大的提升,所以當(dāng)前計(jì)算機(jī)管理系統(tǒng)的改革重點(diǎn)便是加強(qiáng)系統(tǒng)的工作效率。
一、 技術(shù)大況
大規(guī)模計(jì)算機(jī)系統(tǒng)的構(gòu)造有很多種,因此相應(yīng)的監(jiān)控管理系統(tǒng)的模式也不一樣,當(dāng)前較為經(jīng)典的管理系統(tǒng)分為以下幾種:
1. Ganglia系統(tǒng)監(jiān)控,此監(jiān)控系統(tǒng)適屬于分布式監(jiān)控系統(tǒng),此系統(tǒng)的建設(shè)理念為分層設(shè)計(jì),此設(shè)計(jì)起源于加州大學(xué),是一種可以對(duì)當(dāng)前節(jié)點(diǎn)的各種狀態(tài)信息進(jìn)行監(jiān)控的系統(tǒng),例如CPU等使用狀況,并且將歷史數(shù)據(jù)展示出來(lái),具有極強(qiáng)的擴(kuò)展能力。Ganglia的工作原理為,通過(guò)實(shí)現(xiàn)格式之間的轉(zhuǎn)換達(dá)到數(shù)據(jù)傳遞的目的,可以更好地達(dá)到監(jiān)控效果。此監(jiān)控系統(tǒng)體現(xiàn)的優(yōu)點(diǎn)主要為,可以自動(dòng)收集系統(tǒng)的工作數(shù)據(jù),此類收集方式是獨(dú)立的。在收集數(shù)據(jù)后,可以將數(shù)據(jù)以圖像的形式呈現(xiàn)出來(lái),方便使用者的查看,因此可以根據(jù)節(jié)點(diǎn)裝填曲線查看相應(yīng)的內(nèi)容,并且根據(jù)基本的排序規(guī)則,進(jìn)行降序或者升序的處理。
2. Nagios也可以被稱為網(wǎng)絡(luò)監(jiān)視工具,是一種監(jiān)控主機(jī)工作狀態(tài)以及與路由器等外連設(shè)備網(wǎng)絡(luò)設(shè)置狀態(tài)的系統(tǒng)。在系統(tǒng)處于不正常工作狀態(tài)時(shí),可以通過(guò)短信或者郵件的模式對(duì)工作人員及時(shí)通知,并且在恢復(fù)正常后,再次發(fā)出郵件短信通知。Nagios是一種監(jiān)控系統(tǒng)運(yùn)行狀態(tài)以及網(wǎng)絡(luò)狀態(tài)的監(jiān)控系統(tǒng),其主要特點(diǎn)是可以實(shí)現(xiàn)本地或者遠(yuǎn)程服務(wù),并且將異常狀態(tài)通知他人。此監(jiān)控系統(tǒng)的主要功能為,監(jiān)控網(wǎng)絡(luò)服務(wù)、主機(jī)狀態(tài)等多種監(jiān)控服務(wù)。
以上管理軟件在應(yīng)用的過(guò)程中,僅能實(shí)現(xiàn)一定規(guī)模的系統(tǒng)高效運(yùn)行,但是一旦系統(tǒng)規(guī)模過(guò)大,那么此類監(jiān)控軟件在使用的過(guò)程中,會(huì)出現(xiàn)以下的問(wèn)題:
1. 在計(jì)算機(jī)系統(tǒng)的規(guī)模擴(kuò)大的過(guò)程中,監(jiān)控管理系統(tǒng)是否能夠在規(guī)模性能提高的過(guò)程中,繼續(xù)滿足高效的管理以及監(jiān)控。根據(jù)最近的數(shù)據(jù)可以知道系統(tǒng)的規(guī)模呈現(xiàn)日益擴(kuò)大的趨勢(shì),系統(tǒng)規(guī)模呈現(xiàn)多倍數(shù)的擴(kuò)展趨勢(shì),因此傳統(tǒng)系統(tǒng)中的應(yīng)用方式已經(jīng)無(wú)法適用于當(dāng)前的計(jì)算機(jī)系統(tǒng),需要提高監(jiān)控系統(tǒng)的應(yīng)用性。
2. 系統(tǒng)工作的重點(diǎn)在于可靠性,能夠長(zhǎng)期保持在穩(wěn)定的工作狀態(tài)中,所以當(dāng)前監(jiān)控管理系統(tǒng)的發(fā)展方向之一便是可靠性發(fā)展。
3. 在當(dāng)前的監(jiān)控管理軟件中,整體呈現(xiàn)功能單一化,僅側(cè)重于單一方面的發(fā)展,監(jiān)控系統(tǒng)在工作時(shí),由于功能性不足,無(wú)法有效地提高計(jì)算機(jī)系統(tǒng)的實(shí)用性以及可靠性,因此為提高計(jì)算機(jī)系統(tǒng)的管理,需要將本身的功能進(jìn)行全面發(fā)展,更好地管理大規(guī)模計(jì)算機(jī)系統(tǒng)。
二、 MMS系統(tǒng)的構(gòu)成
大規(guī)模計(jì)算機(jī),其本身具有節(jié)點(diǎn)數(shù)目較為龐大,系統(tǒng)設(shè)備復(fù)雜多樣的特點(diǎn),例如儲(chǔ)存設(shè)備、供電設(shè)備等,因此監(jiān)控管理系統(tǒng)在工作的過(guò)程中,需要實(shí)現(xiàn)整體的把握,不但需要對(duì)資源進(jìn)行管理,而且還要對(duì)硬件進(jìn)行檢測(cè)以及控制,使監(jiān)控管理系統(tǒng)呈現(xiàn)多功能的管理狀態(tài)。
(一) MMS功能
MMS是一種通過(guò)訪問(wèn)界面便可以實(shí)現(xiàn)遠(yuǎn)程訪問(wèn)的監(jiān)控管理軟件,將資源管理以及報(bào)警管理、網(wǎng)絡(luò)信息等結(jié)合在一起,實(shí)現(xiàn)多功能多方向性的管理。在此監(jiān)控系統(tǒng)中,有一個(gè)用戶接口,可以通過(guò)此接口,對(duì)系統(tǒng)的配置進(jìn)行修改,并且調(diào)整整體的布局狀態(tài),監(jiān)控管理軟件需要根據(jù)用戶的具體需要提供相關(guān)信息的查詢,并且顯示系統(tǒng)的狀態(tài)。資源管理是MMS監(jiān)控系統(tǒng)的主要職能,內(nèi)容包括軟件系統(tǒng)的管理以及硬件信息管理,軟件系統(tǒng)管理的主要內(nèi)容為系統(tǒng)內(nèi)部信息、儲(chǔ)存信息、結(jié)點(diǎn)以及整體的工作狀態(tài)等,具體內(nèi)容為結(jié)點(diǎn)是否可用、對(duì)當(dāng)前作業(yè)的運(yùn)行狀態(tài)進(jìn)行確認(rèn)等。結(jié)點(diǎn)狀態(tài)主要在于CPU資源以及內(nèi)存兩個(gè)方面。系統(tǒng)的管理人員可以通過(guò)監(jiān)控軟件對(duì)系統(tǒng)當(dāng)前的工作狀態(tài)進(jìn)行監(jiān)控,例如使用狀態(tài)、功效運(yùn)行狀態(tài)等。
(二) MMS系統(tǒng)的結(jié)構(gòu)
MMS系統(tǒng)主要使用的結(jié)構(gòu)為分布式結(jié)構(gòu),分布為三個(gè)層次。底層結(jié)點(diǎn)是由所有需要管理的系統(tǒng)組成的,中層管理是由多個(gè)代理管理點(diǎn)組成,最頂層的為結(jié)點(diǎn),在結(jié)點(diǎn)上有著一個(gè)模塊,此模塊的主要功能便是信息的處理,負(fù)責(zé)將資源、配置等具體狀況進(jìn)行監(jiān)控。
三、 監(jiān)控系統(tǒng)性能
MMS監(jiān)控系統(tǒng)可以整體把握計(jì)算機(jī)的各項(xiàng)數(shù)據(jù)以及各部分的使用狀況,實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)的同時(shí),縮短系統(tǒng)的反應(yīng)時(shí)間。并且MMS系統(tǒng)具有傳統(tǒng)監(jiān)控系統(tǒng)的優(yōu)點(diǎn)以及功能,不僅可以對(duì)系統(tǒng)運(yùn)行過(guò)程中的異常信息進(jìn)行妥善的處理,并且實(shí)現(xiàn)對(duì)系統(tǒng)功能消耗的控制,加強(qiáng)計(jì)算機(jī)系統(tǒng)的應(yīng)用性。集中式的監(jiān)控由于過(guò)于簡(jiǎn)單,僅能支持小規(guī)模系統(tǒng)的運(yùn)行,無(wú)法承擔(dān)大規(guī)模系統(tǒng),在其可靠性等具有一定的劣勢(shì),因此MMS監(jiān)控系統(tǒng)使用分布式的方式,實(shí)現(xiàn)監(jiān)控管理的高效性目標(biāo)。
四、 結(jié)束語(yǔ)
為保證大規(guī)模計(jì)算機(jī)運(yùn)行的高效性以及可靠性,需要對(duì)監(jiān)控管理系統(tǒng)的穩(wěn)定性以及全面性進(jìn)行提升,MMS監(jiān)控系統(tǒng)采用分布式的結(jié)構(gòu)方式,將結(jié)點(diǎn)與中間處理器之間的數(shù)據(jù)實(shí)現(xiàn)一致性的管理,減少傳統(tǒng)分布式監(jiān)控系統(tǒng)中復(fù)雜的協(xié)定方式,提高反應(yīng)速度。
參考文獻(xiàn):
[1]鄭明玲,蔣句平,袁遠(yuǎn),等.一種面向大規(guī)模計(jì)算機(jī)的監(jiān)控管理系統(tǒng)[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,42(4):107-113.
[2]沈青,董波,肖德寶,等.基于服務(wù)器集群的云監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與科學(xué),2012,34(10):73-77.
[3]臧冬松,Vincent Garonne,孫功星,等.一種大規(guī)模分布式應(yīng)用性能分析系統(tǒng)[J].計(jì)算機(jī)工程,2012,38(24):37-41.
[4]楊帆,沈來(lái)信.基于C/S架構(gòu)的電子教室管理系統(tǒng)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(3):168-171.
作者簡(jiǎn)介:
宋博文,岳寶成,遼寧省本溪市,遼寧科技學(xué)院。