李德泉, 何文春, 阮宇智, 劉一鳴
(國(guó)家氣象信息中心,北京100081)
實(shí)時(shí)氣象資料數(shù)據(jù)庫(kù)系統(tǒng)(以下稱“實(shí)時(shí)數(shù)據(jù)庫(kù)”或“實(shí)時(shí)庫(kù)”)作為“國(guó)家級(jí)氣象資料存儲(chǔ)檢索系統(tǒng)”(MDSS)[1]的重要組成部分,是氣象信息部門(mén)針對(duì)預(yù)測(cè)預(yù)報(bào)及相關(guān)業(yè)務(wù)開(kāi)發(fā)的重要數(shù)據(jù)服務(wù)系統(tǒng),是確保從觀測(cè)到預(yù)報(bào)業(yè)務(wù)流程按時(shí)高效完成的重要基礎(chǔ)性數(shù)據(jù)支撐環(huán)境。實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)對(duì)實(shí)時(shí)氣象資料進(jìn)行接收、分類、加工處理,并以地面氣象資料、高空氣象資料、海洋氣象資料、氣象輻射資料、農(nóng)業(yè)氣象資料、數(shù)值分析預(yù)報(bào)產(chǎn)品資料、氣象災(zāi)害資料、氣象衛(wèi)星資料、氣象服務(wù)產(chǎn)品資料和其他資料等12類資料形式存儲(chǔ)并實(shí)現(xiàn)資源共享。
所謂實(shí)時(shí)(Real-Time),是指數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)一方面要維護(hù)大量共享數(shù)據(jù)和相關(guān)用戶信息,另一方面其應(yīng)用服務(wù)有很強(qiáng)的時(shí)間性,要求在一定的時(shí)刻或者一定的時(shí)間期限內(nèi)從外部環(huán)境采集數(shù)據(jù),經(jīng)規(guī)范化處理后,以有效的數(shù)據(jù)組織形式存儲(chǔ),并及時(shí)響應(yīng)隨后的大量并發(fā)訪問(wèn)服務(wù)。因此,整個(gè)數(shù)據(jù)處理過(guò)程具備短時(shí)、高效特點(diǎn),并且每種資料對(duì)數(shù)據(jù)服務(wù)時(shí)效具有明確要求,過(guò)時(shí)則無(wú)意義[2]。
氣象實(shí)時(shí)數(shù)據(jù)庫(kù)不僅作為關(guān)鍵數(shù)據(jù)源連接氣象中心、公共氣象服務(wù)中心等部門(mén)的實(shí)時(shí)業(yè)務(wù)系統(tǒng),還為科研用戶提供一定時(shí)間期限內(nèi)數(shù)據(jù)查詢下載服務(wù)。因其在整個(gè)業(yè)務(wù)流程中發(fā)揮關(guān)鍵的底層支撐作用,其服務(wù)穩(wěn)定性及時(shí)效將直接影響其服務(wù)對(duì)象的實(shí)時(shí)業(yè)務(wù)效能和氣象預(yù)報(bào)及時(shí)性與準(zhǔn)確性,進(jìn)而影響氣象部門(mén)對(duì)內(nèi)外行業(yè)用戶、公眾用戶的氣象服務(wù)質(zhì)量,因此從業(yè)務(wù)運(yùn)行開(kāi)始就一直作為國(guó)家氣象信息中心的運(yùn)維重點(diǎn)。
為了保障實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)穩(wěn)定對(duì)外服務(wù),協(xié)助值班人員日常值班,實(shí)時(shí)動(dòng)態(tài)地監(jiān)測(cè)各類氣象實(shí)時(shí)觀測(cè)資料的到報(bào)、入庫(kù)質(zhì)量,以及實(shí)時(shí)庫(kù)處理相關(guān)線程的運(yùn)行狀態(tài),國(guó)家氣象信息中心組織技術(shù)力量,開(kāi)發(fā)完成實(shí)時(shí)氣象資料數(shù)據(jù)庫(kù)業(yè)務(wù)監(jiān)控系統(tǒng)(RDBCat,以下簡(jiǎn)稱“實(shí)時(shí)庫(kù)監(jiān)控系統(tǒng)”),并在2008年奧運(yùn)會(huì)期間業(yè)務(wù)上線運(yùn)行。
作為針對(duì)實(shí)時(shí)氣象數(shù)據(jù)庫(kù)服務(wù)業(yè)務(wù)的監(jiān)控系統(tǒng),系統(tǒng)核心設(shè)計(jì)目的是針對(duì)實(shí)時(shí)庫(kù)的運(yùn)算環(huán)境及健康狀況進(jìn)行即時(shí)監(jiān)控與報(bào)警,確保實(shí)時(shí)數(shù)據(jù)服務(wù)能穩(wěn)定支撐業(yè)務(wù)使用。因此可歸類為服務(wù)類監(jiān)控系統(tǒng)(Service Monitoring and Control,SMC)[3]。
服務(wù)監(jiān)控系統(tǒng)重點(diǎn)負(fù)責(zé)對(duì)信息服務(wù)系統(tǒng)運(yùn)算環(huán)境及健康狀況進(jìn)行即時(shí)監(jiān)控,動(dòng)態(tài)顯示服務(wù)成功或失敗的可辨識(shí)特征,并對(duì)服務(wù)異常狀況報(bào)警。此外,服務(wù)監(jiān)控還負(fù)責(zé)收集服務(wù)故障相關(guān)上下游運(yùn)行環(huán)境及流程信息,進(jìn)而協(xié)助使用部門(mén)改進(jìn)IT服務(wù)質(zhì)量。
服務(wù)監(jiān)控系統(tǒng)往往以分布式方式采集來(lái)自于信息服務(wù)系統(tǒng)各相關(guān)設(shè)備、應(yīng)用程序的日志信息和告警事件信息,判斷服務(wù)故障事件,快速定位故障事件的來(lái)源,分析故障發(fā)生的根本原因,集中展示信息服務(wù)系統(tǒng)運(yùn)算環(huán)境及整體安全狀況。一旦發(fā)現(xiàn)高風(fēng)險(xiǎn)服務(wù)故障事件還可觸發(fā)相應(yīng)故障事件處理流程,督促值班人員及相關(guān)責(zé)任人進(jìn)行快速排查問(wèn)題和解決故障。
服務(wù)監(jiān)控系統(tǒng)從體系架構(gòu)上可劃分為4層:信息基礎(chǔ)層、數(shù)據(jù)采集層、數(shù)據(jù)及規(guī)則處理層、展示層4個(gè)層面,各個(gè)層面功能各不相同。整體架構(gòu)如圖1所示。
信息基礎(chǔ)層為整個(gè)系統(tǒng)提供基礎(chǔ)設(shè)備及軟件運(yùn)行環(huán)境(網(wǎng)絡(luò)設(shè)備、安全設(shè)備、業(yè)務(wù)系統(tǒng)、服務(wù)器等),其同時(shí)也是各類監(jiān)控信息的數(shù)據(jù)獲取來(lái)源。
數(shù)據(jù)采集層:根據(jù)系統(tǒng)內(nèi)部指定的運(yùn)維策略,借助由專用的數(shù)據(jù)采集引擎,數(shù)據(jù)采集層負(fù)責(zé)從信息基礎(chǔ)層采集各種報(bào)警信息、日志信息、流量信息,經(jīng)過(guò)數(shù)據(jù)格式標(biāo)準(zhǔn)化、數(shù)據(jù)歸并、統(tǒng)計(jì)等處理后,形成原始數(shù)據(jù),提交給上層的數(shù)據(jù)及規(guī)則處理層。
數(shù)據(jù)及規(guī)則處理層:將采集到的原始數(shù)據(jù)按照業(yè)務(wù)系統(tǒng)數(shù)據(jù)、設(shè)備數(shù)據(jù)、網(wǎng)絡(luò)及安全數(shù)據(jù)等進(jìn)行分門(mén)別類,經(jīng)過(guò)基于統(tǒng)計(jì)、基于規(guī)則的關(guān)聯(lián)分析后,科學(xué)合理地定義各類故障事件的性質(zhì)和處理級(jí)別,作為展示層的數(shù)據(jù)基礎(chǔ)。
展示層:實(shí)現(xiàn)整個(gè)服務(wù)監(jiān)控系統(tǒng)的靈活展示和配置管理。通過(guò)豐富的、多元化、分層次的圖形化展示方式呈現(xiàn)各個(gè)監(jiān)控對(duì)象的運(yùn)行狀況,提供有效的安全預(yù)警,減免嚴(yán)重故障的發(fā)生,快速應(yīng)對(duì)突發(fā)故障并降低所造成的損失。
總之,一個(gè)設(shè)計(jì)良好的面向服務(wù)的監(jiān)控系統(tǒng)應(yīng)該至少具備如下完整因素:明確的監(jiān)控對(duì)象,涵蓋所有業(yè)務(wù)需要關(guān)注的場(chǎng)景并提示給使用者簡(jiǎn)明清晰必要信息,監(jiān)控信息明確分類并具有界面友好的處理建議,當(dāng)然,其他方面諸如快速部署、擴(kuò)展性、標(biāo)準(zhǔn)化等根據(jù)實(shí)際需求也必須有所側(cè)重。同時(shí),與之匹配的業(yè)務(wù)運(yùn)維架構(gòu)尤其是監(jiān)控流程和運(yùn)維崗位設(shè)置等管理性內(nèi)容也會(huì)對(duì)監(jiān)控系統(tǒng)設(shè)計(jì)及發(fā)揮效益起著至關(guān)重要的先決制約作用。
圖1 服務(wù)監(jiān)控系統(tǒng)體系架構(gòu)
鑒于服務(wù)監(jiān)控系統(tǒng)主要用戶為一、二線值班人員,作為業(yè)務(wù)值班監(jiān)控系統(tǒng),其設(shè)計(jì)思路上還應(yīng)充分考慮業(yè)務(wù)值班特點(diǎn):支持聲音報(bào)警;支持監(jiān)控信息集中“一頁(yè)式”定制顯示,使報(bào)警信息及統(tǒng)計(jì)信息一目了然,不需要手工繁瑣操作;簡(jiǎn)單易行的策略配置操作;監(jiān)控信息按錯(cuò)誤類別分類,用戶可定制哪些類別在監(jiān)控屏幕顯示,屏蔽不關(guān)心的信息提示,避免值班干擾;具備故障處理向?qū)?幫助值班人員與后臺(tái)技術(shù)人員溝通。
值班運(yùn)維業(yè)務(wù)架構(gòu)采用一線、二線兩個(gè)級(jí)別。一線值班并報(bào)告故障內(nèi)容,二線值班負(fù)責(zé)排查并去除故障,之后反饋一線。
同時(shí),業(yè)務(wù)監(jiān)控系統(tǒng)還應(yīng)作為二線進(jìn)行故障追溯和關(guān)聯(lián)分析的輔助工具。
1.3.1 典型的實(shí)時(shí)數(shù)據(jù)庫(kù)業(yè)務(wù)數(shù)據(jù)流程
實(shí)時(shí)庫(kù)作為系統(tǒng)的監(jiān)視對(duì)象,其流程直接影響系統(tǒng)的監(jiān)視內(nèi)容的設(shè)計(jì),以圖2典型的實(shí)時(shí)業(yè)務(wù)流程進(jìn)行簡(jiǎn)要分析說(shuō)明。
流程中,報(bào)文數(shù)據(jù)首先進(jìn)行入庫(kù)前預(yù)處理,報(bào)文經(jīng)過(guò)格式檢查并解析后按照分類歸并,再存放于一定目錄組織形式的臨時(shí)文件庫(kù)中,格式檢查錯(cuò)誤信息被寫(xiě)入日志。入庫(kù)處理進(jìn)程從臨時(shí)文件庫(kù)中提取數(shù)據(jù)并存入關(guān)系型數(shù)據(jù)庫(kù)或文件庫(kù)中,期間經(jīng)過(guò)質(zhì)量控制算法發(fā)現(xiàn)的異常值寫(xiě)入要素異常值日志。對(duì)外服務(wù)平臺(tái)從數(shù)據(jù)庫(kù)中提取信息,以程序接口、文件推送、查詢服務(wù)等多種形式對(duì)外提供實(shí)時(shí)數(shù)據(jù)服務(wù)。
圖2 實(shí)時(shí)數(shù)據(jù)業(yè)務(wù)流程
1.3.2 監(jiān)控對(duì)象需求
由上述流程可以看出,實(shí)時(shí)氣象資料數(shù)據(jù)庫(kù)系統(tǒng)的監(jiān)視對(duì)象至少包括2個(gè)方面:數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行監(jiān)視和數(shù)據(jù)處理流程監(jiān)視。
數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行監(jiān)視包括數(shù)據(jù)庫(kù)管理系統(tǒng)運(yùn)行狀態(tài)監(jiān)視、空間監(jiān)視和用戶行為監(jiān)視。重點(diǎn)包括底層的商用數(shù)據(jù)庫(kù)的關(guān)鍵進(jìn)程監(jiān)視、表空間監(jiān)視、CPU與磁盤(pán)利用率等系統(tǒng)資源監(jiān)視。
數(shù)據(jù)流程監(jiān)視包括來(lái)報(bào)數(shù)量統(tǒng)計(jì)、應(yīng)到報(bào)缺報(bào)統(tǒng)計(jì)、未處理資料統(tǒng)計(jì)、數(shù)據(jù)入庫(kù)統(tǒng)計(jì)、錯(cuò)報(bào)統(tǒng)計(jì)、處理進(jìn)程狀態(tài)監(jiān)視、數(shù)據(jù)備份和清除監(jiān)視。監(jiān)控對(duì)象重點(diǎn)是對(duì)實(shí)時(shí)資料(地面、高空、國(guó)外數(shù)值預(yù)報(bào)產(chǎn)品等)入庫(kù)情況、關(guān)鍵進(jìn)程運(yùn)行狀態(tài)、數(shù)據(jù)處理臨時(shí)目錄文件積壓狀態(tài)、數(shù)據(jù)質(zhì)量監(jiān)測(cè)等,并提供各省入庫(kù)詳情的查詢。
1.3.3 告警級(jí)別
監(jiān)控系統(tǒng)根據(jù)關(guān)鍵性能指標(biāo)(Key Performance Indicator,KPI)計(jì)算監(jiān)控對(duì)象狀態(tài)所處的風(fēng)險(xiǎn)值,由該值確定告警級(jí)別。系統(tǒng)將風(fēng)險(xiǎn)值分為5個(gè)級(jí)別(見(jiàn)表1),最終界面顯示的告警級(jí)別則將5個(gè)級(jí)別歸并為異常、警告、正常3個(gè)級(jí)別,用紅、黃、綠不同顏色標(biāo)識(shí)。
風(fēng)險(xiǎn)計(jì)算公式為:
F通常取一個(gè)線性函數(shù)集合,即在不同的定義域范圍內(nèi)選取不同的線性函數(shù),以體現(xiàn)隨著監(jiān)控對(duì)象狀態(tài)值在一定條件下不斷上升,將導(dǎo)致風(fēng)險(xiǎn)值線性增長(zhǎng)。通過(guò)與KPI的比較分析計(jì)算得到的風(fēng)險(xiǎn)值為一個(gè)數(shù)字,不同的取值范圍決定了不同的風(fēng)險(xiǎn)級(jí)別,風(fēng)險(xiǎn)級(jí)別劃分為5個(gè)等級(jí):
表1 事件狀態(tài)風(fēng)險(xiǎn)值級(jí)別
系統(tǒng)的架構(gòu)選擇沒(méi)有采用廣泛的Brower/Server架構(gòu),而是采用Client/Server架構(gòu)。關(guān)于“胖”、“瘦”客戶端的優(yōu)缺點(diǎn)爭(zhēng)論由來(lái)已久。胖客戶端的優(yōu)勢(shì)在于優(yōu)良的客戶體驗(yàn)以及可以離線操作,瀏覽器的優(yōu)勢(shì)在于易于部署管理,全部數(shù)據(jù)存儲(chǔ)在服務(wù)器,不存在數(shù)據(jù)同步問(wèn)題。事實(shí)上,現(xiàn)在胖客戶端通過(guò)不同的技術(shù)革新已遠(yuǎn)不是過(guò)去傳統(tǒng)意義上的胖客戶端,例如Java的RCP[4-6]以及.NET平臺(tái)上的Smart Client[7]解決方案都具有廣泛成功案例。不存在任何情況下都能始終保持優(yōu)勢(shì)的唯一方案,方案選擇更多依據(jù)實(shí)際需要。系統(tǒng)選擇胖客戶端主要基于如下考慮:
(1)首先最重要的一點(diǎn),是希望利用客戶端的資源為值班人員提供更加友善的用戶體驗(yàn)。這樣監(jiān)控客戶端既可充分使用客戶端的硬件資源和軟件資源,也可利用客戶端本地存儲(chǔ)能力。
(2)通過(guò)一個(gè)集中的服務(wù)器,客戶端通過(guò)網(wǎng)絡(luò)可以非常容易地實(shí)現(xiàn)部署和自動(dòng)更新,不再出現(xiàn)傳統(tǒng)胖客戶端程序會(huì)出現(xiàn)的各客戶端版本不同的情況。
(3)系統(tǒng)整體功能劃分上,考慮客戶端負(fù)責(zé)數(shù)據(jù)展現(xiàn)和人機(jī)交互,而服務(wù)器負(fù)責(zé)數(shù)據(jù)處理和業(yè)務(wù)邏輯。
圖3為監(jiān)控系統(tǒng)架構(gòu)設(shè)計(jì)圖。
在整個(gè)監(jiān)控框架中,系統(tǒng)通過(guò)部署在各監(jiān)控對(duì)象上的代理程序(agent)采集各種運(yùn)行狀況信息,形成標(biāo)準(zhǔn)化的XML格式監(jiān)控原始數(shù)據(jù),提交給上層的數(shù)據(jù)及規(guī)則處理層。該層獲得原始數(shù)據(jù)后,再根據(jù)在客戶端和服務(wù)器端始終保持一致的全局規(guī)則及處理策略,對(duì)原始數(shù)據(jù)經(jīng)過(guò)基于統(tǒng)計(jì)、基于規(guī)則的關(guān)聯(lián)分析后,形成監(jiān)控展示信息及報(bào)警數(shù)據(jù),以標(biāo)準(zhǔn)化的XML形式,通過(guò)HTTP協(xié)議傳輸給展示層。展示層對(duì)XML文件進(jìn)行解析,根據(jù)客戶端的顯示配置文件,定制圖形化展示各個(gè)監(jiān)控對(duì)象的運(yùn)行狀況,并對(duì)異常情況進(jìn)行聲音報(bào)警。
采用agent方法的優(yōu)勢(shì)在于分布式部署方便靈活,擴(kuò)充方便,并且不會(huì)對(duì)之前監(jiān)控內(nèi)容造成影響;另外,為便于系統(tǒng)整合,agent數(shù)量可以隨意增減,每個(gè)監(jiān)控對(duì)象可以用一個(gè)agent采集,也可多個(gè)監(jiān)控對(duì)象由一個(gè)agent采集。
圖3 實(shí)時(shí)庫(kù)業(yè)務(wù)監(jiān)控系統(tǒng)架構(gòu)
對(duì)業(yè)務(wù)監(jiān)控系統(tǒng),必須支持對(duì)監(jiān)控規(guī)則的靈活配置和調(diào)整,以應(yīng)對(duì)加密觀測(cè)和突發(fā)應(yīng)急服務(wù)事件需要,因?yàn)檫@些情況下往往需要對(duì)部分規(guī)則進(jìn)行調(diào)整,如地震期間對(duì)某些重點(diǎn)關(guān)心區(qū)域應(yīng)到站入庫(kù)情況格外關(guān)注,甚至要求必須規(guī)定時(shí)間內(nèi)全部入庫(kù),對(duì)這些應(yīng)到站的報(bào)警閾值就會(huì)調(diào)高已滿足監(jiān)控需要。
系統(tǒng)通過(guò)靈活的監(jiān)控策略配置文件并建立一套系統(tǒng)的監(jiān)控規(guī)則語(yǔ)法描述,實(shí)現(xiàn)規(guī)則驅(qū)動(dòng)下的監(jiān)控內(nèi)容靈活調(diào)整功能。系統(tǒng)將XML格式作為策略配置文件基本格式,并參考?xì)庀笮袠I(yè)元數(shù)據(jù)特點(diǎn)[8],制定出XML規(guī)范下的規(guī)則策略描述形式。數(shù)據(jù)庫(kù)監(jiān)控策略中需考慮的常見(jiàn)因素如提供者、數(shù)據(jù)庫(kù)及表、響應(yīng)方法、閾值、頻率、時(shí)間及邏輯計(jì)算、規(guī)則屬性及內(nèi)容等,在配置文件中皆使用相應(yīng)XML的標(biāo)簽項(xiàng)(Tag)和屬性值定義表示。
當(dāng)各種規(guī)則及監(jiān)控參數(shù)變更時(shí),通過(guò)XML中的標(biāo)簽項(xiàng)及屬性值予以執(zhí)行。
系統(tǒng)通過(guò)HT TP協(xié)議向客戶端返回XML格式監(jiān)控?cái)?shù)據(jù)結(jié)果。也就是說(shuō),監(jiān)控結(jié)果作為一種服務(wù)器資源,可以簡(jiǎn)單用類似http://localhost/rdbcat/output/device/01這樣形式的URI表示并獲取,并且每一個(gè)會(huì)話都是無(wú)狀態(tài)的,可重復(fù)使用URI訪問(wèn)監(jiān)控結(jié)果資源。這一點(diǎn)上正好符合REST(Representational State Transfer)[9]架構(gòu)思想,即利用簡(jiǎn)便易行的方式滿足遠(yuǎn)程信息獲取的需要。
REST方法引入的另一優(yōu)勢(shì)就是系統(tǒng)監(jiān)控結(jié)果可以方便整合進(jìn)入其他監(jiān)控平臺(tái),因?yàn)橥獠科脚_(tái)獲取系統(tǒng)監(jiān)控結(jié)果資源的方法十分簡(jiǎn)單,采用URI訪問(wèn)即可獲得監(jiān)控結(jié)果(XML形式),然后按照XML描述規(guī)則解析內(nèi)容即可完成整合。
系統(tǒng)監(jiān)控結(jié)果沒(méi)有采用一個(gè)大而全的形式表示,而是分而治之,依照監(jiān)控對(duì)象的分類劃分為資料入庫(kù)、統(tǒng)計(jì)、設(shè)備、進(jìn)程等多個(gè)XML文件,便于未來(lái)與其他系統(tǒng)整合時(shí),外部系統(tǒng)僅提取所關(guān)心監(jiān)控結(jié)果文件即可。
以下為資料入庫(kù)狀況的結(jié)果XML文件示例。
此外,為降低運(yùn)維復(fù)雜度,系統(tǒng)還為一二線值班人員進(jìn)行展示及功能的特殊功能設(shè)計(jì),如集中告警及處理,自動(dòng)遠(yuǎn)程升級(jí),日志查詢統(tǒng)計(jì),各省未入庫(kù)站點(diǎn)分省統(tǒng)計(jì),要素異常值報(bào)警等。實(shí)時(shí)庫(kù)監(jiān)控系統(tǒng)客戶端運(yùn)行展示界面如圖4所示。
圖4 實(shí)時(shí)庫(kù)業(yè)務(wù)監(jiān)控系統(tǒng)界面
隨著氣象業(yè)務(wù)發(fā)展,對(duì)實(shí)時(shí)數(shù)據(jù)庫(kù)進(jìn)行有效服務(wù)監(jiān)控越來(lái)越重要。一方面,隨著數(shù)據(jù)庫(kù)系統(tǒng)自身龐雜程度以及業(yè)務(wù)系統(tǒng)技術(shù)復(fù)雜度的提高,對(duì)整個(gè)系統(tǒng)基礎(chǔ)架構(gòu)維持良好狀態(tài)的要求不斷增強(qiáng);另一方面,實(shí)時(shí)業(yè)務(wù)對(duì)實(shí)時(shí)數(shù)據(jù)庫(kù)的業(yè)務(wù)依賴性逐步加深,實(shí)時(shí)庫(kù)服務(wù)在業(yè)務(wù)供應(yīng)方面所扮演的角色也變得日益重要。業(yè)務(wù)依賴性的直接結(jié)果是,任何服務(wù)故障都會(huì)很快被各級(jí)用戶很快感受到,從而使其對(duì)氣象部門(mén)對(duì)外服務(wù)能力產(chǎn)生嚴(yán)重影響。
實(shí)時(shí)庫(kù)監(jiān)控系統(tǒng)自2008年奧運(yùn)會(huì)期間業(yè)務(wù)上線運(yùn)行后,一直作為重要業(yè)務(wù)保障,提升氣象信息部門(mén)在應(yīng)對(duì)實(shí)時(shí)庫(kù)突發(fā)故障事件時(shí)的響應(yīng)能力,從而有力地支撐實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定運(yùn)行。系統(tǒng)通過(guò)采用服務(wù)監(jiān)控處理流程,能夠不斷改進(jìn)監(jiān)控方式以配合業(yè)務(wù)和技術(shù)變動(dòng),在發(fā)生服務(wù)事故時(shí)提高響應(yīng)能力,從而降低對(duì)業(yè)務(wù)的影響。經(jīng)過(guò)兩年多業(yè)務(wù)實(shí)踐的充分檢驗(yàn),監(jiān)控系統(tǒng)部署靈活、運(yùn)行穩(wěn)定、界面友好、升級(jí)方便、運(yùn)維簡(jiǎn)便,已成為數(shù)據(jù)服務(wù)方面的重要業(yè)務(wù)保障系統(tǒng),實(shí)現(xiàn)了預(yù)期設(shè)計(jì)目標(biāo),并為未來(lái)信息中心建立統(tǒng)一的大運(yùn)維監(jiān)控平臺(tái)奠定技術(shù)基礎(chǔ)。
致謝:感謝國(guó)家氣象信息中心沈文海、高華云、琚玲、劉媛媛、周崢嶸、楊昕等大力協(xié)助和支持,以及眾多一線值班人員的業(yè)務(wù)應(yīng)用反饋支持;感謝張小纓對(duì)系統(tǒng)后續(xù)業(yè)務(wù)發(fā)展方向上的重要建議。
[1] 沈文海,趙芳,高華云,等.國(guó)家級(jí)氣象資料存儲(chǔ)檢索系統(tǒng)的建立[J].應(yīng)用氣象學(xué)報(bào),2004,6.
[2] 趙芳,高峰.如何保障實(shí)時(shí)氣象資料的管理[J].中國(guó)計(jì)算機(jī)報(bào),2007.
[3] Baron Anthony,Pizzo Kathryn,Sarabosing Michael.Methods for service monitoring and control,US Application Publication,Publication No.US 2006/0064486 A1 published on 23-Mar-2006[EB/OL].http://ip.com/patapp/US20060064486.
[4] Rich Client Platform.[EB/OL].http://www.eclipse.org/rcp.
[5] Ed Burnette.SAS.Rich Client Tutorial Part[EB/OL].http://www.eclipse.org.
[6] Jeff McAffer,Jean-Michel Lemieux.Eclipse Rich Client Platform-Designing,Coding,and Packaging Java Applications[D].NY:Addison-Wesley Professional,2005.
[7] Smart Client Application Model and the.NET Framework 1.1,Microsoft[EB/OL].http:∥msdn.microsoft.com.
[8] 王國(guó)復(fù),徐楓,吳增祥.氣象元數(shù)據(jù)標(biāo)準(zhǔn)與信息發(fā)布技術(shù)研究[J].應(yīng)用氣象學(xué)報(bào),2005,1.
[9] Roy Fielding.Architectural Styles and the Design of Network-based Software Architectures[D].University of California-Irvine,2000.