摘要:氣象數(shù)據(jù)庫系統(tǒng)主要由通信分系統(tǒng)、數(shù)據(jù)庫分系統(tǒng)、預報平臺、服務平臺四部分組成。通信部分主要負責各種氣象資料的接收與發(fā)送;數(shù)據(jù)庫部分主要負責對各類數(shù)據(jù)進行分解,處理、存儲;預報人員可以通過預報平臺查詢和檢索相關信息,分析和制作各種天氣預報產(chǎn)品,分發(fā)給需要的用戶;服務平臺供各用戶瀏覽、提取氣象資料。本文通過整理有關技術資料,介紹數(shù)據(jù)庫架構,分析氣象數(shù)據(jù)庫常見故障—報文無法入庫的解決方法。
關鍵詞:氣象數(shù)據(jù)庫系統(tǒng);通信服務器;日志;連接數(shù)
1 引言
通信分系統(tǒng)是民航氣象數(shù)據(jù)庫系統(tǒng)中的基礎系統(tǒng)之一,主要實現(xiàn)航站內各類氣象資料的接收、質量檢查、格式轉換處理,并根據(jù)事先確定的規(guī)則向航站內其他系統(tǒng)和上下節(jié)點分發(fā)資料,實現(xiàn)數(shù)據(jù)交換。本文為了使用、維護的方便,對如何處置氣象報文未入庫的情況進行分析。
2 環(huán)境參數(shù)文件(mssini.ini)
MSSINI.INI文件是通信系統(tǒng)軟件的環(huán)境參數(shù)文件,它包含多個子文件:
mssmmo.ini 公共區(qū)分配和排隊限制表
msslin.ini 線路類型及線路特性定義表
mssfdv.ini 文件設備表
mssprq.ini 排隊及偽通道定義表
mssfil.ini 文件管理表
mssblo.ini 文件鎖表
mssrft.ini 報告格式表
mssamt.ini 本站CCCC和KK定義表
其中mssmmo.ini、mssfdv.ini、mssblo.ini、mssprq.ini、mssfil.ini、mssrft.ini等表格是程序內部使用的,用戶不要變動。下面對需要變動的表格做具體說明。
3線路定義表
為了能夠按數(shù)據(jù)來源進行留底和記錄統(tǒng)計信息,線路的含義已經(jīng)超出其物理含義,即在線路表中定義的線路,有物理上連接到路由器上的,有通過MQ通信隊列進行連接的,還有通過網(wǎng)絡協(xié)議ftp連接的。在本分系統(tǒng)的缺省目錄下,有一個專門作為從其他系統(tǒng)接收各種資料的目錄——receive,對于所有的外部系統(tǒng)都有相應的目錄,對于每一個目錄,我們也將其看作一條線路。按其連接方式可分為兩種類型:
(1)對于連接到路由器上的線路,可定義lcode為R的線路,其lmode可以根據(jù)連接的另一端的特性決定;
(2)通過網(wǎng)絡連接到本分系統(tǒng)的所有外部系統(tǒng),lcode可定義為N,其中通過MQ傳送資料的外部系統(tǒng),lmode定義為M;而采用ftp將資料傳到receive下相應目錄的,其lmode定義為G。
4 Mput進程處理選項配置表(Mput.cfg)
Mput進程用于處理用戶手工放置的氣象報文/產(chǎn)品資料和通過ftp線路傳輸過來的氣象報文/產(chǎn)品資料。該進程具體處理receive目錄下的哪些類型資料由config目錄下的Mput.cfg配置文件指定。Mput.cfg文件內容如下:
############ parameter of Mput program #################
############ '#' is the symbol of comment #################
#9210
#wafs
#plot
#sapt
caac
#rout
#netw
#tele
othe
zxxx
#rada
#awos
#wind
#auto
#meda
(#字符號表示該選項被注釋,Mput進程不處理receive目錄下的對應子目錄)
5 常見報文無法入庫案例分析
某日,預報反映統(tǒng)一平臺提示231212時次FT報未入庫告警,查看華東網(wǎng)、合肥置頂報文監(jiān)控軟件均正常。機務員檢查統(tǒng)一平臺監(jiān)控終端,發(fā)現(xiàn)本地數(shù)據(jù)庫紅燈告警。機務員初步判斷報文未入本地庫,在數(shù)據(jù)庫客戶端上查詢DB00和DB01庫中231212時次的FT報文,發(fā)現(xiàn)DB00庫中能查到,DB01庫查詢不到,通信客戶端線路均正常,且自主開發(fā)的報文監(jiān)控軟件上報文加載不成功。重新使用數(shù)據(jù)庫客戶端登錄DB01數(shù)據(jù)庫,提示連接不成功,多次嘗試后登陸成功,但是cac和awos進程掉線。重啟所有進程后,嘗試報文異地查詢手動入庫,未成功,檢查發(fā)現(xiàn)cac和awos進程再次掉線,判斷DB01數(shù)據(jù)庫故障。
經(jīng)請示領導,決定重啟DB01數(shù)據(jù)庫服務器。通知相關用戶,并按照步驟重啟服務器。18:55(北京時)重啟完畢后,1100時次觀測SA報成功入庫。
幾小時后,DB01數(shù)據(jù)庫再次出現(xiàn)cac和awos進程掉線的問題,重啟進程后恢復正常。
使用xftp連接DB01數(shù)據(jù)庫,找到/home/mhdbs/bin/log目錄下的alarm.log告警日志文件,其中記錄了數(shù)據(jù)庫的告警信息:提示的錯誤代碼為“ORA-12519”
通過分析判斷,告警原因為數(shù)據(jù)庫實際連接數(shù)達到上限,導致進程掉線。
1、查詢數(shù)據(jù)庫的實際連接數(shù):
以oracle用戶登錄DB01,進入sqlplus,輸入select count(*) from v$process;系統(tǒng)會顯示數(shù)據(jù)庫的當前的連接數(shù)為45
2、查詢數(shù)據(jù)庫進程數(shù)的上限
輸入select value from v$parameter where name=processes;系統(tǒng)會顯示數(shù)據(jù)庫進程數(shù)的上限
3、將DB01數(shù)據(jù)庫進程數(shù)的上限提高至500
輸入alter system set processes=500 scope=spfile;
4、重啟數(shù)據(jù)庫
再次使用命令查詢數(shù)據(jù)庫進程數(shù)的上限,已修改為500
13 結束語
通信服務器的正常運行,在保障整個數(shù)據(jù)庫系統(tǒng)運行中具有至關重要的作用,各項參數(shù)的正確配置可以使通信服務器準確有效的發(fā)揮效用。對每個參數(shù)的設置將直接影響到系統(tǒng)的使用,故在日常維護中還應多加總結與學習。
參考文獻:
[1]氣象信息系統(tǒng)基礎 崗前培訓教程
[2]民航傳真廣播系統(tǒng)通信分系統(tǒng)使用手冊
作者簡介:高濤(1988-),男,助理工程師,設備維護維修.