• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺析民航氣象數(shù)據(jù)庫系統(tǒng)巡檢

      2018-11-20 10:50:58楊浩
      世界家苑 2018年11期
      關(guān)鍵詞:巡檢故障處理

      楊浩

      摘 要:民航氣象數(shù)據(jù)庫系統(tǒng)是民航氣象業(yè)務(wù)的核心信息系統(tǒng),其24小時不間斷的運轉(zhuǎn)保證了氣象業(yè)務(wù)的正常開展,本文重點闡述了數(shù)據(jù)庫系統(tǒng)設(shè)備巡檢的內(nèi)容。

      關(guān)鍵詞:民航氣象數(shù)據(jù)庫系統(tǒng);巡檢;AIX;故障處理

      引言

      民航數(shù)據(jù)庫系統(tǒng)是民航氣象業(yè)務(wù)的核心信息系統(tǒng),它采用一套分級的,包含發(fā)送、請求、響應、回復、轉(zhuǎn)發(fā)等多種功能的,復雜的數(shù)據(jù)交換模式,實現(xiàn)了實時收集、處理、儲存、交換民航國內(nèi)、國際飛行所需的綜合航空氣象情報信息的功能,提供給用戶氣象資料自動分析和制作等功能,為航空氣象用戶提供航空氣象產(chǎn)品[1]。

      1配置分析

      民航氣象數(shù)據(jù)庫系統(tǒng)分為三級體系架構(gòu),每一級根據(jù)業(yè)務(wù)處理能力的實際需求進行不同的配置,同級間則采用了相同的配置。本場屬于民航氣象第三級數(shù)據(jù)庫系統(tǒng),系統(tǒng)由一臺ibm system p520 作為數(shù)據(jù)庫服務(wù)器,一臺ibm system p520 作為應用服務(wù)器,一臺DELL OPTIPLEX 745作為通信服務(wù)器,采用cisco2960 交換機作為本地網(wǎng)絡(luò)的核心交換機,通過cisco2851 路由器與所在地區(qū)氣象中心數(shù)據(jù)庫相連,利用cisco pix 515e 作為安全隔離。在數(shù)據(jù)庫服務(wù)器和應用服務(wù)器上,均安裝了AIX操作系統(tǒng)并搭配目前功能最強大的ORACLE數(shù)據(jù)庫,而通信服務(wù)器則安裝了Linux操作系統(tǒng)[2]。

      2數(shù)據(jù)庫主機系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)與數(shù)據(jù)庫巡檢

      通過本場一次氣象數(shù)據(jù)庫系統(tǒng)硬盤自身驅(qū)動器監(jiān)控報錯故障處理分析,結(jié)合AIX系統(tǒng)管理技術(shù)學習,總結(jié)出了民航氣象數(shù)據(jù)庫系統(tǒng)在維護時對主機系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、數(shù)據(jù)庫進行巡檢的方法及命令總結(jié),以便發(fā)現(xiàn)問題及時處理。在巡檢中可以使用工具Secure CRT,它的記錄功能非常實用,方便對巡檢過程進行保存和后期檢查。

      2.1主機系統(tǒng)

      針對濟南本場的情況,數(shù)據(jù)庫系統(tǒng)主機系統(tǒng)的巡檢包括了數(shù)據(jù)庫服務(wù)器DB00、數(shù)據(jù)庫服務(wù)器DB01、通信服務(wù)器,其中數(shù)據(jù)庫服務(wù)器安裝的是AIX操作系統(tǒng),通信服務(wù)器安裝的是Linux操作系統(tǒng)。

      2.1.1數(shù)據(jù)庫服務(wù)器的巡檢內(nèi)容

      (1)用命令errpt查看日常報錯,一旦系統(tǒng)的某個功能模塊檢測到一個錯誤或定義的需要記錄日志的事件,則記錄到/dev/error,錯誤進程errdemon從/dev/error文件中讀取錯誤日志,然后根據(jù)錯誤模板庫(/var/adm/ras/errtmpit)和錯誤消息庫(/usr/lib/nls/msg/$LANGcodedepoint.cat)對其進行處理后寫入系統(tǒng)的錯誤日志/var/adm/ras/errlog中,正常情況下錯誤進程errdemon處于開啟狀態(tài),當使用more或者其他文本的查看命令來打開errlog文件,看到的只有亂碼,為了能夠查看日志,需要使用errpt命令,命令執(zhí)行后輸出的六列內(nèi)容分別為錯誤標示符、時間戳、類型、種類、資源名和描述。

      當需要查看詳細報錯內(nèi)容時,需要輸入指令errpt –aj +錯誤代碼。在軟件錯誤日志中的故障原因(Failure Causes)通常是指一個軟件缺點,如果有用戶原因(User Causes)或安裝原因(Install Causes)或二者都有,而沒有故障原因,那么問題通常不是軟件的缺點。而對硬件設(shè)備進行診斷的時候,最常用的是并發(fā)模式下診斷硬件設(shè)備,在root用戶下使用diag命令進入診斷主菜單,按照現(xiàn)場情況采用Diagnostic Routines和Advanced Diagnostic Routines進行硬件檢測。需要注意的是在做diag診斷時,并發(fā)模式下是比較危險的,可以選擇停止服務(wù)器的服務(wù)和業(yè)務(wù)后再做,可以避免可能出現(xiàn)的系統(tǒng)崩潰問題[3]。

      用戶原因(User Causes)、安裝原因(Install Causes)和故障原因(Failure Causes)只是一般的建議,更換部件則需要根據(jù)診斷和對錯誤日志的分析結(jié)果來確定。

      (2)用命令lsvg –l rootvg查看系統(tǒng)rootvg內(nèi)的每個邏輯卷的以下信息,LV:卷組內(nèi)的一個邏輯卷;Type:邏輯卷類型;LPs:邏輯卷中的邏輯分區(qū)數(shù);PPs:邏輯卷使用的物理分區(qū)數(shù);PVs:邏輯卷使用的物理卷數(shù);Logical volume state:邏輯卷的狀態(tài);Opened/stale:表示邏輯卷是打開的但包含的分區(qū)不是當前的;Opened/syncd:表示邏輯卷是打開和同步的,Closed 表示邏輯卷還沒有打開;Mount point:邏輯卷的文件系統(tǒng)安裝點。

      (3)用命令topas查看系統(tǒng)CPU使用率和工作狀態(tài),具體每項內(nèi)容分為Kernel:

      操作系統(tǒng)的內(nèi)核占用的CPU時間比率;User:用戶進程占用的CPU時間比率;Wait:CPU處于等待狀態(tài)占CPU時間的比率;Idle:CPU空閑時間比率。Real:MB操作系統(tǒng)實際擁有的內(nèi)存的總量,單位是MB;%Comp,計算型內(nèi)存占用比率;%Noncomp非計算型內(nèi)存占用的比率;%Client也為非計算型內(nèi)存,Noncomp包涵Client型內(nèi)存,jfs文件系統(tǒng)使用的內(nèi)存為noncomp,為了區(qū)分,jfs2和nfs使用的內(nèi)存為Client。

      (4)用命令df –g以G為單位查看磁盤使用率,當一個文件系統(tǒng)空間被占滿之后,就會導致大量的問題出現(xiàn),甚至系統(tǒng)崩潰,因此最好要避免這種情況的發(fā)生。

      (5)用命令lsps –a查看內(nèi)存交換區(qū)使用率,濟南本場情況為運行時間5個月的服務(wù)器,2G內(nèi)存基本耗盡,交換分區(qū)使用了百分之三十至四十,重啟后降至百分之十,在系統(tǒng)內(nèi)存耗盡并且交換分區(qū)使用率達到百分之八十以上時,系統(tǒng)崩潰的可能性增大,需要考慮增加物理內(nèi)存。

      (6)用命令svmon查看系統(tǒng)內(nèi)存使用率。在非常繁忙的系統(tǒng)中,svmon收集的數(shù)據(jù)和真實的數(shù)據(jù)會有所差距,因為svmon使用的全是VMM中的數(shù)據(jù),而在svmon進程搜集的過程中,VMM(虛存管理器)可能已經(jīng)發(fā)生改動了。

      在使用svmon命令時,也可以增加參數(shù)來輸出需要的更為詳細的內(nèi)容,例如svmon –G是全局統(tǒng)計信息,svmon –U root oracle –w是輸出只考慮工作段的用戶 root 和 steve 的內(nèi)存使用統(tǒng)計信息等。

      (7)用命令lspv 硬盤名(例如hisk0)主要用來顯示卷組(Volume)中的物理卷(PV,Physical Volume)信息,在輸出信息中需要關(guān)注硬盤是否有陳舊(stale)塊,若存在陳舊分區(qū)、邏輯卷或物理卷,可以嘗試使用syncvg命令來同步它們。

      (8)網(wǎng)絡(luò)巡檢主要利用命令:ifconfig –a;netstat –rn;netstat –i,依次檢查所有網(wǎng)絡(luò)接口的信息、核心路由表、通過接口傳送數(shù)據(jù)包的數(shù)量以及輸入/輸出的錯誤數(shù)。

      2.1.2通信服務(wù)器的巡檢內(nèi)容

      (1)用命令df –h以GB,MB,KB等查看磁盤利用率。linux文件系統(tǒng)的內(nèi)核在識別和使用文件系統(tǒng)時需要利用virtual filesystem switch(虛擬文件系統(tǒng))來讀取文件系統(tǒng),也就是說整個LINUX的文件系統(tǒng)都是VFS在進行管理的,我們用戶并不需要知道每個分區(qū)上頭的文件系統(tǒng)是什么,VFS會主動幫我們做好讀取工作,有了VFS我們可以不用去指定讀取的是哪一個文件系統(tǒng),只需要輸入指令進行查看即可。

      (2)用命令top可以查看系統(tǒng)的狀態(tài),比如CPU、內(nèi)存的使用。具體輸出內(nèi)容包括當前系統(tǒng)時間、登陸系統(tǒng)的用戶數(shù)量、負載情況、任務(wù)進程、CPU狀態(tài)、內(nèi)存狀態(tài)、swap交換分區(qū)狀態(tài)內(nèi)存總量以及各個進程的狀態(tài)監(jiān)控。另外,使用free命令也可以查看swap交換分區(qū)使用率。

      (3)MQ應用方面巡檢,需要查看通道狀態(tài)使用命令showchl,正常狀態(tài)應顯示:Running,若未啟動,則需要使用命令runmqchl進行啟動。查看隊列狀態(tài)使用命令showque,正常狀態(tài)應顯示:0,如隊列有積壓,則檢查通道狀態(tài)。

      (4)使用ifconfig –a;netstat –rn;netstat –i命令依次檢查配置信息、路由表、網(wǎng)絡(luò)接口情況,對網(wǎng)絡(luò)進行巡檢。

      2.2網(wǎng)絡(luò)系統(tǒng)

      民航數(shù)據(jù)庫系統(tǒng)網(wǎng)絡(luò)系統(tǒng)巡檢需要檢查的內(nèi)容包括了交換機cisco3750、路由器cisco2851和防火墻pix515,下面針對濟南本場具體情況結(jié)合需要的命令進行介紹。

      2.2.1檢查cpu使用率

      在交換機和路由器中,使用命令show processes cpu可以輸出CPU在最后5秒的使用率、最后1分鐘的使用率和最后5分鐘的使用率,同時顯示正在運行的進程狀態(tài)。在防火墻中則需要使用命令show cpu usage。

      2.2.2檢查內(nèi)存使用率

      在交換機、路由器和防火墻中均使用show memory命令查看內(nèi)存使用率,具體輸出內(nèi)容為使用內(nèi)存情況的統(tǒng)計信息,包括空閑池統(tǒng)計信息。

      2.2.3設(shè)備電源及風扇

      在交換機和路由器中使用show env temp命令可以查看設(shè)備電源、風扇、溫度,其中交換機需要注意RPS正確顯示為NOT PRESENT。

      2.2.4檢查log日志

      在交換機、路由器和防火墻中均使用show log命令檢查log日志,主要包括了Syslog logging、Console logging、Monitor logging、Buffer logging、Trap logging幾個項目。

      2.3數(shù)據(jù)庫

      本部分介紹ORACLE數(shù)據(jù)的檢查內(nèi)容,專門列出了數(shù)據(jù)庫狀態(tài)、告警日志文件、數(shù)據(jù)庫連接、數(shù)據(jù)文件的狀態(tài)、表空間使用情況和數(shù)據(jù)庫等待事件的檢查方法及命令。

      2.3.1檢查數(shù)據(jù)庫狀態(tài)

      確認所有的INSTANCE狀態(tài)以及l(fā)istener狀態(tài)正常,登陸到所有數(shù)據(jù)庫或?qū)嵗?,檢測ORACLE后臺進程,RAC狀態(tài)等。具體命令分別為oracle@ZSJN $ps -ef|grep ora;oracle@ZSJN $lsnrctl status;SQL>select status from V$instance。

      2.3.2檢查告警日志文件

      數(shù)據(jù)庫發(fā)生的錯誤,如表空間不夠、出現(xiàn)壞塊、數(shù)據(jù)庫內(nèi)部錯誤(ORA-600)定期檢查日志文件,根據(jù)日志中發(fā)現(xiàn)的問題及時進行處理;包括alert,trc,listener日志其中alert位置:/u0/oracle/admin/ ZSJN /bdump;trc位置:/u0/oracle/admin/ ZSJN /bdump;listener位置:/u0/oracle/product/10.2.0/db/network/log。

      2.3.3檢查數(shù)據(jù)庫連接信息

      定時對數(shù)據(jù)庫的連接情況進行檢查,看與數(shù)據(jù)庫建立的會話數(shù)目是不是正常,如果建立了過多的連接,會消耗數(shù)據(jù)庫的資源。同時,對一些“掛死”的連接,可能需要手工進行清理。利用命令SQL>select count(*)from v$session;和SQL>select sid,username,program,status from v$session;進行檢查。

      2.3.4檢查數(shù)據(jù)文件的狀態(tài)

      如果數(shù)據(jù)文件的STATUS列不是AVAILABLE,那么就要采取相應的措施,如對該數(shù)據(jù)文件進行恢復操作,或重建該數(shù)據(jù)文件所在的表空間。參考命令

      SQL>select file_name,status from dba_data_files;

      SQL>select count(*)from dba_data_files;

      SQL>select count(*)from dba_data_files;

      2.3.5檢查表空間使用情況

      檢查表空間使用情況的命令是SQL>select f.tablespace_name,a.total,f.free,round((f.free/a.total)*100)"% Free"

      from(select tablespace_name,sum(bytes/(1024*1024))total from dba_data_files

      group by tablespace_name)a,(select tablespace_name,round

      (sum(bytes/(1024*1024)))free from dba_free_space group by tablespace_name)f WHERE a.tablespace_name=f.tablespace_name(+)order by "% Free"。

      2.3.6檢查數(shù)據(jù)庫的等待事件

      如果數(shù)據(jù)庫長時間持續(xù)大量像latch free,enqueue,buffer busy waits,db file sequential read,db file scattered read等等待事件時,需要對其進行分析,可能存在問題的語句。使用到的命令是SQL>select sid,event,p1,p2,p3,WAIT_TIME,SECONDS_IN_WAIT from v$session_wait where event not like 'SQL%' and event not like 'rdbms%'。

      參考文獻

      [1]梁帆. 民航氣象第三級數(shù)據(jù)庫系統(tǒng)管理維護和典型故障處理.硅谷.2011,24:124-125.

      [2]張迪馨. 民航二期氣象數(shù)據(jù)庫系統(tǒng)主機維護經(jīng)驗總結(jié).空中交通管理.2007,08:45-46.

      [3]于宇斌,IBM UNIX&Linux;—AIX 5L系統(tǒng)管理技術(shù)[M].北京:電子工業(yè)出版社.2005.

      (作者單位:中國民用航空空中交通管理局華東地區(qū)山東分局)

      猜你喜歡
      巡檢故障處理
      基于NFC技術(shù)的智能巡檢系統(tǒng)設(shè)計
      變電站設(shè)備巡檢中無人機的應用與探析
      對電纜隧道運行中巡檢機器人技術(shù)的研究
      無人機巡檢輸電線路技術(shù)的應用分析
      高校網(wǎng)絡(luò)維護與故障處理探析
      電力變壓器高壓試驗技術(shù)及故障處理
      鋼鐵冶煉機械設(shè)備的故障診斷及處理分析
      中國市場(2016年41期)2016-11-28 05:34:44
      天然氣管道運行中常見設(shè)備故障及處理對策
      大型化工裝置儀表自控系統(tǒng)的故障處理研究
      基于計算機網(wǎng)絡(luò)故障處理及網(wǎng)絡(luò)維護方法研究
      科技視界(2016年20期)2016-09-29 12:11:09
      中山市| 宁强县| 洛浦县| 清苑县| 万宁市| 武安市| 浙江省| 金门县| 东平县| 太白县| 南岸区| 水城县| 汕头市| 镇原县| 周至县| 沐川县| 吉首市| 苗栗县| 哈巴河县| 边坝县| 五华县| 织金县| 随州市| 泸州市| 益阳市| 古丈县| 玉龙| 阳山县| 车致| 巴中市| 北安市| 乐都县| 高安市| 勐海县| 长葛市| 赣榆县| 科技| 咸宁市| 凌源市| 宜章县| 南澳县|