劉曉萍,吳曉莉,孫偉杰,董恩強(qiáng),黃雙臨
北京衛(wèi)星導(dǎo)航中心,北京,100094
?
組合多方法快速診斷衛(wèi)星導(dǎo)航系統(tǒng)故障
劉曉萍,吳曉莉,孫偉杰,董恩強(qiáng),黃雙臨
北京衛(wèi)星導(dǎo)航中心,北京,100094
衛(wèi)星導(dǎo)航系統(tǒng)功能多、結(jié)構(gòu)復(fù)雜、集成度高,其故障具有復(fù)雜性、層次性、相關(guān)性、延時(shí)性和不確定性等特點(diǎn)。因此,當(dāng)衛(wèi)星導(dǎo)航系統(tǒng)在實(shí)際運(yùn)行過程中出現(xiàn)故障,單一的故障診斷方法已遠(yuǎn)遠(yuǎn)不能滿足故障診斷的需要。本文主要針對(duì)衛(wèi)星導(dǎo)航系統(tǒng)故障診斷復(fù)雜性的現(xiàn)實(shí)需要,提出了一種多技術(shù)手段融合的衛(wèi)星導(dǎo)航系統(tǒng)故障快速診斷技術(shù),探討了故障快速診斷推理過程,詳細(xì)分析了故障診斷的知識(shí)獲取、知識(shí)表示和診斷推理方法等快速定位故障中的一些關(guān)鍵問題,并利用COMPASS系統(tǒng)實(shí)際數(shù)據(jù)對(duì)該方法進(jìn)行了試驗(yàn)驗(yàn)證。結(jié)果表明:該方法可以對(duì)復(fù)雜故障進(jìn)行快速準(zhǔn)確定位,從而有效提高系統(tǒng)故障診斷的效率,提升了系統(tǒng)故障診斷的智能化水平。
故障診斷;案例推理;案例匹配;相似度;狀態(tài)監(jiān)測(cè)
衛(wèi)星導(dǎo)航系統(tǒng)是復(fù)雜的軟硬件集成系統(tǒng), 其故障具有復(fù)雜性、層次性、相關(guān)性、延時(shí)性和不確定性。系統(tǒng)某一局部的故障往往造成整個(gè)系統(tǒng)的中斷或可用性下降,引發(fā)安全隱患和經(jīng)濟(jì)損失。
衛(wèi)星結(jié)構(gòu)的復(fù)雜性、運(yùn)行環(huán)境的獨(dú)特性和誘發(fā)故障的多源性,使衛(wèi)星故障的診斷與預(yù)測(cè)較一般設(shè)備困難,單粒子翻轉(zhuǎn)等因素會(huì)造成導(dǎo)航業(yè)務(wù)信息中斷等問題。此外,災(zāi)害性空間天氣事件、衛(wèi)星內(nèi)部軟件運(yùn)行異常等原因均會(huì)引起衛(wèi)星導(dǎo)航業(yè)務(wù)信息中斷。衛(wèi)星發(fā)生故障后,就該星向用戶提供的服務(wù)而言,可能產(chǎn)生三種結(jié)果:無法提供服務(wù)、服務(wù)性能下降、錯(cuò)誤服務(wù)。衛(wèi)星較長(zhǎng)時(shí)間處于不可用狀態(tài)是對(duì)衛(wèi)星可用資源與壽命的浪費(fèi),也將降低系統(tǒng)提供導(dǎo)航定位服務(wù)的可用性[1]。
因此,對(duì)衛(wèi)星導(dǎo)航系統(tǒng)故障進(jìn)行快速診斷與恢復(fù),既是保證衛(wèi)星導(dǎo)航系統(tǒng)連續(xù)穩(wěn)定運(yùn)行,最大限度保證系統(tǒng)可用性的需要,也是充分利用衛(wèi)星可用資源與壽命的需要。
由于故障模式多樣、復(fù)雜,因此單一診斷模式已遠(yuǎn)遠(yuǎn)不能滿足故障診斷的需要。為適應(yīng)導(dǎo)航系統(tǒng)故障多樣性要求,必須探索、應(yīng)用新的診斷技術(shù)以適應(yīng)系統(tǒng)要求。一方面,在實(shí)際診斷過程中,只有從多方面獲得關(guān)于診斷對(duì)象的多維信息,才能對(duì)系統(tǒng)進(jìn)行可靠、準(zhǔn)確的診斷;另一方面,隨著所獲取診斷信息的增多,非常有必要引入和研究適用于衛(wèi)星導(dǎo)航故障診斷領(lǐng)域的信息融合技術(shù),充分挖掘信息的內(nèi)涵,并對(duì)多診斷信息進(jìn)行有效地融合利用,從而提高故障診斷的準(zhǔn)確性、有效性和可靠性。本文融合6種診斷方法對(duì)衛(wèi)星導(dǎo)航系統(tǒng)故障的快速診斷進(jìn)行了研究,實(shí)現(xiàn)了衛(wèi)星故障的快速診斷。
智能診斷作為一種仿生診斷方法,為復(fù)雜系統(tǒng)的故障診斷提供了新的解決辦法,也使診斷系統(tǒng)朝微型化、“傻瓜化”邁進(jìn)。但是,每種智能診斷方法都有其優(yōu)缺點(diǎn),因此,研究融合智能診斷方法即如何把多種智能方法有機(jī)結(jié)合起來、取長(zhǎng)補(bǔ)短,以提高診斷準(zhǔn)確率顯得十分必要。下面對(duì)智能診斷對(duì)衛(wèi)星故障快速定位的應(yīng)用進(jìn)行分析。
2.1 故障模式與影響分析(FMEA)
FMEA是分析產(chǎn)品所有可能的故障模式及其產(chǎn)生的影響,并按每個(gè)故障模式產(chǎn)生影響的嚴(yán)重程度予以分類的一種歸納分析方法,是屬于單因素的分析方法。FMEA是產(chǎn)品可靠性分析的一個(gè)重要的工作項(xiàng)目。其分析的目的是在早期發(fā)現(xiàn)產(chǎn)品的各種缺陷與薄弱環(huán)節(jié),減少過多的晚期修改帶來的損失,并采取有效的改進(jìn)和補(bǔ)償措施以提高其可靠性水平。
FMEA工作需提前至從方案設(shè)計(jì)一開始就進(jìn)行,而不是局限在事后分析上。FMEA是以預(yù)防為主的可靠性分析手段,從根本上保證產(chǎn)品的可靠性?;诘孛孢\(yùn)控系統(tǒng)目前的設(shè)計(jì)方案:
(1)分析的產(chǎn)品層次
初始約定層次:地面運(yùn)控系統(tǒng)。
約定層次:地面站,包括主控站、注入站、一類監(jiān)測(cè)站、二類監(jiān)測(cè)站。
最低約定層次:主控站的系統(tǒng),監(jiān)測(cè)站的設(shè)備。
(2)故障判據(jù)
故障判據(jù):性能中的精度和參數(shù)更新周期指標(biāo),超出指標(biāo)要求極限即為故障;發(fā)生無法實(shí)現(xiàn)系統(tǒng)功能的事件,都定義為故障。
地面運(yùn)控系統(tǒng)能夠?qū)崿F(xiàn)規(guī)定的功能,按照指標(biāo)要求實(shí)現(xiàn)導(dǎo)航系統(tǒng)日常運(yùn)行維護(hù)即為正常。
(3)嚴(yán)酷度分類
所有故障影響將根據(jù)運(yùn)控系統(tǒng)嚴(yán)酷度類別進(jìn)行評(píng)估,結(jié)合地面運(yùn)控系統(tǒng)特點(diǎn),嚴(yán)酷度分類規(guī)定見表1。
表1 運(yùn)控系統(tǒng)嚴(yán)酷度類別
嚴(yán)酷度類別故障影響I災(zāi)難的運(yùn)控系統(tǒng)功能完全喪失,造成系統(tǒng)巨大損害,或使人員傷亡;II嚴(yán)重的運(yùn)控系統(tǒng)功能喪失,任務(wù)失敗,造成系統(tǒng)嚴(yán)重?fù)p壞,對(duì)人員傷害有嚴(yán)重威脅;III中度的運(yùn)控系統(tǒng)功能明顯下降,對(duì)系統(tǒng)造成一定的損害,對(duì)人員傷害有輕度威脅,甚至無威脅;IV輕微的系統(tǒng)功能有輕度下降,對(duì)系統(tǒng)未造成損害,對(duì)人員完全無害。
2.2 基于貝葉斯網(wǎng)絡(luò)的故障數(shù)據(jù)挖掘技術(shù)
衛(wèi)星導(dǎo)航系統(tǒng)運(yùn)行過程中,可能出現(xiàn)的故障模式多樣化,故障之間具有動(dòng)態(tài)隨機(jī)性和相關(guān)性。部分故障由于缺乏數(shù)據(jù)關(guān)聯(lián)性,無法快速分離問題;無法通過綜合的失效分析和針對(duì)業(yè)務(wù)能力的故障分析進(jìn)行快速故障定位。這些特點(diǎn)給系統(tǒng)故障分析帶來較多困難。因此,對(duì)系統(tǒng)運(yùn)行管理、故障診斷和恢復(fù)等都提出了嚴(yán)峻的挑戰(zhàn)。當(dāng)故障發(fā)生時(shí)需快速進(jìn)行故障定位,排除故障,縮短故障時(shí)間以保障北斗導(dǎo)航系統(tǒng)服務(wù)的連續(xù)性。
本文將貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)故障樹分析引入至衛(wèi)星導(dǎo)航系統(tǒng)[2],為分析和解決復(fù)雜而繁瑣的任務(wù)提供一個(gè)全新的視角和思路。該分析把系統(tǒng)看成一個(gè)大的開放的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),將問題域中的節(jié)點(diǎn)(變量)當(dāng)成一個(gè)子系統(tǒng),在專家知識(shí)、先驗(yàn)信息、觀測(cè)數(shù)據(jù)的相互作用和影響下,通過最大后驗(yàn)概率與最小描述的協(xié)調(diào)計(jì)算,得到一個(gè)最佳匹配的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)。這樣,不僅有利于綜合相關(guān)知識(shí)和信息解決計(jì)算復(fù)雜性的問題,避免主觀偏見帶來的片面性,而且還有機(jī)結(jié)合網(wǎng)絡(luò)結(jié)構(gòu)的精確性,使結(jié)構(gòu)模型與數(shù)據(jù)實(shí)例達(dá)到最佳匹配。
提出和設(shè)計(jì)了衛(wèi)星導(dǎo)航地面運(yùn)控系統(tǒng)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法。首先,基于樣本數(shù)據(jù)和專家知識(shí),通過互信息測(cè)度和條件獨(dú)立性檢驗(yàn)學(xué)習(xí)出一個(gè)無向圖;其次,運(yùn)用最大后驗(yàn)概率和最小描述長(zhǎng)度的集成準(zhǔn)則,確定節(jié)點(diǎn)之間連接的方向性;最后,通過相關(guān)的知識(shí)和規(guī)則,對(duì)有向無環(huán)圖中的連接邊和方向進(jìn)行優(yōu)化和調(diào)整,達(dá)到最佳匹配的網(wǎng)絡(luò)結(jié)構(gòu)模型。
為了進(jìn)一步提高診斷系統(tǒng)的工作效率,根據(jù)對(duì)象系統(tǒng)和故障的層次性特點(diǎn),確定層次診斷策略、合適的診斷粒度、淺知識(shí)和深知識(shí)有機(jī)結(jié)合等確定診斷力度。根據(jù)系統(tǒng)診斷的要求來進(jìn)行,在滿足診斷要求的前提下,使劃分的“塊”大一些,以降低工作量。
衛(wèi)星出現(xiàn)導(dǎo)航業(yè)務(wù)信息中斷問題,進(jìn)行故障發(fā)現(xiàn)與確認(rèn)的輸入數(shù)據(jù)源主要包括:監(jiān)測(cè)站觀測(cè)數(shù)據(jù)、衛(wèi)星遙測(cè)數(shù)據(jù)和主控站監(jiān)測(cè)數(shù)據(jù)。
對(duì)監(jiān)測(cè)站觀測(cè)數(shù)據(jù)進(jìn)行實(shí)時(shí)的數(shù)據(jù)判讀與比對(duì)是發(fā)現(xiàn)衛(wèi)星異常問題最有效可靠的數(shù)據(jù)源。每個(gè)監(jiān)測(cè)站的監(jiān)測(cè)接收機(jī)都可實(shí)時(shí)對(duì)其可視范圍內(nèi)的在軌衛(wèi)星進(jìn)行監(jiān)測(cè)、測(cè)量,具有接收衛(wèi)星導(dǎo)航電文,完成電文解析的功能。若在軌衛(wèi)星出現(xiàn)異常問題、引起星地?cái)?shù)據(jù)異常時(shí),異常衛(wèi)星可視范圍內(nèi)的多個(gè)監(jiān)測(cè)站將在第一時(shí)間收到異常的星地?cái)?shù)據(jù)。監(jiān)測(cè)站的觀測(cè)數(shù)據(jù)通過專用通道傳送至地面運(yùn)控監(jiān)視管理分系統(tǒng),管理分系統(tǒng)實(shí)時(shí)提取監(jiān)測(cè)站觀測(cè)數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)判讀和比對(duì)。一旦發(fā)現(xiàn)多數(shù)監(jiān)測(cè)站觀測(cè)數(shù)據(jù)出現(xiàn)針對(duì)單星相同的中斷、超差、不連續(xù)等現(xiàn)象時(shí),即可發(fā)出報(bào)警信息,提示出現(xiàn)衛(wèi)星異常問題。如星地時(shí)間同步中斷貝葉斯網(wǎng)絡(luò)故障樹分析如圖1所示。
圖1 星地時(shí)間同步中斷貝葉斯網(wǎng)絡(luò)故障樹
2.3 基于案例推理方法(Case Based Reasoning)
CBR是人工智能和故障診斷方法的一次新發(fā)展[3]。它規(guī)避知識(shí)和規(guī)則難以獲取這一瓶頸,運(yùn)用以前積累的經(jīng)驗(yàn)直接求解問題,成為人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。它是由目標(biāo)案例的提示而得到歷史記憶中的源案例,并由源案例指導(dǎo)目標(biāo)案例求解的一種策略。在CBR中,知識(shí)單元是案例(case),合理的案例表達(dá)方式是CBR推理的基礎(chǔ)和關(guān)鍵。其基本思路是:首先將已解決的故障做成案例并按照一定的格式存儲(chǔ)于案例庫(kù),當(dāng)有新的診斷任務(wù)時(shí),程序依某一匹配算法檢索案例庫(kù),若能匹配相關(guān)案例,則輸出結(jié)果;如果不能匹配,則對(duì)該故障采取其他診斷方法進(jìn)行處理,如專家會(huì)診等,得到的診斷結(jié)果經(jīng)規(guī)范化處理后,作為新的案例添加到案例庫(kù)中去。
衛(wèi)星故障模式多樣、復(fù)雜,單一診斷模式已遠(yuǎn)遠(yuǎn)不能滿足故障診斷的需要。為適應(yīng)衛(wèi)星故障多樣性要求,必須探索、應(yīng)用新的診斷技術(shù)以適應(yīng)系統(tǒng)要求。
2.4 系統(tǒng)參數(shù)判斷技術(shù)
衛(wèi)星導(dǎo)航系統(tǒng)有多個(gè)系統(tǒng),每個(gè)系統(tǒng)有上千個(gè)參數(shù),這些參數(shù)按一定速率快速傳到監(jiān)視與控制分系統(tǒng)。由于參數(shù)太多,主要靠計(jì)算機(jī)程序來實(shí)現(xiàn)故障報(bào)警,報(bào)警方法有3類,具體如下。
2.4.1 參數(shù)門限判斷技術(shù)
該方法是衛(wèi)星管理中應(yīng)用最早的方法,它的算法能及時(shí)發(fā)現(xiàn)參數(shù)的變化[4]。只要參數(shù)在給定的上、下限范圍內(nèi),就表明系統(tǒng)工作正常,否則通過顯示或聲音報(bào)警。
參數(shù)門限判斷方法的問題主要是參數(shù)的上、下限合理取值困難,這反映在2個(gè)方面:第一,當(dāng)上、下限值相差較大時(shí),不容易發(fā)現(xiàn)參數(shù)變化,只有當(dāng)設(shè)備故障到一定程度,超過給定的上、下限值,才能報(bào)警,這樣會(huì)錯(cuò)過故障處理時(shí)間,不利于系統(tǒng)緩變故障的發(fā)現(xiàn);第二,當(dāng)參數(shù)值本身變化較大時(shí),判斷門限不好掌握,無法正確報(bào)警。
2.4.2 參數(shù)相對(duì)值判斷法
參數(shù)相對(duì)值判斷法的結(jié)構(gòu)與行為描述方法是,將診斷對(duì)象看成由一系列單個(gè)零件通過相互連接而構(gòu)成,進(jìn)而對(duì)這些零件的輸入、輸出進(jìn)行行為描述,建立好結(jié)構(gòu)與行為模型后即可預(yù)測(cè)系統(tǒng)的行為。將模型預(yù)測(cè)值與實(shí)測(cè)值相比較以獲取異常征兆,然后利用這些異常征兆搜索那些可使預(yù)測(cè)模型與實(shí)測(cè)值相一致的各種可能行為的狀態(tài)假設(shè),對(duì)于每一個(gè)偏離指定正確行為的上述狀態(tài)的假設(shè)被視為故障。該報(bào)警算法簡(jiǎn)單,只要超限報(bào)警門限設(shè)置合理,就能夠及時(shí)發(fā)現(xiàn)系統(tǒng)出現(xiàn)的異常。2.4.3 參數(shù)關(guān)聯(lián)判斷法
當(dāng)一個(gè)故障導(dǎo)致多個(gè)參數(shù)超限,將所超限參數(shù)都顯示出來,會(huì)讓使用人員無法正確判斷故障源;或者地設(shè)備切換時(shí),相應(yīng)的參數(shù)會(huì)從發(fā)令前的值跳變至發(fā)令后的值,屬于正常情況,如果在對(duì)參數(shù)變化進(jìn)行判斷時(shí)未考慮發(fā)令的影響,就會(huì)造成誤判。因此,對(duì)數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)與比對(duì)也非常必要。在完成對(duì)數(shù)據(jù)的解析后,根據(jù)判定策略,對(duì)其進(jìn)行數(shù)據(jù)判讀和比對(duì),一旦出現(xiàn)異常數(shù)據(jù),及時(shí)發(fā)出提示信息。
2.5 衛(wèi)星和地面站綜合監(jiān)視與控制技術(shù)
監(jiān)視管理系統(tǒng)實(shí)時(shí)接收并處理地面系統(tǒng)的各類觀測(cè)數(shù)據(jù)和定軌與時(shí)間同步軟件的預(yù)處理數(shù)據(jù),以圖形化的方式顯示與業(yè)務(wù)信息中斷現(xiàn)象相關(guān)的監(jiān)測(cè)接收機(jī)測(cè)量數(shù)據(jù)、星地時(shí)間同步上下行數(shù)據(jù)、導(dǎo)航電文、遙測(cè)信息、衛(wèi)星鐘差。結(jié)合地面接收機(jī)工況、規(guī)劃設(shè)備工況、衛(wèi)星任務(wù)規(guī)劃、任務(wù)規(guī)劃回執(zhí)、測(cè)站預(yù)報(bào)等因素,對(duì)衛(wèi)星導(dǎo)航業(yè)務(wù)數(shù)據(jù)綜合狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)視,用于輔助人工判斷,提高地面運(yùn)控系統(tǒng)對(duì)故障判定的及時(shí)性和準(zhǔn)確性[5]。
監(jiān)視管理系統(tǒng)的數(shù)據(jù)庫(kù)接收并保存重要數(shù)據(jù)、事件、控制指令,對(duì)故障前后數(shù)據(jù)、設(shè)備工況進(jìn)行備份。支持對(duì)故障前后的數(shù)據(jù)進(jìn)行事后分析和場(chǎng)景再現(xiàn),幫助分析人員進(jìn)行經(jīng)驗(yàn)積累,對(duì)故障相關(guān)信息進(jìn)行統(tǒng)計(jì)匯總。
2.6 故障模型擴(kuò)展技術(shù)
針對(duì)系統(tǒng)的靈活性和擴(kuò)展性要求,數(shù)據(jù)處理和監(jiān)控分系統(tǒng)以目前已知的各種異?,F(xiàn)象及故障為基礎(chǔ),設(shè)計(jì)并實(shí)現(xiàn)了具有一定擴(kuò)展性的故障模型[6]。故障模型擴(kuò)展性技術(shù)實(shí)現(xiàn)流程見圖2。
圖2 故障模型擴(kuò)展性技術(shù)實(shí)現(xiàn)流程
故障模型的擴(kuò)展性表現(xiàn)在:
①異常現(xiàn)象參數(shù)可修改。在故障模型庫(kù)中可以配置每一種異?,F(xiàn)象的多類閾值,包括參數(shù)報(bào)警閾值、時(shí)間閾值、概率和差值閾值等??梢愿鶕?jù)情況調(diào)整和優(yōu)化異?,F(xiàn)象參數(shù)。
②故障定位策略可擴(kuò)展。在故障模型庫(kù)中,針對(duì)每一種故障,建立了可擴(kuò)展的故障定位模型。通過配置,每一類故障的定位策略可以修改或新增,實(shí)現(xiàn)了衛(wèi)星故障判斷策略的可擴(kuò)展,異?,F(xiàn)象與故障的判定邏輯之間的關(guān)系可配置。在故障定位過程中,故障定位策略是從故障模型庫(kù)中讀取的,在故障模型庫(kù)變化后,相關(guān)軟件通過讀取數(shù)據(jù)庫(kù),自動(dòng)適應(yīng)新的需求。
故障發(fā)現(xiàn)與定位軟件的軟件架構(gòu)具有較好的可擴(kuò)充性,可以加入新的異?,F(xiàn)象判定模塊,在整體架構(gòu)不變的前提下,通過較少的代碼修改,實(shí)現(xiàn)對(duì)新增異?,F(xiàn)象的支持。將新的異?,F(xiàn)象加入故障定位策略,只需通過配置故障模型即可實(shí)現(xiàn),故障定位代碼無需修改。
綜合考慮系統(tǒng)功能、效果和客觀條件等各方面因素,本系統(tǒng)采用了故障模式與影響分析(FMEA)、衛(wèi)星和地面站綜合監(jiān)視與控制、系統(tǒng)參數(shù)判斷、基于貝葉斯網(wǎng)絡(luò)的故障數(shù)據(jù)挖掘、故障模型擴(kuò)展等技術(shù)、故障模式與影響分析(FMEA) 等技術(shù)相融合的混合智能診斷技術(shù)方案。
通過故障模式與影響分析(FMEA)技術(shù)、基于貝葉斯網(wǎng)絡(luò)的故障數(shù)據(jù)挖掘技術(shù)進(jìn)行系統(tǒng)故障關(guān)聯(lián)性的深入分析,全面分析系統(tǒng)故障狀態(tài)的原因,在實(shí)際應(yīng)用中復(fù)雜的故障樹結(jié)構(gòu)函數(shù)會(huì)造成頂事件概率計(jì)算出現(xiàn)組合爆炸的問題,避免障樹分析方法復(fù)雜、費(fèi)時(shí),并形成初步詳細(xì)的診斷方法和策略。衛(wèi)星和地面站綜合監(jiān)視與控制主要實(shí)現(xiàn)實(shí)時(shí)的監(jiān)視與控制,發(fā)現(xiàn)系統(tǒng)參數(shù)異常等故障。根據(jù)故障診斷方法和策略,通過基于案例推理方法實(shí)現(xiàn)復(fù)雜故障的診斷。尋找一個(gè)類似的、成功的過去案例,并對(duì)其進(jìn)行修改直至符合當(dāng)前問題的需要。此方法克服了分析系統(tǒng)機(jī)理的費(fèi)時(shí)工作,并且不需要人從故障實(shí)例中提取規(guī)則,降低了知識(shí)獲取的負(fù)擔(dān),提高了故障診斷效率。
將基于案例的推理和多方法相結(jié)合應(yīng)用于導(dǎo)航系統(tǒng)的故障快速診斷研究中,取長(zhǎng)補(bǔ)短,從而使整個(gè)系統(tǒng)達(dá)到更高智能水平。
3.1 融合案例推理
在進(jìn)行故障診斷過程中,根據(jù)系統(tǒng)故障產(chǎn)生的大致部位及故障現(xiàn)象情況,應(yīng)用案例推理的方法進(jìn)行診斷。如果從案例庫(kù)中檢索到相同或相似故障的故障案例,則按此案例的故障原因進(jìn)行故障定位,若故障定位成功,則說明診斷成功,即可按照此案例的維護(hù)方案展開維護(hù)工作;否則,系統(tǒng)啟動(dòng)基于規(guī)則的診斷流程,使用由故障樹獲得的維修知識(shí)進(jìn)行精確診斷,診斷成功后將此次信息增加到故障案例庫(kù),從而實(shí)現(xiàn)故障快速診斷和精確診段。
一般來說,歸納為以下4個(gè)步驟:
①案例檢索:與給定問題的特征相比較,將最符合的案例從案例庫(kù)中檢索出來;
②案例重用:將最符合案例的解決方案作為新問題的解決方案;
③案例修改:分析檢索出案例與問題間的差異部分,運(yùn)用領(lǐng)域知識(shí)對(duì)案例的解決方案加以修正,形成新的案例;
④案例學(xué)習(xí):根據(jù)一定的策略,把新案例加到案例庫(kù)中,當(dāng)新的問題到來時(shí),系統(tǒng)從案例庫(kù)中檢索出與新問題最相似的舊案例,如果舊案例和新案例完全一致,則采用舊案例的解決方案解決當(dāng)前問題;否則,需要對(duì)相似案例進(jìn)行修改,修改后的案例被添加到案例庫(kù)中。
相似度匹配算法公式如下:
式中,i表示第i個(gè)匹配的關(guān)鍵特征;相似度[i]表示案例間第i個(gè)關(guān)鍵特征的相似度;權(quán)重[i]表示第i個(gè)關(guān)鍵特征的權(quán)重因子。
3.2 案例檢索策略的基本思想
案例檢索是故障快速診斷的核心技術(shù),每個(gè)案例都是在導(dǎo)航設(shè)備使用或診斷實(shí)踐當(dāng)中的故障現(xiàn)象、原因以及排除過程與方法的積累和總結(jié)。不斷豐富的案例形成系統(tǒng)診斷案例庫(kù),以方便系統(tǒng)診斷的查詢和推理[7]。
每一個(gè)故障的發(fā)生都是由其內(nèi)部機(jī)理決定的,因此可以根據(jù)系統(tǒng)的內(nèi)部機(jī)理對(duì)所有故障案例進(jìn)行合理分類。故障表現(xiàn)通常包括故障數(shù)據(jù)和故障狀態(tài)。故障數(shù)據(jù)是對(duì)故障的定量描述,故障狀態(tài)是對(duì)故障的定性描述,可以用它來確定當(dāng)前案例所屬的類別。因此,先根據(jù)目標(biāo)系統(tǒng)的內(nèi)部機(jī)理對(duì)故障案例進(jìn)行合理分類,并在不同的案例集中分別計(jì)算權(quán)重向量;然后根據(jù)權(quán)重向量的差異大小(表明其重要的程度),生成案例集狀態(tài)向量,并將當(dāng)前故障狀態(tài)向量與各個(gè)案例集狀態(tài)向量相比較,確定當(dāng)前故障案例所屬的類別;最后,通過逼近全指標(biāo)的故障狀態(tài)匹配進(jìn)一步縮小范圍,采用改進(jìn)的灰色關(guān)聯(lián)度計(jì)算方法精確定位相似案例。案例檢索流程圖如圖3所示。
圖3 案例檢索流程圖
3.3 案例知識(shí)的獲取
案例知識(shí)的獲取可以采用以下幾種方法:一是參考已有的故障資料和廣泛征求專家的意見,從他們成功的故障判斷和故障恢復(fù)經(jīng)驗(yàn)中提取案例;二是一線工作人員與專家合作,根據(jù)具體故障特點(diǎn),進(jìn)行故障梳理,找出系統(tǒng)故障間的關(guān)聯(lián)信息,確定最優(yōu)故障定位方案,來獲取新的案例;三是通過系統(tǒng)的自學(xué)習(xí)能力來豐富案例。
3.4 建立檢索樹
檢索過程是通過檢索案例庫(kù)中的故障集來和用戶輸入故障的故障現(xiàn)象集匹配,按照案例的故障現(xiàn)象集中的各個(gè)故障現(xiàn)象的重要程度,組成如同故障樹一樣的樹結(jié)構(gòu)。樹的根節(jié)點(diǎn)為某系統(tǒng)故障時(shí)對(duì)應(yīng)的信息,因?yàn)樾畔⑹潜鞠到y(tǒng)中故障診斷的啟發(fā)性信息,通過確定信息可以縮小診斷的范圍,提高故障診斷的速度。通過計(jì)算各個(gè)可見征兆和系統(tǒng)參數(shù)的重要度,確定每層節(jié)點(diǎn)的節(jié)點(diǎn)值。
3.5 案例的修改
案例修改階段包括兩個(gè)任務(wù):①對(duì)檢索出的相似案例進(jìn)行評(píng)估,若可行則進(jìn)入案例學(xué)習(xí)過程,將問題形成新的案例添加至案例庫(kù)中;②若檢索結(jié)果評(píng)估不可行,則要對(duì)相似案例進(jìn)行修改,從而得到新案例的解決方案。
提出了基于特征差異的案例自修改方法。其核心是從已存在的案例數(shù)據(jù)中搜索修改知識(shí),根據(jù)相似案例中不滿足要求的特征值進(jìn)行修改,將故障問題之間的差異轉(zhuǎn)換為故障案例解決方案的修改。在故障診斷系統(tǒng)中,對(duì)比故障案例與檢索出的相似案例,根據(jù)存在差異的征兆,對(duì)相似案例再次采用CBR方法進(jìn)行相似匹配,根據(jù)匹配結(jié)果對(duì)案例的解決方案進(jìn)行修改。案例的規(guī)范化表示與存儲(chǔ)見表2。
表2 故障案例庫(kù)
系統(tǒng)功能故障模式故障原因任務(wù)階段與工作方式故障影響局部影響高一層次影響最終影響嚴(yán)酷度類別故障檢測(cè)方法星間時(shí)間同步上行測(cè)距無上行測(cè)距信號(hào)輸出硬件、軟件故障;天線故障星間時(shí)間同步測(cè)量上行測(cè)距功能喪失星地時(shí)間同步功能降級(jí)星地時(shí)間不能同步II數(shù)據(jù)接收、工況、檢測(cè)儀聯(lián)合上行測(cè)距信號(hào)不連續(xù)硬件、軟件故障星間時(shí)間同步測(cè)量星地時(shí)間同步功能降級(jí)星地時(shí)間同步功能降級(jí)星地時(shí)間同步周期延長(zhǎng)III數(shù)據(jù)接收、工況、檢測(cè)儀聯(lián)合上行測(cè)距信號(hào)輸出錯(cuò)誤硬件、軟件故障星間時(shí)間同步測(cè)量星地時(shí)間同步功能降級(jí)星地時(shí)間同步功能降級(jí)星地時(shí)間同步數(shù)據(jù)出錯(cuò)III數(shù)據(jù)接收、工況、檢測(cè)儀聯(lián)合
實(shí)現(xiàn)對(duì)衛(wèi)星導(dǎo)航業(yè)務(wù)信息故障判斷的前提是實(shí)現(xiàn)對(duì)故障的快速發(fā)現(xiàn)與定位。對(duì)星地異?,F(xiàn)象和參數(shù)的分析與判斷是發(fā)現(xiàn)與定位衛(wèi)星導(dǎo)航業(yè)務(wù)信息中斷及故障單機(jī)的主要途徑。主要采用對(duì)監(jiān)測(cè)站觀測(cè)數(shù)據(jù)、衛(wèi)星遙測(cè)數(shù)據(jù)、系統(tǒng)工況數(shù)據(jù)的綜合判讀,實(shí)現(xiàn)異常問題的定位。
圖4 衛(wèi)星故障快速定位圖
數(shù)據(jù)處理實(shí)時(shí)處理多監(jiān)測(cè)站、多星數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)判讀和比對(duì)。觀測(cè)數(shù)據(jù)的判讀設(shè)計(jì)門限、正常超差等多個(gè)判據(jù),減少誤警率。一旦發(fā)現(xiàn)在軌衛(wèi)星出現(xiàn)觀測(cè)數(shù)據(jù)中斷、超差、不連續(xù)等現(xiàn)象時(shí),即可發(fā)出報(bào)警信息,提示出現(xiàn)衛(wèi)星異常問題或是地面系統(tǒng)的問題。同時(shí)通過對(duì)數(shù)據(jù)的比對(duì)判讀,實(shí)現(xiàn)對(duì)故障以及原因的初步定位。圖4為衛(wèi)星故障快速定位圖,原故障定位方法與快速診斷方法故障定位時(shí)間比較見表3。
表3 原故障定位方法與快速診斷方法故障定位時(shí)間對(duì)比表
針對(duì)衛(wèi)星導(dǎo)航系統(tǒng)故障診斷和預(yù)測(cè)中,故障相關(guān)信息多及故障趨勢(shì)難以預(yù)測(cè)問題,本文提出一種多方法融合的衛(wèi)星導(dǎo)航系統(tǒng)故障快速診斷的技術(shù)解決方案,該研究有效提高衛(wèi)星導(dǎo)航系統(tǒng)故障診斷的智能化水平。根據(jù)研究和開發(fā)實(shí)踐,得出以下結(jié)論:
1)對(duì)于衛(wèi)星的不同故障類型和危險(xiǎn)趨勢(shì),需要應(yīng)用不同的推理方法進(jìn)行診斷。只有這樣,才能使衛(wèi)星故障診斷和危險(xiǎn)趨勢(shì)預(yù)測(cè)更加準(zhǔn)確、有效。
2)在應(yīng)用多形式推理方法進(jìn)行衛(wèi)星故障診斷和危險(xiǎn)趨勢(shì)預(yù)測(cè)中,相關(guān)知識(shí)的形式化描述是其中的一個(gè)難點(diǎn),這也是專家系統(tǒng)中研究的一個(gè)熱點(diǎn)問題,它直接影響著推理的自動(dòng)化。
3)通過貝葉斯網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)建立正確合理的規(guī)則庫(kù)、模型庫(kù)和案例庫(kù)是應(yīng)用多形式進(jìn)行衛(wèi)星故障診斷和危險(xiǎn)趨勢(shì)預(yù)測(cè)的關(guān)鍵。
[1]劉鵬.專家系統(tǒng)在衛(wèi)星測(cè)控管理中的應(yīng)用技術(shù)研究[J].軍事通信, 2006, 37 (8):66-68.
[2]尹偉,章衛(wèi)國(guó),李斌等. 結(jié)合貝葉斯理論的飛控系統(tǒng)故障樹診斷方法[J].計(jì)算機(jī)應(yīng)用, 2007, 27 (7):1802-1805.
[3]宋東,劉飛,吳信永.CBR故障診斷系統(tǒng)中的案例自修改方法研究及應(yīng)用[J].測(cè)控技術(shù),2008,27(5):81-83.
[4]單長(zhǎng)勝.在軌衛(wèi)星異常報(bào)警和故障診斷方法研究[J].飛行器測(cè)控學(xué)報(bào), 2011, 30 (3):6-10.
[5]楊天社,楊開忠,李懷祖.基于知識(shí)的衛(wèi)星故障診斷與預(yù)測(cè)方法[J].中國(guó)工程科學(xué), 2003, 5 (6):63-66.
[6]向睿.在軌衛(wèi)星遠(yuǎn)程診斷體系架構(gòu)[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009, 37 (8):194-197.
[7]侯霞.基于系統(tǒng)級(jí)診斷理論的衛(wèi)星網(wǎng)絡(luò)故障診斷[J].電子學(xué)報(bào), 2005, 33 (11):2066-2068.
Fault Rapid Diagnosis for Satellite Navigation System by Combined Multi-means
Liu Xiaoping, Wu Xiaoli, Sun Weijie, Dong Enqiang, Huang Shuanglin
Beijing Satellite Navigation Center, Beijing 100094, China
The satellite navigation system has the feature of multiple function, complicated architecture and high integrity, which makes the system fault full of complexity, hierarchy, dependency, delay and indeterminacy. Therefore the single-means diagnosis method can not satisfy the need of the satellite navigation system fault diagnosis. To cope with the complexity of system fault diagnosis, a kind of fast diagnosis method with multi-means combination is put forward, this paper discusses the knowledge obtaining, representation and diagnosis reasoning. The method has been verified with real data from BeiDou system and the results show that the method can locate the system fault fast and precisely, which greatly improves the intelligent level of the satellite navigation system fault diagnosis.
fault-diagnosis; case reasoning; case matching; similarity; status monitor
2015-03-17。
劉曉萍(1976—),女,工程師,主要從事衛(wèi)星導(dǎo)航系統(tǒng)運(yùn)行管理與控制方面的研究。
P228
A