• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向航天信號數(shù)據(jù)的柔性分析平臺設(shè)計(jì)與實(shí)現(xiàn)

    2021-05-06 09:38:26史梅花
    關(guān)鍵詞:數(shù)據(jù)文件航天數(shù)據(jù)庫

    姜 南,史梅花,姚 遠(yuǎn),戴 偉

    (1.北京控制工程研究所,北京 100080;2.北京途瑪勝遠(yuǎn)科技有限公司,北京 100195;3.北京航空航天大學(xué),北京 100191)

    0 引 言

    航天器是一類由機(jī)械、電子、材料、控制、能源、通訊、計(jì)算機(jī)技術(shù)等多學(xué)科協(xié)同工作的大型多功能復(fù)雜系統(tǒng),具有結(jié)構(gòu)復(fù)雜、故障危害性大、意外干擾因素難以把握、星上資源配置約束條件苛刻、地面人工干預(yù)的機(jī)會和能力受限制等特點(diǎn)[1]。因此,目前知識系統(tǒng)中欠缺的“黑盒子”機(jī)理使得設(shè)計(jì)師無法對產(chǎn)品進(jìn)行充分的認(rèn)知,也就難以進(jìn)行有效的故障預(yù)測,在航天器研制和使用中會造成不可估量的損失。在航天產(chǎn)品研制及飛行過程中,隨著自動(dòng)化技術(shù)的持續(xù)發(fā)展,采樣頻率的提高,計(jì)算技術(shù)及存儲容量的改善,地面試驗(yàn)和在軌飛行已經(jīng)積累了海量的數(shù)據(jù)(該文統(tǒng)稱為信號數(shù)據(jù)),這些數(shù)據(jù)反映了產(chǎn)品功能和性能的各種突發(fā)的或規(guī)律性的變化,是了解產(chǎn)品性能、開展故障預(yù)測的重要依據(jù)。若能獲得這些參數(shù)的緩慢變化特點(diǎn)并對其趨勢進(jìn)行分析預(yù)測,便能夠逐步實(shí)現(xiàn)對航天器健康狀態(tài)的有效管理[2]。

    目前國內(nèi)外已開展了大量的關(guān)于趨勢分析及參數(shù)預(yù)測等故障預(yù)測和健康管理研究[3-5],“基于狀態(tài)信息、基于異?,F(xiàn)象信息、基于使用環(huán)境信息、基于損傷標(biāo)尺、數(shù)據(jù)融合及綜合診斷”、“統(tǒng)計(jì)預(yù)測、數(shù)字預(yù)測、智能預(yù)測、信息融合”[6]等分類方法可見諸文獻(xiàn)。無論如何分類,基于數(shù)據(jù)的故障預(yù)測方法的基本思想都是在一定代價(jià)函數(shù)的約束下,對對象的歷史數(shù)據(jù)進(jìn)行學(xué)習(xí),逼近數(shù)據(jù)中所隱含的映射機(jī)制,得到對象的數(shù)學(xué)模型關(guān)系,從而對故障進(jìn)行預(yù)測。時(shí)間序列分析方法[7]、機(jī)器學(xué)習(xí)(概率趨勢、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī))技術(shù)[8-10]都要基于一定的分析目的而設(shè)計(jì)和應(yīng)用,不能直接復(fù)制已有的算法程序。另一方面,航天產(chǎn)品往往是一個(gè)產(chǎn)品族,同一產(chǎn)品族下的產(chǎn)品數(shù)據(jù)分析有其相通之處,并不能一事一議地臨時(shí)編寫算法獲得分析結(jié)果,而必須要實(shí)現(xiàn)組織層面的分析算法共享。

    該文研究了面向航天產(chǎn)品信號數(shù)據(jù)的分析平臺的技術(shù)特點(diǎn),構(gòu)造了系統(tǒng)的架構(gòu),從而在組織層面進(jìn)行算法的靈活管理與應(yīng)用。

    1 航天產(chǎn)品信號數(shù)據(jù)分析面臨的技術(shù)問題

    1.1 多階段、長時(shí)空跨度的數(shù)據(jù)規(guī)范問題

    航天產(chǎn)品從開展力學(xué)、溫度等地面試驗(yàn)到在軌飛行,跨越了極大的時(shí)間尺度和空間尺度。雖然是小樣本,但數(shù)據(jù)產(chǎn)生在不同的測試設(shè)備、不同傳感器中,呈現(xiàn)典型的高維度、多源特征。主要表現(xiàn)在:

    (1)不同測試設(shè)備對產(chǎn)品的定義不同。容易造成即使是同一個(gè)產(chǎn)品,由于經(jīng)歷不同測試設(shè)備開展的試驗(yàn)測試,其數(shù)據(jù)文件在數(shù)據(jù)庫中也是一個(gè)個(gè)的孤島;

    (2)測試設(shè)備形成的數(shù)據(jù)文件存儲格式也各不相同。測試設(shè)備形成的文件有Txt文件、Excel文件、Access文件等,讀取這些不同格式的數(shù)據(jù)文件,需要采用不同的文件讀取技術(shù),降低了數(shù)據(jù)使用的效率;

    (3)不同傳感器的采集頻率各有不同,時(shí)間格式不同,造成不同應(yīng)力環(huán)境下的信號數(shù)據(jù)無法進(jìn)行有效的融合;

    (4)數(shù)據(jù)解析方式不同,采集數(shù)據(jù)中有十進(jìn)制數(shù)據(jù),也有十六進(jìn)制數(shù)據(jù)。系統(tǒng)無法自動(dòng)識別十進(jìn)制解碼表示或是十六進(jìn)制源碼表示。

    這些不規(guī)范、不標(biāo)準(zhǔn)的數(shù)據(jù)散落在各個(gè)測試系統(tǒng)中,會對后續(xù)的數(shù)據(jù)融合與分析造成極大的困擾。

    1.2 高采集頻率的數(shù)據(jù)存儲和使用問題

    航天產(chǎn)品經(jīng)歷眾多試驗(yàn),且設(shè)計(jì)壽命往往高達(dá)10年以上,在試驗(yàn)和在軌飛行階段采集頻率一般為毫秒級,因此會在較短的時(shí)間內(nèi)生產(chǎn)海量的數(shù)據(jù)。以1 k/s的采樣率計(jì)算,連續(xù)采集一天,一個(gè)參數(shù)的數(shù)據(jù)量將達(dá)到7億行。而這些數(shù)據(jù)必須能夠及時(shí)地進(jìn)行存儲和管理。

    在使用數(shù)據(jù)時(shí),往往是以一個(gè)參數(shù)為單位獲取數(shù)據(jù),需要獲取一個(gè)參數(shù)在一個(gè)大時(shí)間尺度的數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)庫存儲方式是將數(shù)據(jù)按照表的結(jié)構(gòu)進(jìn)行存儲,表的每一列是一個(gè)參數(shù),每一行則是對應(yīng)具體的參數(shù)值。但是這個(gè)表結(jié)構(gòu)的存儲方式在行數(shù)大于一億行以后,存儲和查詢的效率將會急劇降低。導(dǎo)致的結(jié)果就是,將一個(gè)幾GB的數(shù)據(jù)文件存進(jìn)去速度就很慢,當(dāng)要把其中某一個(gè)參數(shù)的數(shù)值全部獲取出來時(shí)將更慢,時(shí)間將長達(dá)十分鐘以上。

    可見,要實(shí)現(xiàn)高速的數(shù)據(jù)吞吐能力,會對數(shù)據(jù)庫的建設(shè)提出非常高的要求。

    1.3 算法復(fù)雜且專業(yè)

    事實(shí)上,無論是航天產(chǎn)品還是其他任何領(lǐng)域的工業(yè)產(chǎn)品,簡單地去應(yīng)用某種發(fā)布的成熟算法進(jìn)行聚類或異常檢測等分析是不現(xiàn)實(shí)的。在專業(yè)領(lǐng)域的數(shù)據(jù)分析中,面向產(chǎn)品的物理或者機(jī)理知識不可或缺,因此分析算法往往并不能依賴于數(shù)據(jù)分析專家。航天企業(yè)設(shè)計(jì)師一般具有較高的綜合素質(zhì)與能力,往往可以獨(dú)立編寫分析算法;即使數(shù)據(jù)分析專家不可或缺,也是要與設(shè)計(jì)人員的工程知識結(jié)合,協(xié)同定制地編寫算法并驗(yàn)證。因此,算法往往由專業(yè)領(lǐng)域人員編寫并驗(yàn)證,其編寫工具可以是C,可以是Python,也可以是R、MATLAB等等,在調(diào)用時(shí)需要能夠調(diào)用不同的軟件接口。而在一個(gè)分析項(xiàng)目中,也往往需要將多個(gè)算法用一個(gè)流程來管理和驅(qū)動(dòng)。從另一方面看,不同規(guī)格的產(chǎn)品在數(shù)據(jù)分析中往往具有相似性,因此算法在一個(gè)組織內(nèi)往往需要共享使用。

    所以,對不同工具開發(fā)的算法進(jìn)行封裝、管理和調(diào)用也成為解決信號數(shù)據(jù)分析的關(guān)鍵技術(shù)之一。

    2 信號數(shù)據(jù)分析平臺的設(shè)計(jì)與實(shí)現(xiàn)

    2.1 總體架構(gòu)設(shè)計(jì)

    為實(shí)現(xiàn)信號數(shù)據(jù)在不同目的和場景的數(shù)據(jù)分析功能,數(shù)據(jù)分析平臺設(shè)計(jì)包括運(yùn)行支撐環(huán)境層、數(shù)據(jù)層、應(yīng)用支撐層、業(yè)務(wù)應(yīng)用層和前臺展現(xiàn)層,采用.NET框架技術(shù)設(shè)計(jì),如圖1所示。

    在運(yùn)行環(huán)境支撐層中,配置工業(yè)海量數(shù)據(jù)分析所需的網(wǎng)絡(luò)、應(yīng)用服務(wù)器、數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)備份設(shè)備等硬件及用于存儲的Oracle 10g數(shù)據(jù)庫。

    數(shù)據(jù)層則是數(shù)據(jù)庫中存儲的所有數(shù)據(jù),包括各類測試設(shè)備產(chǎn)生的多源數(shù)據(jù)和封裝的數(shù)據(jù)分析算法庫。

    應(yīng)用支撐層是數(shù)據(jù)層與應(yīng)用層之間的功能組件,包括數(shù)據(jù)預(yù)處理組件、數(shù)據(jù)存儲組件和算法執(zhí)行引擎。根據(jù)用戶需求操作數(shù)據(jù)層中的數(shù)據(jù),并將需要數(shù)據(jù)反饋給應(yīng)用界面。

    業(yè)務(wù)應(yīng)用層是系統(tǒng)中實(shí)現(xiàn)的業(yè)務(wù)功能,包括算法庫管理、算法分析接口、產(chǎn)品數(shù)據(jù)管理等,用于對數(shù)據(jù)分析的業(yè)務(wù)進(jìn)行規(guī)范性管理。

    圖1 信號數(shù)據(jù)分析平臺的總體架構(gòu)

    前臺展現(xiàn)層則是用戶使用和操作的系統(tǒng)軟件界面,根據(jù)每個(gè)用戶的特點(diǎn)、喜好和角色的不同,為特定用戶提供量身定做的訪問關(guān)鍵業(yè)務(wù)信息的安全通道和個(gè)性化應(yīng)用界面。

    2.2 關(guān)鍵技術(shù)的實(shí)現(xiàn)

    2.2.1 數(shù)據(jù)預(yù)處理規(guī)范的設(shè)計(jì)

    數(shù)據(jù)預(yù)處理規(guī)范的設(shè)計(jì)目的是使不同測試設(shè)備、不同階段產(chǎn)生的信號數(shù)據(jù)相互握手,數(shù)據(jù)能夠規(guī)范管理。通過對航天產(chǎn)品信號數(shù)據(jù)的分析,數(shù)據(jù)預(yù)處理規(guī)范設(shè)計(jì)包括編碼、文件格式、時(shí)間格式、缺省值標(biāo)識、數(shù)據(jù)解析方式等內(nèi)容。

    (1)編碼規(guī)范。

    為使在不同業(yè)務(wù)系統(tǒng)、不同測試設(shè)備中產(chǎn)生的數(shù)據(jù)能夠握手,需要在組織層面建立包括產(chǎn)品代號規(guī)范、版本編碼規(guī)范、編號規(guī)范在內(nèi)的各種編碼規(guī)范。當(dāng)信號數(shù)據(jù)文件存儲到數(shù)據(jù)庫時(shí),便可自動(dòng)解析該數(shù)據(jù)文件所屬的型號及階段、所屬產(chǎn)品及版本,并將數(shù)據(jù)文件中測試結(jié)果與數(shù)據(jù)字典中的產(chǎn)品參數(shù)相關(guān)聯(lián),實(shí)現(xiàn)統(tǒng)一產(chǎn)品源下的數(shù)據(jù)存儲。

    (2)數(shù)據(jù)文件格式標(biāo)準(zhǔn)化處理。

    將來自于不同試驗(yàn)設(shè)備的不同格式的文件,如Access文件、Txt文件、Csv文件等統(tǒng)一為Txt格式數(shù)據(jù)文件,作為標(biāo)準(zhǔn)數(shù)據(jù)文件的文件格式。

    (3)時(shí)間格式標(biāo)準(zhǔn)化。

    針對多源數(shù)據(jù)在采集時(shí)間、頻率上的不一致,如時(shí)間格式多種多樣,“2018-09-08 12:06:07.245”、“2018/09/08 12:06:07”、“2016-10-09 11:17:37”各不相同。以典型航天執(zhí)行機(jī)構(gòu)為例,其數(shù)據(jù)文件至少包括十幾種時(shí)間格式,因此也需要進(jìn)行標(biāo)準(zhǔn)化,形成一個(gè)統(tǒng)一的時(shí)間格式。本平臺設(shè)計(jì)將所有的時(shí)間格式標(biāo)準(zhǔn)化為“2018-09-08 12:06:07.245”形式。

    (4)缺失值標(biāo)識標(biāo)準(zhǔn)化。

    試驗(yàn)數(shù)據(jù)和在軌數(shù)據(jù)往往存在缺失值,而不同來源的數(shù)據(jù)文件缺失值有“ ”(空格)和“-”兩種標(biāo)識。由于在文件格式標(biāo)準(zhǔn)化處理中采用txt格式的數(shù)據(jù)文件,不能直觀看到空格,因此將采用“-”作為數(shù)據(jù)缺省值的標(biāo)準(zhǔn)標(biāo)識方式。

    (5)數(shù)據(jù)解析方式可配置。

    由于測試設(shè)備輸出文件有十進(jìn)制解碼表示方式和十六進(jìn)制源碼表示方式,面臨著不宜解析的問題,而XML可以為解決各種類型的數(shù)據(jù)共享、交換和使用問題提供一種行之有效的技術(shù)解決方法[11]。并且,Oracle XML DB數(shù)據(jù)庫管理系統(tǒng)對XML(extensible markup language)文檔提供了強(qiáng)大的支持[12]。因此,系統(tǒng)基于可擴(kuò)展標(biāo)記語言對文檔和數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,設(shè)計(jì)了一個(gè)XML配置文件(Setting.xml)作為用戶對參數(shù)的數(shù)值表示類型進(jìn)行配置的文件,如圖2所示。

    圖2 setting.xml文件示意圖

    2.2.2 高效率的數(shù)據(jù)吞吐技術(shù)

    各類測試設(shè)備獲取的信號數(shù)據(jù)均以文件形式傳輸。這些文件具有特定的格式和數(shù)據(jù)存儲方式,在數(shù)據(jù)庫系統(tǒng)內(nèi)屬于BLOB數(shù)據(jù)類型,這是一種用于存儲無邊界數(shù)據(jù)的數(shù)據(jù)類型,將大數(shù)據(jù)以BLOB方式存在數(shù)據(jù)庫中便于管理且具有高可用性[13-14]。為實(shí)現(xiàn)高效率的數(shù)據(jù)吞吐,在數(shù)據(jù)層采用Oracle 10g數(shù)據(jù)庫管理軟件作為基礎(chǔ),利用大對象技術(shù)(Blob),采用自定義數(shù)據(jù)存儲結(jié)構(gòu)存儲產(chǎn)品數(shù)據(jù)。

    系統(tǒng)在存儲數(shù)據(jù)時(shí),首先在內(nèi)存中對數(shù)據(jù)進(jìn)行緩存和聚集,將不同種類的參數(shù)的全部參數(shù)值進(jìn)行分類聚集,如圖3所示。然后再將聚集好的數(shù)據(jù)塊,以數(shù)據(jù)塊Blob技術(shù)存儲到數(shù)據(jù)庫中劃分好的磁盤空間。

    經(jīng)測試,以Blob形式進(jìn)行數(shù)據(jù)存儲的速度大于10 M/s;以Blob形式獲取100 M數(shù)據(jù),并繪制可視化時(shí)序圖的時(shí)間小于1 s。

    圖3 內(nèi)存中參數(shù)值聚集示意圖

    2.2.3 柔性的算法配置

    鑒于算法是由不同設(shè)計(jì)師采用不同的開發(fā)工具開發(fā)并驗(yàn)證,然后在平臺上加載,因此需要在軟件中實(shí)現(xiàn)算法接口調(diào)用的多樣性,從而具備在一個(gè)分析項(xiàng)目中組合多種算法的柔性能力。

    經(jīng)調(diào)研,目前設(shè)計(jì)師進(jìn)行算法編寫的工具一般是C#、Python、R、Matlab。因此解決方案是在.NET平臺上由C#編程語言編寫的軟驅(qū)動(dòng)。C#是以事件為驅(qū)動(dòng)

    的可視化編程語言,可用于方便快捷地開發(fā)運(yùn)行在.NET公共語言庫上的應(yīng)用[15]。其實(shí)現(xiàn)的軟驅(qū)動(dòng)便可天然地兼容調(diào)用C#編寫的數(shù)據(jù)分析算法dll文件。當(dāng)調(diào)用Python算法和MATLAB算法時(shí),則使用混合編程技術(shù)來實(shí)現(xiàn)算法執(zhí)行引擎。以Python算法為例,可以使用IronPython開發(fā)執(zhí)行引擎。IronPython是一個(gè).NET平臺上的Python實(shí)現(xiàn),包括了完整的編譯器、執(zhí)行引擎與運(yùn)行時(shí)支持,能夠與.NET已有的庫無縫整合到一起,所以IronPython和C#的交互也得以實(shí)現(xiàn)[16]。

    通過數(shù)據(jù)分析引擎,系統(tǒng)就可以直接調(diào)用不同設(shè)計(jì)師采用不同工具開發(fā)的算法。在實(shí)際分析工作中,并不可能只用一個(gè)算法來實(shí)現(xiàn)分析,即便如簡單的時(shí)間序列分析,也需要進(jìn)行野值剔除、數(shù)據(jù)拼接、可視化等不同算法。數(shù)據(jù)分析引擎的實(shí)現(xiàn)使得用戶得以對不同算法進(jìn)行友好的組合,實(shí)現(xiàn)柔性的算法配置。

    3 應(yīng)用案例

    信號數(shù)據(jù)柔性分析平臺在筆者所在單位進(jìn)行了良好的應(yīng)用。以典型航天執(zhí)行機(jī)構(gòu)為例,其試驗(yàn)數(shù)據(jù)來自于多個(gè)測試設(shè)備,具有Excel格式、Access格式、Csv格式等,這些不同格式的數(shù)據(jù)文件經(jīng)規(guī)范處理后,能夠在系統(tǒng)中進(jìn)行有效的管理,如圖4所示。

    圖4 不同測試設(shè)備的不同格式文件數(shù)據(jù)規(guī)范化存儲

    目前在系統(tǒng)中已經(jīng)對各類常用數(shù)學(xué)函數(shù)、常用的機(jī)器學(xué)習(xí)算法(異常檢測、聚類等)實(shí)現(xiàn)了算法封裝,設(shè)計(jì)師可以進(jìn)行靈活的組合和調(diào)用。圖5所示為系統(tǒng)對算法的管理,圖6為某產(chǎn)品使用基于動(dòng)態(tài)窗口的異常監(jiān)測算法進(jìn)行異常判讀的結(jié)果。

    圖5 算法管理窗口

    圖6 基于動(dòng)態(tài)窗口的異常監(jiān)測

    4 結(jié)束語

    針對航天產(chǎn)品信號數(shù)據(jù)多源長時(shí)空跨度的特點(diǎn),分析了將來使用機(jī)器學(xué)習(xí)等人工智能技術(shù)進(jìn)行應(yīng)用所必須解決的軟件平臺的關(guān)鍵技術(shù),設(shè)計(jì)并實(shí)現(xiàn)的柔性分析平臺解決了數(shù)據(jù)規(guī)范、數(shù)據(jù)吞吐和算法配置的關(guān)鍵技術(shù)。

    此平臺是應(yīng)用人工智能技術(shù)進(jìn)行各種目的的數(shù)據(jù)利用的基礎(chǔ)。目前算法雖只包含較為基礎(chǔ)的相關(guān)分析、聚類分析等,主要用于產(chǎn)品的健康管理。但平臺提供的算法引擎有效支持了設(shè)計(jì)師系統(tǒng)提供智慧的工作,算法也將不斷積累和完善,信號數(shù)據(jù)的分析將為航天產(chǎn)品的不斷改進(jìn)發(fā)揮更多的作用。

    猜你喜歡
    數(shù)據(jù)文件航天數(shù)據(jù)庫
    我的航天夢
    航天夢,我的夢
    軍事文摘(2021年22期)2022-01-18 06:22:56
    逐夢航天日
    數(shù)據(jù)文件恢復(fù)專題問答
    數(shù)據(jù)文件安全管控技術(shù)的研究與實(shí)現(xiàn)
    SQL數(shù)據(jù)文件恢復(fù)工具
    數(shù)據(jù)庫
    數(shù)據(jù)庫
    數(shù)據(jù)庫
    數(shù)據(jù)庫
    神木县| 乡城县| 常宁市| 怀仁县| 游戏| 垫江县| 尉氏县| 嘉黎县| 临夏市| 乐山市| 唐河县| 那曲县| 安宁市| 兴安盟| 锡林郭勒盟| 平安县| 定襄县| 雷波县| 菏泽市| 沙雅县| 手游| 视频| 长治县| 石景山区| 阜城县| 独山县| 永嘉县| 延津县| 恩施市| 古浪县| 新河县| 阿合奇县| 沐川县| 北安市| 罗田县| 南召县| 武山县| 浦东新区| 邛崃市| 定襄县| 普兰县|