(中國(guó)人民解放軍92941部隊(duì),遼寧 葫蘆島 125001)
戰(zhàn)術(shù)導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)設(shè)計(jì)及其關(guān)鍵技術(shù)
馬艷
(中國(guó)人民解放軍92941部隊(duì),遼寧葫蘆島125001)
為了優(yōu)化導(dǎo)彈生產(chǎn)流程、降低武器裝備壽命周期費(fèi)用、利用導(dǎo)彈在生產(chǎn)和使用維護(hù)階段獲取的海量數(shù)據(jù),運(yùn)用數(shù)據(jù)挖掘技術(shù),提出了導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)的總體設(shè)計(jì)思路;對(duì)導(dǎo)彈數(shù)據(jù)挖掘過(guò)程中的數(shù)據(jù)預(yù)處理方法、數(shù)據(jù)挖掘算法和異常檢測(cè)算法等關(guān)鍵技術(shù)進(jìn)行了研究,采用FP-Growth算法挖掘?qū)椛a(chǎn)過(guò)程中的工藝參數(shù)與產(chǎn)品質(zhì)量的關(guān)聯(lián),采用Z-Score檢測(cè)法完成異常參數(shù)檢測(cè);通過(guò)在導(dǎo)彈全壽命周期中的應(yīng)用,方案合理可行,可以有效地提高導(dǎo)彈質(zhì)量和裝備的戰(zhàn)備完好性,具有廣闊的軍事應(yīng)用前景。
數(shù)據(jù)挖掘平臺(tái);系統(tǒng)設(shè)計(jì);數(shù)據(jù)預(yù)處理;異常檢測(cè)
大數(shù)據(jù)已經(jīng)成為當(dāng)前計(jì)算機(jī)科學(xué)領(lǐng)域的熱點(diǎn)問(wèn)題和發(fā)展趨勢(shì),大數(shù)據(jù)中蘊(yùn)含著巨大的社會(huì)、經(jīng)濟(jì)、科研和軍事價(jià)值,英美等國(guó)已將大數(shù)據(jù)研究列為戰(zhàn)略性技術(shù)和研究發(fā)展計(jì)劃,給予優(yōu)先的資金支持[1-3]。我國(guó)針對(duì)大數(shù)據(jù)的科學(xué)研究日新月異,在諸如電子商務(wù)、云計(jì)算、衛(wèi)生保健、生物信息學(xué)、網(wǎng)頁(yè)挖掘、災(zāi)難信息管理等領(lǐng)域逐步開展了實(shí)際運(yùn)用,但在武器裝備領(lǐng)域的軍事應(yīng)用尚處于摸索階段。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的產(chǎn)生和收集是基礎(chǔ),數(shù)據(jù)挖掘是關(guān)鍵,數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲(chǔ)庫(kù)中自動(dòng)發(fā)現(xiàn)有用信息的過(guò)程。數(shù)據(jù)挖掘技術(shù)用來(lái)探查大型數(shù)據(jù)庫(kù),發(fā)現(xiàn)先前未知的有用模式,還可以預(yù)測(cè)未來(lái)觀測(cè)結(jié)果,能夠解決數(shù)據(jù)的高維性、可伸縮、分布式、異種數(shù)據(jù)和復(fù)雜數(shù)據(jù)以及非傳統(tǒng)分析等問(wèn)題[4]。目前導(dǎo)彈從生產(chǎn)、裝備部隊(duì)直到退役,會(huì)產(chǎn)生大量的數(shù)據(jù),采用適當(dāng)?shù)臄?shù)據(jù)挖掘方法,充分利用這些海量數(shù)據(jù),可以有效地優(yōu)化導(dǎo)彈生產(chǎn)流程、控制生產(chǎn)成本、提高產(chǎn)品質(zhì)量,降低維護(hù)維修費(fèi)用,提高武器裝備的戰(zhàn)備完好率。
裝備部隊(duì)的導(dǎo)彈在全壽命周期內(nèi)一般都要經(jīng)過(guò)工廠生產(chǎn)、部隊(duì)使用維護(hù)和維修等過(guò)程。在導(dǎo)彈生產(chǎn)階段,要經(jīng)過(guò)元器件篩選、彈上設(shè)備組裝調(diào)試、導(dǎo)彈總裝測(cè)試、軍檢驗(yàn)收等環(huán)節(jié),一般包括幾百個(gè)工序,每個(gè)工序包含多個(gè)工位,每個(gè)工位對(duì)應(yīng)一臺(tái)到數(shù)臺(tái)儀器設(shè)備,過(guò)程中要產(chǎn)生裝配、調(diào)試、加注、充氣、檢查、測(cè)試、吊裝、轉(zhuǎn)運(yùn)、交接等各種數(shù)據(jù)、記錄。在導(dǎo)彈部隊(duì)使用維護(hù)階段,要經(jīng)過(guò)日常維護(hù)、吊裝轉(zhuǎn)運(yùn)、裝備轉(zhuǎn)場(chǎng)、值班值勤、故障維修等環(huán)節(jié),過(guò)程中要產(chǎn)生檢查、測(cè)試、拆卸、安裝、維修、吊裝、轉(zhuǎn)運(yùn)、值班日志、環(huán)境監(jiān)測(cè)、交接等各種數(shù)據(jù)、記錄。在生產(chǎn)工序復(fù)雜、任務(wù)轉(zhuǎn)換頻繁、測(cè)試參數(shù)眾多、數(shù)據(jù)分布廣泛、人為及環(huán)境因素交織、數(shù)據(jù)量龐大的背景下,僅靠人為分析研究數(shù)據(jù)來(lái)提高導(dǎo)彈質(zhì)量、控制生產(chǎn)成本、降低維護(hù)維修費(fèi)用是無(wú)法實(shí)現(xiàn)的,因此迫切需要研究基于導(dǎo)彈生產(chǎn)和使用維修過(guò)程的數(shù)據(jù)挖掘工具,從而提高過(guò)程管控能力和產(chǎn)品品質(zhì),有效降低成本,改變以往單純依靠工藝技術(shù)、材料技術(shù)提高產(chǎn)品品質(zhì)的方法。
系統(tǒng)總體設(shè)計(jì)思路是應(yīng)用導(dǎo)彈在工廠生產(chǎn)階段和部隊(duì)使用維護(hù)階段產(chǎn)生的大量數(shù)據(jù),綜合運(yùn)用人工智能、計(jì)算智能、模式識(shí)別、數(shù)理統(tǒng)計(jì)等先進(jìn)技術(shù),對(duì)積累的數(shù)據(jù)進(jìn)行挖掘。平臺(tái)采用四層結(jié)構(gòu),以數(shù)據(jù)分析、分析任務(wù)管理、邏輯資源和物理資源平臺(tái)分層,這種分層架構(gòu)充分考慮了海量數(shù)據(jù)的分布式存儲(chǔ)、不同數(shù)據(jù)挖掘算法的集成、多種分析任務(wù)的配置以及系統(tǒng)和用戶的交互功能。平臺(tái)建立所采用的數(shù)據(jù)挖掘方法主要包括:差異分析、關(guān)聯(lián)分析、預(yù)測(cè)分析和分布分析等。差異分析主要對(duì)導(dǎo)致不同產(chǎn)品品質(zhì)的工藝參數(shù)、環(huán)境因素、使用年限等進(jìn)行對(duì)比分析,關(guān)聯(lián)分析用于分析不良品質(zhì)特性與各種因素間的潛在關(guān)聯(lián)關(guān)系,如Apriori算法、FP-Growth算法等,預(yù)測(cè)分析通過(guò)建立挖掘模型分析各種因素的變化對(duì)產(chǎn)品品質(zhì)測(cè)量值的對(duì)應(yīng)關(guān)系,分布分析更側(cè)重于對(duì)產(chǎn)品品質(zhì)的分布與各種因素的關(guān)系。
平臺(tái)由物理資源層、邏輯資源層、數(shù)據(jù)分析任務(wù)管理層和數(shù)據(jù)分析層組成。導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)架構(gòu)如圖1所示。
1)物理資源層:物理資源層主要包括底層的物理設(shè)備。這些物理設(shè)備能有效支撐導(dǎo)彈各任務(wù)階段數(shù)據(jù)的存儲(chǔ)和擴(kuò)展。
2)邏輯資源層:邏輯資源層包括存儲(chǔ)和計(jì)算資源。存儲(chǔ)資源建立在物理設(shè)備基礎(chǔ)上,包括傳統(tǒng)數(shù)據(jù)庫(kù)、本地文件系統(tǒng)、分布式文件系統(tǒng)等。計(jì)算資源是邏輯上的計(jì)算單元。平臺(tái)的計(jì)算能力依賴計(jì)算單元的數(shù)量,通過(guò)擴(kuò)展配置計(jì)算單元的數(shù)量能有效支撐上層的導(dǎo)彈數(shù)據(jù)挖掘任務(wù)。
3)數(shù)據(jù)分析任務(wù)管理層:數(shù)據(jù)分析任務(wù)管理層是平臺(tái)的核心。它有效地連接了分析功能與后臺(tái)集群。合理的平臺(tái)設(shè)計(jì)需要具備以下任務(wù)管理能力:易于算法擴(kuò)展、支持任務(wù)流和任務(wù)間依賴關(guān)系的配置、任務(wù)調(diào)度、計(jì)算和存儲(chǔ)資源分配。導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)通過(guò)數(shù)據(jù)分析框架FIU-Miner[5]來(lái)有效支撐數(shù)據(jù)分析任務(wù)管理。
4)數(shù)據(jù)分析層:數(shù)據(jù)分析層提供具體分析任務(wù)的用戶執(zhí)行接口。導(dǎo)彈數(shù)據(jù)挖掘系統(tǒng)的數(shù)據(jù)分析任務(wù)主要包括數(shù)據(jù)立方、對(duì)比分析、時(shí)間維分析、操作平臺(tái)、結(jié)果展示和報(bào)告管理等。
圖1 導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)架構(gòu)
操作人員先通過(guò)數(shù)據(jù)立方、對(duì)比分析、時(shí)間維分析3個(gè)子系統(tǒng)(見(jiàn)圖1)對(duì)數(shù)據(jù)進(jìn)行探索性分析總結(jié)出數(shù)據(jù)的分布特性,然后通過(guò)數(shù)據(jù)操作子系統(tǒng)實(shí)施數(shù)據(jù)挖掘任務(wù),挖掘結(jié)果通過(guò)圖形和報(bào)表等可視化手段形成分析報(bào)告,為提高導(dǎo)彈質(zhì)量、優(yōu)化導(dǎo)彈生產(chǎn)流程、控制生產(chǎn)成本、降低維護(hù)維修費(fèi)用等不同目的和任務(wù)提供依據(jù)。
其中數(shù)據(jù)立方子系統(tǒng)使分析人員能夠?qū)?shù)據(jù)進(jìn)行宏觀理解和快速預(yù)覽,采用OLAP技術(shù)建立數(shù)據(jù)立方可以幫助分析人員大致掌握數(shù)據(jù)特性,通過(guò)選擇維度和建立測(cè)度對(duì)數(shù)據(jù)集進(jìn)行分析,使用數(shù)據(jù)立方操作實(shí)現(xiàn)對(duì)數(shù)據(jù)的多粒度、多角度的理解;對(duì)比分析子系統(tǒng)能快速發(fā)現(xiàn)敏感參數(shù)和驗(yàn)證重要參數(shù),通過(guò)比較參數(shù)在不同時(shí)期的統(tǒng)計(jì)特性,有效發(fā)現(xiàn)異常參數(shù)值;時(shí)間維分析子系統(tǒng)重點(diǎn)關(guān)注在不同時(shí)期和時(shí)間粒度上環(huán)境因素變化情況以及導(dǎo)彈性能退化程度;數(shù)據(jù)操作子系統(tǒng)負(fù)責(zé)集成數(shù)據(jù)挖掘算法,提供任務(wù)操作接口,數(shù)據(jù)挖掘算法被合理封裝到各個(gè)任務(wù)中,對(duì)操作人員透明;分析報(bào)告子系統(tǒng)則基于任務(wù)分析結(jié)果,產(chǎn)生分析報(bào)告,通過(guò)分析報(bào)告可以直接給決策者提供依據(jù),同時(shí)也為領(lǐng)域?qū)<姨峁┦占答伒慕涌?,領(lǐng)域?qū)<抑R(shí)的引入對(duì)優(yōu)化模型、改進(jìn)算法具有重大的指導(dǎo)意義。
數(shù)據(jù)挖掘過(guò)程通常經(jīng)過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和后處理3個(gè)環(huán)節(jié)(見(jiàn)圖2所示),是一個(gè)反復(fù)迭代的過(guò)程。數(shù)據(jù)預(yù)處理環(huán)節(jié)完成數(shù)據(jù)的提取,滿足用戶在源數(shù)據(jù)中提取自己所需的相應(yīng)的數(shù)據(jù)[6];數(shù)據(jù)挖掘環(huán)節(jié)中,需要對(duì)不同性質(zhì)的數(shù)據(jù)提取方法進(jìn)行處理分析,選擇適合的數(shù)據(jù)挖掘算法;后處理環(huán)節(jié)包括模式過(guò)濾、可視化和模式表示3個(gè)方面,結(jié)果可以作為原始數(shù)據(jù)、表格、決策樹、規(guī)則、圖表顯示或三維圖形,這個(gè)環(huán)節(jié)是設(shè)法使數(shù)據(jù)挖掘的結(jié)果更容易使用和理解。
圖2 數(shù)據(jù)挖掘過(guò)程
導(dǎo)彈在工廠生產(chǎn)階段和部隊(duì)使用維護(hù)階段由于獲取數(shù)據(jù)的方式不同,數(shù)據(jù)由不同載體存儲(chǔ),如文本、電子表格、各類數(shù)據(jù)庫(kù)、圖片、影像文件等,可以駐留在集中的數(shù)據(jù)存儲(chǔ)庫(kù)中,或分布在多個(gè)站點(diǎn)上。為了便于數(shù)據(jù)分析,需要把這些來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)集成起來(lái),建立格式統(tǒng)一的數(shù)據(jù)表示,從而為后續(xù)的數(shù)據(jù)挖掘奠定基礎(chǔ)。多種數(shù)據(jù)源的語(yǔ)義復(fù)雜性、數(shù)據(jù)維度的豐富性、多樣性等新特點(diǎn)使得傳統(tǒng)的表達(dá)方式已不能滿足實(shí)際應(yīng)用需求[7-8],需要根據(jù)不同情況進(jìn)行多元離散特征的提取、融合和降維、歸一化表達(dá),以提高數(shù)據(jù)處理的效率,實(shí)現(xiàn)數(shù)據(jù)向知識(shí)的轉(zhuǎn)化??梢詫⑺袛?shù)據(jù)集成到MySQL數(shù)據(jù)庫(kù)中,利用MySQL建立數(shù)據(jù)倉(cāng)庫(kù)。通過(guò)在數(shù)據(jù)倉(cāng)庫(kù)中關(guān)聯(lián)不同的維度,對(duì)數(shù)據(jù)進(jìn)行多角度、多粒度的整合,從而構(gòu)建數(shù)據(jù)挖掘算法。
在原始數(shù)據(jù)表中,每枚導(dǎo)彈在不同階段的數(shù)據(jù)和記錄形成了許許多多條數(shù)據(jù),從數(shù)據(jù)管理角度出發(fā),進(jìn)行數(shù)據(jù)挖掘前,需要將與一枚導(dǎo)彈有關(guān)的所有數(shù)據(jù)整合成一條記錄,最終構(gòu)成集合作為數(shù)據(jù)挖掘算法的輸入。這個(gè)數(shù)據(jù)轉(zhuǎn)換過(guò)程需要表的多次自關(guān)聯(lián),用常規(guī)的SQL語(yǔ)句實(shí)現(xiàn)很困難,需要依賴數(shù)據(jù)轉(zhuǎn)換算法完成。
轉(zhuǎn)換后的數(shù)據(jù)還需要統(tǒng)一進(jìn)行清理,以使各枚導(dǎo)彈的數(shù)據(jù)規(guī)范、一致。通過(guò)填寫空缺值、平滑噪聲數(shù)據(jù)、識(shí)別刪除孤立點(diǎn),并解決“不一致”來(lái)清理數(shù)據(jù),從而增強(qiáng)數(shù)據(jù)挖掘結(jié)果的質(zhì)量。
選擇并實(shí)現(xiàn)適當(dāng)?shù)臄?shù)據(jù)挖掘算法是數(shù)據(jù)挖掘階段的主要任務(wù),目前主流的十大數(shù)據(jù)挖掘算法包括:決策樹分類、K均值聚類、支持向量機(jī)分類、關(guān)聯(lián)規(guī)則挖掘、最大期望算法、鏈接分析、集成算法、K近鄰分類、樸素貝葉斯分類、分類和回歸[4]。從數(shù)據(jù)中學(xué)習(xí)和發(fā)掘的基本原則主要是依賴這些理論,實(shí)現(xiàn)從數(shù)據(jù)中成功地學(xué)習(xí),并應(yīng)用這些技術(shù)對(duì)模型給出客觀可信的評(píng)估,從而找到適當(dāng)?shù)哪P汀?/p>
以挖掘?qū)椛a(chǎn)過(guò)程中的工藝參數(shù)與產(chǎn)品質(zhì)量的關(guān)聯(lián)為例,這種關(guān)聯(lián)關(guān)系體現(xiàn)為參數(shù)值組合在某類缺陷數(shù)據(jù)集合中出現(xiàn)的頻率,一些經(jīng)典的挖掘頻率特征集合的算法適用于挖掘重要參數(shù)組合,比如Apriori算法、FP-Growth算法[9]等,從某類缺陷出發(fā),應(yīng)用FP-Growth算法挖掘出出現(xiàn)頻度最高的參數(shù)組合,分析出與該缺陷關(guān)聯(lián)性較高的參數(shù)組合,從而實(shí)現(xiàn)快速定位缺陷原因,修正參數(shù)設(shè)置,提高產(chǎn)品質(zhì)量。
FP-Growth算法由兩步組成:(1)利用集合數(shù)據(jù)構(gòu)建FP樹,此過(guò)程輸入為事務(wù)表CK和最小支持度MinSup,輸出為樹表TreeTable,頭表HeaderTable;(2)從構(gòu)建好的FP樹上使用一種自底向上的分治算法逐步獲取重要的參數(shù)組合,這些參數(shù)可以根據(jù)經(jīng)驗(yàn)和試驗(yàn)進(jìn)行調(diào)試和優(yōu)化。通過(guò)算法可以挖掘出與某缺陷關(guān)聯(lián)性最大的參數(shù)組合,我們以在數(shù)據(jù)集中出現(xiàn)頻率對(duì)這些組合進(jìn)行排序,排序靠前的組合如果均包含某個(gè)或某幾個(gè)參數(shù),則說(shuō)明此組參數(shù)與某缺陷有很大關(guān)系。
FP-Growth算法的挖掘過(guò)程實(shí)現(xiàn)如下:
輸入:樹表TreeTable,頭表HeaderTable,后綴模式Postfix,最小支持度MinSup
輸出:頻繁項(xiàng)集表FP
1)If IsDifferent(TreeTable, Prefix) then //判斷是否有分支
2) for each Pi=Combination(ItemID) //輸出所有組合
3) Insert into FP values(Pi∪Postfix,min(ItemCount))
4)Else for each αiin HeaderTable {
5) Insert into FP values(αi∪Postfix, αi.(ItemCount))
6) Create DA as select Decompose(Prefix), NodeCount from TreeTable where ItemID=αi//生成條件模式基
7)Call Create_Tree(DA, TreeTable2, HeaderTable2, MinSup) //生成條件模式樹
8) If TreeTable2≠Ф then
9) Call FP_Growth(TreeTable2, HeaderTable2, αi∪Postfix, MinSup)} //遞歸調(diào)用FP-Growth
10)Drop table TreeTable, HeaderTable //刪除臨時(shí)無(wú)用的表格,釋放空間
異常參數(shù)檢測(cè)的任務(wù)是識(shí)別其特征顯著不同于其他數(shù)據(jù)的觀測(cè)值。異常檢測(cè)算法的目標(biāo)是發(fā)現(xiàn)真正的異常點(diǎn),避免錯(cuò)誤地將正常的對(duì)象標(biāo)注為異常點(diǎn)。通過(guò)對(duì)導(dǎo)彈數(shù)據(jù)中的參數(shù)進(jìn)行異常檢測(cè),能夠迅速發(fā)現(xiàn)參數(shù)的異常值,這里采用Z-Score檢測(cè)法來(lái)計(jì)算某參數(shù)的取值相對(duì)于正常狀態(tài)下的偏離程度,從而找到離群參數(shù)值。
文獻(xiàn)[10]推薦使用下列公式計(jì)算的Z-Score進(jìn)行離群點(diǎn)檢測(cè):
實(shí)際應(yīng)用中以某批次50枚導(dǎo)彈作為樣本,將50枚導(dǎo)彈生產(chǎn)過(guò)程中和8年使用維護(hù)過(guò)程中的所有歷史數(shù)據(jù)信息錄入數(shù)據(jù)庫(kù)。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后將與一枚導(dǎo)彈有關(guān)的所有數(shù)據(jù)整合成一條記錄,共形成50條記錄,每條記錄中含各類數(shù)據(jù)信息五千余個(gè),包括導(dǎo)彈型號(hào)、批次號(hào)、導(dǎo)彈編號(hào)、彈上各分設(shè)備及組件編號(hào)、裝配記錄、工藝參數(shù)、歷次檢查測(cè)試記錄、環(huán)境監(jiān)測(cè)數(shù)據(jù)、交接記錄、故障維修記錄、值班記錄等等。
通過(guò)數(shù)據(jù)挖掘平臺(tái)分析生產(chǎn)過(guò)程中的工藝參數(shù)與產(chǎn)品質(zhì)量的關(guān)聯(lián),找出數(shù)據(jù)中與特定缺陷“S001”關(guān)聯(lián)最緊密的參數(shù)組合,以在數(shù)據(jù)集合中的出現(xiàn)頻率對(duì)這些組合進(jìn)行排序后發(fā)現(xiàn),排名最高的4個(gè)組合均含有“Char_120105-56”和“Char_120105-58”兩個(gè)參數(shù),可以說(shuō)這兩個(gè)參數(shù)對(duì)缺陷“S001”有很大影響。
通過(guò)數(shù)據(jù)挖掘平臺(tái)進(jìn)行剩余壽命預(yù)測(cè),可以有效開展導(dǎo)彈預(yù)防性維修和視情維修,對(duì)于降低維護(hù)維修成本、提高裝備的戰(zhàn)備完好性具有現(xiàn)實(shí)意義。通過(guò)數(shù)據(jù)挖掘平臺(tái)的時(shí)間維分析子系統(tǒng)預(yù)測(cè)導(dǎo)彈剩余壽命,從圖3可以看出,預(yù)測(cè)的剩余壽命與該枚導(dǎo)彈實(shí)際剩余壽命基本一致,驗(yàn)證了方案的可行性。
圖3 導(dǎo)彈預(yù)測(cè)壽命與實(shí)際剩余壽命比較
本文從導(dǎo)彈數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)需求分析出發(fā),提出了導(dǎo)彈數(shù)據(jù)挖掘平臺(tái)的總體設(shè)計(jì)思路,介紹了導(dǎo)彈數(shù)據(jù)預(yù)處理方法、數(shù)據(jù)挖掘算法和異常參數(shù)檢測(cè)算法的思想和步驟,充分利用導(dǎo)彈在工廠生產(chǎn)階段和部隊(duì)使用維護(hù)階段積累的海量數(shù)據(jù),對(duì)于優(yōu)化導(dǎo)彈生產(chǎn)流程、提高產(chǎn)品質(zhì)量、降低維護(hù)維修費(fèi)用有關(guān)重要的意義。這種思路、設(shè)計(jì)方案可以應(yīng)用于其他型號(hào)導(dǎo)彈及其各型武器裝備的生產(chǎn)和使用維護(hù)中,應(yīng)用前景廣闊,社會(huì)及經(jīng)濟(jì)、軍事效益顯著,對(duì)于提高武器裝備的戰(zhàn)備完好性和使用管理決策支持能力必將起到積極的作用。
[1] White House Office of Science and Technology Policy.Big Data is a Big Deal[EB/OL].[2012-03-29].http:∥www.whitehouse.gov/blog/2012/03/29/big data big deal.
[2]White House Executive Office of the President.Big Data across the Federal Government[EB/OL].[2012-03-29].http:∥www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet.pdf.
[3]Wang Weihang.The British Provides Huge Sum of Money for Developing Big Data Technologies to Promote Economic Growth[EB/OL].[2013-05-31].http :∥www.e-gov.org.cn/xinxihua/news003/201305/141545.html.
[4]Tan Pangning, Michal Steinbach, Vipin Kumar.數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社,2011:2-3.
[5]FIU-Miner[EB/OL]. http://www.Datamining-node08.cs.fiu.edu/ FIU-Miner/.
[6]李秀娟,田 川,馮 欣.?dāng)?shù)據(jù)挖掘分類技術(shù)研究與分析[J].現(xiàn)代電子技術(shù),2010,33(20):86-88.
[7]辛芳芳,焦李成,王桂婷.非局部均值加權(quán)的動(dòng)態(tài)模糊.Fisher分類器的遙感圖像變化檢測(cè)[J].測(cè)繪學(xué)報(bào),2012,41(4):584-590.
[8]李 暉,肖鵬峰,馮學(xué)智,等.基于向量場(chǎng)模型的多光譜遙感圖像多尺度邊緣檢測(cè)[J].測(cè)繪學(xué)報(bào),2012,41(1):100-107.
[9]Han J, Pei J,Yin Y. Mining frequent patterns without candidate generation[R]. In ACM SIGMOD Record, 2000,29:1-12.
[10]李 濤,等.數(shù)據(jù)挖掘的應(yīng)用與實(shí)踐[M].廈門:廈門大學(xué)出版社,2013.
DesignandKeyTechnologyofDataMiningPlatformforTacticalMissile
Ma Yan
(PLA,No.92941 Troop,Huludao 125001,China)
In order to optimize the production process and reduce life cycle costs of the tactical missile,the general design thinking on the missile data mining platform is put forward using huge amounts of data in the production, use and maintenance phase. Data preprocessing methods, data mining algorithms and anomaly detection algorithms are studied in the process of the missile data mining. FP-Growth algorithm is adopted to mine the association with the process parameters and products quality. Z-Score detection method is adopted to detect anomaly parameters. Practical application shows that these methods can enhance missile quality and operational readiness. It has a wide foreground of military application.
data mining platform;system design;data preprocessing;anomaly detection
2017-05-09;
2017-05-18。
馬 艷(1971-),女,山東臨朐人,高級(jí)工程師,碩士,主要從事戰(zhàn)術(shù)導(dǎo)彈試驗(yàn)與鑒定方向的研究。
1671-4598(2017)11-0096-03
10.16526/j.cnki.11-4762/tp.2017.11.025
TP303
A