(內(nèi)蒙古自治區(qū)財(cái)政廳,呼和浩特 010098)
地面?zhèn)鞲衅麝嚵型ㄟ^獲取各種物理場特征信息實(shí)現(xiàn)對所監(jiān)控區(qū)域內(nèi)目標(biāo)的探測與識別。在不確定性和動態(tài)中檢測運(yùn)動目標(biāo),環(huán)境對情報(bào)、監(jiān)視和偵察系統(tǒng)至關(guān)重要。為此,大型分布式傳感器網(wǎng)絡(luò)通常是有吸引力的,因?yàn)樗鼈兛梢愿采w范圍很廣的區(qū)域,運(yùn)行成本適中。每個傳感器都在網(wǎng)絡(luò)中具備通信和計(jì)算能力以及具備集體智慧的行為。這種分布式傳感器網(wǎng)絡(luò)的成本效益非常關(guān)鍵,保持可靠的傳感性能同時限制需要進(jìn)行可靠決策所需的通信量至關(guān)重要。單個傳感器信息處理能力通常受諸多方面因素制約,需要通過網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)交互與融合。目前,常用的數(shù)據(jù)融合方法很少考慮對傳感器工作環(huán)境變化的主動響應(yīng)[1],這與傳感器工作環(huán)境的日趨復(fù)雜構(gòu)成了一對矛盾,特別是通過炮射[2]或無人機(jī)等方式布撒的傳感器,分布的地域較廣,面臨的工作環(huán)境更加多樣,給目標(biāo)識別與分類帶來了極大的挑戰(zhàn)。為了準(zhǔn)確識別目標(biāo)并消除環(huán)境干擾影響。目前的目標(biāo)檢測方法可分為三類:時域方法、頻域方法以及時頻域方法。一般來說,由于干擾噪聲的存在時域分析無法做到非常準(zhǔn)確的檢測目標(biāo),因此相關(guān)研究集中在頻率域或時間頻率目標(biāo)檢測和分類領(lǐng)域特別是基于小波變換的方法,焦點(diǎn)集中在去噪和時頻局部化特性,達(dá)到了良好的分析效果。對于環(huán)境因素影響的處理,文獻(xiàn)[3]提出了一種基于模型的傳感器陣列分布方法,從傳感器布設(shè)位置入手解決問題,該方法適合于人工布設(shè)傳感器的場景,但很難應(yīng)用于機(jī)載布撒的傳感器陣列。文獻(xiàn)[4]采用目標(biāo)分類與關(guān)聯(lián)跟蹤相結(jié)合的方法實(shí)現(xiàn)對環(huán)境影響的處理,其本質(zhì)也是一種基于模型的方法,該方法能夠處理傳感器目標(biāo)分類算法對環(huán)境噪聲的適應(yīng)性,但對于回聲等因素尚無法處理。與基于模型的方法相比,動態(tài)數(shù)據(jù)驅(qū)動方法并不明確依賴于基于物理原理的科學(xué)模型。如果在不同的操作條件下有足夠的培訓(xùn)數(shù)據(jù),數(shù)據(jù)驅(qū)動方法明顯比基于模型的方法在計(jì)算執(zhí)行時間和內(nèi)存需求方面有優(yōu)勢。本文提出一種基于動態(tài)數(shù)據(jù)驅(qū)動的目標(biāo)分類算法。對時變的外部環(huán)境特征加以提取作為目標(biāo)識別計(jì)算的反饋控制量,采用環(huán)境改進(jìn)模型作為決策用有限狀態(tài)自動識別機(jī),為其中每個狀態(tài)訓(xùn)練相應(yīng)的分類識別方法,實(shí)現(xiàn)識別算法對環(huán)境影響的自適應(yīng)過程,從而提高分類識別的準(zhǔn)確度。
本節(jié)首先給出與后續(xù)算法相關(guān)的一些數(shù)學(xué)定義和表達(dá)式。主要是關(guān)于有限狀態(tài)自動識別機(jī)和概率有限狀態(tài)機(jī)的定義。有限狀態(tài)自動識別機(jī)(DFSA)是一個三元組:
G=(∑,Q,δ)
(1)
其中:∑是非空有限集,稱為符號集,滿足|∑|<∞;Q是非空有限集,稱為狀態(tài)集,滿足|Q|<∞;δ:Q×∑→Q是狀態(tài)轉(zhuǎn)移映射 。
概率有限狀態(tài)機(jī)(PFSA)是基于一個DFSA構(gòu)建的,形如:
K=(G,π)=(∑,Q,δ,π)
(2)
其中,π:Q×∑→[0,1]為概率映射函數(shù)滿足∑σ∈∑π(q,σ)=1,?q∈Q。
如果QG是已知環(huán)境的集合,Ψ是特征的集合,C為事件分類的有限集。則函數(shù):
A:QG×Ψ→C
(3)
為基于環(huán)境的事件分類器,滿足:?q∈QG,?P∈Ψ,A(q,P)∈C。
無人值守的地面?zhèn)鞲衅鞴ぷ髟趶?fù)雜的環(huán)境條件之中,其觀察數(shù)據(jù)會隨這些因素改變。因此,目標(biāo)分類算法及其訓(xùn)練需要一個模型來捕捉外部因素。在某地理區(qū)域內(nèi)布置傳感器陣列,陣列中傳感器之間具有通信能力。每個傳感器都包括不同的傳感器模塊,如被動紅外,聲學(xué)和地震模塊等[6-8],即傳感器陣列包含一些獨(dú)立的傳感器,每個獨(dú)立的傳感器可感知一種或幾種物理場信息。每一個傳感器模塊都有一個有限的處理和通信能力,能夠完成目標(biāo)檢測和分類任務(wù),并將結(jié)果進(jìn)行彼此溝通。令c為待探測的事件分類數(shù)量,例如:如車輛(C1),動物(C2),人員(C3),則c=3,且定義C0為上述事件均未出現(xiàn)的狀態(tài)。動態(tài)數(shù)據(jù)驅(qū)動算法執(zhí)行的通用框架如圖1所示。
圖1 算法框架示意圖
算法的最底層,采用SDF法,通過來自傳感器的信號域數(shù)據(jù)(S1,…,Sm)用來計(jì)算各個狀態(tài)的概率矢量(p1,…,pm)。并將結(jié)果合并為一個特征矢量(P)。對于每個獨(dú)立的傳感器來說,都存在一個P矢量,如果傳感器節(jié)點(diǎn)數(shù)量為n,則可以獲得矢量P1,…,Pn,環(huán)境特征不能從單個傳感器數(shù)據(jù)中獨(dú)立獲得,需要進(jìn)行特征層面的數(shù)據(jù)融合。待探測事件的集合{Ci,i=1,…,m}的具備空間維度上的一些特征[5],采用下式對所獲得的特征矢量進(jìn)行處理:
(4)
(5)
其中:i表示單獨(dú)獲取某種物理場的傳感器,m為一個傳感器節(jié)點(diǎn)上上述傳感器的總數(shù),ai是權(quán)值,n為傳感器節(jié)點(diǎn)的總數(shù)。
上述兩式中涉及的矢量運(yùn)算定義如下:
pi=[pj1,pj2,…,pjd]?j∈{1,2,3}
p1⊕p2=p3
(6)
p1?α1=p2
(7)
考慮矢量加法和標(biāo)量乘法的閉合性,將其變?yōu)镠ilbert空間中的符號表示法,詳見文獻(xiàn)[6]。
SDF處理算法可獲得特征空間中的一個數(shù)據(jù)點(diǎn),在時間上重復(fù)該算法,在算法的上層,采用K均值聚類方法,引入非監(jiān)督學(xué)習(xí)機(jī)制,將相同的特征,即特征空間中相同的數(shù)據(jù)點(diǎn)加以合并,獲得特征數(shù)據(jù)集合如:G1,G2…,Gk,K的選擇由模型復(fù)雜性及模型誤差共同決定。這樣,特征集合可以借助符合Gk來表示,即獲得了公式 (1)中的∑。通過D-Markov方法獲得DFSA模型,該模型即為環(huán)境進(jìn)化或環(huán)境改變模型。模型中每個狀態(tài)都是D符號的鏈,也可以認(rèn)為是瞬時或短周期符號的集成,這樣就獲得了關(guān)于環(huán)境的符號表示。DFSA中的各個狀態(tài),稱為環(huán)境狀態(tài)。一旦出現(xiàn)新的特征矢量,DFSA過程對環(huán)境狀態(tài)將做出更新,從而使得對目標(biāo)的分類能夠應(yīng)用最新的狀態(tài)反饋信息,適應(yīng)環(huán)境的短時和長期變化。
符號化動態(tài)濾波(Symbolic Dynamic Filtering, SDF)用于從單個傳感器數(shù)據(jù)中提取特征參數(shù),它的理論尚未完全成熟,目前普遍將動態(tài)濾波處理成一個雙時間尺度問題,在短周期上,系統(tǒng)對數(shù)據(jù)的獲取和處理模型可認(rèn)為是時不變的,而采用長周期模型來描述系統(tǒng)中的緩變特征。其基本步驟為:
第一步,在長周期上采集傳感器數(shù)據(jù)的時間序列{q}∈Q,Q?n×N,n為時間序列的維數(shù),N是每個時間序列的點(diǎn)數(shù);
第二步,將狀態(tài)空間劃分為{B0,…,B(|∑|-1)},每個元素用一個符號σi∈∑表示,范數(shù)形式任取,將時間序列映射到σi,即{q}轉(zhuǎn)換為符號序列{s};
第三步,使用訓(xùn)練數(shù)據(jù),構(gòu)建序列{s}以獲取PFSA,使用測試數(shù)據(jù),通過上述PFSA識別函數(shù)π,此處的PFSA是D-Markov機(jī)[3]。使用上述π和δ,可獲得轉(zhuǎn)移概率矩陣Π=|Q|×|Q|,其元素含義為從狀態(tài)qi到狀態(tài)qj的轉(zhuǎn)移概率。將轉(zhuǎn)移概率矩陣進(jìn)行上三角變換,其變換矢量p用來描述時間序列的特征。
以地震動傳感器為例,傳感器測量的直接結(jié)果是一個時間序列。采用SDF方法時,時間序列首先被轉(zhuǎn)換至小波域,小波系數(shù)是在不同的時間變換和尺度下產(chǎn)生的,基于單個信號的時頻特性選擇小波基函數(shù)與小波尺度。獲得小波表面輪廓后,將其進(jìn)行劃分,將小波系數(shù)的像素值在最大值和最小值之間分成不同的相互排斥的區(qū)域,選擇不同的符號來標(biāo)識區(qū)域的分區(qū),即每個區(qū)域都被貼上標(biāo)簽,這樣就得到了符號集,如果一個值位于上述特定的區(qū)域,則它被編碼為與該區(qū)域相關(guān)的符號。該過程的本質(zhì)是一種基于原始樣本數(shù)據(jù)的特征提取,其關(guān)鍵在于選取能夠描述數(shù)據(jù)核心結(jié)構(gòu)的特征,被選特征具備使得同類樣本在特征空間中呈現(xiàn)距離值最小化的特點(diǎn),而特征矩陣就是對這一結(jié)果的數(shù)學(xué)描述。
經(jīng)過SDF處理傳感器數(shù)據(jù)而獲得的符號系統(tǒng)是一個概率有限狀態(tài)自動機(jī),為了從傳感器數(shù)組中推斷出環(huán)境特征,需要將SDF獲得的特征向量進(jìn)行加權(quán)平均,權(quán)重的選擇依據(jù)傳感器工作性能先驗(yàn)知識來確定,如果傳感器性能良好,則每個傳感器的權(quán)重一致,如果預(yù)先知道某傳感器性能退化,則降低其獲得的權(quán)重。
對于加權(quán)處理后的數(shù)據(jù),應(yīng)用于基于K均值的非監(jiān)督學(xué)習(xí)技術(shù)對其進(jìn)行分類。K均值聚類用于將分組G的元素分成k個互斥簇。在初始啟動集群質(zhì)心的位置之后,根據(jù)預(yù)定義的距離分配每個Gi到最近的群集測量。集群中心通過最小化每個Gi與其相應(yīng)的聚類中心之間的距離度量的總和來更新。該集群分配和距離最小化過程是迭代重復(fù)的,直到算法收斂,G的要素沒有進(jìn)一步的變化集群。集群質(zhì)心的位置被隨機(jī)初始化以避免局部最小。并行使用重復(fù)與隨機(jī)初始啟動以確保算法返回距離度量的最小總和。該k均值聚類的輸出是重心的位置,可用于設(shè)置分類目標(biāo)的門檻。由于很難預(yù)先知道哪些條件會顯著影響信號的生成聚合特性,即使所有條件都已知,也很難確定數(shù)據(jù)中集群,即分類的數(shù)量??梢杂脷埐顏砉烙?jì)建模誤差,通過選擇一個參數(shù)權(quán)衡建模誤差和模型的復(fù)雜性。這樣,一旦獲得了數(shù)據(jù)集中的集群數(shù)量,K均值聚類就會給出K不相交的數(shù)據(jù)集。集群標(biāo)簽被分配到該集合中的每個數(shù)據(jù)點(diǎn),在后續(xù)環(huán)境模型中作為分類符號使用。
要獲得環(huán)境及其變化的模型,需要借助于傳感器之間的網(wǎng)絡(luò)通信功能,將不同傳感器的數(shù)據(jù)進(jìn)行基于時間和空間的聚合。如假設(shè)一組訓(xùn)練數(shù)據(jù)來自分布于不同地質(zhì)特征環(huán)境中的地震動傳感器,一部分傳感器布置于水泥地面,另一部分則布置于土質(zhì)地面。這樣,經(jīng)過網(wǎng)絡(luò)的數(shù)據(jù)交換,位于網(wǎng)絡(luò)中的每個傳感器都會獲得這個環(huán)境信息,從而在目標(biāo)分類過程中利用與環(huán)境信息有關(guān)的判斷準(zhǔn)則進(jìn)行判斷,達(dá)到處理環(huán)境變化的效果。環(huán)境的變化在模型中表示為狀態(tài)轉(zhuǎn)移函數(shù),通過D-Markov方法獲得,D的層數(shù)表示狀態(tài)數(shù)的復(fù)雜性,即模型深度,更大的深度提供了更復(fù)雜的模型,能夠提高分類精度,但網(wǎng)絡(luò)中的通信量增加,必須進(jìn)行權(quán)衡,選擇合適的深度以匹配網(wǎng)絡(luò)的其他性能。D-Markov機(jī)的構(gòu)造是基于依據(jù)相對重要性進(jìn)行狀態(tài)分割產(chǎn)生不同長度的符號塊,進(jìn)而從符號塊中引入歷史數(shù)據(jù)完成狀態(tài)合并,在執(zhí)行任何狀態(tài)合并之前,SDF獲得的字符都可以作為狀態(tài)來處理。
采用仿真數(shù)據(jù)對上述算法進(jìn)行驗(yàn)證與分析,通過對數(shù)據(jù)疊加參數(shù)不同的高斯白噪聲模擬不同的環(huán)境特征。仿真數(shù)據(jù)的類型分為三種,分別表示動物、人和車輛;此外,另采用一組數(shù)據(jù)模擬沒有任何目標(biāo)的情形。圖2中給出了疊加到數(shù)據(jù)中的模擬環(huán)境特征帶來的影響,對于仿真的同一組具有車輛信息的時間序列數(shù)據(jù),添加不同的環(huán)境特征,其結(jié)果如圖2所示,圖中上面的兩個子圖表示時域數(shù)據(jù)的區(qū)別,下面兩個子圖代表特征矢量的區(qū)別,從中可以看出,對于同一目標(biāo),在不同環(huán)境下,其特征矢量發(fā)生了顯著變化。
圖2 不同環(huán)境特征對于目標(biāo)數(shù)據(jù)的影響
在獲得了仿真的目標(biāo)數(shù)據(jù),并對其添加代表不同環(huán)境的噪聲后,對所產(chǎn)生的數(shù)據(jù)進(jìn)行采樣,采樣所使用的頻率根據(jù)計(jì)算需求和數(shù)據(jù)類型確定。將采樣后的數(shù)據(jù)分為兩組,其一用于對計(jì)算模型的訓(xùn)練,其二用于對算法的驗(yàn)證。用于模型訓(xùn)練的數(shù)據(jù)將獲得上文算法中的特征矢量,從而得到完備的目標(biāo)分類模型。進(jìn)一步地,將用于驗(yàn)證的數(shù)據(jù)代入,驗(yàn)證算法的有效性。
運(yùn)用Hilbert空間中的符號表示法,確定數(shù)據(jù)中對應(yīng)幾種目標(biāo),圖3中給出了分組數(shù)量與分組評分之間的關(guān)系,可以看出,當(dāng)分組數(shù)量取3時,對應(yīng)的評分為最小值,滿足符合表示法的規(guī)則要求,因此,目標(biāo)分類為3,即算法中。
圖3 目標(biāo)分組數(shù)量與分組評分示意圖
通過D-Markov機(jī)獲得的DFSA模型中每個狀態(tài)都是D符號的鏈,即瞬時或短周期符號的集成,由此獲得關(guān)于環(huán)境的符號表示。符號表示的復(fù)雜程度對于識別與分類算法的影響見圖4。
圖4 符號表示的復(fù)雜程度對結(jié)果的影響
從圖4中可以看出,符號表示數(shù)目增加,識別結(jié)果總體趨勢趨向更高的識別率,這是因?yàn)楦嗟姆柋硎緮?shù)目其物理含義對應(yīng)的是對環(huán)境特征的更具體的分類,增強(qiáng)了算法的環(huán)境適應(yīng)能力。同時,也可以看到這個過程中擾動十分明顯,這是由于更細(xì)致的分類將引入更多的噪聲。因此,需要根據(jù)實(shí)際情況選擇合適的符號表示數(shù)目,以達(dá)到最佳的識別效果。
文章給出了一種基于動態(tài)數(shù)據(jù)驅(qū)動的與環(huán)境互動的目標(biāo)識別分類算法框架。通過一種具有聚合特性的傳感器融合技術(shù),在指定區(qū)域的傳感器陣列的所有傳感節(jié)點(diǎn)中,獲取一個符號數(shù)據(jù)表示傳感器數(shù)據(jù)。利用K均值聚類算法獲取環(huán)境模型,依賴傳感器網(wǎng)絡(luò)的通信能力在網(wǎng)絡(luò)中不同區(qū)域傳感器之間傳遞環(huán)境改變的信息,以增強(qiáng)每個傳感器的目標(biāo)檢測和分類能力。采用仿真數(shù)據(jù)對所提出的算法進(jìn)行了仿真,結(jié)果表明該計(jì)算框架能夠提高傳感器陣列對于環(huán)境參數(shù)變化的適應(yīng)性,提高不同環(huán)境中目標(biāo)分類的準(zhǔn)確性。
參考文獻(xiàn):
[1] Iyengar S G, Varshney P K, Damarla T. On the Detection of Footsteps Based on Acoustic and Seismic Sensing[A]. Asilomar Conference on[C]. IEEE, 2008:2248-2252.
[2] 陳珅培, 王曙光, 寧全利. 一種基于炮射地面震動傳感器的目標(biāo)識別算法研究[J]. 彈箭與制導(dǎo)學(xué)報(bào), 2011, 31(2):185-188.
[3] 王 斌, 馮立杰. 陣列式振動傳感器環(huán)境干擾消除方法研究[J]. 電子設(shè)計(jì)工程, 2012, 20(18):155-157.
[4] 張 星, 王 雪, 劉 長. 傳感器陣列預(yù)測空域多信號分類目標(biāo)定位跟蹤[J]. 儀器儀表學(xué)報(bào), 2012, 33(5):970-975.
[5] Mehmood A, Patel V M, Damarla T. Discrimination of bipeds from quadrupeds using seismic footstep signatures[J]. IEEE Xplore,2013, 88(60):6920-6923.
[6] Jin X, Sarkar S, Ray A, et al. Target Detection and Classification Using Seismic and PIR Sensors[J]. IEEE Sensors Journal, 2012, 12(6):1709-1718.
[7] Mckenna M H, Mckenna J R, Anderson T S. Effects of Local Meteorological Variability on Surface and Subsurface Seismic-Acoustic Signals[A]. AGU Spring Meeting Abstracts[C]. 2006.
[8] Wilson D K, Marlin D H, Mackay S. Acoustic/seismic signal propagation and sensor performance modeling[A]. Proc. of Unattended Ground, Sea, and Air Sensor Technologies and Applications IX[C]. 2007.