吳駿雄, 林德福, 王輝, 袁亦方
(1.北京理工大學(xué) 無人機(jī)自主控制技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100081;2.北京特種機(jī)電研究所, 北京 100012)
光纖圖像制導(dǎo)武器使用光纖圖像與指令雙向傳輸體制,可在復(fù)雜的交戰(zhàn)條件下攻擊坦克、艦船、地面或低速空中目標(biāo)。彈載圖像導(dǎo)引頭能夠?qū)D像探測(cè)器敏感的戰(zhàn)場(chǎng)實(shí)時(shí)圖像傳輸?shù)娇刂频孛嬲荆涫挚筛鶕?jù)顯示器中的圖像選擇攻擊目標(biāo)以及攻擊部位,并通過圖像跟蹤器自動(dòng)跟蹤,也可以通過控制手柄進(jìn)行手動(dòng)跟蹤直至命中目標(biāo),即所謂的“人在回路”制導(dǎo)方式[1]。因此,了解射手對(duì)導(dǎo)引頭跟蹤誤差的響應(yīng)并對(duì)射手本身進(jìn)行建模,不僅可以更深入地了解射手的感知過程,而且能夠?qū)χ茖?dǎo)控制系統(tǒng)設(shè)計(jì)[2]以及培訓(xùn)模擬設(shè)備評(píng)價(jià)起重要作用[3]。
對(duì)人進(jìn)行建模的研究始于20世紀(jì)50年代[4],其中最具代表性的是McRuer等提出的精確模型,該模型已在諸多領(lǐng)域應(yīng)用[5]。隨著現(xiàn)代控制理論的發(fā)展,Kleinman等[6]建立了人的最優(yōu)控制模型,Hess[7]提出了能充分體現(xiàn)人的信號(hào)處理過程的Hess結(jié)構(gòu)模型。近來,將智能技術(shù)應(yīng)用到人的建模問題中逐漸成為研究熱點(diǎn),其中模糊控制和神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成功應(yīng)用到飛行員模型辨識(shí)中[8-9]。
人響應(yīng)的具體特征是由模型參數(shù)決定的[10],可以利用參數(shù)辨識(shí)技術(shù)從實(shí)驗(yàn)數(shù)據(jù)中得到。目前人的模型參數(shù)辨識(shí)方法可分為兩類:一類是針對(duì)人對(duì)時(shí)不變控制對(duì)象的響應(yīng);另一類是針對(duì)人對(duì)環(huán)境或者控制對(duì)象動(dòng)力學(xué)突然變化時(shí)的響應(yīng)[11]。傅里葉系數(shù)[12]和最大似然估計(jì)[13]是辨識(shí)時(shí)不變控制對(duì)象人的行為典型方法,前者需先估計(jì)非參數(shù)化的系統(tǒng)頻率響應(yīng),再通過擬合非參數(shù)化模型得到模型參數(shù);后者直接通過擬合時(shí)域數(shù)據(jù)來辨識(shí)模型參數(shù)。與傅里葉系數(shù)法相比,最大似然估計(jì)方法僅使用1個(gè)步驟來辨識(shí)模型,減小了參數(shù)估計(jì)的偏差和方差。針對(duì)時(shí)變控制對(duì)象人的響應(yīng)辨識(shí)問題主要有最大似然、小波變換[11]和Kalman濾波[14]等方法?!叭嗽诨芈贰敝茖?dǎo)體制下射手的控制對(duì)象是導(dǎo)引頭內(nèi)回路,在飛行過程中其動(dòng)力學(xué)特性幾乎不變。因此,本文采用最大似然估計(jì)方法來辨識(shí)射手模型。
基于上述分析,本文擬針對(duì)射手控制行為進(jìn)行建模辨識(shí)。目前國內(nèi)外關(guān)于射手模型的文獻(xiàn)較少,未有詳細(xì)的關(guān)于射手建模的相關(guān)文獻(xiàn)。其中趙軍民等采用輔助變量法對(duì)模型參數(shù)進(jìn)行辨識(shí)[2],但其認(rèn)為模型的神經(jīng)延遲環(huán)節(jié)固定,實(shí)驗(yàn)條件也僅考慮在跟蹤橫向運(yùn)動(dòng)的坦克目標(biāo),未能充分激勵(lì)射手的響應(yīng)。因此,本文將設(shè)計(jì)具有較寬頻率范圍的激勵(lì)信號(hào),而且為了提高辨識(shí)精度,采用輸出誤差結(jié)構(gòu)的最大似然法。此外,針對(duì)參數(shù)估計(jì)過程梯度優(yōu)化算法對(duì)初值敏感且易發(fā)散的特性,采用混合梯度算法進(jìn)行優(yōu)化,即利用遺傳算法逼近最優(yōu)值,利用梯度算法的快速性加快算法運(yùn)行,并使用單純形法保證算法的穩(wěn)定性。
光纖圖像制導(dǎo)系統(tǒng)采用大容量光纖傳輸系統(tǒng),能夠?qū)㈦娨晫?dǎo)引頭的圖像實(shí)時(shí)傳輸?shù)降孛嬲?,且能在武器地面站?shí)現(xiàn)傳統(tǒng)的導(dǎo)引頭圖像跟蹤能力,使得跟蹤器可以重復(fù)使用。相比于彈載圖像跟蹤器,地面站圖像跟蹤器的功能可以設(shè)計(jì)得更加強(qiáng)大和全面,同時(shí)降低武器使用成本。人工控制模式下導(dǎo)引頭的控制框圖如圖1所示。
圖1中:qt為目標(biāo)的慣性空間視線角;qs為導(dǎo)引頭光軸相對(duì)于慣性空間的角度;Δq為視場(chǎng)角誤差信號(hào);Hp(s)為射手模型的傳遞函數(shù),s為拉普拉斯算子;n為射手模型中的殘差信號(hào);u為射手的輸出;K為信號(hào)放大器;G(s)和H(s)分別為穩(wěn)定回路校正網(wǎng)絡(luò)和速率陀螺。當(dāng)目標(biāo)偏離光軸時(shí),射手通過顯示屏觀測(cè)到視場(chǎng)角誤差Δq,并操控手柄使得光軸指向目標(biāo),實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤。射手在導(dǎo)引頭跟蹤回路中相當(dāng)于1個(gè)反饋控制器,輸入信號(hào)為屏幕上顯示的視場(chǎng)角誤差。因此射手的目標(biāo)跟蹤任務(wù)可認(rèn)為是單回路補(bǔ)償任務(wù),控制對(duì)象即為圖1中的虛線框內(nèi)部分。不失一般性,可假設(shè)G(s)≈1,H(s)≈1,且導(dǎo)引頭穩(wěn)定回路的帶寬約為20~30 Hz,穩(wěn)定回路的傳遞函數(shù)可近似為100/(s+100)[15],則控制對(duì)象的傳遞函數(shù)Hc(s)可表示如下:
(1)
(1)式中的增益K決定了跟蹤回路的帶寬和穩(wěn)定裕度。導(dǎo)引頭跟蹤回路帶寬遠(yuǎn)小于穩(wěn)定回路帶寬,為保證導(dǎo)引頭系統(tǒng)回路具有足夠的穩(wěn)定裕度,在這里選取增益K=2.
本文采用精確模型[16]來描述射手行為。如圖1所示,射手模型的響應(yīng)包含傳遞函數(shù)Hp(s)的響應(yīng)和殘差信號(hào)n兩部分,其中殘差信號(hào)代表射手模型的非線性部分。射手對(duì)顯示運(yùn)動(dòng)提示作出響應(yīng)的線性部分形式如下:
(2)
式中:Kp為視覺感知的增益;τL為視覺感知超前時(shí)間常數(shù);τl為視覺感知滯后時(shí)間常數(shù);ωnm為系統(tǒng)自然頻率;ξnm為系統(tǒng)阻尼;τd為視覺感知時(shí)間延時(shí)。 (2)式表明神經(jīng)肌肉系統(tǒng)的動(dòng)力學(xué)限制了射手響應(yīng),神經(jīng)肌肉系統(tǒng)認(rèn)為是1個(gè)2階質(zhì)量彈簧阻尼系統(tǒng)。
McRuer的交叉定理[16]表明,人會(huì)調(diào)整自身的配平動(dòng)力學(xué)來適應(yīng)控制對(duì)象的動(dòng)力學(xué),使得系統(tǒng)開環(huán)傳遞函數(shù)在交叉頻率附近具有類似單積分器系統(tǒng)的頻率特性。對(duì)于(1)式所示控制對(duì)象的動(dòng)力學(xué),射手需要在更高的頻率處進(jìn)行配平[17]。因此圖1中射手傳遞函數(shù)表示如下:
(3)
綜上所述,共有5個(gè)參數(shù)需要被估計(jì),參數(shù)向量θ=[Kp,τL,τd,ξnm,ωnm]T。
下面基于最大似然估計(jì)方法來得到射手模型的參數(shù),為簡(jiǎn)化整個(gè)參數(shù)估計(jì)過程,采用輸出誤差的結(jié)構(gòu)來構(gòu)造似然函數(shù)。為了解決非線性優(yōu)化問題的全局最優(yōu)問題,并避免出現(xiàn)局部最優(yōu)現(xiàn)象,即找到觀測(cè)值出現(xiàn)的最大概率,在使用經(jīng)典的梯度優(yōu)化算法之前,使用遺傳算法來決定梯度算法的初值。
最大似然估計(jì)是一種時(shí)域參數(shù)估計(jì)方法,在眾多領(lǐng)域都有著應(yīng)用[18]。最大似然估計(jì)是一類概率性貝葉斯估計(jì)方法,通過引入觀測(cè)量的條件概率密度,構(gòu)造1個(gè)以觀測(cè)數(shù)據(jù)和未知參數(shù)為自變量的似然函數(shù),以觀測(cè)值出現(xiàn)的概率最大作為估計(jì)準(zhǔn)則,獲得系統(tǒng)模型的參數(shù)估計(jì)值。
在應(yīng)用最大似然估計(jì)方法時(shí),需要將射手傳遞函數(shù)模型表示為狀態(tài)空間形式。在轉(zhuǎn)化過程中,射手模型中的純延時(shí)環(huán)節(jié)為非線性環(huán)節(jié),可以將延時(shí)環(huán)節(jié)近似為1個(gè)高階的傳遞函數(shù),其中1種近似方法為Padé近似[19],其具體形式如下:
(4)
式中:T為延遲時(shí)間;ka=0,…,λ,λ為Padé近似的階次。為保證延時(shí)模型在高頻處的精確描述,且不使近似射手模型階次過高,本文采用5階延時(shí)環(huán)節(jié)Padé近似[13]:
(5)
將(5)式代入(3)式中,可得近似的射手傳遞函數(shù)為
(6)
式中:b0,…,b6和a0,…,a6分別為對(duì)應(yīng)的傳遞函數(shù)系數(shù)。
由于引入了Padé近似,射手傳遞函數(shù)的系數(shù)為未知辨識(shí)參數(shù)的非線性函數(shù),例如(6)式中分母的第1項(xiàng)和最后1項(xiàng)系數(shù)為
(7)
將射手傳遞函數(shù)(6)式轉(zhuǎn)換為狀態(tài)空間的標(biāo)準(zhǔn)型,可得
(8)
式中:x為狀態(tài)向量;狀態(tài)矩陣A(θ)、控制矩陣B(θ)和輸出矩陣C(θ)的表達(dá)式分別為
(9)
(8)式給出的射手模型僅在輸出方程中包含1個(gè)額外的噪聲項(xiàng),即假設(shè)沒有過程噪聲的影響,從而可以采用輸出誤差結(jié)構(gòu)的最大似然估計(jì),大大簡(jiǎn)化了辨識(shí)步驟。在文獻(xiàn)[20]關(guān)于辨識(shí)人的模型研究中,一般假設(shè)人的響應(yīng)殘差部分是1個(gè)零均值高斯噪聲,并通過實(shí)驗(yàn)驗(yàn)證該假設(shè)。本文同樣假設(shè)射手殘差具有相同的特性,即認(rèn)為(8)式的模型中殘差是高斯量測(cè)噪聲,其均值和方差定義如下:
(10)
式中:n(k)為殘差信號(hào)n的離散采樣時(shí)間序列,k為序列號(hào),k=1,…,m,m為采樣點(diǎn)個(gè)數(shù)。
最大似然估計(jì)方法中,需要尋找模型參數(shù)向量θ的估計(jì)值,該估計(jì)值使得似然函數(shù)L(θ)具有最大值。L(θ)定義為預(yù)測(cè)誤差的條件概率密度函數(shù):
L(θ)=f(v(1),v(2),…,v(k),…,v(m)|θ),
(11)
式中:v(k)為預(yù)測(cè)誤差,定義為量測(cè)的離散射手輸出信號(hào)u(k)和離散射手模型輸出信號(hào)(k)之差,
v(k)=u(k)-(k).
(12)
由(10)式定義的殘差性質(zhì),可得似然函數(shù)為
(13)
圖2所示為輸出誤差辨識(shí)策略的基本框架,該策略需要最小化1個(gè)二次型罰函數(shù),該函數(shù)與輸出誤差相關(guān),其中輸出誤差為射手實(shí)際輸出和在相同輸入情況下辨識(shí)模型的仿真輸出之差。因此,罰函數(shù)定義為實(shí)際數(shù)據(jù)和仿真數(shù)據(jù)的匹配度,即參數(shù)估計(jì)值和實(shí)際估計(jì)值之間的差別。輸出誤差辨識(shí)策略采用迭代搜索算法在參數(shù)空間中尋找最優(yōu)參數(shù)值,使得罰函數(shù)值最小,則最優(yōu)參數(shù)值即為最終的參數(shù)估計(jì)值。
在應(yīng)用最大似然估計(jì)方法時(shí),若估計(jì)的參數(shù)使得似然函數(shù)最大,則為模型參數(shù)向量θ的估計(jì)值;而在輸出誤差策略下使用最大似然估計(jì)方法,需要用求取似然函數(shù)對(duì)數(shù)形式的最小值代替求取似然函數(shù)的最大值,從而簡(jiǎn)化為一個(gè)更加直接的優(yōu)化問題。當(dāng)對(duì)數(shù)似然取得全局最小時(shí),得到的參數(shù)向量即為最大似然估計(jì)值,表示為ML. 因此,輸出誤差策略下的最大似然估計(jì)表示為
(14)
(14)式概括了本文射手模型的參數(shù)估計(jì)問題,它定義了1個(gè)強(qiáng)非線性優(yōu)化問題。下面采用混合梯度優(yōu)化算法來得到該優(yōu)化問題的全局最優(yōu)解。
傳統(tǒng)求解最大似然極小值的方法有Levenberg-Marquardt、高斯- 牛頓和Newton-Raphson等方法。本文提出一種混合梯度優(yōu)化算法,采用遺傳算法和高斯- 牛頓梯度優(yōu)化算法相結(jié)合的方式來估計(jì)射手傳遞函數(shù)的參數(shù),具體策略如圖3所示。
在沒有先驗(yàn)信息情況下,該混合優(yōu)化算法首先應(yīng)用遺傳算法進(jìn)行初始迭代,然后用高斯- 牛頓和單純形法算法來優(yōu)化(14)式。由于較大的初始誤差可能會(huì)導(dǎo)致參數(shù)估計(jì)發(fā)散,在計(jì)算初始時(shí)刻使用遺傳算法以減小算法對(duì)初始值的敏感。此外,高斯- 牛頓算法具有較快的收斂速度,但當(dāng)離真實(shí)解較遠(yuǎn)時(shí)會(huì)產(chǎn)生不準(zhǔn)確的梯度信息、導(dǎo)致發(fā)散。因此,為增強(qiáng)算法的魯棒性,當(dāng)高斯- 牛頓算法發(fā)散時(shí),切換為Nelder-Mead單純形法進(jìn)行迭代,直至高斯- 牛頓算法能夠收斂。
2.2.1 遺傳算法
遺傳算法固有的隨機(jī)性以及在初始參數(shù)向量集內(nèi)的最優(yōu)解開始搜索,導(dǎo)致該算法有很高的概率找到優(yōu)化問題的全局最優(yōu)值[21]。遺傳算法首先需要?jiǎng)?chuàng)建1個(gè)初始種群,即初始參數(shù)向量集,該種群在參數(shù)的上下界隨機(jī)選取,在此用矩陣表示為
(15)
通過目標(biāo)函數(shù)(14)式評(píng)估種群中每個(gè)個(gè)體的適應(yīng)度。圖4所示為對(duì)當(dāng)前種群每個(gè)個(gè)體運(yùn)用3個(gè)基因操作從而產(chǎn)生新種群的過程,具體步驟如下:
1) 復(fù)制(elite):從當(dāng)前種群中選擇適應(yīng)度強(qiáng)的個(gè)體,并復(fù)制給下一代;
2) 交叉(crossover):從當(dāng)前種群中任選2個(gè)個(gè)體,隨機(jī)選擇基因中交叉點(diǎn)的位置,模擬進(jìn)化過程中的繁殖現(xiàn)象,得到全新基因的個(gè)體;
3) 變異(mutation):當(dāng)前個(gè)體基因小概率隨機(jī)選擇變異點(diǎn),并發(fā)生變化從而產(chǎn)生新的個(gè)體。
不斷重復(fù)上述步驟,直至終止條件滿足。
由于遺傳算法使用概率搜索技術(shù),導(dǎo)致1個(gè)搜索點(diǎn)到另1個(gè)搜索點(diǎn)的轉(zhuǎn)移方式和關(guān)系具有不確定性,也導(dǎo)致每次迭代出的結(jié)果不一致。因此,從測(cè)試數(shù)據(jù)中來估計(jì)射手模型的參數(shù),并不適合僅僅使用遺傳算法。
2.2.2 無約束高斯- 牛頓優(yōu)化算法
遺傳算法迭代得到的模型參數(shù)估計(jì)值,在很大程度上接近于優(yōu)化問題的全局最優(yōu)解。為進(jìn)一步得到精確的參數(shù)估計(jì)值,將遺傳算法的解作為高斯- 牛頓優(yōu)化算法的初始參數(shù)估計(jì)值,這種基于梯度的優(yōu)化算法是解決最大似然優(yōu)化問題的一種經(jīng)典求解方法[22]。高斯- 牛頓優(yōu)化算法的參數(shù)迭代更新方程由下式給出:
(i+1)=(i)+Δ,Δ
(16)
(17)
Mθ=θ(i)為Fisher信息矩陣,
(18)
(16)式中需要求解Fisher信息矩陣的逆矩陣,則要求Fisher信息矩陣可逆。通過求解Fisher信息矩陣可以得到Cramér-Rao的下界(CRLB)[23],即參數(shù)估計(jì)可實(shí)現(xiàn)的最小方差,表示為Jc. 當(dāng)未知模型參數(shù)過多時(shí)或數(shù)據(jù)中信息量不足時(shí),信息矩陣M容易變成病態(tài)矩陣甚至奇異矩陣,導(dǎo)致迭代步長(zhǎng)在某些方向上過大或者信息矩陣不可逆。因此,將信息矩陣M進(jìn)行奇異值分解并求逆,有
(19)
式中:tks、uks分別為矩陣T和U的第ks列;δ1,…,δr為信息矩陣的r個(gè)奇異值。將奇異值從大到小排列,有
δ1≥δ2≥…≥δks≥δr.
(20)
一般而言,信息矩陣中最小的幾個(gè)奇異值所包含的矩陣信息較少,且當(dāng)奇異值過小時(shí)容易導(dǎo)致信息矩陣病態(tài)甚至不可逆,故可將最小的幾個(gè)奇異值舍去。假設(shè)有η個(gè)奇異值滿足舍去的標(biāo)準(zhǔn):
(21)
式中:ε為計(jì)算機(jī)的計(jì)算精度;δmax為最大奇異值。經(jīng)過上述處理后,信息矩陣的逆矩陣階次從r階降低到r-η階,故該方法又稱為降階矩陣求逆法[24]。
此外,為防止高斯- 牛頓優(yōu)化算法發(fā)散而終止迭代,將該算法切換成Nelder-Mead單純形法。Nelder-Mead單純形法是一種多維直接搜索的局部?jī)?yōu)化方法,在尋優(yōu)過程中不必計(jì)算目標(biāo)函數(shù)的梯度,只是針對(duì)一定圖形的頂點(diǎn),按照一定規(guī)則進(jìn)行搜索,該方法操作簡(jiǎn)單且一直是收斂的,但是計(jì)算速度較慢,具體過程詳見文獻(xiàn)[25]。
(22)
下面介紹射手目標(biāo)跟蹤補(bǔ)償實(shí)驗(yàn),目標(biāo)視場(chǎng)角信號(hào)驅(qū)動(dòng)目標(biāo)在視場(chǎng)內(nèi)運(yùn)動(dòng),射手根據(jù)視場(chǎng)誤差角控制手柄,使光軸對(duì)準(zhǔn)目標(biāo)。為了防止射手預(yù)測(cè)信號(hào)的趨勢(shì),激勵(lì)信號(hào)應(yīng)表現(xiàn)一定的隨機(jī)性,McRuer等[16]在實(shí)驗(yàn)中,將激勵(lì)信號(hào)設(shè)計(jì)為由若干正弦信號(hào)疊加而成,其形式為
(23)
式中:Akf為正弦信號(hào)幅值;ωkf為正弦信號(hào)頻率;φkf為正弦信號(hào)相位;kf=1,…,N,N為正弦信號(hào)個(gè)數(shù)。
為了得到較高精度的射手動(dòng)力學(xué)模型,激勵(lì)信號(hào)必須具有充分寬的頻帶和高的信噪比,激勵(lì)信號(hào)的每個(gè)部分即Akf、ωkf和φkf都需要精確設(shè)計(jì)。因此將激勵(lì)信號(hào)的頻譜設(shè)計(jì)成1階低通濾波器形狀[12],每個(gè)頻率點(diǎn)的幅值為
(24)
表1 激勵(lì)信號(hào)參數(shù)
實(shí)驗(yàn)在實(shí)驗(yàn)室開發(fā)的仿真系統(tǒng)上進(jìn)行,該系統(tǒng)主要包括顯示子系統(tǒng)、動(dòng)力學(xué)仿真子系統(tǒng)和控制手柄,仿真系統(tǒng)原理圖如圖5所示。其中動(dòng)力學(xué)仿真子系統(tǒng)在嵌入式系統(tǒng)RTX基礎(chǔ)上開發(fā),用以采集手柄的輸出并實(shí)時(shí)仿真導(dǎo)引頭系統(tǒng)動(dòng)力學(xué),計(jì)算頻率為1 000 Hz;顯示子系統(tǒng)采用vista2D+微軟基礎(chǔ)類庫(MFC)方式開發(fā),用以顯示視場(chǎng)角誤差,其顯示的信息通過用戶數(shù)據(jù)報(bào)協(xié)議(UDP)和動(dòng)力學(xué)仿真子系統(tǒng)通信得到,然后射手根據(jù)顯示信息操縱手柄,將導(dǎo)引頭光軸對(duì)準(zhǔn)目標(biāo)以減小跟蹤誤差。
實(shí)驗(yàn)中共有5個(gè)參試人員,在采集數(shù)據(jù)前,所有參試人員需進(jìn)行相當(dāng)次數(shù)的訓(xùn)練,直到他們的跟蹤表現(xiàn)穩(wěn)定在一定水平。參試人員的跟蹤水平可以通過誤差信號(hào)均方根來評(píng)價(jià),每次訓(xùn)練后參試人員都會(huì)被告知他們的跟蹤評(píng)分,以便在初始熟悉期間激勵(lì)改善他們的跟蹤表現(xiàn),且在達(dá)到一定熟練程度后用以保持穩(wěn)定的表現(xiàn)。為了提高辨識(shí)結(jié)果精度,每個(gè)參試人員重復(fù)5次實(shí)驗(yàn)并采集相應(yīng)的測(cè)量數(shù)據(jù)。
實(shí)驗(yàn)中圖1所示的所有信號(hào)都被記錄下來,為了減少信號(hào)中噪聲部分的影響并改善射手模型參數(shù)估計(jì)的精度,將每個(gè)參試人員的5次重復(fù)實(shí)驗(yàn)信號(hào)求平均值。圖6所示為平均視場(chǎng)角誤差信號(hào)Δq、射手輸出信號(hào)u、目標(biāo)視場(chǎng)角(激勵(lì)信號(hào))qt、光軸相對(duì)于慣性系夾角qs. 由圖6可知參試人員成功將光軸對(duì)準(zhǔn)了目標(biāo)。
3.3.1 算法性能分析
表2 遺傳算法參數(shù)域的上界和下界
遺傳算法是一種基于概率啟發(fā)式的搜索算法,在一定迭代步長(zhǎng)限制下,每次迭代結(jié)果不完全相同。對(duì)單個(gè)參試人員的實(shí)驗(yàn)結(jié)果重復(fù)若干次遺傳算法辨識(shí)運(yùn)算,將迭代結(jié)果最小的10個(gè)解代入高斯- 牛頓優(yōu)化算法進(jìn)一步優(yōu)化。圖7(a)給出了這10個(gè)解的全部迭代過程,由圖7(a)可知,重復(fù)10次遺傳算法最終給出的值都不同,但通過高斯- 牛頓算法優(yōu)化后最終都得到了相同的優(yōu)化結(jié)果,即得到全局最小對(duì)數(shù)似然函數(shù)值,其對(duì)應(yīng)的模型參數(shù)即為辨識(shí)結(jié)果。因?yàn)閮蓚€(gè)優(yōu)化算法中殘差方差的初始估計(jì)值都設(shè)置為1,所以得到的目標(biāo)函數(shù)值較大,經(jīng)過前述交替迭代過程最終得到各自的估計(jì)值,具體結(jié)果如圖7(b)所示。
為了對(duì)比說明混合優(yōu)化算法的優(yōu)勢(shì),選擇高斯- 牛頓優(yōu)化算法結(jié)合單純形法的復(fù)合優(yōu)化算法[24]來估計(jì)模型參數(shù)。在表2參數(shù)域內(nèi)隨機(jī)選擇100個(gè)初始參數(shù)向量,并分別使用高斯- 牛頓優(yōu)化算法結(jié)合單純形法的復(fù)合優(yōu)化算法進(jìn)行尋優(yōu),圖8以升序方式給出了相應(yīng)的結(jié)果。從圖8可知,收斂至全局最小的參數(shù)向量小于一半,剩下的參數(shù)向量將導(dǎo)致收斂發(fā)散或者收斂至局部最小值。由此可見,采用混合優(yōu)化算法能大大地減小初值選取工作,且能夠精確地收斂至全局最小值。
3.3.2 結(jié)果分析
表3 模型參數(shù)辨識(shí)結(jié)果(參試人員1)
表4給出了本次實(shí)驗(yàn)所有參試人員的辨識(shí)結(jié)果,圖10為相應(yīng)的頻率響應(yīng)曲線。從圖10可知,所有參試人員有著一致的辨識(shí)結(jié)果。其中不同參試人員的傳遞函數(shù)略有不同,這是因?yàn)槊總€(gè)參試人員有著不同的控制策略且個(gè)體之間的差異導(dǎo)致的,這種現(xiàn)象在該類型實(shí)驗(yàn)中普遍存在。
表4 所有參試人員的辨識(shí)結(jié)果
相關(guān)性系數(shù)ρu一般用于評(píng)價(jià)辨識(shí)模型的準(zhǔn)確性,能夠用來表示辨識(shí)模型的輸出再現(xiàn)量測(cè)輸出的能力。如果相關(guān)系數(shù)接近于1,則表示辨識(shí)模型的輸出能很好地?cái)M合量測(cè)輸出,辨識(shí)模型可以較真實(shí)地反映實(shí)際對(duì)象的動(dòng)態(tài)特性;反之,如果相關(guān)系數(shù)接近于0,則表示辨識(shí)結(jié)果較差,未能捕捉到實(shí)際對(duì)象的動(dòng)態(tài)特性。相關(guān)系數(shù)ρu的定義[26]如下:
(25)
表4中參試人員1的相關(guān)系數(shù)為86%,可知模型輸出能夠較好地?cái)M合量測(cè)輸出,辨識(shí)模型能夠反映射手動(dòng)態(tài)特性。圖11給出的參試人員1量測(cè)輸出和模型輸出的對(duì)比圖也證明了該結(jié)論。表5給出了所有參試人員的相關(guān)系數(shù)。由表5可見,本實(shí)驗(yàn)得到的每個(gè)參試人員辨識(shí)模型相關(guān)性系數(shù)均大于70%,可以認(rèn)為辨識(shí)模型能夠較好地?cái)M合射手的動(dòng)力學(xué)特性。
相關(guān)系數(shù)參試人員12345ρu^u/%86.1872.6980.9585.7492.52
3.3.3 殘差分析
射手輸出除了線性輸出部分,還包含模型為高斯噪聲的殘差,殘差可以由辨識(shí)線性射手模型輸出和實(shí)際量測(cè)射手的輸出之差得到。圖12(a)給出了參試人員1的殘差時(shí)域圖,其相應(yīng)的功率譜密度(PSD)在圖12(b)中給出。由圖12可以看到,殘差信號(hào)并不為白噪聲,其特性近似為1個(gè)3階低通濾波器:
(26)
式中:Kn為殘差強(qiáng)度,Kn=0.26;ωn為殘差濾波器的轉(zhuǎn)折頻率,ωn=0.8 rad/s;ξn為殘差濾波器的阻尼系數(shù),ξn=0.06.
射手模型殘差的概率密度函數(shù)如圖13所示。由圖13可見:有殘差信號(hào)的分布接近于零均值的高斯分布,同時(shí)也驗(yàn)證了之前的假設(shè);此外殘差信號(hào)譜特性并沒有影響到信號(hào)的正態(tài)性。
本文針對(duì)光纖制導(dǎo)武器中射手模型估計(jì)問題,采用基于輸出誤差框架下最大似然估計(jì)方法對(duì)射手模型參數(shù)和殘差特性進(jìn)行辨識(shí)。為提高優(yōu)化算法的性能和魯棒性,引入混合梯度優(yōu)化算法,并成功應(yīng)用于實(shí)驗(yàn)得到的數(shù)據(jù)中,經(jīng)過多輪次迭代計(jì)算都能夠找到全局最優(yōu)解。辨識(shí)結(jié)果表明:算法能夠從時(shí)域數(shù)據(jù)中精確地辨識(shí)得到射手模型參數(shù),射手辨識(shí)模型能夠真實(shí)地反映射手的動(dòng)態(tài)過程;射手的殘差信號(hào)基本符合正態(tài)分布,且具有色噪聲的頻率特性。