塞拉斯, 宋揚(yáng), 孫華飛
(北京理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 北京 100081)
眾所周知, 一個(gè)不穩(wěn)定的系統(tǒng)在工程上是無(wú)法使用的, 穩(wěn)定性是控制理論核心的研究?jī)?nèi)容之一. 李雅普諾夫方程在線性系統(tǒng)的穩(wěn)定性研究中具有重要的作用. 通常, 李雅普諾夫方程沒(méi)有解析解, 只有數(shù)值解. 如利用定義在正定矩陣流形上的仿射黎曼度量, 利用測(cè)地距離作為目標(biāo)函數(shù)來(lái)求解李亞普諾夫方程[1-4]. 本文利用建立在對(duì)稱(chēng)正定矩陣上的對(duì)數(shù)歐氏度量誘導(dǎo)的測(cè)地距離作為目標(biāo)函數(shù), 給出求解李雅普諾夫方程的幾何求解方法.
設(shè)SPD(n)表示對(duì)稱(chēng)正定矩陣的全體, 可以驗(yàn)證它是一般線性群GL(n,R)的子流形. 對(duì)稱(chēng)正定流形擁有良好的幾何性質(zhì), 在圖像處理、信號(hào)處理以及與統(tǒng)計(jì)相關(guān)的領(lǐng)域具有廣泛的應(yīng)用. 如果把對(duì)稱(chēng)正定矩陣僅僅看成矩陣來(lái)對(duì)待, 也就是說(shuō)僅利用它的代數(shù)性質(zhì)來(lái)使用未免有些浪費(fèi), 而在它們上面再賦予幾何的性質(zhì)使之成為流形, 就可以充分挖掘它的價(jià)值. 在SPD(n)上可以定義不同的黎曼度量, 使之成為黎曼度量, 但是如何針對(duì)實(shí)際問(wèn)題的需求選擇適當(dāng)?shù)睦杪攘繉?duì)解決問(wèn)題至關(guān)重要.
對(duì)于時(shí)不變的線性系統(tǒng)
(1)
u(x(t))=xT(t)Px(t),
(2)
ATP+PA+Q=0.
(3)
文中作者利用幾何的方法給出方程式(3)的求解過(guò)程. 基本想法是在SPD(n)上建立一個(gè)以測(cè)地距離為目標(biāo)函數(shù)的測(cè)量SPD(n)上兩點(diǎn)間最短距離的函數(shù), 當(dāng)距離函數(shù)趨近于0時(shí)便獲得了求解的結(jié)果.
在本節(jié)中,簡(jiǎn)要介紹定義在對(duì)稱(chēng)正定矩陣流形SPD(n)上的各種黎曼度量,使得SPD(n)成為黎曼流形. 可以在SPD(n)定義不同的度量, 因而其所呈現(xiàn)的幾何結(jié)構(gòu)也不同. 例如定義歐氏度量
〈X,Y〉A(chǔ)=tr(XTY),
(4)
其中tr表示矩陣的跡. 對(duì)于SPD(n)上的任意兩點(diǎn)A,B, 距離為
(5)
但是, 這樣定義的內(nèi)積所獲得的測(cè)地線是一個(gè)直線γ(t)=Α+(B-A)t, 這里的參數(shù)t的范圍有限制, 換句話說(shuō)該直線不能連接SPD(n)上的任意兩點(diǎn). 這樣的度量不能用于計(jì)算SPD(n)上任意兩點(diǎn)的距離.
為了克服上面度量的弱點(diǎn), 可以定義所謂的仿射的黎曼度量[5-6]. 對(duì)于SPD(n)的切空間TASPD(n)上任意的兩點(diǎn)X,Y,A∈SPD(n), 定義
〈X,Y〉A(chǔ)=tr(A-1XA-1Y),
(6)
在該度量下的測(cè)地線可以表示為
γ(t)=A1/2exp(tA-1/2SA-1/2)A1/2,
(7)
式(7)表示過(guò)點(diǎn)A,切向量為S的曲線,參數(shù)t沒(méi)有限制,γ(t)為連接SPD(n)上任意兩點(diǎn)的測(cè)地線. 利用該測(cè)地線, 可以得到連接SPD(n)上任意兩點(diǎn)A,B的測(cè)地距離為
(8)
其中λi為矩陣A-1B的特征值, 它們是恒正的. 利用式(8), 也可以對(duì)式(3)求解, 但是利用上述方法在計(jì)算上復(fù)雜度比較高, 原因是在仿射黎曼度量下的黎曼流形SPD(n)是一個(gè)截面曲率為非正的彎曲空間.
為了降低計(jì)算的復(fù)雜度, 在SPD(n)上定義新的乘法
A·B=exp[log(A)+log(B)],
(9)
式中A,B是SPD(n)中的兩個(gè)矩陣. 以驗(yàn)證在該乘法定義下, SPD(n)是一個(gè)群, 群結(jié)構(gòu)和拓?fù)浣Y(jié)構(gòu)是相容的, 從而SPD(n)是一個(gè)李群, 而且是一個(gè)可交換的李群. 進(jìn)一步,SPD(n)上存在雙不變度量, 使得SPD(n)與歐氏空間TASPD(n)等距. 這樣做的意義在于, 盡管SPD(n)本身不是一般線性群GL(n,R)的李子群, 但是在這樣的乘法定義下成為李群, 而且在等距意義下保曲率的性質(zhì)使得SPD(n)成為一個(gè)平坦的歐氏空間.
在SPD(n)上定義新的黎曼度量--對(duì)數(shù)歐氏度量
〈X,Y〉A(chǔ)=〈dlogAX,dlogAY〉I,
(10)
式中:d表示微分;I為單位矩陣. 經(jīng)計(jì)算可得知, 連接SPD(n)上任意兩點(diǎn)A,B的測(cè)地線可以表示為
γ(t)=exp[(1-t)logA+tlogB],
(11)
此時(shí)連接A,B兩點(diǎn)的測(cè)地距離函數(shù)為
dL(A,B)=‖logA-logB‖.
(12)
對(duì)于給定的對(duì)稱(chēng)正定矩陣Q, 利用式(12)有
dL[Q,-(ATP+PA)]=‖logQ-
log(-(ATP+PA))‖,
(13)
對(duì)于一般的光滑黎曼流形(M,g),以及定義在A上的函數(shù)f:M→R,可以利用自然梯度給出求解函數(shù)f(θ)的最小值的迭代公式
(14)
利用黎曼度量式(6), 對(duì)于建立在SPD(n)上的目標(biāo)函數(shù)fR:SPD(n)→R, 其中
fR(P)=dR[Q,-(ATP+PA)],
(15)
可以獲得求目標(biāo)函數(shù)fR的最小值點(diǎn)的迭代公式
(16)
利用歐式內(nèi)積(4), 對(duì)于建立在SPD(n)上的目標(biāo)函數(shù)fE:SPD(n)→R, 其中
fE(P)=dE(Q,-(ATP+PA)),
(17)
可以獲得求目標(biāo)函數(shù)fE的最小值點(diǎn)的迭代公式
(18)
根據(jù)SPD(n)上的對(duì)數(shù)歐式度量(10), 建立目標(biāo)函數(shù)
fL(P)=dL(Q,-(ATP+PA)),
(19)
當(dāng)式(19)趨近于0時(shí), 就可以獲得式(3)的解. 希望求該目標(biāo)函數(shù)的最小值來(lái)獲得正定矩陣P. 利用梯度算法可以得到計(jì)算式(19)的迭代公式
(20)
在本節(jié)中,將利用例子,通過(guò)模擬仿真比較LGDA法來(lái)驗(yàn)證的算法的優(yōu)越性.
對(duì)于給定的對(duì)稱(chēng)正定矩陣
以及初始矩陣P0=0.5I, 用LGDA、NGDA、GDA法分別求解方程(3), 誤差矩陣的模長(zhǎng)小于0.01時(shí)算法停止. LGDA法求解得到的對(duì)稱(chēng)正定矩陣為
迭代次數(shù)為3步. NGDA法求解得到的對(duì)稱(chēng)正定矩陣為
迭代次數(shù)為7步. GDA法不收斂,通過(guò)圖1,發(fā)現(xiàn)
相比于GDA法, NGDA和LGDA有更好的收斂性, 并且LDGA的收斂速度比NGDA更快.
利用定義在對(duì)稱(chēng)正定矩陣流形上的歐氏對(duì)數(shù)度量, 給出了李雅普諾夫矩陣的幾何上的求解算法, 模擬仿真結(jié)果驗(yàn)證了該方法的優(yōu)越性. 進(jìn)一步的研究將著眼于兩個(gè)方面, 一方面是利用該方法給出代數(shù)Riccati方程的求解方法, 研究最優(yōu)控制問(wèn)題; 另一方面是利用建立在對(duì)稱(chēng)正定矩陣上的主叢結(jié)構(gòu), 給出新的測(cè)地距離函數(shù), 來(lái)求解李雅普諾夫方程以及Riccati方程, 獲得更好的求解方法; 進(jìn)一步, 將嘗試研究線性時(shí)變系統(tǒng)的李雅普諾夫方程和Riccati方程的求解問(wèn)題, 并研究相關(guān)的系統(tǒng)的穩(wěn)定性和最優(yōu)控制問(wèn)題.