韓存武,周 慧,劉 蕾,張曉平
(北方工業(yè)大學(xué)現(xiàn)場(chǎng)總線(xiàn)及自動(dòng)化北京市重點(diǎn)實(shí)驗(yàn)室,北京 100144)
功率和速率控制是無(wú)線(xiàn)通信網(wǎng)絡(luò)中的關(guān)鍵技術(shù),其目的是在保證網(wǎng)絡(luò)可靠連接的前提下降低發(fā)射功率以及在克服網(wǎng)絡(luò)擁塞的情況下增大傳輸速率,以使網(wǎng)絡(luò)容量和網(wǎng)絡(luò)吞吐量最大化。因此,無(wú)線(xiàn)通信網(wǎng)絡(luò)的功率和速率控制已成為通信領(lǐng)域和控制領(lǐng)域的研究熱點(diǎn)問(wèn)題之一,并取得了大量的研究成果[1]。
A.Subramanian等人基于控制理論建立了無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的狀態(tài)空間模型,并提出了相應(yīng)的魯棒控制方法[2];M.Taki等人針對(duì)無(wú)線(xiàn)網(wǎng)絡(luò),考慮了不同鏈路的不同吞吐量要求和誤碼率約束[3];A.Sachan等人設(shè)計(jì)了一個(gè)基于資源高效的通信網(wǎng)絡(luò),使用具有虛擬多輸入多輸出技術(shù)的推理算法以及分組編碼來(lái)實(shí)現(xiàn)無(wú)線(xiàn)通信的可靠性[4];C.W.Han等人考慮了時(shí)滯和信道衰落,提出了無(wú)線(xiàn)通信網(wǎng)絡(luò)自適應(yīng)功率和速率的控制算法[5];S.L.Kong等人提出了基于預(yù)測(cè)控制的無(wú)線(xiàn)網(wǎng)絡(luò)功率和速率聯(lián)合控制算法[6];J.W.Fonda等人提出了基于自適應(yīng)控制的無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率聯(lián)合控制算法[7]。
上述論文都是基于模型的控制方法。然而,由于無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率控制系統(tǒng)的復(fù)雜性,很難建立精確的數(shù)學(xué)模型,因此,很難達(dá)到滿(mǎn)意的控制效果。為此,在文獻(xiàn)[8]和[9]中采用模糊控制來(lái)處理建模難的問(wèn)題,但只考慮了功率或速率單一的影響。
為了克服由于實(shí)際系統(tǒng)建模難而導(dǎo)致的基于模型的控制方法控制效果不好的問(wèn)題,近年來(lái),基于數(shù)據(jù)的控制方法引起了控制界的關(guān)注[10]。隨著信息科學(xué)技術(shù)的快速發(fā)展,控制過(guò)程越來(lái)越復(fù)雜,即建立精確的數(shù)學(xué)模型并對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率進(jìn)行控制越來(lái)越困難,現(xiàn)有的無(wú)線(xiàn)通信網(wǎng)絡(luò)模型都存在大量隱含著信息的離線(xiàn)、在線(xiàn)數(shù)據(jù),故研究基于數(shù)據(jù)的功率與速率控制有重要的理論意義。由于無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的復(fù)雜性,可以采用自適應(yīng)動(dòng)態(tài)規(guī)劃算法。常規(guī)動(dòng)態(tài)規(guī)劃隨著狀態(tài)和控制維數(shù)增加而導(dǎo)致計(jì)算量急劇增長(zhǎng),而自適應(yīng)動(dòng)態(tài)規(guī)劃算法[11,12]是一種改進(jìn)的動(dòng)態(tài)規(guī)劃算法,是最優(yōu)領(lǐng)域新興的一種近似最優(yōu)方法,適合于復(fù)雜系統(tǒng)優(yōu)化控制,近年來(lái)取得了很多研究成果[13-15],所以本文針對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的復(fù)雜性,不需要任何系統(tǒng)動(dòng)力學(xué)方程,推導(dǎo)出一個(gè)新的基于數(shù)據(jù)的狀態(tài)方程,在此基礎(chǔ)上采用自適應(yīng)動(dòng)態(tài)規(guī)劃算法實(shí)現(xiàn)對(duì)功率和速率的跟蹤。
在無(wú)線(xiàn)通信網(wǎng)絡(luò)中,每個(gè)單元中n個(gè)移動(dòng)臺(tái)(MS)共享一個(gè)基站(BS)。
節(jié)點(diǎn)i在k時(shí)刻的信噪比如下[16]
(1)
信道衰落可以表示為
(2)
令
(3)
那么式(1)可以表示為
γi(k)=βi(k)pi(k-τip)
(4)
在無(wú)線(xiàn)通信網(wǎng)絡(luò)中,以分貝為單位,因此可以式(4)兩側(cè)分別取對(duì)數(shù)可得
(5)
根據(jù)文獻(xiàn)[16]中的公式推導(dǎo),可以得到如下式
(6)
+μ[di(k)-c2(k)fi(k-τif)]
(7)
在式(6)中引入帶有時(shí)滯的功率控制變量uip(k-τip),使實(shí)際信噪比達(dá)到期望信噪比,可得
+bip1(k)uip(k)+bip2(k)uip(k-τip)+ηi(k)
(8)
其中bip1、bip2是待定系數(shù)。
在式(7)中引入帶有時(shí)滯的速率控制變量uif(k-τ),使實(shí)際速率達(dá)到期望的速率,可得
fi(k+1)=[1-μc1(k)]fi(k)-μc2(k)fi(k-τif)
+bif1(k)uif(k)+bif2(k)uif2(k-τif)+μdi(k)
(9)
其中bif1、bif2是待定系數(shù)。
參考大量無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的模型,可以得出現(xiàn)有的模型都存在大量隱含著信息的離線(xiàn)、在線(xiàn)數(shù)據(jù)。隨著信息科學(xué)技術(shù)的快速發(fā)展,建立的數(shù)學(xué)模型并不能對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)精確概括,不能有效的模擬無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的實(shí)際情況,故研究基于數(shù)據(jù)的功率和速率控制方法有重要的實(shí)際價(jià)值。
為了簡(jiǎn)化其參數(shù)不確定性,無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率系統(tǒng)表示為以下等效形式
(10)
(11)
本文考慮的參考軌跡具有以下形式
rk+1=Grk
(12)
基于無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)功率與速率狀態(tài)方程和參考軌跡系統(tǒng),可以將其增廣時(shí)延系統(tǒng)表示如下
(13)
可以得到如下式子
zk+1=Αzk+Βuk
(14)
為了設(shè)計(jì)基于數(shù)據(jù)的無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)的自適應(yīng)動(dòng)態(tài)規(guī)劃算法,首先需要將增廣型系統(tǒng)轉(zhuǎn)換為基于輸入、輸出數(shù)據(jù)的系統(tǒng)。通過(guò)將Υk-1…Υk-N依次帶入式(13)中,可得如下式
(15)
式子(15)可以簡(jiǎn)化為以下形式
(16)
輸出方程式可以在時(shí)間范圍[k-1,k-N]上寫(xiě)為如下的擴(kuò)展輸出方程
(17)
同樣,通過(guò)將xk-1…xk-N順序帶入式子(17),可以得到如下式
(18)
式(18)可以縮寫(xiě)為以下形式
(19)
為了簡(jiǎn)化基于數(shù)據(jù)的自適應(yīng)動(dòng)態(tài)規(guī)劃算法的設(shè)計(jì),需要將帶時(shí)延的無(wú)線(xiàn)通信網(wǎng)絡(luò)的增廣矩陣(13)轉(zhuǎn)化為僅依賴(lài)于歷史輸入、輸出數(shù)據(jù)組成的狀態(tài)方程。以下推導(dǎo)給出了基于數(shù)據(jù)狀態(tài)方程的表達(dá)式。
為了導(dǎo)出無(wú)線(xiàn)通信網(wǎng)絡(luò)擴(kuò)展延時(shí)系統(tǒng)(13)的狀態(tài)方程,首先需要將擴(kuò)展輸出方程(19)代入增廣狀態(tài)矩陣(16)。增廣時(shí)滯系統(tǒng)(16)的數(shù)據(jù)驅(qū)動(dòng)狀態(tài)方程可以轉(zhuǎn)換為以下由輸入、輸出數(shù)據(jù)組成的狀態(tài)方程。
(20)
為了確保數(shù)據(jù)驅(qū)動(dòng)狀態(tài)方程(20)的存在,假設(shè)本文考慮的系統(tǒng)的DN具有完整的列秩。
式子(20)可以寫(xiě)成如下形式
zk=ENZk
(21)
其中
在本文中,功率和速率跟蹤問(wèn)題的性能指標(biāo)函數(shù)采用以下形式
(22)
根據(jù)動(dòng)態(tài)規(guī)劃的思想,上述功率和速率跟蹤問(wèn)題也可以表示為
+ωV(zk+1)
(23)
這是無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率跟蹤的貝爾曼方程。
對(duì)于功率和速率跟蹤問(wèn)題,無(wú)線(xiàn)通信網(wǎng)絡(luò)系統(tǒng)具有由系統(tǒng)狀態(tài)Υk和參考軌跡rk組成的二次性能指標(biāo),使得
(24)
將式(24)帶入式(23),功率和速率跟蹤的貝爾曼方程采用以下形式
(25)
假設(shè)本文的反饋控制uk滿(mǎn)足如下式子
(26)
將式(21)代入性能指標(biāo)函數(shù)(24),產(chǎn)生如下由輸入、輸出數(shù)據(jù)組成的性能指標(biāo)函數(shù)
(27)
則基于數(shù)據(jù)的功率和速率跟蹤貝爾曼方程為
(28)
相應(yīng)的貝爾曼誤差方程如下
(29)
(30)
將式(30)帶入式(28),并應(yīng)用一階必要條件可得
(31)
可以通過(guò)使用最小二乘法迭代求解基于數(shù)據(jù)的線(xiàn)性二次跟蹤的貝爾曼方程(28)來(lái)生成最優(yōu)控制策略(31)。
根據(jù)文獻(xiàn)[18]中的定義,以下等式成立。
(φT?φT)vec(κ)=vec(φTκφ)
(32)
則方程(28)可以寫(xiě)成如下形式
(33)
(34)
(35)
現(xiàn)代控制理論所研究的無(wú)線(xiàn)通信網(wǎng)絡(luò)控制方法需要建立系統(tǒng)的動(dòng)力學(xué)方程,隨著信息科學(xué)技術(shù)的快速發(fā)展,建立精確的數(shù)學(xué)模型并對(duì)功率和速率進(jìn)行控制越來(lái)越困難,本文采用僅依靠輸入、輸出和歷史數(shù)據(jù)來(lái)避免使用系統(tǒng)的動(dòng)態(tài)。
針對(duì)由于實(shí)際系統(tǒng)建模難而導(dǎo)致的基于模型的控制方法控制效果不好的問(wèn)題,提出一種基于數(shù)據(jù)的自適應(yīng)動(dòng)態(tài)規(guī)劃算法實(shí)現(xiàn)對(duì)功率和速率的跟蹤,該算法利用函數(shù)近似結(jié)構(gòu)來(lái)逼近動(dòng)態(tài)規(guī)劃方程中的性能指標(biāo)函數(shù)和控制策略,使之滿(mǎn)足貝爾曼最優(yōu)性原理,進(jìn)而獲得最優(yōu)控制和最優(yōu)性能指標(biāo)函數(shù),對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率控制系統(tǒng)的穩(wěn)定性、收斂性、最優(yōu)性等具有很好效果。下面利用Matlab仿真驗(yàn)證算法對(duì)功率和速率跟蹤的有效性,仿真參數(shù)取值:A=[1 0;0 0.75],Aτ=[-0.2 6;0 -0.25],B=[0.5 ; 0.5],Bτ=[0.5 ; 0.5],C=[0.5 0.1;0.4 0.3],Cτ=[0.5 0.1;-0.1 0.5]。R=1,Rτ=1,Q=I3×3,延遲指標(biāo)τ=1,折扣系數(shù)為ω=0.6,期望信噪比取30dB,則期望速率可以取40MB/s。為了驗(yàn)證本文的算法可以實(shí)現(xiàn)對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率的跟蹤,通過(guò)在控制輸入uk上添加隨機(jī)噪聲來(lái)滿(mǎn)足條件,并將N的值設(shè)置為2。仿真結(jié)果如圖1至圖4。其中,圖1和圖3為系統(tǒng)的輸出跟蹤曲線(xiàn),圖2和圖4分別為系統(tǒng)的功率和速率控制曲線(xiàn)。
圖1 實(shí)際信噪比跟蹤期望信噪比
圖2 功率控制量up(k)
圖3 實(shí)際速率跟蹤期望速率
圖4 速率控制量uf(k)
本文針對(duì)由于實(shí)際系統(tǒng)建模難而導(dǎo)致的基于模型的控制方法控制效果不好的問(wèn)題,利用無(wú)線(xiàn)通信網(wǎng)絡(luò)模型中存在大量隱含著信息的離線(xiàn)、在線(xiàn)數(shù)據(jù),提出了一種基于數(shù)據(jù)的自適應(yīng)動(dòng)態(tài)規(guī)劃算法實(shí)現(xiàn)對(duì)功率和速率的跟蹤。首先,構(gòu)造基于時(shí)滯系統(tǒng)和參考系統(tǒng)的增廣狀態(tài)方程;其次,利用由輸入,輸出和參考軌跡組成的歷史數(shù)據(jù)推導(dǎo)一個(gè)新的數(shù)據(jù)驅(qū)動(dòng)狀態(tài)方程,該狀態(tài)方程被視為狀態(tài)估計(jì)器;最后,基于數(shù)據(jù)的自適應(yīng)動(dòng)態(tài)規(guī)劃算法實(shí)現(xiàn)了對(duì)無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率的跟蹤。仿真結(jié)果證明了使用的算法對(duì)于無(wú)線(xiàn)通信網(wǎng)絡(luò)功率和速率系統(tǒng)的跟蹤問(wèn)題具有很好的效果。