董玉浩,趙學(xué)軍,袁修久,賀 剛,王明芳,李嘉林
(1.空軍工程大學(xué) 研究生院, 西安 710038; 2.中國人民解放軍9272部隊(duì), 上海 210406)
在無人機(jī)協(xié)同作戰(zhàn)的過程中,機(jī)間需要高效手段來實(shí)現(xiàn)通信,而數(shù)據(jù)鏈(Data Link)可以為這些機(jī)間通信提供技術(shù)支持,提高數(shù)據(jù)鏈網(wǎng)絡(luò)的吞吐量,優(yōu)化發(fā)射功率是主要選擇之一。
文獻(xiàn)[1]提出了一種新的功率控制手段,并給出了選擇信道的方法。為了可以在滿足QoS需求的同時(shí)提高網(wǎng)絡(luò)的吞吐量[2],各方面的研究都在進(jìn)行,本文的研究基于功率優(yōu)化。功率優(yōu)化與節(jié)點(diǎn)的動(dòng)態(tài)博弈緊密相關(guān),為了得出各博弈方在信干比固定時(shí)所采用的發(fā)射功率的分布情形,Stefano Buzzi等[3]定義了一個(gè)效用函數(shù),用來量化模型的優(yōu)化結(jié)果。在文獻(xiàn)[4-5]中,Yun Zhu等選擇適當(dāng)?shù)陌l(fā)射功率來實(shí)現(xiàn)沖突的減少和網(wǎng)絡(luò)連通性的鞏固,改進(jìn)了優(yōu)化網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),整體增強(qiáng)了功率優(yōu)化的互聯(lián)和相關(guān)性。Giacomo Bacci等在文獻(xiàn)[6-7]中提出自適應(yīng)調(diào)整發(fā)射功率的方法實(shí)現(xiàn)吞吐量的最大化,以輕微的代價(jià)換取了算法的快速收斂。文獻(xiàn)[8]采用一個(gè)適當(dāng)?shù)姆椒ǜ淖兇鷥r(jià)因子的值。文獻(xiàn)[9]中的結(jié)論顯示,選擇合適的效用函數(shù)能使功率水平更低,同時(shí)達(dá)到更高的吞吐量。在文獻(xiàn)[10]中,賀剛采用組合代價(jià)函數(shù)的形式,提出了一種基于博弈論的功率控制方法,保證了無人機(jī)之間數(shù)據(jù)鏈系統(tǒng)的低截獲,并有效地提高了其抗干擾能力。
針對(duì)博弈方參與博弈進(jìn)行功率更新時(shí)的次序,本文提出了基于動(dòng)態(tài)博弈模型的功率控制方案,該算法在更新功率值時(shí)考慮了更新次序,以獲取的其他博弈方的當(dāng)前信息,有效提高了算法的收斂速度,有利于提高數(shù)據(jù)鏈系統(tǒng)的公平性和穩(wěn)定性。
在AWGN信道下建立無人機(jī)作戰(zhàn)編隊(duì)的信道模型,對(duì)于接收節(jié)點(diǎn)終端,其信干比SIR可表示為:
(1)
其中:擴(kuò)頻增益G=W/Ri,W表示chip速率;Ri表示節(jié)點(diǎn)i的信息傳輸速率;N表示編隊(duì)中共享無線信道的節(jié)點(diǎn)數(shù),hi表示節(jié)點(diǎn)i的信道增益,pi表示節(jié)點(diǎn)i的發(fā)射功率水平,σ2表示AWGN信道下的接收機(jī)背景噪聲。
(2)
當(dāng)節(jié)點(diǎn)i的功率大于最優(yōu)功率時(shí),可以定義懲罰函數(shù)模型如下:
(3)
其中,未施加懲罰的效用函數(shù)為
ui(p)=uiarctan(1+γi)
(4)
式中,ci(p)是代價(jià)函數(shù)或稱懲罰函數(shù)。
采用鏈路增益代價(jià)函數(shù):
ci(p)=δhipi
(5)
加入代價(jià)函數(shù)后的實(shí)際效用函數(shù)模型:
(6)
其中,δ為實(shí)比例系數(shù),該模型將會(huì)主要懲罰功率大的節(jié)點(diǎn)。
(7)
(8)
由式(7)與式(8)可以看出,節(jié)點(diǎn)i在博弈過程中每次進(jìn)行信息迭代更新時(shí),采用的信息是上一輪迭代的信息,而不是當(dāng)前最新的信息,故而最終結(jié)果不是當(dāng)前的最佳值。
為解決這個(gè)問題,必須及時(shí)更新其他節(jié)點(diǎn)的功率干擾信息,因此,在這里提出基于動(dòng)態(tài)博弈的功率控制,當(dāng)節(jié)點(diǎn)更新自身功率時(shí),可獲取其他節(jié)點(diǎn)對(duì)其最新的動(dòng)態(tài)干擾信息,節(jié)點(diǎn)i第k+1次更新時(shí)掌握的動(dòng)態(tài)信息可以被表示為:
(10)
(11)
由式(10)、式(11)可知,由于每個(gè)節(jié)點(diǎn)在更新當(dāng)前功率值時(shí),所采用的其他節(jié)點(diǎn)的信息值是離當(dāng)前時(shí)間最近的干擾信息,效益函數(shù)的優(yōu)化效果更好。
完美均衡的概念在文獻(xiàn)[11]中被提出,根據(jù)動(dòng)態(tài)博弈理論,子博弈完美納什均衡是由完美信息動(dòng)態(tài)博弈得到的均衡解。子博弈指每個(gè)當(dāng)前需更新功率的節(jié)點(diǎn)與在它之后將更新的節(jié)點(diǎn)構(gòu)成的一個(gè)博弈組合。換句話說,系統(tǒng)中的N個(gè)節(jié)點(diǎn)構(gòu)成N個(gè)子博弈,若存在一組功率向量p′,它對(duì)每個(gè)節(jié)點(diǎn)構(gòu)成的子博弈都達(dá)到納什均衡,p′即為該博弈的子博弈完美納什均衡。各個(gè)子博弈采用相同的效益函數(shù)時(shí),所對(duì)應(yīng)節(jié)點(diǎn)的策略空間也保持相同。
下面將通過仿真證明其具有更快的收斂速度,即在數(shù)據(jù)鏈的應(yīng)用當(dāng)中,能使戰(zhàn)機(jī)編隊(duì)的通信在更短的時(shí)間內(nèi)達(dá)到穩(wěn)定。
在動(dòng)態(tài)博弈模型下,得到應(yīng)用于數(shù)據(jù)鏈系統(tǒng)的分布式功率控制算法,其流程如下:
步驟2:當(dāng)k=k+1時(shí),每個(gè)節(jié)點(diǎn)依次計(jì)算兩式的值:
步驟3:判決是否終止迭代。終止的條件是p(tk)=p(tk-1),此時(shí)的發(fā)射功率為p(tk)不滿足終止條件則令k=k+1,并返回步驟2,直至滿足終止條件。
圖1 靜態(tài)博弈與動(dòng)態(tài)博弈不同距離節(jié)點(diǎn)達(dá)到均衡時(shí)的功率曲線
圖2 靜態(tài)博弈與動(dòng)態(tài)博弈功率控制收斂曲線
圖3 靜態(tài)博弈與動(dòng)態(tài)博弈SIR(信干比)收斂曲線
圖1所示為不同距離的節(jié)點(diǎn)達(dá)到均衡時(shí)的發(fā)射功率,其中圖1 (a)為靜態(tài)博弈功率控制下用戶達(dá)到均衡時(shí)的最終發(fā)射功率,圖1 (b)為動(dòng)態(tài)博弈功率控制下用戶達(dá)到均衡時(shí)的最終發(fā)射功率,由圖所示可知,兩種博弈情形的均衡狀態(tài)下,動(dòng)態(tài)博弈無需犧牲發(fā)射功率。
圖2、圖3所示分別為各節(jié)點(diǎn)發(fā)射功率和信干比SIR(歸一化)收斂到穩(wěn)定值時(shí)的迭代次數(shù)曲線,其中圖2 (a)與圖3(a)分別為靜態(tài)博弈情形下發(fā)射功率和信干比SIR達(dá)到穩(wěn)定值時(shí)的迭代次數(shù)曲線,其中圖2 (b)與圖3(b)分別為動(dòng)態(tài)博弈情形下發(fā)射功率和信干比SIR達(dá)到穩(wěn)定值時(shí)的迭代次數(shù)曲線,比較圖2、圖3所示的兩種博弈模型,兩種情況下同一個(gè)節(jié)點(diǎn)發(fā)射功率和信干比SIR都能收斂到同樣的均衡值,與靜態(tài)博弈相比,動(dòng)態(tài)博弈中功率從初始值達(dá)到收斂需要的迭代次數(shù)明顯減少,即功率的收斂速較快,原因在于動(dòng)態(tài)博弈情形下,各節(jié)點(diǎn)所獲得的信息是最新更新的信息,所以能更快地達(dá)到均衡點(diǎn)。這對(duì)于要求快速、準(zhǔn)確的數(shù)據(jù)鏈通信系統(tǒng)而言,是非常好的解決方案。
表1列出了每個(gè)節(jié)點(diǎn)達(dá)到收斂需要的迭代次數(shù)。由表可知,動(dòng)態(tài)博弈算法達(dá)到均衡時(shí)所需迭代次數(shù)大幅減少,如節(jié)點(diǎn)1、節(jié)點(diǎn)2、節(jié)點(diǎn)3靜態(tài)博弈算法下需要的次數(shù)為15次,而在動(dòng)態(tài)博弈算法下只需9次,節(jié)點(diǎn)4、節(jié)點(diǎn)5降低的次數(shù)近1/2,所有節(jié)點(diǎn)的平均迭代次數(shù)除低了42.5%。由此可知,動(dòng)態(tài)博弈算法可以大幅度改善功率控制的收斂性能。
表1 動(dòng)態(tài)博弈與靜態(tài)博弈模型性能對(duì)比
針對(duì)CDMA通信系統(tǒng)的功率控制問題,本研究在靜態(tài)博弈功率控制模型的基礎(chǔ)上,引入動(dòng)態(tài)博弈,讓每個(gè)參與博弈的通信節(jié)點(diǎn)獲取最新的信息,使各節(jié)點(diǎn)更加理性。通過理論分析和仿真對(duì)比都表明,在不犧牲其他性能的情況下,基于動(dòng)態(tài)博弈的功率控制算法比靜態(tài)博弈功率控制算法的平均收斂速度提升了42.5%,這對(duì)于要求快速、準(zhǔn)確的數(shù)據(jù)鏈通信系統(tǒng)有一定的價(jià)值。