陳威龍,梁 俊,肖 楠,郭子楨
(空軍工程大學 信息與導航學院,西安 710077)
星地網(wǎng)絡作為實現(xiàn)全球無縫覆蓋的重要組成部分,能夠使衛(wèi)星網(wǎng)絡[1]和地面網(wǎng)絡形成有效互補與互連互通,是下一代衛(wèi)星通信技術發(fā)展的主要趨勢[2]。隨著地面網(wǎng)絡業(yè)務傳輸需求的不斷增多,衛(wèi)星通信與地面通信對頻譜的競爭日益激烈,頻譜干擾問題成為制約星地網(wǎng)絡發(fā)展的主要因素[3]。認知無線電技術是一種提高頻譜利用率的有效手段,如何將衛(wèi)星鏈路長時延、大衰落等特點與認知無線電相結合,成為衛(wèi)星通信研究機構的關注焦點[4]。
在認知無線電中,減少頻率干擾的關鍵是功率控制技術,因此,星地認知網(wǎng)絡中的功率控制得到了國內(nèi)外學者的廣泛關注。文獻[5]采用基于投影梯度的動態(tài)博弈模型,通過納什均衡方法提高了頻譜利用率,但前提是基于完美信道感知信息的情況,通常網(wǎng)絡難以得到精確的系統(tǒng)參數(shù)。文獻[6]聯(lián)合考慮能量消耗,對信道選擇和控制進行聯(lián)合優(yōu)化,但是沒有考慮衛(wèi)星信道的時變特性。文獻[7]考慮功耗和接收到的信干比,提出一種魯棒的功率控制算法,但是沒有考慮感知存在延遲的情況。文獻[8]引入一種特殊的約束條件優(yōu)化上行鏈路,但是沒有考慮次級用戶間公平性的問題。文獻[9]考慮網(wǎng)絡的能效和平均吞吐量,提出聯(lián)合確定最優(yōu)功率和幀長的低復雜度算法,但是沒有考慮因網(wǎng)絡拓撲或信道的變化而產(chǎn)生的中斷問題。文獻[10]根據(jù)距離提出動態(tài)調度的功率分配策略,但不足是需要精確感知每個用戶的位置。文獻[11]考慮信道信息感知的不確定性,提出一種魯棒的資源分配方案,但是能量效率較低。文獻[12]提出一種低復雜度的中繼選擇和功率分配聯(lián)合優(yōu)化算法,但是沒有考慮因授權用戶行為變化而導致中斷的情況。
目前,多數(shù)星地網(wǎng)絡功率控制算法仍基于完美信道信息感知情景,沒有考慮衛(wèi)星網(wǎng)絡中因覆蓋范圍大而產(chǎn)生中斷的情況。此外由于衛(wèi)星網(wǎng)絡用戶大多為移動用戶,因此能量消耗也是需要解決的問題。本文考慮信道轉移概率的不確定性,提出信道狀態(tài)似然不確定性模型,并進一步構建信道狀態(tài)離散馬爾科夫鏈。在此基礎上,采用魯棒的向后遞歸方法得到功率分配矩陣,利用博弈論方法設計基于中斷概率的星地網(wǎng)絡魯棒功率控制算法。
本文在靜止軌道衛(wèi)星點波束覆蓋場景下建立星地認知網(wǎng)絡模型,如圖1 所示,網(wǎng)絡中包括N個認知用戶(Secondary User,SU)和M個授權用戶(Primary User,PU)。假設每個授權用戶信道只允許一個認知用戶進行通信,認知用戶采用定向天線與衛(wèi)星進行通信,衛(wèi)星傳輸鏈路采用Generalized-K 模型[13]。
圖1 星地認知網(wǎng)絡模型Fig.1 Satellite-ground cognitive network model
在信道模型中,視距分量和多徑分量的幅度均服從Nakagami-m分布,接收信號功率的概率密度函數(shù)為:
其中:x>0;KmS-mM(?)是第2 類修正貝塞爾函數(shù),階數(shù)為mS-mM,mM≥0.5,mS≥0,分別為多徑參數(shù)和陰影參數(shù)為接收信號的平均功率。
衛(wèi)星用戶到衛(wèi)星的通信鏈路增益為hi,地面用戶到衛(wèi)星用戶的鏈路增益為hp,則第i個認知用戶的信干比為:
采用圖2 所示的離散時間馬爾科夫鏈對PUm行為建模,由一組離散狀態(tài)S={s0,s1,…,sK-1}表示,其中:K是狀態(tài)總數(shù);s0表示PUm處于活動時的狀態(tài);s1,s2,…,sK-1表示PUm處于不活動時的狀態(tài),在此狀態(tài)下,PUm不同的狀態(tài)影響SUi的信干比,因此,用SUi的信噪比閾值來確定PUm的各個狀態(tài)[15]。
圖2 離散時間馬爾科夫鏈Fig.2 Discrete time Markov chain
對于馬爾科夫鏈各個狀態(tài)sk做如下規(guī)定:
1)當k=0 時,活動狀態(tài)s0可以轉變?yōu)槿魏螤顟B(tài)。
2)當1≤k≤K-1 時,每個不活動狀態(tài)sk只能轉換為相鄰狀態(tài)或活動狀態(tài),即sk→sk-1/sk+1/s0。
以Pkj表示從狀態(tài)i到狀態(tài)j的轉移概率,以St表示時隙t中的信道狀態(tài),有Pkj=P(St+1=sj|St=sk)。將信噪比閾值表示為{Γ1,Γ2,…,ΓK-1},分別對應于PUm不活動時的各個狀態(tài)。因此,可以得到PUm非活動狀態(tài)之間的轉移概率[16],如式(4)所示:
其中:τ是一個時隙的長度;Pk表示信干比落入[Γk,Γk+1]的概率;N(Γk+1)表示電平通過率,其為衡量衰落的關鍵指標。與此同時,PUm的活動狀態(tài)(即P0j和Pk0)由PUm自身決定。因此,PUm的狀態(tài)由轉移概率Pkj=P(St+1=sj|St=sk)組成的轉移矩陣決定。
當PUm處于活動狀態(tài)時,規(guī)定SUi的最大發(fā)射功率為pL。當pi>pL時,信道會發(fā)生中斷;另一方面,由于星地認知網(wǎng)絡覆蓋范圍大,存在傳輸延遲和頻譜感知延遲,因此只能在當前時隙t觀察到St-t0,其中t0為延遲時間。由此可以得到信道的中斷概率為:
為了在延遲存在的情況下實現(xiàn)最優(yōu)的功率控制,定義時隙t中的中斷概率預算Ot,Ot+1=Ot-ot。因此,時隙t中的系統(tǒng)狀態(tài)Xt?(St-t0,Ot),其由時隙t觀測到的信道狀態(tài)St-t0和中斷概率預算Ot組 成[17]。令P(Xt+1|Xt,pt)表示轉移概率,由于信道狀態(tài)轉移概率與中斷概率相互獨立,因此有:
對于接入信道l的用戶SUi,功率控制優(yōu)化目標是不僅實現(xiàn)當前時隙內(nèi)速率的最大化,同時也實現(xiàn)未來速率期望的最大化。因此,本文優(yōu)化目標為:
對于式(9)所示問題的魯棒功率分配,應考慮兩方面的速率最大化,令時隙t時的未來速率期望和如式(10)所示[18]:
在實際過程中,PU 的行為和信道轉移概率模型都難以準確描述,造成功率計算的精確度大大降低,因此,本文考慮魯棒性來降低模型不確定性的影響。在魯棒的功率分配問題中,定義信道狀態(tài)的轉移矩陣如式(13)所示:
其中:Pt∈Θ,Θ是給定的有界集合。因此,式(9)所示的魯棒性問題表示為式(14),即考慮信道轉移模型最壞情況下的功率分配速率期望和最大化,求解方法是與式(12)類似的向后遞歸方法。
對式(10)~式(12)做簡單整理,首先根據(jù)轉移模型最壞情況下得到速率期望和最小值[19],如式(15)所示。然后找出使速率期望和最小值最大化的功率分配,如式(16)所示:
可以看出,求解上述魯棒功率分配問題的關鍵在于式(15)的求解,即信道狀態(tài)的不確定模型,本文采用似然不確定性模型來解決此問題[20]。基于似然不確定性模型的經(jīng)驗轉移概率矩陣可以表示為:
其中:P(j)是信道轉移矩陣Pt的元素;αi是預先給定的,表示第i行的不確定性水平,取值范圍為如式(20)所示:
由于目標函數(shù)是線性的,并且約束條件中對pT求二階導均為非負,容易得到上述問題是凸的,因此采用轉換為對偶問題的方法。構建式(23)所示問題的拉格朗日函數(shù),如式(24)所示:
將式(25)代入式(24),得式(23)所示的對偶問題[21]:
而在其他情況下,δ(λ,μ)→+∞。
為了簡化變量,由文獻[22]可得:
將式(28)代入式(27),即可得到式(23)所示問題的轉化問題,如式(29)所示:
由于已知μ的取值范圍,因此可以先求導再采用對分搜索方法[23]求解,得出式(15)所示問題的解,而對于式(16)所示問題,依然采用式(12)的向后遞歸的方法。
上一節(jié)中得到了儲存在離線表中的最佳傳輸策略,而對于多用戶的星地認知網(wǎng)絡,則需要進行信道選擇與功率控制以得到最優(yōu)的通信質量。本節(jié)采用博弈論的方法來進行多用戶的資源分配,設計基于感知延遲的星地網(wǎng)絡魯棒功率節(jié)能博弈算法RPSGA-SD。
在博弈論中,每個參與博弈的用戶都希望自身的效用函數(shù)最大化,而在星地認知網(wǎng)絡中用戶多為移動用戶,能量消耗是要考慮的重要問題。因此,定義效用函數(shù)如式(31)所示[24]:
因此,可以實現(xiàn)認知用戶SUi的最優(yōu)功率控制,如式(33)所示:
RPSGA-SD 算法流程如圖3 所示。
圖3 RPSGA-SD 算法流程Fig.3 Procedure of RPSGA-SD algorithm
假設本文星地網(wǎng)絡有10個PU用戶和5個SU用戶,馬爾科夫決策模型有10個狀態(tài),其中,s0表示活動狀態(tài),s1,s2,…,s9表示不活動狀態(tài)。信噪比閾值設置為Γk=Γk-1+2 dB,Γ0=0。仿真時隙數(shù)T=20,最低功率限制pL=0.5 W,功率預算Bih=100 W,信干比門限=1 dB,中斷概率預算Oc=0.1,信道延遲t0=2。衛(wèi)星高度為35 786 km,信道轉移概率設置如下:P0j=0.02,j=1,2,…,9,Pi0=0.25,i=1,2,…,9,Pi,i+1和Pi-1,i由式(3)給出。本文選取RRAP 算法[11]和TS-RS-PA 算法[12]作為對比算法,在不同情況下比較3 種算法性能。
總時隙內(nèi)3種算法在時延t0=2和t0=4時的平均功率和中斷概率分別如圖4和圖5所示??傮w來看,隨著時隙的增加,用戶功率逐漸下降。從圖4(a)和圖5(a)可以看出:RRAP 算法由于考慮了SU 用戶的QoS 需求和延遲,平均功率為三者最高,并且由于信道延遲的增加造成了功率下降;TS-RS-PA 算法將觀察到的延遲信道狀態(tài)近似為當前信道狀態(tài),平均功率基本沒有變化;RPSGA-OP 算法由于考慮了能量消耗問題,因此平均功率最低。從圖4(b)和圖5(b)可以看出:由于TS-RS-PA算法忽略延遲狀態(tài),因此中斷概率最高;而RPSGA-OP算法會考慮所有可能的信道狀態(tài),因此中斷概率可以滿足通信要求。
圖4 基于網(wǎng)絡延遲的算法性能比較(t0=2)Fig.4 Comparison of algorithms performance based on network delay(t0=2)
圖5 基于網(wǎng)絡延遲的算法性能比較(t0=4)Fig.5 Comparison of algorithms performance based on network delay(t0=4)
在信道狀態(tài)不確定情況下,總時隙內(nèi)3 種算法的平均功率和中斷概率如圖6 所示。定義區(qū)間模型不確定度為:
其中,fi(j)表示真實過渡矩陣的元素,圖中不確定度是對估計的過渡矩陣和真實過渡矩陣之間誤差的量化表示。從圖6(a)可以看出,隨著信道不確定度的上升,RPSGA-OP 算法為了減少信道不確定性帶來的影響,增強系統(tǒng)的魯棒性,功率逐漸降低,而其他2 種算法功率基本保持不變,由此帶來的結果如圖6(b)所示,可以看出,RPSGA-OP 算法中斷概率還是維持在中斷約束內(nèi),具有較好的魯棒性,而其他2 種算法隨著不確定度的增加,中斷概率不斷上升。
圖6 基于模型不確定度的算法性能比較Fig.6 Comparison of algorithms performance based on model uncertainty
總時隙內(nèi)3 種算法剩余能量的變化如圖7 所示,可以看出,RPSGA-OP 算法在博弈過程中由于考慮剩余能量的變化,因此能量剩余最多,達到了節(jié)能的目的,而其他2 種算法沒有考慮剩余能量,能量消耗相較RPSGA-OP 算法很大。
圖7 能量消耗隨時隙數(shù)的變化Fig.7 Energy consumption changes with the number of time slots
本文針對因感知延遲而導致用戶通信中斷的問題,建立信道馬爾科夫決策鏈表征信道衰落和PU 用戶行為,并利用中斷約束保護PU 用戶傳輸,考慮模型參數(shù)不確定時的魯棒功率控制,同時針對能量消耗問題采用博弈論方法,使每個認知用戶都選擇對自身最優(yōu)的信道。仿真結果表明,在考慮網(wǎng)絡延遲的情況下,該方法能夠有效降低中斷概率,并且其在信道轉移模型不確定的情況下也具有較好的性能。下一步將從算法復雜度和收斂速度2 個方面出發(fā)設計功率控制算法,更好地滿足實際應用要求。