李永成,周小猛,高貞貞,3,白少壯,李康澤
(1.電子信息系統(tǒng)復(fù)雜電磁環(huán)境效應(yīng)國家重點(diǎn)實(shí)驗(yàn)室,471003,河南洛陽;2.西安交通大學(xué)信息與通信工程學(xué)院,710049,西安;3.東南大學(xué)移動(dòng)通信國家重點(diǎn)實(shí)驗(yàn)室,210096,南京)
由于無線通信具有廣播特性使其易遭受干擾攻擊,因此抗干擾技術(shù)的研究顯得日益重要。在無線抗干擾技術(shù)的研究中,已有的研究方向主要是針對(duì)空間域、頻域或者功率域。應(yīng)用于衛(wèi)星通信的空間域抗干擾技術(shù)[1-3]通常有空間隔離法、頻率隔離法、信號(hào)處理法(擴(kuò)頻和跳頻等)等抗干擾方案;頻域的主要抗干擾技術(shù)[4-5]是擴(kuò)頻技術(shù),它包括跳頻技術(shù)[6]、直接序列擴(kuò)頻技術(shù)[7]及自適應(yīng)擴(kuò)頻技術(shù)[8];功率域的抗干擾技術(shù)被認(rèn)為是最直接有效也是使用最廣的抗干擾方案,主要通過改變通信方與干擾機(jī)的發(fā)射功率來實(shí)現(xiàn)[9-11]。
近年來,從很多人為干擾案例可以看出通信與干擾都在向著智能化發(fā)展。博弈論可以滿足通信方與干擾機(jī)進(jìn)行智能化決策的需求[12-13]。例如,文獻(xiàn)[14]提出了一種零和博弈模型,用來分析用戶和干擾者之間的關(guān)系。針對(duì)通信方與干擾機(jī)之間的主從對(duì)抗特征,已有文獻(xiàn)表明Stackelberg博弈模型非常適用于該場景。文獻(xiàn)[6]研究了時(shí)間域的抗干擾策略,通過Stackelberg博弈模型找到通信方跳頻的最優(yōu)跳速,并在求解過程中考慮了觀測誤差造成的影響。文獻(xiàn)[9]的作者主要研究功率域抗干擾系統(tǒng),在不完全信息場景下建立Stackelberg博弈模型。文獻(xiàn)[10]的作者梳理了各種不同情況下的無線通信抗干擾技術(shù)。文獻(xiàn)[11]的作者主要研究了無人機(jī)通信中的抗干擾問題,考慮了觀測誤差和信息的不確定性。
前述工作主要針對(duì)點(diǎn)對(duì)點(diǎn)通信系統(tǒng)研究了基于單域的抗干擾技術(shù)。隨著中繼的引入,無線通信系統(tǒng)應(yīng)用場景進(jìn)一步擴(kuò)展,中繼可以有效地幫助用戶提高通信質(zhì)量。針對(duì)譯碼轉(zhuǎn)發(fā)中繼輔助抗干擾通信系統(tǒng),文獻(xiàn)[15]的作者將中繼節(jié)點(diǎn)作為Stackelberg博弈的副領(lǐng)導(dǎo)者,建立了3層Stackelberg博弈模型。針對(duì)放大轉(zhuǎn)發(fā)中繼系統(tǒng),文獻(xiàn)[16]的作者提出了一種基于跳頻的多域抗干擾策略,使用Stackelberg博弈來模擬通信方和干擾者之間的交互作用,但是該工作只適用于博弈雙方能夠獲得彼此完美信息的理想情況。
基于已有研究工作基礎(chǔ),本文針對(duì)存在不確定信道信息和參數(shù)估計(jì)誤差的非理想情況,在放大轉(zhuǎn)發(fā)中繼系統(tǒng)中提出了基于Stackelberg博弈的聯(lián)合時(shí)間域和功率域的抗干擾方案。本文的博弈模型將源和中繼作為領(lǐng)導(dǎo)者,干擾機(jī)作為跟隨者,建立雙層的Stackelberg博弈模型,然后用逆向歸納法求解通信方和干擾機(jī)的最優(yōu)多域參數(shù)。仿真結(jié)果表明,本文所提多域抗干擾方案相比于已有單域方案和多域隨機(jī)方案具有顯著的性能優(yōu)勢。
考慮一個(gè)兩跳的無線中繼系統(tǒng),系統(tǒng)模型如圖1所示。該系統(tǒng)由一個(gè)源節(jié)點(diǎn)S、一個(gè)目的節(jié)點(diǎn)D、一個(gè)可信中繼節(jié)點(diǎn)R和一個(gè)干擾節(jié)點(diǎn)(干擾機(jī))J組成,中繼采用放大轉(zhuǎn)發(fā)協(xié)議,工作在半雙工模式。由于障礙物的遮擋,源節(jié)點(diǎn)和目的節(jié)點(diǎn)之間沒有直接鏈路。源到目的節(jié)點(diǎn)的傳輸分為兩個(gè)階段:階段1,源節(jié)點(diǎn)以功率PS向中繼發(fā)送信號(hào);階段2,中繼對(duì)接收信號(hào)能量歸一化并用功率PR進(jìn)行信號(hào)轉(zhuǎn)發(fā)。干擾機(jī)在檢測到信號(hào)后會(huì)對(duì)源和中繼進(jìn)行干擾。用hSR、hRD、hJR、hJD來分別表示S與R、R與D、J與R以及J與D之間的信道。在D處受干擾的接收信號(hào)可以表示為[17]
圖1 兩跳無線中繼系統(tǒng)模型Fig.1 System model of two-hop wireless relay
y=hRDη(hSRs+hJRsJ1+nR)+hJDsJ2+nD
(1)
式中:s表示信源S發(fā)出的信號(hào),發(fā)射功率為PS;sJ1表示J發(fā)送到R并且功率為PJ1的零均值高斯干擾信號(hào);sJ2表示J發(fā)送到D且功率為PJ2的零均值高斯干擾信號(hào);nR表示R處方差為NR的零均值高斯噪聲;nD表示D處方差為ND的零均值高斯噪聲;η表示中繼的放大轉(zhuǎn)發(fā)因子,可以用下式來表示
(2)
假設(shè)源節(jié)點(diǎn)和中繼的最大發(fā)射功率分別為PS,max和PR,max,則PS≤PS,max,PR≤PR,max。對(duì)于干擾機(jī),假設(shè)其最大總功率為PJ,則PJ1+PJ2=PJ,功率分配系數(shù)為ρ=PJ1/PJ。
典型的跳頻信號(hào)結(jié)構(gòu)示意圖如圖2所示。干擾機(jī)采用引導(dǎo)式跟蹤干擾的干擾策略:在每個(gè)跳頻周期內(nèi),干擾機(jī)首先檢測跳頻信號(hào),若檢測到跳頻通信信號(hào),則立即引導(dǎo)干擾機(jī)進(jìn)行干擾;否則,干擾機(jī)不發(fā)射干擾信號(hào)。將每個(gè)跳頻周期T表示成兩部分:信號(hào)檢測時(shí)間TE和干擾時(shí)間TI,即T=TE+TI,其中T∈[0,Tmax],Tmax為最大跳頻周期。假設(shè)T1為階段1和階段2的持續(xù)時(shí)間,且T=nT1,其中n為正整數(shù)。此外,將TI表示為TI=mT1,m 圖2 跳頻信號(hào)結(jié)構(gòu)示意圖Fig.2 Structure diagram of frequency hopping signal 跳頻信號(hào)在M個(gè)相鄰但不相交的子頻帶內(nèi)偽隨機(jī)跳變。通信方包括源和中繼能夠根據(jù)引導(dǎo)式跟蹤干擾的參數(shù),在滿足最大跳頻周期的范圍內(nèi)自適應(yīng)調(diào)整跳頻周期。從圖2可見,干擾機(jī)檢測時(shí)間越長,它能正確跟蹤通信方信號(hào)的概率就越高,但是剩下用來干擾的時(shí)間就會(huì)越短。通信方能夠根據(jù)干擾機(jī)的情況自適應(yīng)改變跳頻周期以最大化自己的利益,故干擾機(jī)的檢測時(shí)間和通信方的跳頻周期對(duì)通信方的性能有著重要的影響。因此,本文將時(shí)間域和功率域聯(lián)合考慮,求解能最大化通信方效用函數(shù)的時(shí)間域和功率域參數(shù)。 由于信號(hào)檢測概率往往與檢測時(shí)間或信號(hào)發(fā)射功率有關(guān),用pd表示跳頻通信信號(hào)的檢測概率,根據(jù)文獻(xiàn)[19],pd可表示為 (3) 式中:γJ表示干擾機(jī)J處的接收信噪比。 已有工作通常假設(shè)通信方具有干擾機(jī)的完美信道狀態(tài)信息,并依此來確定其最佳策略,這在實(shí)際情況下往往是不可行的。為了建模更實(shí)際的情況,本文考慮如下的非理想情況:通信方只能獲得干擾信道的不確定信道信息,且干擾機(jī)和通信方對(duì)功率域及時(shí)間域參數(shù)的估計(jì)存在誤差。 考慮到信道信息的不確定性,通信方?jīng)]有干擾機(jī)信道增益的完美信息,但是根據(jù)文獻(xiàn)[9],可以如假設(shè)1所示,通信方能夠獲取他們的概率分布。此外,如假設(shè)2所示,干擾機(jī)和通信方對(duì)對(duì)方參數(shù)的估計(jì)存在估計(jì)誤差。 假設(shè)1對(duì)于通信方而言,只能獲得干擾機(jī)到通信系統(tǒng)的不確定信道信息,假設(shè)干擾機(jī)到中繼和目的節(jié)點(diǎn)的信道增益分別為gJR,gJD,它們分別有B和K種狀態(tài),表示為βJR,b,b=1,…,B和βJD,k,k=1,…,K。其概率分布分別為φR(βJR,b)和φD(βJD,k),則有 (4) 1.3.1 通信方效用函數(shù) 考慮到實(shí)際無線設(shè)備電池容量有限的能量限制,建立通信方的效用函數(shù)時(shí),在衡量通信關(guān)鍵指標(biāo)的同時(shí)也要考慮發(fā)射代價(jià)。除此之外,由于考慮了不確定信道信息和參數(shù)估計(jì)誤差,我們需要對(duì)不同干擾機(jī)信道增益下的接收機(jī)的平均信干噪比依概率求和,因此將通信方的效用值定義為 CSPS-CRPR (5) (6) 由信噪比的定義得到式(6)中γD為[16] (7) 式中:gSR=κ[d0/dSR]α和dSR分別是S到R信道的增益和距離,κ是由天線特性和平均信道損耗所決定的常系數(shù),d0是天線遠(yuǎn)場的參考距離,α是路徑損耗因子;gRD=κ[d0/dRD]α和dRD分別是R到D的信道增益和距離??紤]到非理想情況,式(6)中的ΓD應(yīng)寫為 (8) 根據(jù)[16],通信方估計(jì)J的接收信噪比為 (9) 式中:NJ是J處的零均值高斯噪聲的方差。 (10) 1.3.2 干擾機(jī)效用函數(shù) 考慮干擾機(jī)由電網(wǎng)供能,這對(duì)于合法通信系統(tǒng)來說是最壞情況。與電池供能設(shè)備相比,干擾機(jī)的發(fā)射代價(jià)可以忽略不計(jì)。因此考慮估計(jì)誤差后,干擾機(jī)的效用函數(shù)表示為 (11) (12) (13) (14) 式中:Le3=[ND+(1-ρ)PJgJD];Le2=[NR+ρPJgJR]。 (15) (16) 1.3.3 基于效用函數(shù)的優(yōu)化模型 根據(jù)上述效用函數(shù),通信方和干擾機(jī)的目標(biāo)是使各自的效用值最大化。根據(jù)跳頻信號(hào)的檢測結(jié)果,作為跟隨者的干擾機(jī)從以下優(yōu)化問題中確定最佳檢測時(shí)間TE和功率分配系數(shù)ρ (17) 而作為領(lǐng)導(dǎo)者,信源和中繼從以下優(yōu)化問題中確定最佳發(fā)射功率和跳頻周期 (18) 本節(jié)將采用逆向歸納法對(duì)建立的Stackelberg博弈模型進(jìn)行求解。求解時(shí),干擾機(jī)作為跟隨者根據(jù)跳頻信號(hào)的檢測結(jié)果求解其最優(yōu)檢測時(shí)間和干擾功率分配因子,并推導(dǎo)出最優(yōu)近似閉式解。通信方作為領(lǐng)導(dǎo)者使用基于遺傳算法(GA)的優(yōu)化方案求解其功率域和時(shí)域參數(shù)。 干擾機(jī)作為跟隨者可以根據(jù)檢測到的跳頻信號(hào)估計(jì)通信方參數(shù),下面將在給定通信方參數(shù)下求解最優(yōu)干擾機(jī)參數(shù)。 (19) 根據(jù)文獻(xiàn)[16],可求得閉式解為 ρ*=min(1,max(0,ρ0)) (20) 式中,ρ0所代表的多項(xiàng)式如下 (21) 2.1.2 最優(yōu)信號(hào)檢測時(shí)間 在獲得最優(yōu)功率分配系數(shù)后,可得到信號(hào)檢測時(shí)間的最優(yōu)值。根據(jù)文獻(xiàn)[16]已經(jīng)證明的結(jié)論,公式(17)可以被簡化為以下等式 (22) 其中m*的表達(dá)如下 (23) (24) 式中,μ的表達(dá)式為 (25) 以信源和中繼為領(lǐng)導(dǎo)著來優(yōu)化PS、PR、T。采用一種基于質(zhì)數(shù)分布的遺傳算法(GAED)[20]來解決這一非線性雙層規(guī)劃問題。 2.2.2 適應(yīng)度計(jì)算 對(duì)于第t代的個(gè)體,適應(yīng)度函數(shù)由下式表示 (26) 式中:η表示一個(gè)充分大的正數(shù)。適應(yīng)度函數(shù)后兩項(xiàng)的存在,使得算法能夠在迭代過程中讓含有異常值的個(gè)體獲得很低的適應(yīng)度值,并在之后的迭代過程中淘汰這部分個(gè)體。 完成第t代所有個(gè)體的適應(yīng)度值計(jì)算后,記錄適應(yīng)度最好個(gè)體為I*t=(L*t,G*t)和從t-1代遺傳的所有可能個(gè)體中具有最大通信方的效用值的個(gè)體I′t=(L′t,G′t)。 (27) 式中:μ∈[0,τ],其中τ是限制因子,避免交叉過后的個(gè)體的參數(shù)在約束集之外;Qt是提供交叉方向的向量,并且基于L*t和L′t進(jìn)行優(yōu)化。 選擇合適的Qt十分重要,因?yàn)長*t是第t代種群中適應(yīng)度最好個(gè)體的通信方參數(shù),我們希望Qt能以更高的概率接近L*t,因此本文選擇了基于指數(shù)分布的選擇法。假設(shè)F服從指數(shù)分布,則有 (28) (29) 2.2.5 選擇 從第t代所有個(gè)體、集合O1和集合O2之中選擇適應(yīng)度值最高的Pn個(gè)個(gè)體作為下一代種群的一部分個(gè)體,其中Pn 本文主要仿真參數(shù)的設(shè)置參照了相關(guān)文獻(xiàn)[6,15-16]對(duì)類似場景的仿真參數(shù)設(shè)置,設(shè)置如下:令單時(shí)隙通信周期T1為1 ms,頻率切換時(shí)間T0為0.5 ms,最大跳頻周期為100 ms;干擾機(jī)的發(fā)射功率為PJ=10 W;信源和中繼的最大功率限制設(shè)置為PS,max=PR,max=1 W;噪聲功率NJ=NR=ND=-50 dBm;可選信道數(shù)M為32。仿真采用室外場景,信源、接收機(jī)、干擾機(jī)和中繼的位置坐標(biāo)設(shè)置為[-4,0]、[2,0]、[0,3]及[-1,0]km;信道參數(shù)設(shè)置為κ=1,d0=0.1 km,α=3。仿真中初始種群數(shù)l為30;交叉概率pc和變異概率pm分別為0.8和0.2;信源和中繼的發(fā)射功率代價(jià)因子設(shè)為CS=CR=0.8。 為了衡量不確定信道信息、功率及時(shí)間域參數(shù)估計(jì)誤差對(duì)效用值的影響,我們定義了通信方和干擾機(jī)的實(shí)際效用值,即通信方和干擾機(jī)在不確定信道信息和參數(shù)估計(jì)誤差的情況下進(jìn)行抗干擾決策,將決策結(jié)果運(yùn)用于干擾機(jī)當(dāng)前真實(shí)信道及功率分配,以及通信方真實(shí)發(fā)射功率和跳頻周期的情況下,計(jì)算通信方和干擾機(jī)的實(shí)際效用值,因此通信方的實(shí)際效用值可寫為 (30) 圖3為干擾機(jī)對(duì)參數(shù)T的估計(jì)誤差對(duì)效用值的影響圖,可以看到εT越大,通信方效用值越大,干擾機(jī)效用值越小。這是因?yàn)楫?dāng)干擾機(jī)對(duì)通信方參數(shù)存在估計(jì)誤差會(huì)導(dǎo)致自己的參數(shù)偏離最優(yōu)值,使得干擾機(jī)效用值下降,通信方效用值增大。 圖3 時(shí)間域估計(jì)誤差對(duì)效用值的影響Fig.3 Effect of estimation error in time domain on utility value 圖4為干擾機(jī)對(duì)發(fā)射機(jī)功率參數(shù)的估計(jì)誤差對(duì)效用值的影響圖,令εP=εPS=εPR??梢钥闯?εP越大,通信方效用值越大。同樣因?yàn)楦蓴_機(jī)估計(jì)誤差越大,干擾機(jī)的觀察結(jié)果與實(shí)際值之間的偏差就越大,這會(huì)影響干擾機(jī)的決策并降低干擾機(jī)效用值和增加通信方效用值。 圖4 功率域估計(jì)誤差對(duì)效用值的影響Fig.4 Effect of estimation error in power domain on utility value 圖5考察了不確定信道信息對(duì)效用值的影響,我們在不同的概率分布下進(jìn)行了通信方實(shí)際效用值仿真。在圖5的3種概率分布中,當(dāng)φR(βJR,1)=0.5、φR(βJR,2)=0.5時(shí),對(duì)于干擾信道狀態(tài)的不確定度最大;φR(βJR,1)=0.9、φR(βJR,2)=0.1時(shí),對(duì)信道狀態(tài)的不確定度最小。由圖5可得,當(dāng)信道的不確定度增加時(shí),由于通信方不能精確進(jìn)行優(yōu)化而導(dǎo)致通信方效用值下降。 圖5 不確定信道信息對(duì)效用值的影響 Fig.5 Effect of incomplete channel information on utility value 假設(shè)J到R的信道增益有兩個(gè)狀態(tài)[βJR,1,βJR,2]=[0.2,0.3],干擾節(jié)點(diǎn)J到接收機(jī)D的信道增益也有兩種狀態(tài)[βJD,1,βJD,2]=[0.3,0.6],其分布概率為φR(βJR,1)=φR(βJR,2)=φD(βJD,1)=φD(βJD,2)=0.5。對(duì)于通信方和干擾機(jī)的估計(jì)誤差,我們設(shè)置εT=εTE=εPS=εPR=0.2,ερ=0.02。 圖6展示了本文所提多域博弈方案與單域博弈方案和多域隨機(jī)方案的效用值對(duì)比。單域博弈方案包括單時(shí)域和單功率域,其中,在單時(shí)域方案中隨機(jī)選擇功率(PS,PR),通過遍歷獲得最優(yōu)跳頻周期T,最后用上文推導(dǎo)出的閉式解來選擇最優(yōu)信號(hào)檢測周期TE和功率分配ρ。而單功率域方案則是相反,即盲跳頻隨機(jī)選擇跳頻周期T,遍歷獲得最優(yōu)(PS,PR)。多域隨機(jī)方案則隨機(jī)選擇時(shí)域和功率域參數(shù)。通過分析圖6的仿真結(jié)果,可以發(fā)現(xiàn)多域隨機(jī)方案具有最小的通信方效用值,而本文所提方案具有最大的通信方效用值。單域博弈方案中,單功率域方案能取得較高的通信方效用函數(shù)值,隨著發(fā)射代價(jià)的增大,單功率域方案與本文方案的差距逐漸減小。當(dāng)發(fā)射代價(jià)為CS=CR=0.7時(shí),本文方案通信方效用值為27.43,單功率域方案通信方效用值為13.22,本文方案的通信方效用值相比于單功率域方案提高約100%,當(dāng)發(fā)射代價(jià)為CS=CR=0.8時(shí),本文方案通信方效用值為7.56,單功率域方案通信方效用值為3.36,本文方案的通信方效用值相比于單功率域方案提高約50%。與此同時(shí),本文方案取得了最小的干擾機(jī)效用值。當(dāng)發(fā)射代價(jià)為CS=CR=0.7時(shí),本文方案的干擾機(jī)效用值約為-165,單功率域方案的干擾機(jī)效用值約為-100,本文方案的干擾機(jī)效用值相比于單功率域方案至少惡化了50%。 圖6 本文方案與對(duì)比方案的效用值對(duì)比Fig.6 Comparison of utility value between the proposed scheme and the comparative schemes 本文針對(duì)存在惡意干擾機(jī)的放大轉(zhuǎn)發(fā)中繼系統(tǒng)提出了一種多域抗干擾方案。該方案使用Stackelberg博弈來建模通信方和干擾者之間的交互作用,并考慮了實(shí)際情況下對(duì)抗雙方信息獲取困難的問題,對(duì)不確定信道信息和功率域及時(shí)間域參數(shù)估計(jì)誤差進(jìn)行了建模,采用逆向歸納法對(duì)博弈雙方的時(shí)域和功率域參數(shù)進(jìn)行了求解。通過仿真討論了參數(shù)估計(jì)誤差和不確定信道信息對(duì)于通信方和干擾機(jī)效用值的影響,并證明了本文所提多域博弈方案相較于單域博弈方案和多域隨機(jī)方案的優(yōu)勢。1.2 非理想情況
1.3 Stackelberg博弈模型建立
2 基于多域的博弈抗干擾方案
2.1 跟隨者干擾機(jī)的子博弈
2.2 領(lǐng)導(dǎo)者通信方的子博弈
3 仿真結(jié)果分析
3.1 估計(jì)誤差對(duì)效用值的影響
3.2 不確定信道信息對(duì)效用值的影響
3.3 與不同方案的對(duì)比
4 結(jié) 論