張新春,何世彪,葛利嘉,孫 江
(1.重慶通信學(xué)院,重慶400035;2.海軍航空工程學(xué)院,煙臺 264001)
隨著無線通信技術(shù)的不斷發(fā)展以及人們對無線通信需求的不斷增長,整個無線電頻譜空間被劃分得所剩無幾。然而,從一些研究調(diào)查可以看到,頻譜資源的缺乏更多是由于對不同無線接入技術(shù)的頻譜分配不合理造成的,認(rèn)知無線電技術(shù)應(yīng)運(yùn)而生。它能夠主動檢測頻譜使用情況,自適應(yīng)地改變自身通信參數(shù),擇機(jī)地選擇主用戶暫不使用的頻段進(jìn)行通信,期望實(shí)現(xiàn)高可靠性的通信以及最大化頻譜利用率。
目前,認(rèn)知無線電關(guān)鍵技術(shù)包括頻譜感知,頻譜分配,頻譜管理等。本文主要研究頻譜感知后的頻譜分配問題。把博弈理論引入認(rèn)知無線電中的動態(tài)頻譜分配,是一個全新的研究方案,如Nie等人[1]提出了利用潛在博弈(potential game)的自適應(yīng)信道分配算法,文獻(xiàn)[2]提出了多個主系統(tǒng)間頻譜價格博弈的伯川德(Bertrand)模型,以及動態(tài)博弈的斯坦克爾伯格(Stackelberg)博弈模型等,這些大都是構(gòu)建特殊的博弈模型來解決頻譜分配。
本文在特殊博弈模型靜態(tài)古諾博弈模型基礎(chǔ)上,考慮了頻譜的水平差異以及信道容量狀況,對其提出了改進(jìn)算法。
本文分析了有N個用戶端設(shè)備(customer premises equipment,CPE)的分布式無線通信系統(tǒng),用戶端設(shè)備也稱認(rèn)知用戶(cognitive user,CU)。
各個認(rèn)知用戶隨機(jī)的分布在一個網(wǎng)絡(luò)小區(qū)內(nèi),獨(dú)自地感知主網(wǎng)絡(luò)(primary network)頻譜使用狀況,相互間通過公共控制信道傳遞頻譜使用信息,然后在相互協(xié)商好的信道上進(jìn)行通信鏈接,如圖1所示。由于博弈理論的特點(diǎn)是各個博弈玩家通過自身所掌握的可用信息選擇自己的策略,正是分布式網(wǎng)絡(luò)的特點(diǎn)。
圖1 認(rèn)知無線電網(wǎng)絡(luò)模型Fig.1 Model of cognitive radio network
假設(shè)認(rèn)知用戶系統(tǒng)采用自適應(yīng)調(diào)制技術(shù),傳輸速率基于信道質(zhì)量可以動態(tài)地調(diào)整。對于正交幅度調(diào)制采用矩形星座圖(如4QAM,16QAM),那么其單輸入單輸出系統(tǒng)在高斯噪聲信道的比特錯誤概率可以近似表示為
(1)式中:γ表示接收機(jī)的信噪比;k代表所用調(diào)制方式的頻帶利用率,且一般為非負(fù)值。為保證傳輸質(zhì)量,比特誤碼率應(yīng)達(dá)到一定門限值(BERtari),則認(rèn)知用戶i的頻帶利用率為
(2)式中,
通過1.1節(jié)的網(wǎng)絡(luò)模型描述,我們可以把認(rèn)知無線電的動態(tài)頻譜分配問題用博弈過程進(jìn)行描述。在這個博弈過程中,參與者是認(rèn)知用戶,他們的行動(策略)是對傳輸信道的選擇,并且他們的效用和所選擇的信道質(zhì)量相聯(lián)系。信道質(zhì)量信息可由認(rèn)知無線電用戶通過在不同的無線頻率上的測量來獲得(見1.2 節(jié))。
則頻譜分配問題的博弈論模型一般形式為
(4)式中:N是博弈者(也即認(rèn)知用戶)的有限集;Si是相對于博弈者i的策略集,其策略空間為S=×Si,i∈N,則Ui:S→R是效用函數(shù)集。在博弈Γ中的每一個博弈者i,效用函數(shù)Ui是si和當(dāng)前其對手的s-i的函數(shù),這里si是博弈者i選擇的策略,s-i是其對手的策略。
目前,認(rèn)知無線電中常用的靜態(tài)博弈模型有伯川德博弈和古諾博弈2種。伯川德博弈[2]主要適用于主系統(tǒng)之間的交互,而古諾博弈[4]更適用于認(rèn)知用戶之間的頻譜分配過程。
在1.1節(jié)所述的系統(tǒng)模型基礎(chǔ)上,一個古諾博弈模型表述如下:博弈方是認(rèn)知用戶,每個博弈方的策略相應(yīng)為分配的非零值的頻譜(用bi表示每個認(rèn)知用戶i)。在與其他認(rèn)知用戶以及主用戶共享的頻譜系統(tǒng)中每個博弈方的支付(payoff)是認(rèn)知用戶的利益(比如收益減去花費(fèi),用pi表示)。
對于主系統(tǒng),假設(shè)定價函數(shù)(Pricing function)是向認(rèn)知用戶收費(fèi),表示為
(5)式中:x,y是非零常數(shù);τ≥1確保定價函數(shù)為凸函數(shù);Β={b1,…,bN},代表所有認(rèn)知用戶策略集。用ω代表對于主用戶來說頻譜的價值,于是為了確保主用戶愿意共享頻譜尺寸(spectrum size)b給認(rèn)知用戶,條件是必要的。另外,主用戶向所有認(rèn)知用戶收費(fèi)是相同的價格。
認(rèn)知用戶i的收益由ri×ki×bi獲得,ri表示每單位傳輸速率認(rèn)知用戶的收益,而獲得頻譜分配的花費(fèi)為bi c(b)。于是認(rèn)知用戶i獲得的利益將可以表示為
通過(5)和(6)式,可以得到其效用函數(shù)為
2.1 節(jié)的定價函數(shù)是把頻譜統(tǒng)一進(jìn)行定價,也即主用戶向所有認(rèn)知用戶收費(fèi)是相同的價格。然而頻譜是有區(qū)別的。頻譜有水平差異和垂直差異2種。水平差異性是指認(rèn)知用戶對不同頻譜的偏好不同,也就是即使頻譜特性完全相同,也不能相互代替。而頻譜的垂直差異指的是頻譜的質(zhì)量差異,如空閑情況以及信道容量狀況等。由于頻譜的空閑狀況已經(jīng)感知,而信道容量通過認(rèn)知用戶的接收信噪比獲得,故本文在考慮頻譜的水平差異以及信道容量狀況下,對定價函數(shù)(5)式改進(jìn)如下
(8)式中:c為非負(fù)常數(shù),這里頻譜水平差異由頻譜相似度矩陣μ描述。μij表示對于認(rèn)知用戶來說,把頻譜bj看成bi的相似程度,且 μij∈[-1,1],μij越小,說明兩頻譜的水平差異越大,當(dāng)μij=0時,表示頻譜bi和bj完全不同,認(rèn)知用戶不能隨意更換頻譜;μij越大,說明頻譜的差異程度越小,當(dāng)μij=1時,頻譜bi和bj完全相同,主用戶的要價也就越高,也即文獻(xiàn)[4]提到的情況,而當(dāng)μij<0時,表示頻譜bi需要bj的補(bǔ)充,也就是說,頻譜bi不足以滿足認(rèn)知用戶的需要,需要從另一頻譜bj那里獲得補(bǔ)充(比如,一個用做上行鏈路,一個用做下行鏈路)??梢钥闯鱿嗨贫染仃嚘痰奶攸c(diǎn)是主對角線上元素為1,其余元素關(guān)于主對角線對稱。而信道容量由(2)式頻譜利用率體現(xiàn)。這樣通過(6)式和(8)式,其效用函數(shù)改進(jìn)如下
根據(jù)納什均衡點(diǎn)原理[5],如果沒有一個參與者能夠靠自身行動的改變提高自身收益時,整個參與者集合對應(yīng)的行動向量就稱為納什均衡。如果滿足以下條件,則本文博弈過程就能定性判斷納什均衡存在:
1)認(rèn)知用戶集合是有限的;
2)認(rèn)知用戶策略集Β={b1,…,bN}是封閉的、有界的凸集;
3)效用函數(shù)pi(Β)是在行動空間上的連續(xù)的擬凹函數(shù)。
可行性證明:對于條件1)和2),本文提出的基于頻譜差異的古諾博弈模型(spectrum difference based cournot game,SDCG)是顯然成立的,下面證明條件3)。
對效用函數(shù)進(jìn)行二次求導(dǎo)有:
本文利用反應(yīng)函數(shù)法[6]求解,反應(yīng)函數(shù)法就是參與者根據(jù)給定的其他參與者的戰(zhàn)略,獲得自己的最佳戰(zhàn)略。
Β-i==1,…,N;j≠i}表示除了認(rèn)知用戶i的所有策略集合,也即Β=Β-i∪{bi},于是,認(rèn)知用戶i的最佳反應(yīng)函數(shù)為
集合Β*={b*1,…,b*N}表示此博弈納什均衡解,當(dāng)且僅當(dāng)
當(dāng)給定(13)式中所有參數(shù)值,求解該方程,即可得到納什均衡解b*i。
根據(jù)第1部分提出的網(wǎng)絡(luò)模型,本文考慮了2個認(rèn)知用戶的共享頻譜。設(shè)定目標(biāo)BERtari門限值為10-4,定價函數(shù)中的常數(shù)因子c=1,τ值根據(jù)實(shí)際測量環(huán)境獲得(比如線性模型時τ=1),主用戶的頻譜價值ω=1,每單位傳輸速率認(rèn)知用戶的收益ri=10。其中一些參數(shù)在具體的仿真環(huán)境中可能發(fā)生變化。
圖2給出了2個認(rèn)知用戶的反應(yīng)函數(shù)曲線,2條曲線的交點(diǎn)就是納什均衡點(diǎn)。從圖2中可以看出,每個認(rèn)知用戶的最佳反應(yīng)是另一個認(rèn)知用戶策略上的線性函數(shù)點(diǎn),2個認(rèn)知用戶的策略bi成逆向變動,當(dāng)認(rèn)知用戶1的頻譜尺寸減小時,認(rèn)知用戶2的頻譜尺寸將會增大,反之亦然。當(dāng)μ=1時,就是經(jīng)典古諾博弈模型,也就是說文獻(xiàn)[4]提出的方法是我們算法的特殊情況。
圖2 不同條件下的納什均衡Fig.2 Nash equilibrium in different conditions
由于2個認(rèn)知用戶的效用函數(shù)相同,因此圖3只給出了1個認(rèn)知用戶的價格(效用)隨頻譜尺寸變化的曲線。從圖3中可以看出,認(rèn)知用戶的利益均在納什均衡點(diǎn)時達(dá)到最大,這與前面的分析是一致的。對比圖3中的幾條曲線發(fā)現(xiàn),當(dāng)頻譜差異越大時,認(rèn)知用戶的利益就越大,這是因?yàn)轭l譜差異越大時,主用戶向認(rèn)知用戶對該頻譜的要價就越低,認(rèn)知用戶獲得更大的頻譜尺寸的同時,認(rèn)知用戶能獲得更多利益。同樣當(dāng)μ=1時,就是經(jīng)典的古諾博弈模型。
圖3 不同條件下的均衡效用Fig.3 Equilibrium utilities in different conditions
本文主要研究了認(rèn)知無線電中基于博弈論的動態(tài)頻譜分配算法,重點(diǎn)描述了運(yùn)用靜態(tài)古諾博弈模型算法??紤]到實(shí)際環(huán)境中頻譜的差異性,本文對頻譜進(jìn)行了分級,用相似度矩陣進(jìn)行表示,本文的仿真中已經(jīng)驗(yàn)證,已有的古諾博弈算法是本文提出算法的一個特殊模式,對已有算法進(jìn)行了完善和擴(kuò)充,達(dá)到了一定的實(shí)際運(yùn)用能力。
[1]NIE N,COMANIU C.Adaptive channel allocation spectrum etiquette for cognitive radio networks[J].Journal Mobile Networks and Applications,2006,11(6):779-797.
[2]NIYATO D,HOSSAIN E.Competitive Pricing for Spectrum Sharing in Cognitive Radio Networks:Dynamic Game,Inefficiency of Nash Equilibrium,and Collusion[J].IEEE Journal on Selected Areas in Communication,2008,26(1):192-202.
[3]GOLDSMITH A J,CHUA S G.Variable rate variable power MQAM for fading channels[J].IEEE Trans Commun,1997,45(10):1218-1230.
[4] NIYATO D,HOSSAIN E.A Game-Theoretic Approach to Competitive Spectrum Sharing in Cognitive Radio Networks[C]//IEEE Communications Society WCNC 2007.Kowloon:IEEE Press,2007:16-20.
[5] FUDENBERG D,TIROLE J.Game theory[M].Cambridge,MA:MIT Press,1991:23-26.
[6]OSBORNEM J.An Introduction to Game Theory[M].Oxford:Oxford University Press,2003.