黃 麗,方紅斌
(1中南民族大學(xué) 電子信息工程學(xué)院, 智能無線通信湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430074; 2華為技術(shù)有限公司武漢研究所,武漢 430074)
?
非對稱認(rèn)知網(wǎng)絡(luò)中分布式多用戶頻譜共享算法
黃麗1,方紅斌2
(1中南民族大學(xué) 電子信息工程學(xué)院, 智能無線通信湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430074; 2華為技術(shù)有限公司武漢研究所,武漢 430074)
為解決多用戶沖突導(dǎo)致非對稱認(rèn)知網(wǎng)絡(luò)吞吐量降低的問題,根據(jù)網(wǎng)絡(luò)中用戶信道收益矩陣的特點(diǎn),提出了一種分布式多用戶聯(lián)合頻譜共享方法.首先,基于Gale-Shapley理論實(shí)現(xiàn)認(rèn)知用戶和信道之間的“一對一”頻譜分配,以避免認(rèn)知用戶之間的競爭沖突;其次,在未知信道先驗(yàn)知識或者認(rèn)知用戶僅有部分信道感知能力時,通過順序最優(yōu)學(xué)習(xí)算法獲取信道收益信息;同時設(shè)置接入定時器,實(shí)現(xiàn)分布式機(jī)會頻譜共享.仿真結(jié)果表明:所提方法的平均網(wǎng)絡(luò)吞吐量明顯優(yōu)于隨機(jī)等分布式算法,且復(fù)雜度比最優(yōu)算法大大降低,收斂速度較快,適于感知帶寬受限和用戶地理位置分散的非對稱認(rèn)知網(wǎng)絡(luò).
非對稱認(rèn)知網(wǎng)絡(luò);分布式頻譜共享;Gale-Shapley理論;聯(lián)合學(xué)習(xí)算法
機(jī)會認(rèn)知頻譜共享技術(shù)在未知干擾溫度和碼本信息情況下,能有效解決無線頻譜資源稀缺和利用率低下的矛盾[1],成為認(rèn)知網(wǎng)絡(luò)的研究熱點(diǎn)問題之一.現(xiàn)有機(jī)會頻譜接入技術(shù)研究從網(wǎng)絡(luò)結(jié)構(gòu)上可分為集中式[2,3]和分布式[4-6]兩大類.集中式策略由中央控制節(jié)點(diǎn)對空閑頻譜進(jìn)行分配,例如文獻(xiàn)[2]提出帶有接入閾值和超時隙的集中式認(rèn)知網(wǎng)絡(luò)頻譜分配策略,文獻(xiàn)[3]利用LTE基站間的相互協(xié)作對重負(fù)荷小區(qū)邊緣進(jìn)行動態(tài)頻譜借用和選擇服務(wù)基站.雖然集中式頻譜分配算法能夠避免認(rèn)知用戶之間的無序競爭, 但控制交互信息開銷大,不適于無中心節(jié)點(diǎn)的分布式網(wǎng)絡(luò).
分布式接入算法中認(rèn)知用戶通過競爭獲取空閑頻譜的使用權(quán),多信道多用戶接入問題可建模為分布式多臂賭博機(jī)模型[4],當(dāng)認(rèn)知網(wǎng)絡(luò)中頻譜具有稀疏特征時,Bagheri等人[5]提出自適應(yīng)有限速率采樣方法以解決認(rèn)知接入問題.文獻(xiàn)[6]提出的時分公平復(fù)用方法要求認(rèn)知用戶保持嚴(yán)格同步,同時假設(shè)不同認(rèn)知用戶接入同一信道時具有相同的傳輸速率,難以適應(yīng)信道收益不同的非對稱網(wǎng)絡(luò).
針對現(xiàn)有算法中的不足,本文首先分析了非對稱認(rèn)知網(wǎng)絡(luò)的信道收益矩陣特點(diǎn),然后采用 Gale-Shapley(G-S)理論實(shí)現(xiàn)“一對一”頻譜分配,以有效解決多用戶通信沖突問題;之后在未知信道信息情況下,利用順序最優(yōu)學(xué)習(xí)算法獲得穩(wěn)定的分配結(jié)果;最后設(shè)置定時器實(shí)現(xiàn)分布式算法,避免了大量交互信息開銷.
1.1網(wǎng)絡(luò)模型
假設(shè)機(jī)會頻譜接入網(wǎng)絡(luò)中有N個相互正交的授權(quán)信道和M個認(rèn)知用戶(N≥M>1).認(rèn)知用戶在授權(quán)信道上的收益主要取決于兩個因素,即授權(quán)信道的空閑概率和認(rèn)知用戶的信道質(zhì)量.當(dāng)認(rèn)知用戶局限在較小的范圍內(nèi)時,可認(rèn)為感知到的授權(quán)信道占用概率相同,忽略信道質(zhì)量時可認(rèn)為不同認(rèn)知用戶在同一授權(quán)信道上的收益相同(即對稱認(rèn)知網(wǎng)絡(luò)).而非對稱認(rèn)知網(wǎng)絡(luò)中,由于認(rèn)知用戶分布在較廣泛的區(qū)域,感知到的授權(quán)信道占用情況可能不同;同時認(rèn)知用戶對之間的信道質(zhì)量也可能存在差異,這樣不同認(rèn)知用戶即使在同一授權(quán)信道上獲得的收益也不相同,可見非對稱認(rèn)知網(wǎng)絡(luò)模型更適于認(rèn)知用戶分散的網(wǎng)絡(luò)系統(tǒng).
非對稱認(rèn)知網(wǎng)絡(luò)模型如圖1所示,圖中有3個授權(quán)用戶(P1、P2和P3), 各自占用不同的信道(信道1、信道2和信道3),3個位置分散的認(rèn)知用戶(S1、S2和S3)分別位于不同授權(quán)用戶覆蓋范圍內(nèi).由于認(rèn)知用戶位于不同的授權(quán)用戶附近,感知到的授權(quán)信道空閑概率和信道質(zhì)量都可能不同,因此認(rèn)知用戶在相同授權(quán)信道上的收益存在差異.
圖1 非對稱認(rèn)知網(wǎng)絡(luò)系統(tǒng)模型Fig.1 System model of asymmetric cognitive radio network
表1 認(rèn)知用戶信道收益
認(rèn)知用戶信道收益表1中的數(shù)值表示認(rèn)知用戶在各個授權(quán)信道上的收益.根據(jù)認(rèn)知用戶信道收益表很容易得到最優(yōu)信道分配結(jié)果:將信道2分配給認(rèn)知用戶1,將信道3分配給認(rèn)知用戶2,將信道1分配給認(rèn)知用戶3.然而由于授權(quán)用戶的業(yè)務(wù)信息和認(rèn)知用戶的信道狀態(tài)隨機(jī)變化,認(rèn)知用戶信道收益表難以事先獲得,往往需要通過在線學(xué)習(xí)估計(jì)信道收益.另外,由于最優(yōu)分配算法的搜索空間為P(N,M),計(jì)算復(fù)雜高, 且需中心節(jié)點(diǎn)進(jìn)行集中控制,因此需要研究具有自學(xué)習(xí)能力、低復(fù)雜度、收斂速度快的分布式策略.
1.2數(shù)學(xué)模型
非對稱認(rèn)知網(wǎng)絡(luò)頻譜共享或信道分配問題可描述為M個認(rèn)知用戶對(或等價于M對認(rèn)知發(fā)送用戶和接收用戶)共享N個授權(quán)信道的模型(M≤N).常用信道效用(或收益)可采用認(rèn)知用戶的各態(tài)歷經(jīng)信道容量表示,例如用Ri,j(k)表示信道實(shí)際收益,即時隙k認(rèn)知用戶i在信道j上的可達(dá)傳輸速率或者吞吐量.
(1)
式中T為認(rèn)知時隙周期, Ts(k)表示在時隙k內(nèi)認(rèn)知用戶感知信道和等待接入的時間.感知時間由硬件檢測時間決定,等待時間與認(rèn)知用戶的退避時長有關(guān).信道空閑狀態(tài) Ii,j表示認(rèn)知用戶i感知到信道j 的狀態(tài)(‘0’信道忙,‘1’信道閑), Kj表示信道j上的競爭用戶數(shù), Ci,j為認(rèn)知用戶i在信道 j的傳輸速率.其中信道空閑狀態(tài) Ii,j和多用戶競爭結(jié)果Ei(Kj) 均為Bernoulli隨機(jī)變量,它們的概率密度函數(shù)表示如下:
ρθi,j(Ii,j)=θi,jδ(Ii,j-1)+(1-θi,j)δ(Ii,j),
(2)
其中δ(·) 為delta函數(shù),θi,j是授權(quán)信道空閑概率平均值.
(3)
認(rèn)知用戶i在獨(dú)立同分布瑞利衰落信道j下的信道容量Ci,j可表示為:
Ci,j=log2(1+SNR·X),
(4)
由上述公式(1)~(4)可得認(rèn)知用戶i在信道j收益的數(shù)學(xué)期望值為:
(5)
收益矩陣(或效用矩陣)R為M行N 列,矩陣元素表示認(rèn)知用戶在每個信道上的收益(或效用).當(dāng)認(rèn)知用戶分布廣泛時,認(rèn)知用戶在同一信道上的收益不同,即收益矩陣R中的元素具有差異性特點(diǎn),這個特征非常適合利用G-S穩(wěn)定定理.
(6)
非對稱機(jī)會認(rèn)知網(wǎng)絡(luò)頻譜共享技術(shù)的設(shè)計(jì)目標(biāo)是在不干擾授權(quán)用戶情況下最大化認(rèn)知網(wǎng)絡(luò)吞吐量之和,其全局效用函數(shù)可表示為:
(7)
如果已知效用矩陣R,可采用Hungarian集中式分配方法,全局搜索空間為無干擾的信道排列組合P(N,M).而實(shí)際系統(tǒng)中由于認(rèn)知用戶無法事先知道信道收益,并且分布式網(wǎng)絡(luò)中認(rèn)知用戶難以交互大量的信息,這些因素都給信道分配策略帶來了挑戰(zhàn),為此需要采用學(xué)習(xí)算法在線獲得信道收益.
由于學(xué)習(xí)算法估計(jì)值與真實(shí)值之間存在誤差,學(xué)習(xí)策略Л產(chǎn)生的損失函數(shù)可表示為[7]:
(8)
為解決分布式認(rèn)知網(wǎng)絡(luò)中未知信道信息情況下多用戶通信沖突問題,本文提出基于G-S理論和學(xué)習(xí)自動機(jī)聯(lián)合算法(OLGS),該算法采用G-S理論為認(rèn)知用戶分配“一對一”信道,以最小化多用戶沖突帶來的損失;然后在未知信道知識和不具備全頻段感知能力情況下,采用順序最優(yōu)學(xué)習(xí)算法實(shí)現(xiàn)穩(wěn)定的信道分配;并設(shè)置退避定時器實(shí)現(xiàn)分布式算法.下面簡要介紹G-S理論和學(xué)習(xí)算法.
2.1Gale-Shapley理論
Gale-Shapley理論是著名的穩(wěn)定匹配理論[8],最初用于解決高校入學(xué)申請和婚姻結(jié)合問題,后來廣泛應(yīng)用于研究“一對一”的優(yōu)化分配問題.G-S理論已被證明總是存在穩(wěn)定解,并且通過迭代過程能夠找到穩(wěn)定解[9].本文考慮采用G-S理論解決非對稱認(rèn)知頻譜分配問題的原因如下:(1)當(dāng)共享信道上同一時刻只允許一對認(rèn)知用戶進(jìn)行通信時,此模型下采用G-S方法可獲得認(rèn)知用戶與授權(quán)信道的“一對一”匹配.(2)非對稱認(rèn)知網(wǎng)絡(luò)中信道效用矩陣元素具有差異化特點(diǎn),采用G-S理論可獲得唯一穩(wěn)定的分配結(jié)果.(3)G-S理論具有分布式迭代算法,適合無中心節(jié)點(diǎn)的分布式認(rèn)知網(wǎng)絡(luò).
參照婚姻結(jié)合問題模型,可將認(rèn)知信道分配問題建模為M個認(rèn)知用戶與N個授權(quán)信道的“一對一”配對模型.假設(shè)認(rèn)知用戶在每個時隙能順序感知多個信道,但只能選擇一個信道接入.根據(jù)存在性定理,非對稱認(rèn)知頻譜接入具有唯一穩(wěn)定的信道分配算法[9].首先假設(shè)已知完美信道信息(即已知信道收益表),根據(jù)信道收益表設(shè)置認(rèn)知用戶退避定時器(定時器的值與認(rèn)知用戶信道收益成反比), 采用G-S理論迭代算法取得穩(wěn)定分配結(jié)果的過程如下:首先將收益矩陣R(M行N列)中最大值(或者最小退避時間)對應(yīng)的信道分配給相應(yīng)的認(rèn)知用戶;然后刪除收益矩陣R中最大值對應(yīng)的行和列,表示相應(yīng)的信道和用戶已經(jīng)被分配過;在剩余的子矩陣R′(M-1行N-1列)中重復(fù)上述過程,直到所有認(rèn)知用戶或者信道都分配完畢.
2.2順序最優(yōu)學(xué)習(xí)算法
由于實(shí)際系統(tǒng)事先難以獲得完美信道信息,并且受器件硬件限制無法同時檢測所有信道質(zhì)量,因此需借助學(xué)習(xí)算法獲得G-S策略的穩(wěn)定分配結(jié)果.為了兼顧穩(wěn)定性和收斂速度,本文采用復(fù)雜度低的順序最優(yōu)學(xué)習(xí)算法估計(jì)用戶信道收益.順序最優(yōu)學(xué)習(xí)算法最初用于分析經(jīng)典多臂賭博機(jī)問題,Anandkumar等在文獻(xiàn)[10]中證明了該算法在有限收益時學(xué)習(xí)損失與學(xué)習(xí)時間呈對數(shù)關(guān)系,因此廣泛應(yīng)用于解決“探索”和“利用”折中問題.根據(jù)有限時間分析結(jié)果,只要信道采樣速度達(dá)到O(lnT),用戶收益估計(jì)值將收斂于實(shí)際值.
算法步驟如下.
1) 初始化:將初始信道質(zhì)量設(shè)為1,學(xué)習(xí)前認(rèn)知用戶先感知所有信道以獲得初始信道狀態(tài).
2) 循環(huán)過程:認(rèn)知用戶在每個時隙開始時, 利用順序最優(yōu)學(xué)習(xí)算法更新用戶信道收益估計(jì)值,并選擇估計(jì)值最大的信道接入.信道收益值取決于認(rèn)知用戶成功發(fā)送概率和信道質(zhì)量兩方面因素,文獻(xiàn)[7]證明了順序?qū)W習(xí)算法的性能,其學(xué)習(xí)損失上限值可表示如下:
(9)
式中L(R;ΓUCB1)表示順序最優(yōu)學(xué)習(xí)算法的學(xué)習(xí)損失[7],μ1表示信道收益隨機(jī)變量的數(shù)學(xué)期望值,μ*表示信道收益期望最大值,T表示算法學(xué)習(xí)次數(shù).R*表示認(rèn)知用戶m選擇最優(yōu)信道獲得的收益,Δm,n表示與最優(yōu)策略相比的信道收益差值.可見順序最優(yōu)學(xué)習(xí)算法的損失主要是在學(xué)習(xí)過程中采樣較差信道導(dǎo)致的,該算法的特點(diǎn)是:在開始階段采樣點(diǎn)更稠密,以盡量探索更多的信道避免不可靠采樣點(diǎn)影響正確收斂方向;當(dāng)?shù)欢ù螖?shù)后采樣點(diǎn)更稀疏,以保證采樣平均值大(即信道收益值大)的信道被選擇的機(jī)會更多,從而加快了收斂速度,減少了學(xué)習(xí)損失.
2.3分布式OLGS聯(lián)合算法
分布式OLGS聯(lián)合算法采用順序最優(yōu)學(xué)習(xí)算法估計(jì)用戶收益,并聯(lián)合G-S策略解決多個認(rèn)知用戶之間的沖突,算法描述如下.
1) 初始化:認(rèn)知用戶在每個信道上收益初始值設(shè)為1/N(N為信道數(shù)),然后設(shè)置接入信道退避時間T.T為單調(diào)遞減函數(shù)(時間T與信道收益R成反比),即認(rèn)知用戶信道收益越大其信道退避時間越短.
2) 在每個時隙開始時,認(rèn)知用戶計(jì)算退避時間并設(shè)置定時器值.
3) 當(dāng)最短定時時間到期后, 認(rèn)知用戶選擇收益最大的信道接入.
4) 如果被選擇的信道空閑且該信道上沒有其它用戶通信時,則認(rèn)知用戶能夠成功接入信道,并計(jì)算出信道傳輸速率.如果被選擇的信道空閑忙,則從信道集合中排除該信道.
5) 當(dāng)每個時隙結(jié)束時,認(rèn)知用戶統(tǒng)計(jì)成功發(fā)送概率和平均信道容量,并更新每個信道的收益.
6) 返回步驟(2)循環(huán)上述迭代過程.
可見OLGS算法中認(rèn)知用戶僅憑本地觀察結(jié)果和歷史決策來學(xué)習(xí)用戶收益,無需知道信道的先驗(yàn)統(tǒng)計(jì)信息,適于動態(tài)變化的認(rèn)知無線電網(wǎng)絡(luò).
OLGS算法聯(lián)合了Gale-Shapley理論和順序?qū)W習(xí)算法,因此與最優(yōu)算法的性能差距取決于二者的性能.參考文獻(xiàn)[7]推導(dǎo)出了順序?qū)W習(xí)算法的學(xué)習(xí)損失, 即估計(jì)值與真實(shí)值之間的誤差,并給出了學(xué)習(xí)算法損失函數(shù)的表達(dá)式(公式8)和上限值(公式9).同時Gale-Shapley理論是一對一的信道分配策略, 其上下限分別為:
上限值: 若每個認(rèn)知用戶貪婪地選擇收益最大的信道而忽略沖突,可得到認(rèn)知網(wǎng)絡(luò)吞吐量之和上限.
下限值: 若認(rèn)知用戶將信道收益排序并依次選擇最差M個信道接入, 可得到認(rèn)知網(wǎng)絡(luò)吞吐量之和下限.
為驗(yàn)證OLGS算法的性能,采用Matlab軟件進(jìn)行仿真,實(shí)驗(yàn)條件如下:假設(shè)認(rèn)知用戶有連續(xù)的發(fā)送數(shù)據(jù)流,不考慮感知錯誤;為簡化計(jì)算歸一化認(rèn)知用戶在每個信道上的吞吐量.在相同的仿真參數(shù)下與其它四種算法進(jìn)行了比較:最優(yōu)算法、隨機(jī)算法、單純學(xué)習(xí)算法、完美GAGS算法性能.隨機(jī)接入策略是一種最常用且簡單的接入方法,而最優(yōu)算法需要已知用戶收益矩陣,并且集中搜索全局最優(yōu)解,可作為網(wǎng)絡(luò)吞吐量上界.單純學(xué)習(xí)算法采用順序?qū)W習(xí)算法學(xué)習(xí)動態(tài)無線環(huán)境中的未知信道參數(shù),但認(rèn)知用戶采取貪婪接入方法.GAGS算法和OLGS算法都是基于G-S策略最小化多用戶沖突,其中GAGS算法假設(shè)已知信道完美信息,而OLGS算法聯(lián)合學(xué)習(xí)方法獲得未知信道信息.
3.1吞吐量性能
假設(shè)網(wǎng)絡(luò)中有3個認(rèn)知用戶和5個授權(quán)信道(信道收益矩陣如下),仿真結(jié)果為105次實(shí)驗(yàn)平均值.
由用戶信道收益矩陣可以得到最優(yōu)信道分配組合:認(rèn)知用戶1接入授權(quán)信道5,認(rèn)知用戶2接入授權(quán)信道1,認(rèn)知用戶3接入授權(quán)信道4,可得到最優(yōu)分配策略的網(wǎng)絡(luò)吞吐量之和是2.7347.GAGS算法的信道分配組合是:認(rèn)知用戶1接入授權(quán)信道4,認(rèn)知用戶2接入授權(quán)信道1,認(rèn)知用戶3接入授權(quán)信道3,則GAGS策略的網(wǎng)絡(luò)吞吐量之和是2.702.
圖2比較了各種算法的網(wǎng)絡(luò)總吞吐量性能,其中單純學(xué)習(xí)算法的網(wǎng)絡(luò)吞吐量為2.358,比隨機(jī)選擇算法吞吐量(1.651)大,但比OLGS算法(2.626)和GAGS算法(2.702)的性能差.原因是雖然單純學(xué)習(xí)算法能很好地找到空閑信道,但在迭代過程中無法避免多個認(rèn)知用戶之間的通信沖突.相反,基于G-S策略的兩種算法(OLGS和GAGS算法)能實(shí)現(xiàn)“一對一”的穩(wěn)定分配,可將多用戶沖突損失降低到最小.由圖2可以看出,GAGS算法性能基本接近最優(yōu)算法性能,并且OLGS算法與GAGS算法之間的差距隨著學(xué)習(xí)過程逐步減小,原因是順序最優(yōu)學(xué)習(xí)算法能逐漸學(xué)習(xí)到信道的真實(shí)信息.由此可見,OLGS穩(wěn)定信道分配算法的吞吐量性能大大地超過了隨機(jī)分配和單純學(xué)習(xí)算法,并且能夠逐漸逼近GAGS算法的性能.
圖2 非對稱OSA系統(tǒng)中不同算法吞吐量性能比較Fig.2 Throughput comparison of different algorithms in asymmetricopportunistic spectrum access system
3.2收斂性能
為了驗(yàn)證OLGS算法的收斂性,假設(shè)用戶收益矩陣在T個時隙塊內(nèi)保持不變.假設(shè)3個認(rèn)知用戶和5個授權(quán)信道的系統(tǒng)收益矩陣如下:
上例中穩(wěn)定的信道分配組合是:認(rèn)知用戶1接入授權(quán)信道2,認(rèn)知用戶2接入授權(quán)信道1,認(rèn)知用戶3接入授權(quán)信道4.圖3給出了OLGS算法認(rèn)知用戶吞吐量隨時間變化的曲線,可以看出每個用戶的吞吐量大約迭代60次后收斂到最優(yōu)信道.從圖3中可見,順序?qū)W習(xí)算法的學(xué)習(xí)損失與學(xué)習(xí)時間呈O(lnT)關(guān)系,收益估計(jì)值能迅速收斂到真實(shí)值.
圖3 OLGS算法收斂性能Fig.3 Convergence of OLGS algorithm
表2列出了不同算法與最優(yōu)算法的性能比率以及各種算法的收斂性.從表中可以看出,最優(yōu)算法雖然性能最好,但迭代速度非常慢O(N3).由于GAGS算法假設(shè)能同時檢測到所有信道,因此可在一個時隙內(nèi)達(dá)到穩(wěn)定的信道分配,并且比單純學(xué)習(xí)算法的效率更高.OLGS算法與單純學(xué)習(xí)算法的收斂速度相仿,但性能接近GAGS算法.由此可見,除了集中最優(yōu)算法和理想假設(shè)條件下的GAGS算法外,OLGS算法優(yōu)于其它算法的吞吐量性能,收斂速度較快,且無需信道先驗(yàn)知識.
表2 算法性能比較表
本文基于G-S理論和學(xué)習(xí)自動機(jī)算法提出了OLGS聯(lián)合頻譜共享方法,首先將非對稱網(wǎng)絡(luò)的機(jī)會頻譜接入問題建模為婚姻配對問題,借助G-S策略實(shí)現(xiàn)完美信息下的“一對一”認(rèn)知用戶和信道匹配.然后在未知信道信息和部分信道感知能力情況下,采用順序最優(yōu)學(xué)習(xí)算法收斂到穩(wěn)定的分配結(jié)果.仿真結(jié)果表明,基于G-S策略的平均吞吐量可達(dá)到最優(yōu)算法吞吐量的96%,優(yōu)于單純的學(xué)習(xí)算法性能(約為最優(yōu)算法吞吐量的80%),并且比隨機(jī)算法的網(wǎng)絡(luò)吞吐量提高了60%.同時,OLGS算法收斂速度與學(xué)習(xí)算法相當(dāng)(O(log2T )),比最優(yōu)算法的復(fù)雜度大大降低(O(T3)).由此可見,OLGS算法在部分信道感知條件下實(shí)現(xiàn)了穩(wěn)定頻譜分配,提高了認(rèn)知網(wǎng)絡(luò)的吞吐量,適于解決分布式非對稱認(rèn)知網(wǎng)絡(luò)頻譜接入問題.
[1]Goldsmith A, Jafar S A, Maric I, et al. Breaking spectrum gridlock with cognitive radios: an information theoretic perspective [J]. IEEE Proceeding, 2009, 97(5): 894-914.
[2]金順福, 代羽. 帶有接入閾值和超時隙的認(rèn)知無線網(wǎng)絡(luò)頻譜分配策略[J]. 電子與信息學(xué)報(bào), 2014,36(8):1817-1823.
[3]劉勤, 李紅霞, 李釗,等. 基于認(rèn)知的LTE系統(tǒng)動態(tài)頻譜分配[J]. 電子與信息學(xué)報(bào), 2015,37(1):175-181.
[4]朱江,韓超, 楊浩磊,等.認(rèn)知無線網(wǎng)絡(luò)中基于無休止多臂賭博機(jī)模型的多用戶頻譜接入機(jī)制[J].計(jì)算機(jī)應(yīng)用, 2014,34(10):2782-2786.
[5]Bagheri S, Scaglione A. The restless multi-armed bandit formulation of the cognitive compressive sensing problem [J]. IEEE Transactions on Signal Processing, 2015, 63(5): 1183-1198.
[6]Liu K, Zhao Q. Distributed learning in multi-armed bandit with multiple players [J]. IEEE Transactions on Signal Processing, 2010, 58(11):5667-5681.
[7]Gai Y, Krishnamachari B. Distributed stochastic online learning policies for opportunistic spectrum access [J]. IEEE Transactions on Signal Processing, 2014, 62(23): 6184-6193.
[8]Gale D, Shapley L S. College admissions and the stability of marriage [J]. The American Mathematical Monthly, 1962,69(1):9-15.
[9]Leshem A, Zehavi E, Yafee Y, et al. Multichannel opportunistic carrier sensing for stable channel access control in cognitive radio systems [J]. IEEE Journal on Selected Areas in Communications, 2012, 30(1): 82-95.
[10]Aanandkumar A, Michael N, Tang A K, et al. Distributed algorithms for learning and cognitive medium access with logarithmic regret [J]. IEEE Journal on Selected Areas in Communications, 2011, 29(4):731-745.
Distributed Multiuser Spectrum Sharing Algorithm in Asymmetric Cognitive Radio Networks
HuangLi1,F(xiàn)angHongbin2
(1 College of Electronics and Information, Hubei Key Laboratory of Intelligent Wireless Communications,South-Central University for Nationalities, Wuhan 430074, China;2 Wuhan Research Institute,Huawei Technologies Limited Corporation, Wuhan 430074, China)
The throughput of asymmetric cognitive networks is dramatically decreased by the collisions among multiple cognitive users. In order to resolve the issue, a novel distributed Order-optimal Learning Gale-Shapley Scheme (OLGS) is presented in a time-varying system based on analyzing the characteristic of channel gain matrix in asymmetric cognitive networks. Collisions among secondary users are eliminated in the proposed method with a one-to-one user-channel matching policy. Moreover, the stable spectral allocation is also achieved using learning method without prior channel parameters and independent of information exchange among secondary users. In addition, back-off timers are used to implement distributed spectral allocations without central control. Numerical results show that higher sum throughput and less complexity as well as faster convergence speed are achieved in the joint scheme than other distributed algorithms. It is suitable for realistic asymmetrical networks in which secondary users are geographically dispersed with partial sensing capabilities.
asymmetric cognitive radio network;distributed spectrum sharing;Gale-Shapley theory; joint learning algorithm
2016-01-27
黃麗(1975-),女,博士,講師,研究方向:寬帶無線通信和認(rèn)知無線電,E-mail:szemmah@hotmail.com
湖北省自然科學(xué)基金資助項(xiàng)目(2015CFC870);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)基金資助項(xiàng)目(CZY14001); 智能無線通信湖北省重點(diǎn)實(shí)驗(yàn)室開放基金項(xiàng)目(20140623).
TN929.5
A
1672-4321(2016)03-0111-06