雷維嘉 孫嘉琳* 謝顯中 雷宏江
①(重慶郵電大學(xué)通信與信息工程學(xué)院 重慶 400065)
②(移動通信技術(shù)重慶市重點(diǎn)實(shí)驗(yàn)室 重慶 400065)
③(重慶郵電大學(xué)光電工程學(xué)院 重慶 400065)
隨著無線通信技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)用戶數(shù)急劇增加,能量消耗問題日益嚴(yán)峻。以開源、節(jié)流為理念的綠色通信技術(shù)是目前學(xué)術(shù)界和產(chǎn)業(yè)界研究的熱點(diǎn)技術(shù)之一[1]。能量收集是“開源”的重要技術(shù)手段,通信網(wǎng)絡(luò)中的節(jié)點(diǎn)從自然環(huán)境中收集能量并轉(zhuǎn)化為電能用于信息的傳輸[2],可降低化石能源的消耗,保護(hù)環(huán)境,同時也是解決電網(wǎng)供電或電池更換不便設(shè)備供電問題的有效途徑。由于環(huán)境能量源具有不穩(wěn)定性和隨機(jī)波動特性,再加上無線信道的隨機(jī)衰落,需要對信號發(fā)送功率和信息傳輸速率進(jìn)行動態(tài)的控制,以高效地利用收集的能量和信道資源[3]。
在已有的相關(guān)研究文獻(xiàn)中,根據(jù)傳輸過程中能量到達(dá)、信道狀態(tài)是否可提前獲知,可將能量收集通信系統(tǒng)的能量管理策略分為離線和在線兩類。離線管理策略應(yīng)用于事先知道收集的能量、信道狀態(tài)等信息的情況。雖然這一假設(shè)缺乏合理性,但離線策略能獲得優(yōu)越的性能,因而常被作為評估其他策略性能的上界。文獻(xiàn)[4–6]針對不同場景下的離線能量管理策略進(jìn)行了研究。文獻(xiàn)[4]考慮具有連續(xù)能量和數(shù)據(jù)到達(dá)的能量收集通信系統(tǒng),給出了一個三步最優(yōu)能量調(diào)度算法以實(shí)現(xiàn)單用戶在有限時隙數(shù)量下吞吐量最大化。Ozel等人[5]針對衰落信道條件下的能量收集系統(tǒng),提出了一種定向注水算法,對每時隙發(fā)送功率進(jìn)行控制,在有限傳輸時間內(nèi)最大化信息傳輸量,或在一定傳輸數(shù)據(jù)量要求下最小化傳輸時間。定向注水指當(dāng)前時隙收集的能量只可供以后的時隙進(jìn)行功率注水,而不可供之前的時隙使用,即收集的能量只能定向流動。文獻(xiàn)[6]研究能量收集的多用戶多址接入系統(tǒng)中的能量調(diào)度算法,在已知多個時隙的信道狀態(tài)和能量收集狀態(tài)下,采用迭代動態(tài)注水算法,最大化每個時隙的和速率。離線注水算法性能優(yōu)越,但僅限于有限時隙數(shù)量下的優(yōu)化,且實(shí)際的系統(tǒng)中,能量收集量、數(shù)據(jù)流量和信道狀態(tài)都是隨機(jī)變化的,事先能獲得它們的具體數(shù)值并不現(xiàn)實(shí),因此離線算法并不實(shí)用。與離線算法不同,在線算法主要依賴能量和數(shù)據(jù)到達(dá)、信道衰落等的統(tǒng)計信息,以及當(dāng)前和過去的系統(tǒng)狀態(tài)進(jìn)行決策。在發(fā)射機(jī)能獲得反映能量和數(shù)據(jù)到達(dá)過程、信道衰落過程的統(tǒng)計信息的條件下,將功率控制過程建模為馬爾科夫決策過程(Markov Decision Process, MDP),并應(yīng)用動態(tài)規(guī)劃(Dynamic Programming, DP)求解是相關(guān)文獻(xiàn)中研究較多的在線功率控制解決方案。文獻(xiàn)[7]針對最大發(fā)送功率約束的點(diǎn)對點(diǎn)通信系統(tǒng),用分段線性擬合函數(shù)描述電池狀態(tài),將隨機(jī)信道條件下的發(fā)送功率分配問題構(gòu)造成一個MDP,并利用DP求解該優(yōu)化問題。文獻(xiàn)[8]使用了一種策略迭代(Policy Iteration ,PI)算法來求解與文獻(xiàn)[7]相同系統(tǒng)模型下的功率控制問題。算法首先將電池電量劃分為有限個狀態(tài),并用馬爾科夫鏈來描述電池狀態(tài)的變化。通過對不同發(fā)送功率策略下系統(tǒng)傳輸性能的變化進(jìn)行評測,并以吞吐量最大化為目標(biāo)進(jìn)行策略迭代獲得最優(yōu)的功率傳輸策略。為了對系統(tǒng)狀態(tài)有較準(zhǔn)確的描述并獲得較好的性能,基于MDP的方案中需要有較大狀態(tài)和動作空間,算法的計算復(fù)雜度通常很高。Lyapunov優(yōu)化技術(shù)是一種在控制論中被廣泛應(yīng)用的優(yōu)化方法,該方法在應(yīng)用中不需要知道系統(tǒng)狀態(tài)的統(tǒng)計特性,而是根據(jù)當(dāng)前的系統(tǒng)狀態(tài)做出決策,是一種非常具有實(shí)用性的優(yōu)化方法。該算法特別適合于解決排隊問題,隊列積壓最小化是其基本的目標(biāo)和特征。用Lyapunov方法求解包含約束的優(yōu)化問題時,可根據(jù)約束條件構(gòu)造虛隊列,通過使虛隊列漂移最小化來保持虛隊列長期時間意義上的穩(wěn)定,間接地滿足約束條件;而優(yōu)化的目標(biāo)則作為懲罰項,將其與隊列漂移一起構(gòu)造“隊列漂移加懲罰”作為優(yōu)化的目標(biāo)函數(shù),通過最小化該目標(biāo)函數(shù),在達(dá)到長期時間平均意義下隊列的穩(wěn)定的同時實(shí)現(xiàn)目標(biāo)的優(yōu)化。該方法將長期時間平均的優(yōu)化問題轉(zhuǎn)化成單時隙優(yōu)化問題,并可減少約束條件,優(yōu)化問題求解的復(fù)雜度大大降低。近幾年來已有學(xué)者利用Lyapunov優(yōu)化框架解決通信網(wǎng)絡(luò)中的資源分配問題[9]、能量收集通信系統(tǒng)中的功率控制問題[10,11]。文獻(xiàn)[10]針對源節(jié)點(diǎn)由能量收集裝置供電的點(diǎn)對點(diǎn)通信系統(tǒng),提出一種利用Lyapunov優(yōu)化框架的在線功率控制算法最大化長期平均速率。將電池電量約束轉(zhuǎn)化為虛隊列穩(wěn)定,需要最大化的傳輸速率的負(fù)數(shù)作為懲罰項,構(gòu)建“漂移加懲罰”,通過最小化其上界,在保持電池電量穩(wěn)定的同時最大化傳輸速率。文獻(xiàn)[11]研究了利用Lyapunov優(yōu)化框架求解能量收集兩跳放大轉(zhuǎn)發(fā)中繼網(wǎng)絡(luò)的傳輸速率最大化問題。依據(jù)源和中繼節(jié)點(diǎn)的電池電量狀態(tài)和兩跳信道的衰落狀態(tài),對源節(jié)點(diǎn)和中繼節(jié)點(diǎn)的發(fā)送功率進(jìn)行聯(lián)合優(yōu)化控制。
在關(guān)于能量收集通信系統(tǒng)中傳輸速率或吞吐量最大化,或傳輸時間最小化的文獻(xiàn)中,一般都以香農(nóng)公式計算得到的信道容量作為系統(tǒng)的傳輸速率(包括以上介紹的文獻(xiàn))。在實(shí)際的系統(tǒng)中,需要根據(jù)信道狀態(tài)和發(fā)送功率,選擇合適的信道編碼(包括編碼的類型、碼長、碼率)和調(diào)制方式[12],最大化傳輸速率(或吞吐量)。目前僅有很少量的文獻(xiàn)針對能量收集通信系統(tǒng)中的功率控制和調(diào)制方式選擇進(jìn)行了研究。文獻(xiàn)[13]針對點(diǎn)對點(diǎn)能量收集無線通信系統(tǒng),根據(jù)接收端用1 bit表示的信道狀態(tài)與閾值的比較結(jié)果,構(gòu)造MDP問題并采用后向迭代算法尋求最優(yōu)調(diào)制方式與傳輸功率組合,最大化有限長的時隙內(nèi)系統(tǒng)平均吞吐量。由于采用了后向迭代算法,計算復(fù)雜度很高,且只使用1 bit表示信道狀態(tài),無法準(zhǔn)確反映信道狀態(tài)的隨機(jī)性與多樣性。文獻(xiàn)[14]提出了一種基于深度強(qiáng)化學(xué)習(xí)的算法,在滿足系統(tǒng)要求的誤碼性能的前提下,以最大化實(shí)際傳輸速率為目標(biāo)優(yōu)化每時隙發(fā)送功率,并采用當(dāng)前的信道質(zhì)量和發(fā)送功率下可支持的最高階調(diào)制方式。但機(jī)器學(xué)習(xí)算法需要不斷與環(huán)境交互積累大量數(shù)據(jù)樣本進(jìn)行訓(xùn)練,在某些情況下不適用,如信道和能量到達(dá)不具有平穩(wěn)性時。文獻(xiàn)[15]提出了一種利用Lyapunov優(yōu)化框架最大化長期平均凈比特速率的功率及調(diào)制方式聯(lián)合優(yōu)化算法。算法給定QPSK,8PSK, 16QAM 3種可選調(diào)制方式,先優(yōu)化每種調(diào)制方式下的發(fā)送功率,然后從中選擇使漂移與懲罰項最小的調(diào)制方式。該算法中數(shù)據(jù)包的長度固定,沒有考慮數(shù)據(jù)包中如包頭、校驗(yàn)位等開銷,且可用的調(diào)制方式較少,階數(shù)最高僅為16,限制了數(shù)據(jù)的傳輸速率,在信道質(zhì)量較好和可用能量較多時不能充分利用信道和能量資源。
本文研究點(diǎn)對點(diǎn)能量收集無線通信系統(tǒng)中,以最大化系統(tǒng)長期平均吞吐量為目標(biāo)的功率和傳輸速率的優(yōu)化控制問題。源節(jié)點(diǎn)配備有能量收集裝置和可充電電池,每時隙發(fā)送信號的能量來自從周圍環(huán)境中收集的能量。在電池容量有限條件下,考慮數(shù)據(jù)幀中存在校驗(yàn)位等開銷,利用Lyapunov框架求解發(fā)送功率、調(diào)制方式、幀長的聯(lián)合優(yōu)化問題,最大化長期時間平均傳輸速率。比較現(xiàn)有的相關(guān)文獻(xiàn),本文的特點(diǎn)在于:(1) 本文提出的算法采用Lyapunov優(yōu)化框架將長期時間平均的優(yōu)化問題轉(zhuǎn)化成單時隙優(yōu)化問題,將能量約束轉(zhuǎn)化為隊列穩(wěn)定性要求,僅依賴當(dāng)前的電池狀態(tài)和信道狀態(tài),不需要獲得能量到達(dá)和信道衰落變化的統(tǒng)計信息,是一種在線的、低復(fù)雜度的控制算法;(2) 相較同是采用Lyapunov方法的功率控制的相關(guān)文獻(xiàn),如文獻(xiàn)[10,11],本文提出的算法在優(yōu)化發(fā)送功率的同時優(yōu)化調(diào)制方式、數(shù)據(jù)幀長,最大化的目標(biāo)不是理論上傳輸速率的極限,而是實(shí)際可實(shí)現(xiàn)的傳輸速率,仿真結(jié)果表明,本文實(shí)際可實(shí)現(xiàn)的速率要高于文獻(xiàn)[10]的算法;(3) 相比較文獻(xiàn)[15]中固定幀長、優(yōu)化發(fā)送功率與調(diào)制方式的方案,本文提出的算法中考慮了實(shí)際的數(shù)據(jù)幀中必需的校驗(yàn)位等開銷,同時對發(fā)送功率、調(diào)制方式、幀長進(jìn)行聯(lián)合優(yōu)化,可用調(diào)制方式更多,且還可推廣到更多調(diào)制方式的場景,性能更好,更具有實(shí)用性。
本文的系統(tǒng)模型如圖1所示,包括1個發(fā)送節(jié)點(diǎn)S與1個目的節(jié)點(diǎn)D。發(fā)送節(jié)點(diǎn)配備能量收集設(shè)備和容量有限的充電電池,向目的節(jié)點(diǎn)發(fā)送數(shù)據(jù)的能量來自收集的能量。傳輸過程中,發(fā)送節(jié)點(diǎn)收集的能量及無線信道是隨機(jī)變化的,發(fā)送節(jié)點(diǎn)根據(jù)瞬時的信道狀態(tài)信息以及能量收集情況,動態(tài)地調(diào)整發(fā)送功率、調(diào)制方式以及數(shù)據(jù)幀長,最大化長期時間平均系統(tǒng)速率。
圖1 系統(tǒng)模型
由式(10)可知,信息傳輸速率與發(fā)送功率、調(diào)制方式和幀長有關(guān)。對于調(diào)制方式,若采用較高階調(diào)制方式,每個符號可攜帶更多信息比特,但誤比特率較高,誤幀率也較高;而采用較低價調(diào)制方式時,雖然錯誤率較低,但相同的時間內(nèi)傳輸?shù)谋忍財?shù)較少。因此,需根據(jù)發(fā)送功率和信道衰落情況選擇一個合適的調(diào)制階數(shù)使信息傳輸速率最大。而幀長的選擇也要影響信息傳輸速率,采用較長的幀進(jìn)行傳輸時,校驗(yàn)比特所占比重較小,開銷較小,但在相同的誤比特率下,幀錯誤概率較高;反之,幀長較小時,幀錯誤概率較低,但校驗(yàn)比特等開銷較大。由此可見,系統(tǒng)實(shí)際可達(dá)到的信息傳輸速率不是調(diào)制階數(shù)、幀長的單調(diào)函數(shù),最優(yōu)的調(diào)制階數(shù)、幀長與發(fā)送功率和信道狀態(tài)有關(guān),而發(fā)送功率又受到可用的能量的約束,優(yōu)化問題是對每個時隙的發(fā)送功率P(t)、調(diào)制階數(shù)M和幀長N進(jìn)行聯(lián)合優(yōu)化,最大化系統(tǒng)的長期平均信息傳輸速率:
本文采用Lyapunov優(yōu)化框架來解決優(yōu)化問題P2,其中的約束條件轉(zhuǎn)化為保持虛隊列穩(wěn)定問題,并將長期平均優(yōu)化問題轉(zhuǎn)換為單時隙優(yōu)化問題。首先構(gòu)造發(fā)送節(jié)點(diǎn)的電池能量虛隊列
其中,A為偏移量。根據(jù)電池電量更新公式(6)易得能量虛隊列的更新公式為
其中,V是漂移和懲罰項之間的權(quán)重,為正數(shù),用于在隊列穩(wěn)定性和系統(tǒng)傳輸速率最大化間進(jìn)行權(quán)衡。若能使“漂移加懲罰”最小化,則在保持虛隊列(即電池電量)穩(wěn)定的同時,最大化信息傳輸速率?!捌萍討土P”存在一個上界,將優(yōu)化改為最小化上界可進(jìn)一步降低優(yōu)化問題求解的復(fù)雜度。由式(16)—式(18)可得
通過保持能量虛隊列穩(wěn)定,即電池的電量在一個有限的范圍內(nèi)波動,而不會隨時間趨于無窮大或趨于0,則從長期來看收集的能量與用于信息傳輸?shù)哪芰渴窍嗟鹊?,P2中的約束條件式(14)得到滿足,就可將其移除。進(jìn)一步去除“漂移加懲罰”上界中與P(t), M, N無關(guān)的項,再乘以–1,相應(yīng)將最小化改為最大化,同時由于當(dāng)前的信道狀態(tài)和電池狀態(tài)已知,上界中的均值運(yùn)算可以去掉,優(yōu)化問題轉(zhuǎn)化為單時隙的優(yōu)化問題
式(25)已將式(15)中的約束條件式(3),式(4)進(jìn)行了改寫。
令J(P(t),M,N)=P(t)X(t)+V Rb(t)為優(yōu)化目標(biāo)函數(shù),其中Rb(t)與調(diào)制方式(調(diào)制階數(shù))、幀長和發(fā)送功率有關(guān)。優(yōu)化問題P3是一個3變量聯(lián)合優(yōu)化問題,其中可選用的調(diào)制方式為BPSK, QPSK,8PSK, 16QAM, 32QAM, 64QAM中的一種,也即M只能選有限幾種值。由于不能直接聯(lián)合優(yōu)化這3個變量,但調(diào)制方式數(shù)量有限,可以改為在給定的調(diào)制方式下以最大化J(P(t),N|M)為目標(biāo)優(yōu)化發(fā)送功率P(t)和幀長N,然后選擇使J(P(t),N|M)最大的M及其對應(yīng)的P(t),N為最優(yōu)解。下面先分析在給定M下最優(yōu)P(t),N的求解。
首先目標(biāo)函數(shù)對N的偏導(dǎo)為
式中的K恒大于0,為
將優(yōu)化算法總結(jié)如表1所示。
本算法在推廣到更多調(diào)制方式的應(yīng)用場景時,需要在式(7)中擴(kuò)充新增調(diào)制方式的誤比特率公式,并在優(yōu)化問題求解過程中增加搜索新增調(diào)制方式下的最優(yōu)功率。如新增的是矩形星座的128QAM, 256QAM, 512QAM, 1024QAM等更高階的MQAM調(diào)制方式,則誤比特率可直接使用式(7)中的最后一行。
表1首先對每個調(diào)制方式執(zhí)行步驟(3)~步驟(12),優(yōu)化給定調(diào)制方式下的{P(t),N}。當(dāng)X(t)≥0時,需計算1次誤比特率Peb和幀長N;當(dāng)X(t)<0時,在搜索最優(yōu)功率時需要在每個功率點(diǎn)處計算1次誤比特率Peb和幀長N,在可用功率范圍內(nèi)共需搜索Pd,max/δ次。由于X(t)≥0時的計算復(fù)雜度遠(yuǎn)小于X(t)<0時,作為計算復(fù)雜度上限的估計,假設(shè)X(t)<0。下面分析1次搜索的計算量。觀察式(7)可知,M=16,32,64時的誤比特率計算量最高,因此以這幾種調(diào)制方式的計算量為據(jù)進(jìn)行算法復(fù)雜度分析。每個功率搜索點(diǎn)處需先根據(jù)式(7)計算誤比特率,再根據(jù)式(30)計算幀長。計算誤比特率的過程包括1次加(減)法運(yùn)算、3次乘(除)法運(yùn)算、1次開方運(yùn)算、1次Q函數(shù)查表運(yùn)算;計算幀長的過程包括2次加(減)法運(yùn)算、4次乘(除)法運(yùn)算、1次開方運(yùn)算、1次對數(shù)運(yùn)算。所以1次搜索需進(jìn)行3次加(減)法運(yùn)算、7次乘(除)法運(yùn)算、2次開方運(yùn)算、1次對數(shù)運(yùn)算、1次Q函數(shù)查表運(yùn)算。在一個調(diào)制方式下需搜索Pd,max/δ個功率點(diǎn),共6種調(diào)制方式,總共需搜索6Pd,max/δ個功率點(diǎn)。一般而言,在可用功率范圍內(nèi)選擇100~1000個功率點(diǎn)的精度已經(jīng)足夠,由于算法主要是基礎(chǔ)的代數(shù)運(yùn)算,因此算法的復(fù)雜度很低。
表1 算法實(shí)現(xiàn)流程
為比較本文算法的性能,將其與貪婪算法、半貪婪算法、文獻(xiàn)[10]提出的優(yōu)化算法3種在線算法以及離線注水算法進(jìn)行性能比較。(1) 貪婪算法(Greedy Algorithm, GA):每個時隙發(fā)送節(jié)點(diǎn)根據(jù)電池中可用電量的最大值設(shè)置發(fā)送功率,即PGA=min(Pd,max,ES(t)/Δt)。(2) 半功率算法(Half Power Algorithm, HPA):每個時隙發(fā)送節(jié)點(diǎn)以電池中可用電量的一半設(shè)置發(fā)送功率,即PHGA=min(Pd,max,ES(t)/2Δt)。(3) 文獻(xiàn)[10]提出的在線功率控制算法:該文獻(xiàn)以香農(nóng)公式得到的信道容量作為傳輸速率,利用Lyapunov框架對發(fā)送功率進(jìn)行優(yōu)化最大化系統(tǒng)長期平均傳輸速率。文獻(xiàn)[10]算法在仿真時權(quán)重V=4,虛隊列偏移量A=30,此時能獲得最佳性能。(4) 離線注水算法:發(fā)送端在傳輸前已獲得整個傳輸過程中信道變化情況和能量收集的情況,根據(jù)傳輸過程中收集到的總能量得到信號平均發(fā)送功率。在此平均功率的約束下,以最大化平均信道容量為目標(biāo),采用注水算法得到各時隙發(fā)送功率。此算法不考慮數(shù)據(jù)和能量的因果性,也不考慮電池的溢出。
仿真對比算法實(shí)際可達(dá)到的傳輸速率時,先根據(jù)算法得到發(fā)送功率,然后計算6種調(diào)制方式的誤比特率Peb,再根據(jù)式(30)計算得到不同調(diào)制方式下最優(yōu)的幀長N,以及能達(dá)到的信息傳輸速率Rb(t),選擇其中的最大值作為該算法能達(dá)到的信息傳輸速率。
圖2(a)是10000個時隙的仿真過程中,不同算法平均信息傳輸速率隨著時間變化的軌跡圖。每時隙的平均信息傳輸速率為從仿真開始到當(dāng)前時隙各時隙傳輸速率的平均值。圖中虛線為在相同的發(fā)送功率下的信道容量;實(shí)線為在6種可選調(diào)制方式下實(shí)際能達(dá)到的最高傳輸速率。從仿真結(jié)果可以看到,本文算法的性能明顯高于貪婪算法及半功率算法,其中本文算法實(shí)際可達(dá)平均傳輸速率比半功率算法高21.3%,比貪婪算法高52.9%。貪婪算法和半功率算法僅依據(jù)當(dāng)前時隙的電池狀態(tài)做出發(fā)送功率的決策,因此性能較差。貪婪算法每時隙的發(fā)送功率決定于前一時隙收集的能量,完全無時隙間的能量調(diào)度,所以性能最差;半功率算法保留了當(dāng)前電池中一半的能量供后面時隙使用,在一定程度上平均了不同時隙的發(fā)送功率,所以性能比貪婪算法要好。離線注水算法在傳輸前就已知信道狀態(tài)和能量收集情況,根據(jù)信道狀態(tài)以最大化理論傳輸速率為目標(biāo)進(jìn)行全局功率分配,且不受能量和數(shù)據(jù)達(dá)到因果性限制,因此其能獲得的理論傳輸速率最高,相比較本文算法的理論最高傳輸速率約有5.7%的性能優(yōu)勢。文獻(xiàn)[10]的算法以信道容量為目標(biāo)函數(shù)進(jìn)行優(yōu)化,其能達(dá)到的理論最高傳輸速率也要高于本文算法,約有5.0%的性能優(yōu)勢。但若考慮實(shí)際可用的調(diào)制方式和數(shù)據(jù)幀中的開銷,離線注水算法及文獻(xiàn)[10]算法確定的發(fā)送功率并不是最優(yōu)的。本文算法在確定發(fā)送功率時已經(jīng)同時考慮了調(diào)制方式和數(shù)據(jù)幀中的開銷,聯(lián)合優(yōu)化發(fā)送功率、調(diào)制方式和幀長,因此實(shí)際能達(dá)到的傳輸速率反而要高于離線注水算法(高8.1%)與文獻(xiàn)[10]的算法(高10.8%)。
圖2 與對比算法性能比較
圖2(b)是仿真過程中4種在線算法電池電量隨著時間變化的軌跡圖,離線注水算法中發(fā)送功率的選擇不受收集能量因果性約束,電池電量變化無實(shí)際意義,因此這里沒有給出。仿真結(jié)果顯示,本文算法及文獻(xiàn)[10]算法的電池電量能在一定水平上上下波動,能保證有足夠的電量和剩余存儲空間。而貪婪算法、半功率算法在很短時間內(nèi)消耗完事先存儲電量,隨后電量穩(wěn)定在一個很低的水平。
本節(jié)分析算法和電池參數(shù)對系統(tǒng)性能的影響。仿真圖中給出的結(jié)果是10000個時隙仿真結(jié)果的平均值。
圖3給出了能量到達(dá)率λ變化對實(shí)際傳輸速率的影響,同時給出了文獻(xiàn)[15]算法在500 bit, 1000 bit和2000 bit 3種傳輸幀長下的平均傳輸速率。可見,隨著能量到達(dá)率λ的增大,平均傳輸功率增大,因此本文算法和文獻(xiàn)[15]算法的傳輸速率都相應(yīng)增大。相比較文獻(xiàn)[15]算法,本文算法由于同時對數(shù)據(jù)幀長進(jìn)行了優(yōu)化,且可用調(diào)制方式更多,因此能獲得更高的傳輸速率,且能量到達(dá)率λ越大,本文算法的性能優(yōu)勢越大。
圖3 能量到達(dá)率λ 對實(shí)際傳輸速率的影響
圖4給出了能量虛隊列偏移量變化對系統(tǒng)的性能影響。偏移量A可控制電池中的平均電量水平,保證電池中有足夠的能量和存儲空間,適應(yīng)信道狀態(tài)和能量收集量的隨機(jī)變化。從圖中可以看出,當(dāng)A增大時,電池存儲電量的平均水平提高,系統(tǒng)傳輸速率則先增大后輕微下降。這是因?yàn)锳增大時,電池的平均電量水平上升,各時隙根據(jù)信道狀態(tài)調(diào)整發(fā)送功率的范圍更大,在信道條件好時能支持更高的傳輸速率,對信道利用更充分,因此平均傳輸速率增大。但A過大后,電池的平均剩余存儲空間減少,出現(xiàn)電池電量溢出、收集能量部分損失的概率增大,從而導(dǎo)致傳輸速率輕微下降。
圖4 虛隊列偏移量A變化對系統(tǒng)性能的影響
圖5給出了漂移加懲罰函數(shù)中權(quán)重V變化對系統(tǒng)性能的影響。權(quán)重V用于在目標(biāo)函數(shù)的最大化與能量虛隊列穩(wěn)定性之間進(jìn)行折中。電池電量的穩(wěn)定性
圖5 懲罰項權(quán)重V對系統(tǒng)性能的影響
本文針對發(fā)送端由能量收集設(shè)備供電的無線通信系統(tǒng),在能量收集和信道狀態(tài)先驗(yàn)信息未知的條件下,利用Lyapunov優(yōu)化框架求解以最大化實(shí)際可達(dá)傳輸速率的發(fā)送功率、調(diào)制方式和數(shù)據(jù)幀長的聯(lián)合優(yōu)化問題。將收集能量使用的長期約束轉(zhuǎn)換為能量虛隊列的穩(wěn)定性要求,將長期時間平均實(shí)際可達(dá)傳輸速率最大化問題轉(zhuǎn)化為單時隙的、僅依賴當(dāng)前信道狀態(tài)和電池狀態(tài)的“漂移加懲罰”項上界的最小化問題。由于可用調(diào)制方式集合為離散集,而發(fā)送功率和幀長可連續(xù)取值,該聯(lián)合優(yōu)化問題不能直接求解。本文首先在給定調(diào)制方式下優(yōu)化發(fā)送功率與幀長。求解時,最優(yōu)幀長通過解析求解方式得到,而最優(yōu)發(fā)送功率只能采用數(shù)值方式求解。在獲得每種調(diào)制方式下的最優(yōu)發(fā)送功率和幀長后,選擇能使漂移加懲罰最小化的調(diào)制方式作為最優(yōu)調(diào)制方式,與其對應(yīng)的最優(yōu)發(fā)送功率和幀長一起作為問題的最優(yōu)解。仿真結(jié)果表明,本文提出的算法能夠有效利用收集的能量,適應(yīng)信道變化,長期平均實(shí)際可達(dá)的信息傳輸速率明顯優(yōu)于貪婪和半功率算法;相較于以最大化信道容量為目標(biāo)的離線注水算法及文獻(xiàn)[10]中的功率控制優(yōu)化算法,在實(shí)際可達(dá)的信息傳輸速率上本文算法也有優(yōu)勢;傳輸速率也高于未優(yōu)化幀長、可用調(diào)制方式較少的文獻(xiàn)[15]算法。但仿真結(jié)果顯示,實(shí)際可達(dá)傳輸速率與理論上最高傳輸速率還有較大的差距,這是因?yàn)樵趥鬏斨袥]有使用信道編碼。要獲得接近于信道容量的傳輸速率,信道編碼是必不可少的。聯(lián)合優(yōu)化發(fā)送功率、調(diào)制方式和信道編碼的碼長、碼率等參數(shù)將是下一步研究中需要解決的問題。