非合作博弈在D2D通信資源分配中的應(yīng)用

2019-09-24 02:00:29高男

電腦知識(shí)與技術(shù) 2019年19期

高男

摘要：目前5G時(shí)代已經(jīng)到來(lái)，終端直通通信技術(shù)（D2D，Device-to-Device）逐漸引起人們的廣泛注意，在下一代的蜂窩移動(dòng)通信系統(tǒng)中它也是關(guān)鍵技術(shù)之一。而非合作博弈論以其能夠最大化頻譜資源利用率的優(yōu)點(diǎn)成為研究熱點(diǎn)。首先對(duì)博弈論進(jìn)行簡(jiǎn)介;其次重點(diǎn)介紹了幾種非合作博弈論與資源分配相結(jié)合的研究現(xiàn)狀;最后總結(jié)了D2D頻譜資源分配仍然存在的問(wèn)題以及未來(lái)的研究方向。

關(guān)鍵詞：5G;D2D;博弈論;資源分配

中圖分類號(hào)：TN914? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼：A

文章編號(hào)：1009-3044（2019）19-0233-02

Abstract： At present， the 5G era has come， and the device-to-device （D2D） has gradually attracted widespread attention and is considered to be one of the key technologies in the next generation of cellular mobile communication systems. Non-cooperative game theory has become a research hotspot because of its advantages of maximizing spectrum resource utilization. Firstly， the game theory is introduced. Secondly， the research status of several non-cooperative game theory and resource allocation is introduced. Finally， the problems still existing in D2D spectrum resource allocation and future research directions are summarized.

Key words：5G; D2D; game theory; resource allocation

1 引言

隨著通信系統(tǒng)的日益擴(kuò)大與逐漸完善，通信系統(tǒng)內(nèi)的頻譜資源日漸緊張，傳統(tǒng)的通信方式已經(jīng)不能滿足人們的通信需求，且隨著在網(wǎng)設(shè)備的指數(shù)級(jí)增加，通信方式以及資源利用亟需變革。博弈論作為經(jīng)濟(jì)領(lǐng)域經(jīng)典的理論系統(tǒng)，其經(jīng)典的非合作博弈模型及囚徒困境等理論能夠較好地應(yīng)用于D2D通信中的頻譜資源分配中，以達(dá)到頻譜資源被最大化、最高質(zhì)量利用的目的，這樣的結(jié)合也逐漸成了頻譜資源分配的主流方式。

2 博弈論簡(jiǎn)介

博弈論，也叫作對(duì)策論。它的幾個(gè)相關(guān)元素為：（1）參與人：參與人作為博弈過(guò)程中博弈雙方的行為選擇的主體，至少需要有2個(gè)及以上，才能形成博弈環(huán)境。（2）行動(dòng)：所謂的行動(dòng)，就是指參與人在博弈環(huán)境中需要以及自身?xiàng)l件采取一些動(dòng)作的集合。（3）信息：參與人需要有博弈過(guò)程中其他參與人的一些包括行動(dòng)，策略等方面的信息。（4）策略：即參與人要有對(duì)應(yīng)的措施來(lái)完成方案的貫徹執(zhí)行。（5）效用：即參與人需要執(zhí)行策略的過(guò)程中獲得對(duì)應(yīng)的收益。（6）結(jié)果：在博弈過(guò)程結(jié)束后所有參與人在過(guò)程中的策略執(zhí)行的集合。（7）均衡：即所有參與者在博弈過(guò)程中選擇最佳策略的集合。

博弈理論可以依據(jù)不同的標(biāo)準(zhǔn)來(lái)進(jìn)行不同的分類。例如，根據(jù)參與人之間的依賴關(guān)系，可以將博弈論分為合作博弈和非合作博弈，這其中的非合作博弈，也就是參與人之間沒(méi)有約束力的鍥約。由于非合作博弈理論考慮更多的是博弈個(gè)體之間的利益相關(guān)事件。因此更加符合面向D2D通信技術(shù)的蜂窩網(wǎng)絡(luò)系統(tǒng)的資源分配問(wèn)題。當(dāng)前的博弈理論研究也基本集中在非合作博弈理論的基礎(chǔ)之上。而作為非合作博弈最基本的解，納什均衡（Nash Equilibrium，NE）可以作為解決非合作博弈的均衡問(wèn)題的唯一性標(biāo)準(zhǔn)。下面是對(duì)納什均衡的相關(guān)定義表述：

在一個(gè)N人博弈中，策略組合S = （S1，S2，…，SN）構(gòu)成一個(gè)納什均衡，當(dāng)且僅當(dāng)：對(duì)于每一個(gè)博弈者i，i = 1，2，…，N，其策略Si是對(duì)策略組合S中的其他所有博弈者策略S?i的最優(yōu)回應(yīng)，即對(duì)任意Si′∈Si，Ui（Si，S?i） ≥ Ui（Si′，S?i）。同時(shí)，納什均衡實(shí)現(xiàn)的前提條件必須滿足：每個(gè)參與人不僅可以很清楚地知道其他參與人的均衡策略，也很清楚地了解對(duì)手很清楚地知道自己的均衡策略。也就是說(shuō)，所有參與人的均衡策略是共同認(rèn)知。只有這樣，納什均衡才可以實(shí)現(xiàn)。

3 非合作博弈在D2D通信資源分配中的研究現(xiàn)狀

D2D通信網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖1所示。傳統(tǒng)的移動(dòng)通信網(wǎng)絡(luò)中，通信終端的信息一般是交由基站來(lái)轉(zhuǎn)發(fā)。即使兩個(gè)移動(dòng)終端之間的距離很近，而距離基站很遠(yuǎn)的時(shí)候，或移動(dòng)通信設(shè)備再蜂窩小區(qū)邊緣地帶時(shí)，信息從一個(gè)移動(dòng)終端發(fā)送到另一個(gè)移動(dòng)終端時(shí)，仍然是先發(fā)送到距離很遠(yuǎn)的基站，然后再由基站轉(zhuǎn)發(fā)回來(lái)送達(dá)另一個(gè)移動(dòng)終端。這種情況就會(huì)造成系統(tǒng)過(guò)多的消耗功耗，增加了通信系統(tǒng)的時(shí)延，進(jìn)而降低了數(shù)據(jù)的傳輸效率。而如果采用D2D通信技術(shù)，就省去了將信息交由基站來(lái)轉(zhuǎn)發(fā)的環(huán)節(jié)，而是直接時(shí)移動(dòng)設(shè)備端對(duì)端之間的直通通信。這樣從D2D通信的技術(shù)層面來(lái)看，D2D通信過(guò)程對(duì)于用戶就是完全透明的狀態(tài)。通信的過(guò)程就需要交由蜂窩通信系統(tǒng)來(lái)管理，而移動(dòng)設(shè)備終端只需要實(shí)時(shí)的呼叫，發(fā)送信息。

目前非合作博弈論已經(jīng)成功應(yīng)用在了多種D2D通信的資源分配場(chǎng)景中，例如蜂窩系統(tǒng)內(nèi)多D2D對(duì)用戶間的頻譜資源分配以及跨小區(qū)的D2D用戶資源分配。下文主要對(duì)非合作博弈在D2D通信資源分配中的發(fā)展現(xiàn)狀進(jìn)行闡述。

文獻(xiàn)[1]提出將非合作博弈論應(yīng)用于D2D通信系統(tǒng)頻譜資源分配中，大大提高了頻譜資源利用率。文獻(xiàn)[2]提出了一種SPS（Semi-PersistentScheduling）資源分配算法，在考慮頻譜資源利用率的基礎(chǔ)上又考慮到了同系統(tǒng)中D2D用戶之間的互相干擾，并將系統(tǒng)抗干擾性提高了13%。文獻(xiàn)[3]提出可以對(duì)D2D資源分配問(wèn)題進(jìn)行轉(zhuǎn)化，變成研究混合整數(shù)的非線性規(guī)劃問(wèn)題，并設(shè)計(jì)出一種基于非合作博弈的可供選擇的啟發(fā)式資源分配方案，通過(guò)信道增益的變化來(lái)降低D2D設(shè)備對(duì)蜂窩通信系統(tǒng)的干擾。文獻(xiàn)[4]將連續(xù)二價(jià)拍賣理論引入蜂窩通信系統(tǒng)作為D2D通信資源分配算法。作者提出的方案是將信道資源分成一個(gè)一個(gè)連續(xù)的單元模塊，并設(shè)定成商品用來(lái)拍賣，接著將D2D移動(dòng)用戶設(shè)定成競(jìng)拍者來(lái)競(jìng)爭(zhēng)設(shè)定的資源模塊，通過(guò)這種方式來(lái)獲取D2D通信模式下的最佳傳輸鏈路。文獻(xiàn)[5]結(jié)合Stackelberg博弈模型提出兩個(gè)算法，并利用基站與D2D用戶終端的層次交互再以D2D發(fā)射功率為基準(zhǔn)對(duì)用戶實(shí)行收費(fèi)機(jī)制，以達(dá)到綜合考慮頻譜資源復(fù)用率與用戶間干擾的最優(yōu)解。文獻(xiàn)[6]提出一種時(shí)隙分享策略，使互為中繼的D2D用戶通過(guò)分享時(shí)隙的方式建立合作，并通過(guò)拉格朗日乘數(shù)法求解出了D2D用戶以多大時(shí)隙中繼復(fù)用彼此數(shù)據(jù)，解決了D2D用戶如何合作的問(wèn)題。文獻(xiàn)[7]基于D2D通信系統(tǒng)中傳統(tǒng)能效函數(shù)僅能捕獲瞬時(shí)數(shù)據(jù)流量，而無(wú)法獲取特定時(shí)間段內(nèi)數(shù)據(jù)流量的能效，將吞吐量和終端使用時(shí)間之積作為效用函數(shù)，以終端使用時(shí)間內(nèi)的吞吐量最大化為目標(biāo)，并將其建模為非合作功率控制博弈（non-conperative power control game，NPG）問(wèn)題并得到其納什均衡解，不僅提升系統(tǒng)效用值和終端使用時(shí)間，還可以保持系統(tǒng)公平性。文獻(xiàn)[8]針對(duì)混合通信網(wǎng)絡(luò)中蜂窩用戶與D2D用戶同頻干擾問(wèn)題，提出基于競(jìng)價(jià)的D2D頻譜資源分配算法。創(chuàng)新地使用了注水算法并通過(guò)拉格朗日條件來(lái)優(yōu)化價(jià)格。

以上大量杰出的研究工作表明，為了能夠更加合理、高效的復(fù)用有限的頻譜資源，同時(shí)盡量減少D2D用戶間干擾及用戶與基站間的上下行信道干擾，引入非合作博弈論作為研究工具是非?？扇〉模Ч彩欠浅３晒Φ?。

4 結(jié)束語(yǔ)

目前基于非合作博弈的D2D資源分配研究已經(jīng)可以說(shuō)是較為全面了，無(wú)論是在用戶間的信息傳輸速率還是在用戶與用戶或基站間的干擾方面都有了長(zhǎng)足的考慮與深入研究。但若用戶處于高速移動(dòng)中等情況下，這種資源分配的有效率便無(wú)法保證，目前還沒(méi)有一個(gè)有效的解決方法能夠應(yīng)用于這種復(fù)雜的場(chǎng)景中。而且隨著現(xiàn)代通信技術(shù)的飛速發(fā)展以及5G下一步的全面鋪開(kāi)，入網(wǎng)用戶勢(shì)必會(huì)越來(lái)越多，用戶們對(duì)于Qos也一定會(huì)有更高的要求。

對(duì)于未來(lái)的D2D資源分配研究方向，研究者應(yīng)該關(guān)注于如何能在更高速或者更極端的情況下能夠盡快完成D2D用戶的身份識(shí)別、信息傳遞以及資源的分配，尤其是在5G全面鋪開(kāi)后，面對(duì)越來(lái)越大比特的信息的用戶間的傳輸，如何能夠讓用戶更快地收到自己想要的信息，又如何能保證整個(gè)系統(tǒng)中的所有用戶的Qos，甚至在這種高速的發(fā)展?fàn)顟B(tài)下，如何能時(shí)刻保持著頻譜資源的高效利用，這都是亟需我們解決的問(wèn)題，所以基于非合作博弈的D2D資源分配技術(shù)在未來(lái)將越來(lái)越是一個(gè)值得研究的方向。

參考文獻(xiàn)：

[1] 榮濤. D2D通信技術(shù)研究[D].南京郵電大學(xué)，2013.

[2] 劉佳. LTE系統(tǒng)下D2D通信的干擾控制與資源分配[D].西安電子科技大學(xué)，2014.

[3] Akkarajitsakul K， Phunchongharn P， Hossain E， et al. Mode selection for energy-efficient D2D communications in LTE-advanced networks： A coalitional game approach[C]//2012 IEEE international conference on communication systems （ICCS）. IEEE， 2012： 488-492.

[4] Gao C， Li Y， Zhao Y， et al. A two-level game theory approach for joint relay selection and resource allocation in network coding assisted D2D communications[J]. IEEE Transactions on Mobile Computing， 2017， 16（10）： 2697-2711.

[5] Chu Z， Nguyen H X， Le T A， et al. Game theory based secure wireless powered D2D communications with cooperative jamming[C]//2017 Wireless Days. IEEE， 2017： 95-98.

[6] 張闖，邵坦，王慧武.D2D網(wǎng)絡(luò)中基于博弈論的時(shí)隙分享合作策略研究[J].電子技術(shù)應(yīng)用，2018，44（06）：80-84.

[7] 李民政，苗春偉.D2D通信中基于帕累托占優(yōu)的非合作博弈功率控制算法[J/OL].系統(tǒng)工程與電子技術(shù)：1-8[2019-03-05].http：//kns.cnki.net/kcms/detail/11.2422.tn.20190124.1746.030.html.

[8] 薛建彬，李俞虹.一種基于價(jià)格競(jìng)爭(zhēng)的D2D通信資源分配算法[J].測(cè)控技術(shù)，2018，37（07）：14-18.

【通聯(lián)編輯：代影】