牟 迪,蒙 文,趙尚弘,王 翔,劉文亞
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,陜西 西安 710077)
無(wú)人駕駛飛機(jī)簡(jiǎn)稱無(wú)人機(jī)(Unmanned Aerial Vehicle,UAV),最早于20世紀(jì)20年代生產(chǎn),且由于其造價(jià)與維護(hù)費(fèi)用低、地勤保障要求低、安全風(fēng)險(xiǎn)系數(shù)小等優(yōu)點(diǎn)很快引起了美國(guó)軍方的興趣,隨著無(wú)人機(jī)在通信、偵查和搜索等方面的應(yīng)用和突出的表現(xiàn),迅速受到廣泛關(guān)注,進(jìn)而產(chǎn)生了對(duì)無(wú)人機(jī)井噴式的投入。在無(wú)人機(jī)通信領(lǐng)域,大量原始數(shù)據(jù)需要以無(wú)損的方式進(jìn)行傳輸,部分設(shè)備對(duì)傳輸速率的要求已經(jīng)達(dá)到了3~5 Gbps,然而,以微波為傳輸方式可以達(dá)到的最高傳輸速率僅僅Gbps量級(jí),因此無(wú)法利用現(xiàn)有的微波傳輸系統(tǒng)對(duì)這些圖像和數(shù)據(jù)進(jìn)行無(wú)損的實(shí)時(shí)傳輸,進(jìn)而大大限制了無(wú)人機(jī)的偵察能力,除此之外,對(duì)定向隱秘傳輸、空間高速組網(wǎng)、輕小型、低功率和技術(shù)發(fā)展推動(dòng)的需求也在迫使無(wú)人機(jī)通信方式的更新?lián)Q代。
現(xiàn)有通信鏈路中,激光通信鏈路具有帶寬容量大、傳輸隱蔽性強(qiáng)、傳輸速率快、具有較好的抗干擾能力、鏈路組網(wǎng)形式靈活且終端尺寸小,重量輕,功耗低,是無(wú)人機(jī)通信方式更新?lián)Q代的一個(gè)重要方向。但無(wú)人機(jī)激光通信技術(shù)最大的問(wèn)題在于無(wú)人機(jī)在遂行通信任務(wù)時(shí)主要飛行在大氣層內(nèi),由于大氣介質(zhì)是非均勻的,其密度和溫度會(huì)發(fā)生不均勻變化,會(huì)導(dǎo)致大氣中的折射率發(fā)生隨機(jī)變化,信道狀態(tài)不穩(wěn)定,很難進(jìn)行預(yù)測(cè),很難保證通信的質(zhì)量。智能通信是指在通信的基礎(chǔ)上,將深度神經(jīng)網(wǎng)絡(luò)(DNN)應(yīng)用于開(kāi)發(fā)端到端通信系統(tǒng),主要用來(lái)訓(xùn)練發(fā)射器和接收器,但DNN需要精確的瞬時(shí)信道狀態(tài)信息(CSI)來(lái)優(yōu)化發(fā)射機(jī)的梯度,才能完成較高質(zhì)量的模型訓(xùn)練。本文將提出一種基于條件生成對(duì)抗網(wǎng)(GAN)的DNN方法,利用條件生成對(duì)抗網(wǎng)實(shí)現(xiàn)在無(wú)準(zhǔn)確信道狀態(tài)信息情況下,開(kāi)發(fā)無(wú)線端到端通信系統(tǒng)。
現(xiàn)有激光通信系統(tǒng)大多采用數(shù)字通信技術(shù),其框圖如圖1所示。雖然該系統(tǒng)中的技術(shù)非常成熟,但其中的每個(gè)模塊是分開(kāi)設(shè)計(jì)的,通常具有不同的假設(shè)和目標(biāo),很難確保系統(tǒng)的全局最優(yōu)性。另外,信道傳播以嵌入在設(shè)計(jì)中的假設(shè)數(shù)學(xué)模型表示,假定的模型可能無(wú)法準(zhǔn)確地反映實(shí)際的傳輸場(chǎng)景,進(jìn)而極大程度地影響系統(tǒng)整體傳輸性能。最近,深度學(xué)習(xí)被用于改善傳統(tǒng)塊結(jié)構(gòu)通信系統(tǒng)的性能,包括多輸入多輸出(MIMO)檢測(cè)[1],信道解碼[2]和信道估計(jì)[3]。此外,基于深度學(xué)習(xí)的方法還通過(guò)聯(lián)合優(yōu)化處理塊來(lái)顯示潛在的改進(jìn),包括聯(lián)合信道估計(jì)和檢測(cè)[4],聯(lián)合信道編碼和源編碼[5]。但傳統(tǒng)的DNN必須在有確定的信道狀態(tài)信息(CSI)的條件下才能很好地進(jìn)行學(xué)習(xí)和訓(xùn)練,但無(wú)人機(jī)激光通信穿過(guò)復(fù)雜的大氣信道,信道狀態(tài)信息(CSI)不穩(wěn)定且變化極快[6]。
端到端通信系統(tǒng)使用DNN學(xué)習(xí)發(fā)送器和接收器的實(shí)現(xiàn),其系統(tǒng)框圖如圖2所示,信源通過(guò)自動(dòng)編碼器進(jìn)入信道,在自動(dòng)解碼器處反饋梯度信息進(jìn)行DNN權(quán)重訓(xùn)練。然而,用于訓(xùn)練DNN權(quán)重的反向傳播被信道阻塞,阻止了端到端網(wǎng)絡(luò)的整體學(xué)習(xí)[7]。為了解決這個(gè)問(wèn)題,我們使用條件GAN來(lái)學(xué)習(xí)通道效應(yīng)。在本節(jié)中,介紹了條件GAN,并介紹了如何使用條件GAN來(lái)模擬通道效應(yīng)[8]。
圖1 經(jīng)典通信系統(tǒng)框圖
圖2 應(yīng)用DNN的通信系統(tǒng)框圖
GAN是一種新的分布式學(xué)習(xí)生成方法,其目標(biāo)是學(xué)習(xí)一種能夠生成接近某些目標(biāo)-pdata分布的樣本模型。在系統(tǒng)中,應(yīng)用GAN來(lái)模擬信道輸出的分布,然后在訓(xùn)練發(fā)射機(jī)時(shí)將學(xué)習(xí)的模型用作實(shí)際信道的替代,使得梯度可以傳遞到發(fā)射機(jī)[9-10]。
GAN的結(jié)構(gòu)如圖3所示,其中在發(fā)生器G和鑒別器D之間引入了最小-最大兩個(gè)玩家游戲[11]。鑒別器D學(xué)習(xí)區(qū)分由發(fā)生器產(chǎn)生的數(shù)據(jù)和來(lái)自真實(shí)數(shù)據(jù)集的數(shù)據(jù),而生成器G學(xué)習(xí)生成樣本以欺騙判別網(wǎng)絡(luò)使其出現(xiàn)誤判。在訓(xùn)練期間,生成器將輸入噪聲z與先前分布PZ(Z)映射到樣本,然后收集來(lái)自真實(shí)數(shù)據(jù)的樣本和從生成器G生成的樣本以訓(xùn)練鑒別器D,以最大化增強(qiáng)生成鑒別器的能力。如果鑒別器D成功地對(duì)兩個(gè)源的樣本進(jìn)行分類,則其成功可用于生成反饋到發(fā)生器G,使得生成器G將學(xué)習(xí)生成更類似于真實(shí)樣本。訓(xùn)練過(guò)程將在達(dá)到平衡時(shí)結(jié)束,平衡時(shí)鑒別器D不能比隨機(jī)猜測(cè)更好地區(qū)分真實(shí)樣本和生成的假樣本。發(fā)生器G和鑒別器D均由DNN表示,分別帶有參數(shù)G和D,優(yōu)化的目標(biāo)是:
圖3 GAN結(jié)構(gòu)圖
Ez~px(z)[log(1-DD(GG(z)))]
(1)
鑒別器D的目的是當(dāng)輸入屬于真實(shí)數(shù)據(jù)集時(shí)給出高值,當(dāng)輸出由發(fā)生器G生成時(shí)給出低值,而生成器G的目的是最大化輸出類似真實(shí)樣本的生成樣本,鑒別器D的值為G(z)。如果發(fā)生器G和鑒別器D都以某些額外信息m為條件,則GAN可以擴(kuò)展到條件GAN模型。條件GAN的結(jié)構(gòu)如圖4所示。只需要將調(diào)節(jié)信息m作為附加輸入發(fā)生器G和鑒別器D中。因此,發(fā)生器的輸出G將是G(x|m),鑒別器的輸出D將是D(x|m)。最小-最大優(yōu)化目標(biāo)變?yōu)閇12]:
(2)
圖4 條件GAN結(jié)構(gòu)圖
在端到端系統(tǒng)中采用條件GAN,利用編碼信號(hào)和接收的導(dǎo)頻數(shù)據(jù)的給定調(diào)節(jié)信息對(duì)信道輸出分布進(jìn)行建模。
GAN是學(xué)習(xí)分布和通道輸出的強(qiáng)大工具,給定信道輸入x,輸出y由條件分布p(y|x)決定。因此,通過(guò)將x作為條件信息,可以采用條件GAN來(lái)學(xué)習(xí)信道的輸出分布。發(fā)生器將嘗試產(chǎn)生類似于實(shí)際信道輸出的樣本,而鑒別器將試圖區(qū)分來(lái)自真實(shí)信道的數(shù)據(jù)和來(lái)自發(fā)生器的數(shù)據(jù)。在瞬時(shí)CSI中,h可以被視為來(lái)自大信道集H的樣本,并且也是接收機(jī)處的數(shù)據(jù)的重要相干檢測(cè)。為了獲得CSI,通常的做法是向接收器發(fā)送一些導(dǎo)頻信息,以便基于接收的導(dǎo)頻信息yp推斷信道信息。在我們提出的方法中,可以將接收的導(dǎo)頻信息yp作為調(diào)節(jié)信息的一部分添加,使得輸出y的樣本遵循給出的給出的x的信息和接收的導(dǎo)頻數(shù)據(jù)yp。
利用條件GAN,梯度可以反向傳播到發(fā)射機(jī)。在之前的工作[6]之后,從有限離散的大小為M的集合中繪制的發(fā)送信號(hào)被轉(zhuǎn)換為長(zhǎng)度為M的單熱矢量s,端到端傳輸被視為M級(jí)分類的問(wèn)題。接收器的輸出s是M個(gè)可能類的概率向量。在接收器處計(jì)算交叉熵?fù)p失,其被定義為[13]:
(3)
所提出的端到端通信系統(tǒng)的訓(xùn)練和測(cè)試如圖5所示。在訓(xùn)練期間,隨機(jī)生成發(fā)送信號(hào),并且從信道集中隨機(jī)采樣獲得瞬時(shí)CSI?;谟?xùn)練數(shù)據(jù),可以迭代地訓(xùn)練條件GAN中的發(fā)射器,接收器和信道發(fā)生器,并且當(dāng)訓(xùn)練一個(gè)組件時(shí),其他組件的參數(shù)保持固定[14]。
圖5 接收機(jī)、發(fā)射機(jī)、生成器訓(xùn)練結(jié)構(gòu)圖
在訓(xùn)練接收器和發(fā)射器時(shí),目標(biāo)是最小化端到端損耗。目的是在訓(xùn)練用于生成信道的條件GAN時(shí)最小化最小-最大優(yōu)化目標(biāo)。測(cè)試階段在學(xué)習(xí)的發(fā)射器和具有真實(shí)信道的接收器上評(píng)估端到端重建性能。
由于在接收器處計(jì)算損耗函數(shù),因此可以容易地訓(xùn)練接收器,進(jìn)而可以容易地獲得損耗的梯度。DNN的輸入將是接收信號(hào)y和接收導(dǎo)頻數(shù)據(jù)yp。對(duì)于時(shí)變信道,通過(guò)直接將接收信號(hào)y和接收導(dǎo)頻數(shù)據(jù)yp一起作為輸入,接收機(jī)可以自動(dòng)推斷信道條件并同時(shí)執(zhí)行信道估計(jì)和檢測(cè),而無(wú)需明確估計(jì)信道。
由于信道發(fā)生器是模擬信道,發(fā)射機(jī)的訓(xùn)練類似于接收機(jī)的訓(xùn)練。在接收器處計(jì)算端到端交叉熵?fù)p失,并且梯度通過(guò)條件GAN傳播回發(fā)送器。將基于隨機(jī)梯度下降(SGD)更新發(fā)射機(jī)的權(quán)重,同時(shí)保持條件GAN和接收機(jī)的權(quán)重。
用鑒別器和發(fā)射機(jī)一起訓(xùn)練信道發(fā)生器。利用來(lái)自發(fā)射機(jī)的編碼信號(hào)通過(guò)實(shí)際信道獲得實(shí)際數(shù)據(jù),同時(shí)從通過(guò)信道發(fā)生器的編碼數(shù)據(jù)獲得偽數(shù)據(jù)。優(yōu)化的目標(biāo)函數(shù)如等式(2)所示。
本節(jié)提供了信號(hào)在加性高斯白噪聲(AWGN)信道和對(duì)數(shù)正態(tài)信道中傳播輸出的仿真結(jié)果。將基于通道無(wú)關(guān)學(xué)習(xí)條件GAN的方法與基于通道傳遞函數(shù)設(shè)計(jì)的傳統(tǒng)方法進(jìn)行比較。每種模型的結(jié)構(gòu)和參數(shù)列于表1權(quán)重由Adam更新,培訓(xùn)的批量大小為320。
表1 模型參數(shù)
首先在AWGN信道中應(yīng)用條件GAN方法,其中信道的輸出y是輸入信號(hào)x和高斯噪聲w的總和,即y=x+w。在這種情況下,調(diào)節(jié)信息僅是來(lái)自發(fā)射器的編碼信號(hào),不需要信道估計(jì)。
首先測(cè)試條件GAN學(xué)習(xí)通道輸出分布的能力。圖6表示具有標(biāo)準(zhǔn)16 QAM調(diào)制的信道發(fā)生器的輸出作為調(diào)節(jié)信息。從圖中可以看出,發(fā)生器產(chǎn)生的合成信號(hào)與AWGN通道的輸出非常相似,即在AWGN信道中,通過(guò)條件GAN對(duì)信號(hào)的訓(xùn)練達(dá)到預(yù)期目標(biāo)。
圖6 由條件GAN表示的AWGN信道的輸出處的信號(hào)星座
AWGN信道上的端到端誤碼性能如圖7所示。發(fā)送器發(fā)送漢明(7,4)碼,從圖中可以看出,基于學(xué)習(xí)的方法的塊誤碼率(BLER)與具有最大似然解碼(MLD)的漢明(7,4)碼誤碼率十分接近,即通過(guò)條件GAN對(duì)無(wú)確定端到端信道的訓(xùn)練誤碼性能通傳統(tǒng)方法保持相同水準(zhǔn),但應(yīng)用了條件GAN的DNN可以在無(wú)確切CSI情況下應(yīng)用,泛用性更強(qiáng)。
圖7 高斯信道條件GAN方法BLER和傳統(tǒng)方法BER比較
對(duì)數(shù)正態(tài)信道屬于大氣湍流信道中的一種,其信道輸出由yn=hn·xn+n確定,其中hn表示信道衰落系數(shù),n~CN(0,1)。由于信道是時(shí)變的,噪聲是隨機(jī)的,因此附加的條件信息被添加到信道發(fā)生器和接收器。可以將實(shí)數(shù)h用于相干檢測(cè)任務(wù)或接收導(dǎo)頻數(shù)據(jù)yp,用于聯(lián)合信道估計(jì)和檢測(cè)(假設(shè)導(dǎo)頻為1)。我們首先測(cè)試條件GAN在學(xué)習(xí)標(biāo)準(zhǔn)16 QAM作為編碼符號(hào)的信道分布方面的有效性。圖8表示生成的樣本,其具有添加到調(diào)節(jié)信息的不同信道值。從圖中可以看出,條件GAN能夠根據(jù)條件信息以各種方式產(chǎn)生樣本。
圖8 由條件GAN表示的瑞利衰落信道的輸出處的信號(hào)星座
對(duì)數(shù)信道上的端到端誤碼率性能如圖9所示,從圖中可以看出,基于深度學(xué)習(xí)的方法得到的塊誤碼率(BLER)與傳統(tǒng)方法的信號(hào)誤碼性能相差無(wú)幾,即基于條件GAN的DNN方法在對(duì)數(shù)正態(tài)信道條件下可以獲得很好的端到端通信性能。
圖9 對(duì)數(shù)正態(tài)信道條件GAN方法BLER和傳統(tǒng)方法BER比較
無(wú)人機(jī)作為通信載體具有無(wú)與倫比的優(yōu)勢(shì),而無(wú)人機(jī)激光通信具有機(jī)動(dòng)性強(qiáng)、帶寬容量大、傳輸隱蔽性強(qiáng)、傳輸速率快、具有較好的抗干擾能力、鏈路組網(wǎng)形式靈活且終端尺寸小,重量輕,功耗低等優(yōu)點(diǎn)更是被寄予厚望。智能通信是指在通信的基礎(chǔ)上,將DNN應(yīng)用于開(kāi)發(fā)端到端通信系統(tǒng),主要被用來(lái)訓(xùn)練發(fā)射器和接收器,但DNN需要精確的瞬時(shí)信道狀態(tài)信息(CSI)來(lái)優(yōu)化發(fā)射機(jī)的梯度,才能完成較高質(zhì)量的模型訓(xùn)練。然而,在許多通信系統(tǒng)中,信道狀態(tài)信息(CSI)很難獲得并且隨時(shí)間和位置發(fā)生變化。本文中提出了基于條件GAN方法,完成了無(wú)明確信道狀態(tài)信息(CSI)條件下的通信系統(tǒng)端到端學(xué)習(xí)。通過(guò)對(duì)AWGN和對(duì)數(shù)正態(tài)信道的仿真表明:基于條件GAN的DNN方法可以有效的完成無(wú)明確信道狀態(tài)信息(CSI)的通信系統(tǒng)端到端學(xué)習(xí),且其誤碼性能可以達(dá)到傳統(tǒng)方法的性能。
本文提出的方法使得無(wú)人機(jī)智能光通信的實(shí)現(xiàn)變成可能,雖然模擬僅基于AWGN和對(duì)數(shù)正態(tài)信道,但它可以很容易地?cái)U(kuò)展到其他信道,為構(gòu)建智能通信系統(tǒng)開(kāi)辟了新的思路。但應(yīng)用DNN時(shí)隱藏層數(shù)量、學(xué)習(xí)率是否達(dá)到最佳等問(wèn)題仍需更多的研究。