劉 波,白曉東,張更新,沈 俊,謝繼東,趙來定,洪 濤
(1. 南京郵電大學 通信與信息工程學院,南京 210003; 2. 西安空間無線電技術研究所,西安 710000)
移動互聯網的發(fā)展和無線智能設備的普及使得越來越多的用戶接入到互聯網中, 同時單個用戶對帶寬的需求也在增長, 基礎的語音服務已無法滿足多樣化的通信及娛樂休閑需求, 而短缺的頻譜資源卻是現實的. 理論上講, 頻譜資源是無限的, 但受到天線尺寸、電磁波特性、設備性能和發(fā)射功率的限制, 現實可用的頻譜資源被嚴格限制在一定的范圍內; 而這些頻帶已經基本被劃分完畢, 國際電信聯盟規(guī)劃的可用頻譜資源為9 kHz ~ 275 GHz[1]. 美國聯邦通信委員會(Federal Communications Commission, FCC)曾研究指出, 大量已經分配的頻譜資源在時間和空間上均存在較大程度的閑置. 在任意時間、任意地點的頻譜平均利用率都不超過5%[2]. 造成頻譜資源緊缺的一大因素是頻譜資源的靜態(tài)分配政策. 雖然這種分配方式可減輕各頻段通信系統(tǒng)的互相干擾, 但靜態(tài)分配的策略不夠靈活, 授權用戶在相當長時間內不使用或不完全使用其頻譜, 而其他的無線電用戶卻無法對該頻段加以利用.這就造成了頻譜資源日益緊張和現有頻譜利用率不理想的矛盾局面. 而這樣的矛盾恰好也為新技術的涌現提供了機遇, 其中的一個突破點便是頻譜的動態(tài)分配—認知無線電(CR).
作為新型的無線通信技術, CR已成為解決頻譜利用率不足問題的一種理想方案, 并受到越來越多學者的關注. 在有限的頻譜資源中, 允許非授權用戶(Secondary User, SU)使用主用戶(Primary User, PU)沒有使用的空閑頻段, 以提高頻譜利用率. CR這一概念最早于1999年由Mitola博士和Maguire教授在他們發(fā)表的論文[3]中提出. CR技術的核心思想是通過頻譜感知和智能的無線電實現頻譜的動態(tài)分配. 它允許非授權用戶在空閑時間使用已授權用戶的頻段進行通信, 前提是不能干擾授權用戶的正常使用, 當主用戶發(fā)起業(yè)務請求時, 非授權用戶必須切換頻段[4]. Haykin認為, CR建立在軟件無線電的基礎上, 是一種智能的無線通信系統(tǒng), 它借助人工智能技術對外界電磁環(huán)境進行感知,并自適應調整無線電參數, 實現了高質量的通信和最大化的頻譜利用效率[5]. 從某種程度上講, CR是智能技術和無線通信技術的結合技術, 是很好地利用人工智能技術的平臺. 深度學習作為機器學習的新興領域, 近年來發(fā)展迅速. 如何把深度學習技術應用于CR已成為一種新的可靠的思路, 相關成果也越來越多[6].
在“Web of Science ”數據庫輸入主題關鍵詞CR、深度學習(Deep Learning, DL)查閱2009—2018 年收錄的國內外有關的學術文獻, 結果顯示(見圖1), 過去10年, 國際上關于深度學習(由Hinton等于2006年提出)與CR的論文發(fā)表數量增長迅速.
圖1 近年論文發(fā)表趨勢Fig. 1 Publication trends in recent years
Mitola博士在提出CR這一概念時, 根據其功能愿景, 構建了包含了感知、判斷、計劃、決策、學習、行動的認知環(huán)路設計, 如圖2所示. 圖2中包含內環(huán)、外環(huán)兩個閉合的環(huán)路, 其中, 外部的環(huán)路感知無線電環(huán)境, 并結合內部狀態(tài)信息判斷可用頻段和信道參數.
圖2 認知環(huán)路[7]Fig. 2 Cognitive loop[7]
結合業(yè)務模型, “計劃”根據判斷信息生成目標函數. “決策”是應用優(yōu)化算法對目標函數進行優(yōu)化, 調整發(fā)射機參數, 包括功率控制、調制解調、編碼方式等. 總之, 外環(huán)主要進行無線電設備的參數調整和認知系統(tǒng)配置; 而內環(huán)是運行過程中提取歷史經驗知識并存入數據庫. 依據這些經驗, 并利用人工智能和技術實現參數優(yōu)化, 驅動外環(huán)運行.
綜上可知, 驅動這樣的認知環(huán)路運行是一個復雜的系統(tǒng)工程, 其中涵蓋了眾多的研究方向和細分領域. 所以, 研究人員們致力于構建一個中間控制單元, 以控制認知環(huán)路中各節(jié)點運作, 這一核心控制單元便是認知引擎. 認知引擎依據具體業(yè)務情況驅動不同的認知環(huán)路, 認知引擎不針對具體的業(yè)務模型而設計, 而是著眼于更通用的架構, 是CR技術的核心.
Clancy等[8]認為, CR就是在軟件無線電平臺上增加了認知引擎. 認知引擎由知識庫、推理引擎和學習引擎組成, 如圖3所示.
圖3 認知引擎Fig. 3 Cognitive engine
(1) 知識庫存儲歷史經驗知識, 包括感知信息、無線電環(huán)境的預測和行動策略, 是推理與學習的前提. 在知識庫中, 需要將以上信息表示為一種可以讓機器理解的數據結構. 合適的知識表示可以降低信息被檢索的難度, 提高檢索效率. 典型的知識表示語言有Mitola博士提出的RKRL (Radio Knowledge Representation Language)、Rondeau提出的XML (Extensible Markup Language); 另外, 還有OWL (Web Ontology Language)、SDL (Simple DirectMedia Layer)、UML (Unified Modeling Language)等. 各知識表示語言在準確性和靈活性上各有優(yōu)劣, 相關研究也在不斷推進.
(2) 推理引擎對知識庫中的信息進行判斷、計劃、決策和執(zhí)行. 目前, 遺傳算法、模糊識別、基于規(guī)則的系統(tǒng)、基于案例推理等人工智能技術可被用于推理引擎的研究.
(3) 學習引擎主要是對歷史數據進行反饋分析, 處理突發(fā)情況, 豐富知識庫. 可用的人工智能算法主要有貝葉斯邏輯、博弈論、遺傳算法、神經網絡、Q學習法(Q-learning)、決策樹等.
目前, 人工智能技術被定義為新一輪科技革命和產業(yè)變革的重要驅動力量, 加快發(fā)展新一代人工智能是事關我國能否抓住新一輪科技革命和產業(yè)革命發(fā)展機遇的戰(zhàn)略問題. 機器學習在人工智能領域起著舉足輕重的作用. 自20世紀80年代以來, 機器學習從理論算法到實際應用都取得了豐碩的成果. 深度學習作為機器學習中的細分學科, 越來越受到理論研究人員和各大前沿科技公司的重視.
深度學習概念由Hinton和Salakhutdinov在2006年提出, 他們在文獻[9]中指出: ①多隱層的人工神經網絡擁有更強的特征學習能力, 學習到的特征對數據有更本質的刻畫, 進而能夠進行更準確的分類或描述; ②Pre-training可以有效降低深度神經網絡在訓練上的難度.
經典的機器學習和信號處理技術通常只包含 1 層到 2 層的非線性變換層. 這類淺層網絡在有限的數據量和神經節(jié)點下不能夠對復雜的模型進行很好的表征, 在復雜的分類任務中這種結構的泛化能力不足. 與之相比, 深度學習旨在訓練更大規(guī)模的非線性網絡, 能夠從大量的樣本中學習數據更本質的特征, 在相對緊湊的網絡結構下可實現對復雜函數的逼近. 深度學習強調模型結構的深度[10], 通常有5層以上的隱藏層. 經過逐層地非線性運算, 將樣本數據映射到一個高度抽象的特征空間, 以期能夠實現更好的分類效果或預測精度. 常用的深度學習模型有自編碼器(Auto-Encoder, AE)、限制玻爾茲曼機(Restricted Boltzmann Machine, RBM)、深度信任網絡(Deep Belief Network, DBN)、卷積神經網絡(Convolutional Neural Network, CNN)、循環(huán)神經網絡(Recurrent Neural Network, RNN)、長短期記憶網絡(Long Short-Term Memory, LSTM)等. 幾種典型的深度學習模型在CR中的應用見表1 所示.
表1 深度學習模型在CR中應用概況Tab. 1 Deep learning model in CR
卷積神經網絡(CNN)是一種深層的前饋型神經網絡, 多應用于圖像識別及計算機視覺領域[63-64].其算法一般流程如圖4所示. 作為深度神經網絡中較為經典的網絡結構, 其突出性能在處理圖像相關問題時得到驗證, 許多學者嘗試將這一網絡結構遷移到其他領域. 比如Abdel-Hamid等把CNN應用于語音識別, 使錯誤率較原先減少了6% ~ 10%[65-66]; Niu等開發(fā)的手寫輸入法使用了CNN加支持向量機(Support Vector Machine, SVM)的組合模型, 使識別率高達99.81%[67]. 實踐表明, 借助深層網絡強大的特征表征能力, 將其用作特征抓取器并輸出至SVM、MLP (Multilayer Perceptron)等淺層分類器中也能獲得很好的應用效果.
圖4 CNN模型訓練步驟Fig. 4 CNN model training process
典型的CNN結構如圖5所示. 由圖5 可知, 同一張?zhí)卣饔成涞乃猩窠浽灿孟嗤木矸e核[68],因此一個卷積核只能提取一部分特征, 所以需要用多個卷積核來提取圖像的不同特征. S2層為降采樣層(池化層), 池化層的卷積核一般只取對應位置的平均值(Avy pooling)、最大值(Max pooling). 池化操作一方面可以降低特征圖的維度, 簡化結構, 并可在一定程度上避免過擬合; 另一方面可以減少目標的旋轉、傾斜之類的相對位置變化對參數的影響, 從而強化主要特征. C2卷積層與S1池化層為局部連接結構. 每個神經元僅與輸入特征映射的一塊區(qū)域連接, 這塊局部區(qū)域稱作感受野. LeCun等[69]在設計用于手寫字符識別的LeNet-5模型時指出, 全連接架構的一個不足之處是完全忽略了輸入的拓撲結構. 而圖像(或信號的時頻表示譜)局部結構具有較強的關聯性, 局部連接保證了學習后的分類器能夠對局部特征有很好的響應. 這種局部連接的結構進一步減少了學習參數數量. 不過, 當卷積核深度過大, 稀疏連接對參數數量的控制作用將大打折扣. 雖然說神經網絡結構汲取了一些生物神經系統(tǒng)的靈感, 尤其是深度學習, 有時候人們也可以以此去簡單地理解大腦的功能. 但深度學習并不能定義為一種仿生學性的技術, 因為其主要關注的是如何構建計算機系統(tǒng), 而生物神經學是致力于構建大腦如何真實工作的精確模型.
圖5 典型CNN結構Fig. 5 General CNN structure
3.1.1 信號調制識別
自動調制分類技術(Automatic Modulation Classification, AMC)是CR和其他非協(xié)作通信系統(tǒng)的核心難點技術之一, 其本質上就是一個分類問題. 調制識別算法主要有基于似然的和基于特征的兩種,前者理論性能是最優(yōu)的, 但較高的復雜性使其在真實電磁環(huán)境中很難有理想的魯棒性. 而傳統(tǒng)的基于特征的次優(yōu)分類方法嚴重依賴特征的選取. 特征選擇的復雜性和時間復雜度較高, 因此脫離專家工程的特征自學習模型在實際應用中具有重要意義. 近年來, 以CNN為代表的深度學習算法被證明可以實現高識別精度, 可有效降低專家特征的提取難度. 而當與深度學習方法相結合時, 基于特征的方法也將顯著提升性能, 獲得更高的效率和魯棒性, 雖然嚴格的基于特征的方法可能會隨著深度學習在信號智能應用中的推進而過時, 但現階段專家特征分析可以為深度學習算法提供有意義的預處理, 表2對此進行了歸納. 下面對現有模型進行簡要歸類.
表2 特征選擇與適用Tab. 2 Features selection and their characteristics
1. 基于IQ (In-phase and Quadrature)
直接從原始IQ樣本中對調制進行分類的技術不僅可以加快調制分類的速度, 而且可以釋放接收器中的資源用于其他任務. O’Shea等[21]直接將時域IQ樣本輸入到CNN, 在不同環(huán)境中自動學習其合適的分類器參數. West 等[32]分析了不同尺寸和深度的CNN架構的分類精度, 還提出了一種混合學習方案, 將CNN模型與LSTM相結合, 以獲得更好的分類性能. 由于CNN并不是專為無線通信場景應用的技術, 針對無線通信中的相位和頻率偏移, Yashashwi等[12]引入偏移校正模塊(Signal Distortion Correction Module, CM), 用調制識別前對信號的頻率和相位進行移位, 沒有用到任何額外的先驗知識. CM模塊權值可微, 可實現CM+CNN的端到端協(xié)同訓練. 考慮到接收的信號可能來自不同的信道, Gu等[18]將信道分為視距和非視距兩種基本類型, 采用兩個階段的CNN, 即第一階段對信道類型進行盲識別, 第二階段依據信道類型分別匹配一個針對訓練的調制識別網絡; 仿真結果表明, 在信道狀態(tài)不唯一的場景下, 一般的模型識別精度會大大降低.
輸入端接在原始IQ樣本上做出分類決策可以降低系統(tǒng)復雜性, 并且無須專業(yè)設計的變換和特征提取. 但在實踐中, 射頻環(huán)境通常非常密集, 因此在執(zhí)行分類之前, 接收機必須首先檢測并隔離每個目標信號. 這種檢測和隔離過程引入的錯誤將尤其影響僅使用原始IQ樣本的CNN的準確性, 該過程引入了兩種主要的誤差形式, 即中心頻率偏移和采樣率偏移. Hauser等[70]的試驗結果表明, 規(guī)模越大的神經網絡越易受到此類誤差的影響.
2. 基于星座圖
一些基于同相和正交分量樣本訓練的CNN模型, 在識別16QAM(Quadrature Amplitude Modulation)波形和64QAM波形時識別率下降明顯[71]. 通過將信號樣本映射到復平面上的散射點, 星座圖已被廣泛用作調制信號的二維表示. 針對QAM波形, Wang等[14]單獨設置了一個CNN用于識別QAM類波形,他們把訓練集改為QAM波形的星座圖, 這樣即使在信噪比低的情況下也能對QAM波形進行有效的分類. 星座圖為表示信號的基本結構和不同調制方式之間的關系提供了一種較為直觀的方法,CNN能夠在不知道任何其他參數的情況下處理星座圖, 這里調制識別任務便轉向了圖像識別[20]. 為了在分類性能和計算成本之間取得平衡, Peng等[25]選取星座圖中心部分較小的區(qū)域作為輸入, 在識別性能上仍然優(yōu)于常見的基于累積量和基于SVM的方法. 此類方法在處理較高階數的幅度相位調制信號時有更好的性能, 缺陷是因多徑衰落而引起的碼間串擾會影響星座圖的恢復, 所以對信道盲均衡的要求比較苛刻.
3. 基于循環(huán)譜
循環(huán)平穩(wěn)性是大多數信號固有的物理特征性, 對噪聲和干擾具有很強的魯棒性. Li等[22]提出了一種甚高頻(Very High Frequency, VHF)信號調制分類方法, 即將接收到的信號轉換為循環(huán)譜, 然后將去噪處理后的頻譜圖像輸入到CNN模型中進行自學習, 訓練分類器識別調制格式. 針對基于循環(huán)譜特征的識別算法性能會隨著調制階數的增多而明顯下降的問題, Wu等以一個雙路小規(guī)模CNN, 通過合理的目標函數參數設置, 將同一信號的循環(huán)譜和星座圖特征相融合[17], 該方法具有計算效率高、神經網絡精簡等特點, 缺點就是需要檢測信號的先驗特征.
4. 基于時頻譜
時頻變換在表征時變信號方面起著重要作用, Zhang等[11]提出的基于CNN+MLP的自動波形識別模塊, 相較于一些基于循環(huán)平穩(wěn)的信號識別方法, 在噪聲環(huán)境下可識別多達8種CR波形, 該方法是先對感知信號進行CWD (Choi- Williams time-frequency distribution)變換, 轉化為時-頻2D圖譜并二值化, 然后保留圖譜形狀而省略其強度, 其中, 噪聲在圖中往往表現為長條狀直線, 寬度在3個像素點之內. 利用圖像形態(tài)學算法等方法可有效提升其信噪比, 圖像預處理流程如圖6所示. Gao等[13]嘗試格納-維爾變換在不同核函數下時頻圖的特征融合, 利用主成分分析法確定權值, 得到了更全面的圖像細節(jié)信息. Zhang等[15]選用短時傅里葉變換對接收信號進行轉換, 并采用小波的分解重構在信號輸入CNN前對信號降噪. 小波變換亦可以提供信號的頻率和與這些頻率相關的時間信息, 基于此的CNN調制分類器進一步提高了在不同信噪比、衰落信道和頻移場景下的識別率[23]. 基于信號的瞬時特性, Nadeem等[24]采用異步時延抽頭采樣訓練集, 利用多層神經網絡結構進行調制識別, 此類模型適合處理間隔較長或時延較大的時間序列數據. 以上這些以簡單的專家特征用作神經網絡的輸入, 可以實現較高的分類精度. 鑒于原始IQ樣本必須在分類之前進行處理, 因此可能會增加接收器的復雜性, 尤其是在深度神經網絡規(guī)模較大的時候.
圖6 頻譜圖像形態(tài)學預處理[11]Fig. 6 Morphological preprocessing of spectral images[11]
需要密切關注的是, 深度學習技術已顯示出容易受到對抗性機器學習技術攻擊的勢頭, 尤其是考慮將深度學習用于無線電信號調制分類任務的時候, 此類算法極易遭受對抗性攻擊. Sadeghi等[26]嘗試對基于CNN的調制識別網絡進行白盒和黑盒攻擊, 結果顯示, 這些攻擊可以很小的輸入擾動來大大降低分類性能. 與傳統(tǒng)的干擾情況(攻擊者僅發(fā)送隨機噪聲)相比, 這類對抗性攻擊所需的發(fā)射功率更小, 因此在以后的研究應當對此加以關注.
3.1.2 頻譜感知
頻譜感知是CR理論的重要組成部分, 是CR首先要解決的問題(Fundamental Problem in CR),眾多的CR及頻譜感知相關文獻中多有此類陳述. 主用戶在認知系統(tǒng)中具有絕對的優(yōu)先地位, 這就需要從用戶的頻譜感知高度可靠. 但是, 感知器接受信號的強度會因多徑效應和陰影衰落等信道因素而降低; 而且, 噪聲加其他從用戶干擾的不確定性也會限制感知的魯棒性[72]. 所以, 可靠準確的頻譜感知技術一直是CR研究領域的熱點.
如果PU信號脈沖波形、調制類型和幀結構等一系列信息先驗可知, 匹配濾波器檢測可以使用似然比實現最佳檢測性能. 然而, 在實際應用中并不總是能夠獲得PU信號和噪聲的先驗信息. 所以, 許多學者關注于半盲的檢測方法, 如能量檢測(Energy Detection, ED)、最大特征值檢測(Maximum Eigenvalue Detection, MED)等, 它們只需要噪聲功率的知識. 這類半盲法的性能在很大程度上取決于對噪聲功率的準確判定. 而在非合作通信中, 依賴先驗知識的方法很難適用. 有學者又提出了全盲檢測方法, 包括盲能量合并檢測(Blind Combined Energy Detection, BCED)、協(xié)方差全值檢測(Covariance Absolute Value, CAV), 最大最小值算法(Maximum Minimum Eigenvalue, MME)等. 所有這些全盲方法都不需要任何先驗知識, 因此對噪聲不確定性具有很強的魯棒性. 然而, 它們的性能比半盲方法稍差[54], 且很多仿真多假設CR用戶天線數趨向無窮. 表3梳理了部分基于深度神經網絡(DNN)頻譜感知模型所依賴的先驗知識情況, 其中, 噪聲模型多為零均值的高斯噪聲.
表3 一些基于深度神經網絡的頻譜感知模型需要的先驗知識Tab. 3 Prior knowledges that some DNN based spectrum sensing models needed
CNN廣泛應用于圖像識別和語音識別, 具有良好的分類性能, 利用CNN來解決頻譜感知可以看作是一個二元假設的檢驗問題. Zhang等[11]在進行波形識別時, 利用二維時頻圖對各種信號進行表征,然后進行信號識別. 然而, 圖像化的原始信號不可避免地會丟失一些信息, 從而影響分類結果.
基于能量和循環(huán)平穩(wěn)特征, Tang等[58]較早探討了多層的神經網絡的頻譜感知算法; Han等[52]在此基礎上引入CNN模型, 在–20 dB范圍內具有比循環(huán)平穩(wěn)特征檢測(Cyclostationary Feature Detection,CFD)更高的檢測概率; Liu等[51]在已知充足的PU信號幀結構信息下, 提出了有對抗性訓練數據庫的CNN, 旨在實現有嚴重噪聲污染和信道衰落的頻譜感知. 不足的是, 循環(huán)平穩(wěn)值和幀結構信息是基于PU的先驗知識, 這在實踐中并不總是可用的, 因此, 這些方法易受到建模不確定性的影響. 此外,樣本數量和檢測性能正相關. 然而, 隨著接收信號長度的增加, 這可能導致感測時間和復雜性的進一步增加. 必須找到感測時間和性能檢測之間的平衡, 以降低這種疊加的復雜性, 這對于算力嚴格受限的設備尤其重要.
Liu等[54]使用樣本協(xié)方差矩陣作為輸入來生成測試統(tǒng)計量, 設計了一個以最大后驗概率(Maximum Posterior Probability, MAP)為代價函數的CNN模型; 并根據奈曼-皮爾遜引理推導了基于CNN的頻譜感知似然比檢驗方法, 證明了CM-CNN方法等價于i.i.d (Independently Identically Distribution)模型下的最優(yōu)的估計相關(Estimator-Correlator)檢測器; 同時在檢測性能、信噪比魯棒性、可擴展性和復雜度方面進行了大量的實驗. 結果表明, 無論PU信號是獨立的還是相關的, CM-CNN方法都可以獲得與最優(yōu)E-C檢測器幾乎相同的性能, 且不需要任何先驗信息. 他們的這篇論文應是第一篇對基于CNN感知方法的理論分析. Ke等[59]在進行頻譜感知時, 引入類似自然語音處理的CNN+LSTM+DNN結構網絡, 實現了盲感知, 從而可以有效克服前述方法易受建模不確定性影響的缺陷, 其中CNN和LSTM分別提取信號的頻域和時域相關特征; 不過基于協(xié)方差的預處理過程是最復雜的.
由于每個從用戶所處的網絡環(huán)境不同, 信道條件也不同, 在協(xié)作感知體系(CSS)中, 從用戶之間共享感知信息, 融合中心對各節(jié)點感知信息進行聯合判決, 并對可用信道進行統(tǒng)一分配, 在提高了感知精確度的同時也降低了對單個節(jié)點的感知能力要求[73]. 較常見的數據融合方式是集中式硬融合方式中的“或”準則、“與”準則和“K 秩”準則. Do等[49]提出的基于CNN的聯合頻譜感知技術, 融合中心以記錄的歷史判決數據訓練CNN模型, 以此進行判決, 其性能優(yōu)于上述的幾種硬判決方式且其控制信道開銷少于軟判決; 然而, 其并沒有對不同空間位置上的陰影衰落、路徑損耗和多徑衰落指數進行專門的研判, 沒有充分發(fā)揮合作感知的優(yōu)勢[74]. Lee等[53]發(fā)展了Do等的工作, 彌補了這一問題, 拓寬了輸入矩陣的維度, 豐富了數據集的有效特征; 驗證了節(jié)點能量感知加CNN數據融合的深度感知模型在節(jié)點位置時變場景下的可行性.
多輸入多輸出被認為是5G無線通信系統(tǒng)中最有前途的技術之一, 并且在未來的動態(tài)頻譜接入具有前景[75]. 如果波束成形CR技術與CNN相結合, 將可發(fā)揮CNN易于處理多維化數據結構的優(yōu)勢.CNN模型變種繁多, 對于頻譜感知, 如何搭建結構合理層次精簡的網絡是急需解決的課題, 這需要對CNN與頻譜感知的結合做進一步的理論推導. 前面提到, Liu等[54]已經做開始了一些工作. 在CR中,不守規(guī)則或純惡意的用戶可以修改其空中接口以模仿主要用戶. 射頻指紋識別旨在通過表征發(fā)射器發(fā)射的模擬信號中存在的特定于設備的特征來識別發(fā)射器, 對抗性機器學習技術的出現使得我們需要在未來的頻譜感知工作中增加抗干擾的研究.
3.1.3 資源分配
CR的主要特征就是能夠通過對操作環(huán)境的感知而改變發(fā)射機參數, 偵聽頻譜中是否有空間容納非授權用戶進行通信, 而不干擾該頻段執(zhí)牌用戶的正常通信. 從廣義上講, “認知無線電”這個術語可以是指實現這一技術目標的各種解決方案. 這些解決方案試圖以盡可能不影響頻譜主用戶的方式, 將次要用戶的信號與主要用戶的信號交織(Interweave)、覆蓋(Underlay)、重疊(Overlay)在一起,CR設備可以是在以上3種工況下運行. 在交織模式下, 次用戶通過頻譜感知尋找空穴進行信號傳輸.而在譜覆蓋模式中, 允許非授權用戶與執(zhí)牌用戶傳輸同時同頻進行, 就像超寬帶(Ultra Wide Band,UWB) 系統(tǒng)一樣. 次級無線電通過足夠大的帶寬傳播信號, 以確保對主要用戶造成的干擾量在可容忍的范圍內[76]. 因此, 引入了干擾溫度的概念來確定主接收機的可容忍干擾水平[77]. 如果采用有效的頻譜管理和資源分配技術, 這種模式可以顯著提高頻譜利用率.
資源分配分為頻譜分配和功率分配兩類. 在Underly模式中, 主要研究的是發(fā)射機的功率分配.在以往的資源分配研究中, 公式化的優(yōu)化問題通常是非凸的, 它們通常使用需要大量迭代計算的對偶分解技術來求解, 這也阻礙了該技術方案的實際應用拓展. 而CNN可以使我們在不需要顯式解決復雜優(yōu)化問題的情況下, 為通信系統(tǒng)找到最優(yōu)控制策略. 此外, 考慮到經過訓練的CNN模型的層數適中, 可以用較低的計算時間, 處理一些對實時性要求較高的問題[78].
Lee[60]提出了一種基于CNN的多信道認知無線網絡功率資源分配算法, 算法損失函數的設計考慮了非授權用戶的整體頻譜效率, 也考慮了對授權用戶的干擾量, 這樣CNN便可自主學習資源分配策略以最大化頻譜效率, 同時不超過對授權用戶干擾量的閾值. 其所提出的CNN模型由全連接的兩個子模塊組成, 分別計算各非授權發(fā)射機歸一化總發(fā)射功率和對每個子信道的功率配比, 由此便可得到一個N×K的功率分配矩陣(N為非授權發(fā)射機個數,K為已分配子信道個數). 為了對CNN進行訓練, 必須首先收集大量的信道增益樣本. 歸一化樣本向量為兩個子網絡的輸入, 非歸一化的信道增益可能致使網絡的訓練時間變長和精度下降. 在實際應用中, 信道增益可能是不準確的, 但層數適中且經過訓練的CNN模型在這種存在有信道增益誤差的情況下一般也可以具有相對穩(wěn)定的性能, 也就是說CNN模型方案對不準確的信道信息具有很好的魯棒性.
由于CNN對大量完備標記的訓練數據的依賴, 使得其在資源分配中的應用形式還不夠靈活. 近年來, 更多的實驗傾向于將強化學習引入到CR的資源分配中, 強化學習理論中的一個稱為回報函數的基本概念也與資源分配的效用最大化理念相契合[79-81]. 經典的強化學習的缺陷是用表格來存儲每一個狀態(tài)和在這個每個行為的Q值. 而當狀態(tài)空間和動作空間較大時 (如多用戶和大帶寬的資源分配).如果全用表格來存儲它們, 將有較大的內存和網格搜索壓力. DRN是強化學習和深度學習技術的結合, 而其中(DeepQNetwork, DQN)是CNN和Q-Learning的結合, CNN的輸入是原始多維矩陣數據, 輸出是每個決策所對應的價值評估(Q值). 通過神經網絡分析后得到動作的Q值, 省去了在表格中記錄Q值. 已經有研究將DQN應用于動態(tài)資源分配[61-62]; 缺陷是它需要通過反復迭代與環(huán)境進行大量的交互, 從而又導致較大的功耗和傳輸延遲. 針對DQN的隨機經驗回放, Wang等[82]引入有優(yōu)先級的經驗回放, 即讓不同的數據擁有不同的優(yōu)先級, 以此加速收斂速度. 更多關于DQN的發(fā)展可以參照劉全等[83]的綜述. 深度強化學習有望成為未來CR資源分配策略研究的新思路.
遞歸神經網絡(Recurrent neural network, RNN)最初由Pollack于1990年提出, 已用于語言建模中長度不固定的遞歸數據結構的表征[84], 其結構見圖7所示. 有別于其他前饋型機器學習算法, 數據流只向一個方向流動, 即輸入到輸出. RNN是一種具有記憶的神經網絡算法. 由于具有內部存儲組件,當前狀態(tài)不光取決于當前時刻的輸入, 還與之前時刻的狀態(tài)相關, 如圖7a)所示. 圖7b)中, 可以看到,t時刻的輸出取決于輸入Xt及上一時刻狀態(tài)St–1. 所以, RNN及其變種在處理序列型數據, 如音頻、視頻、文本等具有較強前后關聯性的數據時展現了優(yōu)異的性能. 此外, RNN還能對連續(xù)數據進行預測, 這是其他前饋型神經網絡所不能的.
圖7 遞歸神經網絡結構Fig. 7 Recursive neural network structure
RNN在時間序列上所能處理的長度理論上是沒有限制的. 但是當它在處理長期依賴問題, 即當前預測位置與相關信息較遠時, RNN會喪失學習這種相關信息的能力. 另外, 傳統(tǒng)的RNN網絡訓練相對困難, 易出現梯度消失或梯度爆炸等問題[85]. 針對這些問題, Hochreiter等[86]于1997年提出了長短時記憶網絡(LSTM), 以改進其單元結構. 圖8所示為RNN與LSTM單元結構對比: 圖8a)為經典RNN單元結構圖, 只有一個tanh層; 圖8b)所示, LSTM單元添加了額外的門結構單元來控制當前時刻的輸入對網絡的影響, 信息流中只進行少量線性交互, 從而更容易實現長期信息的記憶, 且模型更易于收斂.
圖8 RNN與LSTM單元結構對比Fig. 8 RNN and LSTM unit structure
神經網絡(Neural Network, NN)的性能受一系列超參數(Hyper-parameter)設置的影響. 所謂超參數, 指在開始神經網絡開始訓練之前就設置的參數. 超參數的設置其依賴于工程師們豐富的經驗,其對網絡性能是一個綜合的影響, 不能單獨優(yōu)化. Mackay[87]研究了統(tǒng)一貝葉斯框架下的反向傳播學習, 提出了超參數和模型結構的選擇方法. 另一種經典方法是交叉驗證. Utsugi[88]研究發(fā)現, 交叉驗證方法傾向于復雜結構, 而經驗貝葉斯方法傾向于簡單結構, 且交叉驗證的計算時間較長. 此外, 較經典神經網絡的超參數選擇方法還有啟發(fā)式算法(Heuristic Selection)、L曲線法(L-Curve)和廣義交叉驗證(Generalized Cross-Validation)等[89].
當前頻譜感知和頻譜預測是探測CR中可接入頻譜的兩種方法. 由于設備限制, 在一個時隙內感知機只能感知部分頻帶. 而且無差別的全頻段感知也會浪費感知能量并需要更多時間, 不僅使得探測到頻譜空穴的機會變少, 而且也浪費了頻譜空穴存在的時隙[90-92]. 導致非授權用戶的頻繁搬移, 甚至會產生與授權用戶的沖突[93]. 為了解決這一問題, 非授權用戶首先根據信道歷史狀態(tài)對下一時刻信道狀態(tài)進行預測. Ding等[94]驗證了頻譜使用狀態(tài)預測的可行性. 感知機針對性地對預測為空閑的頻譜進行感知, 達到既節(jié)省了感知能量又能更快感知到可用信道的目的[95], 如圖9所示[38].
圖9 基于預測的頻譜接入時序結構Fig. 9 Timing structure based on the predicted spectrum access
在某一時隙中可能是主用戶在使用該段頻譜, 也可能是其他非授權用戶正在借用該頻段進行通信, 甚至可能是偽裝成主用戶的惡意信號(Merchant等[50]設計的CNN偽裝用戶檢測模型, 在信噪比理想的情況下檢出概率可達93%以上).
在CR網絡中, 主用戶的頻譜使用呈現很強的規(guī)律性. 對主用戶活動規(guī)律的學習及預測, 更具針對性. Hernández等[37]提出的基于LSTM的主用戶行為預測模型, 提高了GSM(Global System for Mobile Communications)和Wi-Fi下主用戶未來行為的預測精度. 相對于其他預測模型, LSTM在不同主用戶活躍度情況下都有穩(wěn)定的預測精度. 對于共享頻譜的多個信道, Zuo 等[38]根據每個PU的歷史活動規(guī)律, 確定各信道的最優(yōu)感知接入區(qū)間, 作為LSTM預測長度: 若預測結果為“ 1 100···”, 代表PU活動將結束; “00···1 ”表明PU將開始占用. 由此提出了一種基于時域最優(yōu)頻譜感知區(qū)間和頻域信道選擇相結合的新型頻譜接入策略, 以期提高網絡的吞吐量, 降低頻譜感知的能耗.
與預測時隙數增多相對的, 也伴隨著RNN層數的加深. Tang等[48]提出了利用擴展卡爾曼濾波對DRNN進行訓練, 以克服普通RNN在輸入長序時梯度下降法收斂速度慢和梯度消失的問題. Agarwal等[47]將krigin統(tǒng)計空間插值和遞歸神經網絡的頻譜時間預測相結合, 形成空域+時域的信道占用估計模型. Yu等[36]從分類和回歸兩個角度構造基于LSTM的頻譜預測框架, 在優(yōu)化超參數設置時, 他們采用與田口法(Taguchi Methods)相結合的方法進行超參數的優(yōu)化, 有效地降低了對時間消耗和計算資源的要求. 田口法是一種正交試驗的設計方法, 起源于工程領域的質量控制, 其實驗結果表明: ①學習率對頻譜預測性能的影響最大; ②網絡的深度比網絡的寬度對網絡性能的影響更大; ③初始化器和激活函數對單譜點預測性能的影響都很小. 因此, 在設計LSTM進行頻譜預測時, 更注重的是學習速度和神經網絡的深度. 此外, LSTM高得多的算力消耗和復雜的網絡結構是實際應用中需要進一步考慮的問題.
現有基于RNN的預測算法, 其數據集采用滑動窗口構造, 在固定時間段內挖掘歷史數據, 預測下一時間段的頻譜狀態(tài). 作為補充, Yu等[46]提出了基于有殘差網絡的CNN的高頻段頻譜預測架構, 輸入前一時段各頻點數據及前幾天相同時間段頻譜數據, 可以獲取頻譜數據在更長時間尺度上的規(guī)律.
與頻譜感知相似, 從單個SU度進行的頻譜占用預測在惡劣信道條件下同樣是不夠可靠的[96].Shawel等[41]研究了基于反距離加權(Inverse Distance Weight, IDW)插值加LSTM模型的協(xié)作頻譜預測, 以LSTM提供離散空間節(jié)點的時間維預測, 以反距離權重插值處理空間依賴關系, 實現了異構網絡的軟協(xié)作融合.
從前面的綜述可以發(fā)現, LSTM在頻譜預測上應用的缺陷在于, 盡管射頻信號具有在時間、頻率和空間上的相互依賴關系, 但現階段較少有基于遞歸神經網絡的應用程序能夠利用射頻數據的時空特性. 因為盡管LSTM已經被證明可以處理頻譜時域相關性以進行頻譜預測, 但是它很難保持數據序列上每一時隙的結構特性, 導致了信號空間特性被壓縮為占用與否或者功率水平. ConvLSTM是LSTM的一種演進, 改進的地方是輸入與各個門之間的連接由前饋式替換成了卷積, 同時狀態(tài)與狀態(tài)之間也換成了卷積運算, 從而不僅能夠進行時序建模, 還能夠像CNN一樣刻畫空間特性. Shawel等[42]針對距離馬德里市中心6 000 m以內的特定區(qū)域, 使用反距離加權(IDW)方法創(chuàng)建地域插值頻譜圖; Roy等[44]使用采集的原始射頻I/O信號作為每一時間片的輸入引入空間關系, 分別使用ConvLSTM進行了較長時間尺度上功率點評預測和占用預測.
不考慮信號空間特性的預測模型大體可分為占用與否的二值預測[37,45]和功率水平預測加門限判定[36,38,41,46-48]兩類: 前者的健壯性依賴輸入數據的準確性, 有錯誤的感知會被傳遞到神經網絡中, 從而導致錯誤的預測; 而后者對預測的功率值的判定也是一個難題, 因為簡單的閾值選擇很難將現實中信號和噪聲分開, 噪聲的隨機性對判斷精度會產生負面影響.
相對的考慮空時結構的ConvLSTM對環(huán)境變化的魯棒性更強. 盡管每個ConvLSTM計算單元內的權值是共享的, 但是過于復雜的結構導致了訓練時不易收斂. Omotere在相同的條件下對CNN和LSTM的頻譜預測研究顯示, LSTM達到最佳預測精度節(jié)點所需的時間窗口長度和相同的時間窗口長度的訓練收斂時間均多于CNN結構, 而在合適的窗口長度上, 收斂完成的LSTM結構表現出了更好的性能[43]. 復雜的訓練過程導致在使用規(guī)律多變的主用戶預測上靈活度欠缺.
目前, 大多數譜預測工作主要集中在短期預測上, 隨著預測時間的延長, 預測性能逐漸下降. 至于未來的工作, 可以考慮預測長度的增加. 當歷史頻譜數據出現異常時, 如何實現有效的頻譜預測, 如何減少異常和缺失數據對預測結果的影響也需要進一步的研究. 另外, 由于任意一個頻譜數據在時間、空間、頻率上與其臨近數據都有緊密的聯系, 未來可繼續(xù)延伸到時、頻、空多個維度, 利用這些內在關系來開展合作形式的預測工作將有利于提高數據計算效率、減少硬件開支, 從而以較低的代價獲得高精度的多個維度的頻譜數據.
DBN是另一種典型的深度學習算法, 由Hinton等[97]于2006年提出, 在自然語言處理(Natural Language Processing, NLP)和計算機視覺(Computer vision, CV)等領域獲得了廣泛的應用. 它是一種概率生成模型, 多用于非監(jiān)督學習和神經網絡的參數初始化. 如果用它執(zhí)行監(jiān)督學習任務, 可以在每層的RBM里增加表示分類的神經元, 并連接一個淺層分類器. 有關深度信任網絡在CR中的實踐應用相對較少, 在此只能作簡要介紹.
Zhang等[27]提出的波形分類模型, 采用無監(jiān)督貪婪算法對RBM進行預訓練, 得到的結果作為監(jiān)督學習訓練概率模型的初值, 監(jiān)督訓練集為I/Q數據. Mendis等[28-29]提出的DBN的認知無線電信號調制模式識別算法, 譜相關函數作為接收信號的特征表示, 即使存在環(huán)境噪聲, 也能達到較高的分類精度. 在CR中, 如何根據主要用戶的活動對其進行分類并預測其行為是其中的兩個關鍵挑戰(zhàn). Cui等[56]提出的基于DBN的深度學習算法在主用戶分類中的應用、在顯著減少標記數據的數量的同時, 比采用淺層學習等傳統(tǒng)策略的CRs引擎具有更好的識別率, 0 dB以上, 其檢測精度大于90%以上, 分類精度大于85%. 針對塊稀疏寬帶信號, Sun等[57]提出了一種基于RBM的協(xié)同貝葉斯壓縮譜檢測方法, 即使用貝葉斯壓縮感知模型來檢測寬帶稀疏信號, 然后利用RBM學習實現了基于多用戶恢復信號的融合決策.
自編碼機(AE)和限制性玻耳茲曼機(RBM)是深度學習中使用較多的兩種非監(jiān)督學習的神經網絡模型, 但它們通常并不直接用于解決非監(jiān)督學習問題, 而是通過非監(jiān)督學習找到更好體現數據內在規(guī)律的特征表示, 再用到監(jiān)督學習的深層神經網絡模型中, 常常被用于神經網絡的初始化及學習, 適用于下游分類的特征表示.
從本文的綜述可以看出, 有關深度學在CR中應用的探索起步于10年之內, 多數成果涌現于近3年. 在有些方面有持續(xù)研究的必要, 具體如下.
(1)從CR的角度, 神經網絡可以看作是一個可適應復雜信道環(huán)境的判別器; 而從深度學習的角度, 現有的CR的經典算法思想多可見于神經網絡的數據預處理過程. 深度學習流行的其中一個特點在于它能夠使人們以相對容易的方式去使用復雜的模型, 并且還能收獲不錯的效果. 可深度學習的種類繁多, 僅僅CNN模型就有眾多變種, 如LeNet、AlexNet、ResNet、VGG等, 它們已被證實在各自的任務中有著卓越的性能. 然而, 目前的工作理論性推導還不夠, 如何選擇合適的網絡結構還缺乏充分的理論依據. 深度學習與CR結合的廣度已經顯現, 但深度還亟待繼續(xù)突破.
(2)許多研究都采用的簡化的系統(tǒng)模型, 沒有對復雜的無線電環(huán)境進行綜合的考量, 比如噪聲模型是單一的、默認各節(jié)點位置信息接收信號強度分布已知, 而這在實際應用中是很難準確獲得的. 可以嘗試對發(fā)射機功率泄漏、譜相關、傳輸路徑損耗、信道多徑損耗, 以及突發(fā)噪聲等無線環(huán)境特性進行綜合考慮.
(3)現有研究的數據采多在1個月之內, 在研究場景更加真實化、模型復雜化的趨勢下, 需要對特定頻段進行更長時間尺度上的數據采集與整理. 深度學習近年來之所以快速發(fā)展, 變種繁多, 完備的公共數據集和統(tǒng)一性能評判標準或許是一個很好的推動力. 現階段在CR結合深度學習的研究中, 眾多研究者的方案在不同的數據集上表現了優(yōu)異性能, 或者很好地解決了他們所面臨的問題. 在較熱門的一般性的應用場景中建立完備的數據庫和性能評價指標, 或許有助于加深CR和深度神經網絡結合的深度, 從而有利于特殊和具體部署場景下的結合.
在如今頻譜資源緊缺及現有頻譜利用率的不足的矛盾局面下, 先前的眾多研究已經表明, CR顯然是解決這一矛盾的有效方法之一, 并且也取得了一定的理論成果. 本文簡要探討了深度學習技術在CR中的應用, 介紹了包括卷積神經網絡(CNN), 循環(huán)神經網絡(RNN), 深度信任網絡(DBN)等典型深度學習模型在CR中預測、感知、功率分配等場景的應用及存在的問題. 不難看出, CNN在挖掘信號射頻結構特征方面表現出了不錯的特性, 在無線電感知、識別方面表現優(yōu)異; 而遞歸神經網絡適用于挖掘無線電時間序列上的使用規(guī)律. 但應用場景并不絕對, 比如結合了卷積運算的ConvLSTM可以處理無線電用戶的結構和時序特征, 但復雜的卷積和遞歸運算網絡導致訓練不易收斂. 因其模型較高的復雜度和很好的多維數據的處理能力而傾向于在統(tǒng)一的融合中心部署. 由于對完備的有標記的訓練數據的依賴, CNN還較少應用于認知無線電的決策過程. 而結合獎勵機制的深度強化學習已將卷積網絡運用到認知無線電的資源分配算法. 在現實應用中, 海量數據的采集相對容易, 而對數據進行人工標注往往較為繁瑣. 深度置信網絡、自編碼機是深度學習中應用較為普遍的非監(jiān)督模型, 借助于非監(jiān)督模型找到更好體現數據內在規(guī)律的特征表示, 可以輔助監(jiān)督模型; 而只需少量樣本的半監(jiān)督模型亦可在認知網絡中應用, 以利用無法逐一標注的大量射頻數據, 從而增強模型的泛化能力.
目前CR的思想已在其他領域獲得實際應用[73], 雖然只是CR設想的一小部分功能, 但我們相信,CR所構想的全部功能將會逐步實現. 在此背景下, 將深度學習與CR相結合既是新的思路, 也是合理的趨勢.