王安義, 周孝銘
(西安科技大學 通信與信息工程學院, 陜西 西安 710054)
礦井無線通信系統(tǒng)對智能礦山建設起著至關重要的作用[1-2],但由于煤礦空間受限、環(huán)境復雜,電磁波傳輸過程中存在嚴重的反射、繞射、散射等現(xiàn)象,使得建立可靠的礦井無線通信系統(tǒng)面臨較大困難[3-4]。礦井巷道場強覆蓋大小直接影響礦井無線通信系統(tǒng)性能,因此在井下基站建成之前,了解基站在礦井巷道的電磁波傳播路徑損耗規(guī)律,提高場強預測精度,有助于合理規(guī)劃基站位置和基站覆蓋范圍,避免出現(xiàn)網絡覆蓋盲區(qū)或網絡資源浪費等情況。
國內外研究人員對場強預測方法進行了大量研究。文獻[5-7]建立了基于幾何光學法的射線追蹤模型,用射線來近似等價電磁波,其優(yōu)點是能夠得到巷道中過渡場和穩(wěn)態(tài)場的所有信息,但缺點是在預測遠場區(qū)場強時要考慮較多的鏡像級數,導致算法復雜度增加。文獻[8-9]提出了利用三維射線跟蹤法進行場強預測,但數據測量需要消耗大量人力和時間,且建模過程較為復雜。文獻[10-11]對室內走廊環(huán)境中2.4 GHz無線信號的路徑損耗進行分析,提出了單斜率和雙斜率模型,但其在受限空間下擬合效果不理想,場強預測精度較低。文獻[12-14]建立了基于支持向量機(Support Vector Machine,SVM)的礦井無線信道大尺度和小尺度場強預測模型,并利用最小二乘法和遺傳算法對SVM參數進行了優(yōu)化,但面對大規(guī)模訓練樣本時,SVM算法需要不斷迭代參數,增加了計算復雜度和訓練時間。
近年來,神經網絡逐漸應用于場強預測[15-16]。文獻[17]針對室內毫米波信道建立了BP神經網絡路徑損耗模型,但只適用于短距離傳輸場景,且與實際路徑損耗對比,預測誤差大。卷積神經網絡(Convolutional Neural Network,CNN)是一種具有深度結構的前饋神經網絡,本文對CNN進行改進,利用批量歸一化(Batch Normalization,BN)層代替池化層,可保留有效數據特征;利用改進CNN建立礦井巷道場強預測模型,可加快模型收斂速度,達到降低計算復雜度、提高場強預測精度的目的。
礦井信道大尺度衰落是指移動接收端在一定的距離范圍內移動時,由于巖石、機車、風門等障礙物對電磁波的遮擋所造成的電磁波傳播陰影而引起的衰落,其主要受收發(fā)端距離和周圍地物環(huán)境的影響。
結合電磁波傳播理論及其實際傳播特性,利用路徑損耗來表示巷道場強變化。收發(fā)端距離在百米至千米之間變化時,接收信號強度隨著傳播距離增大呈衰減趨勢,其路徑損耗為
(1)
以電磁波水平極化方式為前提[14],考慮各種環(huán)境因素對電磁波傳播衰減的影響,得出礦井巷道中電磁波信號水平極化衰減總損耗:
LdB=LE+Lα+Lt
(2)
式中:LE為水平極化模式損耗;Lα為巷道壁粗糙度損耗;Lt為巷道壁傾斜度損耗。
聯(lián)合Maxwell及Helmholtz波動方程,通過模式匹配法推導出水平極化模式損耗:
(3)
式中:f為天線工作頻率;dz為收發(fā)端距離;p,q分別為巷道的寬度和高度;ε1,ε2分別為巷道兩壁和頂壁的相對介電常數。
礦井巷道壁的粗糙度函數符合高斯分布,可得巷道壁粗糙度損耗[18]:
(4)
式中α為巷道壁粗糙度。
巷道壁傾斜度損耗[18]為
Lt=4.343π2θ2dzf
(5)
式中θ為巷道壁傾斜度。
由式(2)—式(5)可知,電磁波在巷道中的傳播主要受天線工作頻率,收發(fā)端距離,巷道截面尺寸,巷道壁粗糙度、傾斜度、相對介電常數等因素的影響。
傳統(tǒng)CNN由卷積層和池化層組合來提取原始數據特征,其結構如圖1所示。
圖1 CNN基本結構Fig.1 Basic structure of CNN
礦井巷道環(huán)境復雜且數據之間有較強的非線性關系,原始數據特征無法很好地反映巷道場強變化,因此需要提取原始特征中有效信息進行場強預測。本文在傳統(tǒng)CNN基礎上,在每個卷積層后加入BN層來代替原有的池化層(圖2),以避免池化層下采樣導致的數據特征丟失,削弱模型擬合程度??紤]到所設計的網絡模型規(guī)模較小,利用BN層可避免網絡過度擬合,加快網絡收斂。
圖2 改進CNN結構Fig.2 Improved CNN structure
通過分析確定天線工作頻率f,矩形巷道寬度p、高度q,巷道壁粗糙度α、傾斜度θ、相對介電常數ε,收發(fā)端距離dz共7個礦井巷道電磁波傳輸影響因素作為原始數據特征,構建維度為1×7×1的輸入向量X=(f,p,q,α,θ,ε,dz)。
卷積層通過卷積核對輸入向量X進行卷積運算,提取數據特征h。卷積層1采用數量為20、尺寸為1×3的卷積核,卷積層2采用數量為10、尺寸為1×2的卷積核。
h=w*X+b
(6)
式中:w為卷積層權重;*表示卷積運算;b為卷積層偏置。
激活層將數據特征進行非線性映射,提取數據中復雜的非線性特征。本文激活層采用ReLU函數對h進行非線性變換,使訓練后網絡中的部分神經元輸出為0,避免過擬合。
ReLU(h)=max(0,h)
(7)
BN層對每個卷積層采用均值方差法進行處理,讓每一層卷積的輸出保持相似分布,提高網絡泛化能力。
(8)
(9)
(10)
(11)
全連接層將前面提取到的特征綜合起來并展開為一維向量,獲取路徑損耗預測值。最后通過回歸層計算預測值和真實值的均方誤差,優(yōu)化預測結果。
基于改進CNN的礦井巷道場強預測具體步驟如下。
(1) 數據預處理。對仿真生成的路徑損耗數據進行預處理,剔除異常數據,并對數據進行歸一化處理。將處理后的數據按照6∶4的比例劃分為訓練集和測試集,構造輸入向量。
(2) 參數初始化。設置改進CNN中卷積層權重w、偏置b為隨機數;初始學習率η為0.001,且每經過5輪將學習率降低0.2倍;優(yōu)化器選用Adam函數;最大迭代次數為100,閾值誤差為0.000 1。
(3) 輸入層輸入訓練集,通過卷積層計算提取數據特征,BN層使數據保持相似分布,最后經過全連接層將特征展開為一維向量,計算路徑損耗預測值。
(5) 判斷是否滿足訓練結束要求。當誤差達到閾值或迭代次數達到最大時,執(zhí)行步驟(7),結束訓練;否則繼續(xù)執(zhí)行步驟(6)。
(7) 保存最優(yōu)網絡參數,基于改進CNN的礦井巷道場強預測模型訓練完成。
(8) 通過測試集對訓練所得模型進行性能評估。輸入測試集,輸出路徑損耗預測值,并與真實值進行對比,評估模型擬合程度。
實驗平臺配置:Intel Core i7中央處理器;16 GB內存;Matlab2020。
仿真實驗采用矩形巷道,仿真參數設置見表1。
表1 仿真參數Table 1 Simulation parameters
沿巷道長度方向均勻劃分501個點進行測量,且每個點記錄10次數據??紤]到礦井環(huán)境復雜,為保證數據的有效性,將異常數據剔除,對數據進行歸一化處理,得到5 010個路徑損耗值。礦井巷道路徑損耗分布如圖3所示,可看出收發(fā)端距離越遠,路徑損耗越嚴重,表征了礦井信道大尺度衰落的趨勢。選取收發(fā)端距離為0~299 m時對應的3 000個數據作為訓練集,收發(fā)端距離為300~500 m時對應的2 010個數據作為測試集。
圖3 礦井巷道路徑損耗分布Fig.3 Path loss distribution of mine roadway
CNN模型(2層卷積+2層池化)與改進CNN模型的擬合效果對比如圖4所示。可看出CNN模型的預測結果整體上符合場強變化規(guī)律,但抖動現(xiàn)象嚴重,尤其當收發(fā)端距離為460~500 m時,抖動較為劇烈,無法很好地貼合實際值,原因是傳統(tǒng)CNN模型的池化層會丟掉對預測有用的特征向量;改進CNN模型能夠更加準確地預測場強,預測值和實際值的契合度較好,表明該模型具有較強的魯棒性。
圖4 CNN改進前后預測結果對比Fig.4 Comparison of prediction results before and after CNN improvement
為進一步驗證改進CNN模型的有效性,與BP神經網絡模型(含有2個隱藏層,神經元個數為6,迭代次數為10 000)和SVM模型(正則化參數γ=8.206,核函數參數σ=0.089 1)進行對比。利用相同的實驗數據分別對BP神經網絡模型、SVM模型和改進CNN模型進行回歸分析,結果如圖5所示??煽闯鯞P神經網絡模型在收發(fā)端距離為360~380 m時過擬合現(xiàn)象嚴重,陷入局部最小值;相比于BP神經網絡模型,SVM模型的預測性能有了一定的提高,但當收發(fā)端距離較大時,預測值偏離實際值較大;改進CNN模型的預測值與實際值的匹配度最高。
圖5 不同模型預測結果對比Fig.5 Comparison of prediction results of different models
3種模型預測的路徑損耗誤差如圖6所示??煽闯龈倪MCNN模型預測誤差明顯小于其他2種模型,最大絕對誤差在0.4 dB以下,表明改進CNN模型能有效提高預測精度。
圖6 不同模型預測誤差對比Fig.6 Comparison of prediction errors of different models
采用平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和相關系數作為模型預測性能評價指標。MAPE描述礦井巷道場強變化的整體預測效果,是評價模型預測效果的主要依據,其值越小,表明預測效果越好;RMSE和MAE分別側重場強變化劇烈和變化平穩(wěn)時的預測誤差,其值越小,表明預測效果越好;相關系數反映預測值和實際值的偏差,其值越接近1,表明預測精度越高。
3種模型預測性能評價指標結果對比見表2。可看出改進CNN模型的MAPE,RMSE,MAE均比BP神經網絡模型和SVM模型小,而相關系數最高,表明改進CNN模型能有效提高預測精度。
表2 不同模型預測性能評價指標結果對比Table 2 Comparison of prediction performance evaluation index results of different models
建立了基于改進CNN的礦井巷道場強預測模型。通過分析礦井巷道大尺度衰落下影響電磁波傳播的因素,將天線工作頻率、巷道截面尺寸、巷道壁粗糙度、巷道壁傾斜度、巷道壁相對介電常數、收發(fā)端距離作為模型輸入;通過改進CNN結構,即在每個卷積層后加入BN層代替池化層,在保證不丟失有效特征條件下降低了網絡復雜度且易于訓練,實現(xiàn)了網絡結構輕量化。仿真結果表明,與CNN模型、BP神經網絡模型及SVM模型相比,該模型預測精度更高,具有較強的魯棒性。