雒 騰 張德鑫 桂貝貝 曾志勇
(云南財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,云南 昆明650000)
運(yùn)營(yíng)商在部署5G 網(wǎng)絡(luò)的過(guò)程中,需要合理地選擇覆蓋區(qū)域內(nèi)的基站站址,進(jìn)而通過(guò)部署基站來(lái)滿足用戶的通信需求[1]。而在整個(gè)無(wú)線網(wǎng)絡(luò)規(guī)劃流程中,高效的網(wǎng)絡(luò)估算對(duì)于精確的5G 網(wǎng)絡(luò)部署有著非常重要的意義, 無(wú)線傳播模型正是通過(guò)對(duì)目標(biāo)通信覆蓋區(qū)域內(nèi)的無(wú)線電波傳播特性進(jìn)行預(yù)測(cè), 使得小區(qū)覆蓋范圍、小區(qū)間網(wǎng)絡(luò)干擾以及通信速率等指標(biāo)的估算成為可能。
本文數(shù)據(jù)來(lái)源于“華為杯”第十六屆中國(guó)研究生數(shù)學(xué)建模競(jìng)賽,賽題提供的數(shù)據(jù)集包含多個(gè)小區(qū)的工程參數(shù)數(shù)據(jù)、地圖數(shù)據(jù)和RSRP 標(biāo)簽數(shù)據(jù), 其中工程參數(shù)數(shù)據(jù)記錄了各小區(qū)站點(diǎn)的工程參數(shù)信息,地圖數(shù)據(jù)記錄地形地貌等信息。RSRP 簽代表平均信號(hào)接收功率, 單位為dBm. 并將弱覆蓋判決門限Pth的值定為-103 dBm.若RSRP 預(yù)測(cè)值或?qū)崪y(cè)值小于Pth則為弱覆蓋,若大于等于Pth則為非弱覆蓋。
華為競(jìng)賽平臺(tái)希望我們站在設(shè)備供應(yīng)商與無(wú)線運(yùn)營(yíng)者的角度,合理地運(yùn)用機(jī)器學(xué)習(xí)來(lái)建立無(wú)線傳播模型,來(lái)對(duì)不同地理位置的RSRP 柵格的平均信號(hào)接收功率進(jìn)行預(yù)測(cè), 并有效識(shí)別出弱覆蓋區(qū)域, 幫助運(yùn)營(yíng)商精準(zhǔn)規(guī)劃和優(yōu)化網(wǎng)絡(luò)從而提升客戶體驗(yàn)[3],其中使用均方根誤差來(lái)作為RSRP 預(yù)測(cè)的評(píng)價(jià)標(biāo)準(zhǔn),為有效測(cè)試目標(biāo), 還將弱覆蓋識(shí)別準(zhǔn)確率作為識(shí)別弱覆蓋區(qū)域的評(píng)價(jià)指標(biāo)。
高效的機(jī)器學(xué)習(xí)模型建立依賴于輸入變量與問(wèn)題目標(biāo)的強(qiáng)相關(guān)性, 因此我們通過(guò)文獻(xiàn)資料查找可能影響無(wú)線發(fā)射機(jī)信號(hào)的因素[4],并通過(guò)模型以及大賽數(shù)據(jù)信息去設(shè)計(jì)出合適的特征變量,主要從兩個(gè)角度去設(shè)計(jì)可能影響的特征變量,即幾何位置、經(jīng)驗(yàn)信道模型涉及參數(shù),最終構(gòu)造出了7 個(gè)新特征如表1 所示。
2.3.1 幾何位置
對(duì)于影響無(wú)線發(fā)射機(jī)信號(hào)傳播的因素, 我們可以根據(jù)已知的幾何位置來(lái)挑選合理的特征. 目標(biāo)柵格與發(fā)射機(jī)的地理位置關(guān)系如圖1 所示。
a.目標(biāo)柵格與發(fā)射機(jī)的距離
表1
圖1
b.目標(biāo)柵格與信號(hào)線的相對(duì)高度
c.天線與目標(biāo)柵格的距離
d.天線與目標(biāo)柵格相對(duì)高度的距離
e.發(fā)射機(jī)信號(hào)的強(qiáng)度
f.發(fā)射機(jī)所在柵格與目標(biāo)柵格海拔差
2.3.2 經(jīng)驗(yàn)信道模型涉及參數(shù)
a.發(fā)射機(jī)的有效高度
b.場(chǎng)景糾正常數(shù)
查閱了 Cost231-Hata模型及其相關(guān)的理論背景知識(shí),發(fā)現(xiàn)在模型場(chǎng)景糾正常數(shù)的定義為:
Cm相當(dāng)于傳播路徑損耗的懲罰因子, 結(jié)合實(shí)際的地物類型名稱的編號(hào)含義,進(jìn)行一定的分類區(qū)別對(duì)待,從而創(chuàng)造出新的特征,即場(chǎng)景糾正常數(shù)。
以上我們完成了特征分析和設(shè)計(jì)的工作, 下面我們來(lái)進(jìn)行特征篩選.輸入變量也稱為“特征”,而選擇“少而精”的特征,一方面可以降低模型的復(fù)雜性,防止過(guò)擬合;另一方面也能夠提高模型運(yùn)行效率.本文從相關(guān)性和重要性兩個(gè)角度來(lái)選擇特征,計(jì)算出各個(gè)特征與目標(biāo)變量(RSRP)的相關(guān)性,并利用決策樹算法輸出各特征對(duì)RSRP 的重要性, 再進(jìn)行加權(quán)平均求出二者的綜合得分,篩選出得分較高的15 個(gè)特征。
由于數(shù)據(jù)量比較龐大,因此我們隨機(jī)抽取了10 萬(wàn)條數(shù)據(jù)進(jìn)行研究分析,對(duì)上面篩選的特征數(shù)據(jù)利用Tensorflow框架構(gòu)建了神經(jīng)網(wǎng)絡(luò)模型[3], 隱藏層數(shù)設(shè)置為3,第一個(gè)隱藏層為300 個(gè)神經(jīng)元,第二個(gè)隱藏層為200 個(gè)神經(jīng)元,第三個(gè)隱藏層為100 個(gè)神經(jīng)元.隱藏層神經(jīng)元個(gè)數(shù)逐層減少,呈漏斗形,使得低級(jí)別的特征會(huì)逐漸被合并到高級(jí)別特征中。并且在每層采用了非飽和激活函數(shù)relu,之所以選用非飽和激活函數(shù)relu 激活函數(shù),是我們考慮了梯度消失/爆炸問(wèn)題.同時(shí),為了避免多層神經(jīng)網(wǎng)絡(luò)在模型訓(xùn)練和模型預(yù)測(cè)過(guò)程當(dāng)中可能出現(xiàn)的欠擬合和過(guò)擬合現(xiàn)象,我們必須要對(duì)多層神經(jīng)網(wǎng)絡(luò)進(jìn)行一定的防范措施, 本文我們采用了正則化以避免可能出現(xiàn)的過(guò)擬合現(xiàn)象,即采用dropout 正則化進(jìn)行一定的防過(guò)擬合處理。
在此,通過(guò)Tensorflow框架構(gòu)建的多層網(wǎng)絡(luò)的模型及其參數(shù)選擇就基本已經(jīng)完成, 接下來(lái)的工作就是通過(guò)我們構(gòu)建的多層神經(jīng)網(wǎng)絡(luò)模型,代入訓(xùn)練數(shù)據(jù)集,進(jìn)行相應(yīng)的模型訓(xùn)練,最后得到預(yù)測(cè)值和實(shí)測(cè)值整體偏差的評(píng)價(jià)指標(biāo)RMSE(均方根誤差)結(jié)果為11.8001, 弱覆蓋率的評(píng)價(jià)指標(biāo)PCRR 為0.29, 符合大賽規(guī)定的大于0.2。
本文主要是通過(guò)構(gòu)建無(wú)線傳播模型對(duì)目標(biāo)通信覆蓋區(qū)域內(nèi)的無(wú)線信號(hào)傳播的RSRP 進(jìn)行預(yù)測(cè),是一個(gè)回歸問(wèn)題,并且還通過(guò)設(shè)置弱覆蓋判決門限對(duì)弱覆蓋情況進(jìn)行檢測(cè), 又涉及到了二分類問(wèn)題. 因此在模型中用到的神經(jīng)網(wǎng)絡(luò)框架可以移植到其他回歸或分類問(wèn)題中,只需要改動(dòng)數(shù)據(jù)預(yù)處理部分即可.這也是神經(jīng)網(wǎng)絡(luò)的強(qiáng)大之處,回歸或分類問(wèn)題,都可以通過(guò)增加神經(jīng)網(wǎng)絡(luò)的復(fù)雜度(增加隱藏層、增加神經(jīng)元)和改變輸出來(lái)實(shí)現(xiàn)。