翟龍飛 陳迎春 楊沖 閆心寶
摘 要: 輸入神經(jīng)網(wǎng)絡數(shù)據(jù)的優(yōu)劣直接關系著網(wǎng)絡訓練結果,因此訓練數(shù)據(jù)的預處理在整個系統(tǒng)模型設計中具有十分重要的意義。本文以短波測量數(shù)據(jù)為初始樣本訓練集進行預處理研究。
關鍵詞:BP神經(jīng)網(wǎng)絡 歸一化處理 降維處理
中圖分類號:TP183 文獻標識碼:A 文章編號:1003-9082(2016)03-0008-01
BP神經(jīng)網(wǎng)絡是基于訓練數(shù)據(jù)的建模,因此由神經(jīng)網(wǎng)絡建立起的模型能夠精確反映實際預測情況[1]。本短波場強預測系統(tǒng)的測試訓練數(shù)據(jù)是建立在已有短波資源仿真調(diào)度系統(tǒng)生成數(shù)據(jù)集基礎上,因此,可對比網(wǎng)絡學習模型預測輸出值與期望輸出值來判斷網(wǎng)絡適應能力。
一、輸入輸出變量的選擇
由于BP神經(jīng)網(wǎng)絡的靈活擴展性以及快速自適應能力,使得其應用廣泛。在最適網(wǎng)絡選取階段,根據(jù)模型傳輸損耗影響因素, 做到相關性小甚至不相關,結合數(shù)據(jù)庫提供數(shù)據(jù),訓練輸入變量選取為:偵收位置(經(jīng)緯度),信號位置(經(jīng)緯度),信號功率,信號頻率,偵收任務時間(月、日、時、分)。輸出量即期望值為:場強中值,傳輸損耗。
二、歸一化處理
1.基于最大最小樣本值的線性歸一化處理
該歸一化數(shù)據(jù)處理方式是將相同輸入變量(輸出量)的樣本進行預處理。其數(shù)學關系為: (1)
針對短波場強樣本訓練集,在原始數(shù)據(jù)的基礎上進行線性歸一化處理,而后進入網(wǎng)絡仿真學習。本學習運算是在Matlab中運行采用標準梯度學習算法并以均方誤差MSE作為性能參考。
2.基于標準差的歸一化處理
因此歸一化數(shù)據(jù) 的數(shù)據(jù)區(qū)間大于[-1,1]。從而使得訓練網(wǎng)絡得到的性能參數(shù)MSE較大。為了能夠得到適用于本系統(tǒng)的性能參數(shù)參考值,采取兩者結合的歸一化方法。
3.混合的歸一化處理方法
該方法是在數(shù)據(jù)訓練前期進行最大最小值線性歸一化處理,將輸入變量壓縮至[-1,1]區(qū)間,而后在網(wǎng)絡訓練階段采用標準差法處理數(shù)據(jù)。由MSE平均值可知,在網(wǎng)絡內(nèi)部運用標準差歸一化法處理數(shù)據(jù)可以使訓練時更加規(guī)整從而利于訓練。
4.歸一化方法分析比較
通過仿真實驗,比較三種歸一化方法的MSE,如表1:
在相同訓練數(shù)據(jù)的情況下,以混合的歸一化處理方法處理訓練樣本數(shù)據(jù)得到的MSE最小,因此在系統(tǒng)設計應用中選取混合歸一化處理方法,對數(shù)據(jù)進行預處理。
三、降維處理
分析樣本產(chǎn)生、樣本變量因素(特別是時間因素)以及神經(jīng)網(wǎng)絡運算效率,若對短波傳播損耗模型進行完全學習,由于樣本集的過大導致學習過慢,訓練精度也可能無法保證。因此提出對訓練集的單個月份學習,模型預測針對網(wǎng)絡學習所在月份任務進行預測。因此,選取訓練樣本集較完備的5月份進行訓練學習。根據(jù)短波損耗模型,短波傳播主要受電離層影響,而電離層區(qū)別主要存在于白天與黑夜的區(qū)分[2],因此對時、分輸入變量進行降維處理僅區(qū)分白天與黑夜。在神經(jīng)網(wǎng)絡預測實驗中,對訓練數(shù)據(jù)分析而后進行數(shù)據(jù)的概略區(qū)分,選取6:00至19:00為白天數(shù)據(jù),以“1”表示,19:00至次日6:00為黑夜數(shù)據(jù),以“2”表示。
在訓練集經(jīng)過歸一化以及篩選降維處理后,對其進行神經(jīng)網(wǎng)絡學習,并分析其訓練性能參數(shù),以及其預測結果。下面針對5月份數(shù)據(jù)進行預測并與期望值進行對比,如表2:
通過對比可知,神經(jīng)網(wǎng)絡訓練時,完備數(shù)據(jù)集是網(wǎng)絡學習的關鍵,通過分析輸入變量,進行合理性降維對提高網(wǎng)絡訓練效率提高訓練精度也十分重要。
參考文獻
[1] 朱凱,王正林等. 精通MATLAB神經(jīng)網(wǎng)絡[M] 北京: 電子工業(yè)出版社, 2010.1.
[2] 羅佳,張文明,王雪松. 通信對抗中短波天波傳輸損耗的仿真建模[J],計算機仿真,2007,8(24).