謝春生,趙 龍,柳躍朋
(中國民航大學a.空中交通管理學院;b.機場學院,天津 300300)
航空器通常在空域內(nèi)按照一定的航路、航線和程序飛行,但設備、天氣等因素會導致航空器在運行中出現(xiàn)一定的偏離。隨著自動相關(guān)監(jiān)視廣播系統(tǒng)(ADS-B,automatic dependent surveillance-broadcast)的廣泛使用,在為民航運行提供便利的同時,也促進了航空器運行航跡的深入研究。準確識別和分析航跡數(shù)據(jù)將極大地促進空域結(jié)構(gòu)優(yōu)化、航路和航線規(guī)劃、飛行程序設計和交通流態(tài)勢分析等問題的研究。
國外對于航跡的研究已有了較多成果。García 等[1]從分類角度出發(fā),以歷史數(shù)據(jù)為基礎(chǔ),采用一種概率預測模型對某個航跡段進行分類。Enrique[2]從航跡聚類角度出發(fā),采用一種層次聚類方法來識別終端區(qū)的交通流,識別結(jié)果具有良好的魯棒性。國內(nèi)對航跡的研究大多從聚類角度出發(fā):王濤波等[3]在航跡分析中引入遺傳模擬退火算法對模糊C 均值聚類進行改進,使聚類中心偏離數(shù)據(jù)點集中位置的問題得到改善;徐濤等[4-5]以航跡點法向距離來度量航跡的相似度,并采用K 均值聚類算法對航跡進行聚類分析,改善了聚類的效果,同時還提出以航跡間面積大小來確定航跡間的相似度,采用CURE 聚類算法分析航跡與標準飛行程序的關(guān)系,為飛行員飛行品質(zhì)的評估提供了參考。聚類分析作為無監(jiān)督學習的典型方法,在航空器航跡研究中得到了廣泛使用,但同時也受多種因素影響,會出現(xiàn)聚類結(jié)果不理想、聚類中心偏離過大、類別數(shù)量與實際偏差過大以及計算困難等問題。
模式識別已經(jīng)在語音識別、圖像識別、醫(yī)用科學等領(lǐng)域中得到廣泛運用。Lukas 等[6]利用模式識別技術(shù)處理圖案噪聲,并降低了圖像識別的誤報率。Barrachicote 等[7]利用模式識別對語音進行分類,取得了良好的效果。此外,模式識別在對其他運動主體軌跡研究中也得到一定運用,李婷等[8]對人類活動軌跡模式的相關(guān)研究做了詳細的介紹,包括人的運動軌跡數(shù)據(jù)采樣軌跡點組成和不同角度運動軌跡模式的識別,以及其在可視化模擬和監(jiān)控等方面中應用;郭際明等[9]以智能手機的傳感器數(shù)據(jù)為基礎(chǔ),利用支持向量機的方法,對人上下扶梯、電梯等幾種狀態(tài)進行識別且識別率較高;任艷青等[10]將模糊神經(jīng)網(wǎng)絡運用到乒乓球旋轉(zhuǎn)運動的研究中,對上、下、左、右旋球進行了有效的分類。
模式識別在類似的軌跡分析領(lǐng)域研究中已取得一定的成果并廣泛應用,但極少應用于航空器航跡分析研究領(lǐng)域。由于提前獲得航跡樣本在實際研究中具有一定困難,因此選擇自組織神經(jīng)網(wǎng)絡(SONN,selforganizing neural network)方法,從一個新的角度研究航跡的特性,克服聚類分析中存在的問題,從而改進終端區(qū)的航跡識別問題。
《民用航空空中交通管理規(guī)則》[11]對終端區(qū)的空域范圍做了一定的劃設,即高度在6 000 m(含)以下最低高度層以上;水平范圍為半徑50 000 m 或者走廊進出口以內(nèi)的除機場塔臺管制區(qū)以外的空間。終端區(qū)內(nèi)航空器的飛行航線主要有:進場航線、離場航線和飛越航線。
使用ADS-B 設備,以1 s 的掃描率獲取某終端區(qū)范圍內(nèi)所有航空器運行的實時經(jīng)度、緯度、高度、速度、升降速度等數(shù)據(jù)。一系列的離散點構(gòu)成了每個航空器的航跡。設時間t內(nèi)某終端區(qū)有m架航空器飛行,則在t時間內(nèi)統(tǒng)計到的航跡集為
式中Di為第i架航空器的航跡,i=1,2,…,m,由ni個航跡d點組成,則表示為
從航跡點中選取時間t、經(jīng)度x、緯度y、高度h4 個參數(shù)表征航跡點的特征,則航跡點表示為
不同航跡集合在數(shù)據(jù)質(zhì)量、航跡點序列長度和時空分布等方面有時會存在較大差別,不能滿足航跡分析中數(shù)據(jù)間應具有相似性的要求。因此,通過線性插值的時間歸一化方法,把所有航跡映射到t∈[0,1],以等時間間隔Δt分布,可把所有航跡轉(zhuǎn)變成等航跡點數(shù)量且有相同時間分布的序列Di′={d1′,d2′,…,dn′}。
空間任意兩點(x1,y1,z1)和(x2,y2,z2)之間的歐式距離為
對于兩個航跡Di′與Dj′,航跡Di′上的點dk′(xk,yk,hk)和航跡Dj′上的任意點(x,y,h)由于經(jīng)緯度和高度之間的計量單位存在區(qū)別,先將兩點間的經(jīng)緯度差轉(zhuǎn)換為距離,再結(jié)合高度計算兩點間的空間距離為
式中R為地球半徑,取R=6.371×106m。
取最小的Sk作為dk′點到航跡Dj′的最小距離,以同樣的方法計算航跡Di′上其他點到航跡Dj′上的最小距離,再取航跡Di′上所有點到航跡Dj′最小距離的平均值,作為航跡Di′到航跡Dj′的距離。航跡Di′到航跡Dj′之間的距離定義為
式中n為航跡Di′上的航跡點數(shù)量。
自組織神經(jīng)網(wǎng)絡[12-14]以競爭學習為核心,各網(wǎng)絡單元在受到外界刺激時會相應產(chǎn)生競爭響應,競爭勝利的一個或幾個網(wǎng)絡單元得到接受刺激權(quán)利,從而自適應地改變了原網(wǎng)絡結(jié)構(gòu)。SONN 有輸入層和競爭層兩層結(jié)構(gòu)。輸入層將接收到的外界信息傳給競爭層;競爭層分析對比,調(diào)整勝利單元的權(quán)向量,同時調(diào)整其周圍單元的權(quán)值,尋找規(guī)律。
在SONN[15]中,初始為各神經(jīng)單元賦予對應的小的隨機權(quán)值向量W=(Wi),i=1,2,…,m,其中Wi=(ω1,ω2,…,ωp)。建立初始勝利域Ni*(0),學習率為η。輸入樣本特征數(shù)據(jù)集X=(Xj),j=1,2,…,n,其中Xj=(x1,x2,…,xq)。
1)向量歸一化
由于各指標可能存在不同計量單位,量值上的差別過大會對結(jié)果造成較大影響,同時神經(jīng)網(wǎng)絡對于介于0~1 之間的輸入與輸出數(shù)據(jù)處理效果較好,因此,對樣本向量進行歸一化處理,即
將權(quán)向量和樣本向量分別歸一化得到Wi′=(ω1′,ω2′,…,ωp′)和Xj′=(x1′,x2′,…,xq′)。
2)尋找獲勝神經(jīng)單元
將輸入的樣本向量和競爭層各神經(jīng)元所對應的權(quán)向量做相似性比較,把最相似的權(quán)向量對應的神經(jīng)元視為勝利單元。而相似度的判別方法就是通過作向量的內(nèi)積得到,在單位圓中找到與樣本向量夾角最小的點為獲勝單元,即
3)調(diào)整網(wǎng)絡輸出和權(quán)值
獲勝的神經(jīng)單元獲得輸出為1,其余則為0,即
同時,獲勝單元獲得調(diào)整權(quán)值的機會,各單元的學習調(diào)整的規(guī)則為
式中δ(x)為學習率,且δ(x)∈(0,1]。隨著學習逐漸深入,學習率逐漸減小,表明調(diào)整的幅度越來越小,即逐漸接近類別中心。
4)迭代至收斂
經(jīng)過調(diào)整的新向量已經(jīng)不是單位向量,所以要對新向量重新歸一化,重復步驟1)~步驟3),重復多次訓練,直到δ(x)逐漸衰減至趨向于0。
5)測試
輸入新的樣本,通過訓練好的神經(jīng)網(wǎng)絡進行計算。若某一類對應的節(jié)點相似度最大,則將其分入到該類中。對比其所屬的航跡與分入類別中其他航跡的相似情況判斷其是否歸入了正確的類別。
為了便于初步研究,采集了國內(nèi)某國際機場所在終端區(qū)空域內(nèi)流量正常一天內(nèi)的飛行數(shù)據(jù)作為原始數(shù)據(jù)。以應答機碼和航班號同時唯一性,篩選出每一條航跡包括的航跡點數(shù)據(jù),一共篩選出482 條航跡數(shù)據(jù)點。以經(jīng)度、緯度、高度為參數(shù),各航跡的空間分布情況如圖1 所示。
圖1 終端區(qū)內(nèi)航跡分布情況Fig.1 Track distribution in terminal area
根據(jù)文獻[16]中對航跡數(shù)據(jù)的篩選與處理方法,對獲取的數(shù)據(jù)進行空間篩選、有效數(shù)據(jù)關(guān)聯(lián)、有效航跡篩選和歸一化處理,并且映射到時間t∈[0,1]的等時間間隔Δt 中。
根據(jù)式(6)計算航跡間的平均最小距離,構(gòu)造航跡間的距離矩陣。取,作為軌跡間相似度矩陣A 的元素,計算所得的相似度矩陣如下,即
任意選擇400 條航跡數(shù)據(jù)作為訓練集,以其和其他航跡的相似度向量構(gòu)成的矩陣作為訓練數(shù)據(jù),并進行訓練。由于臨時航線、雷雨繞飛等問題,終端區(qū)內(nèi)的航線數(shù)量共計33 條。網(wǎng)絡節(jié)點的數(shù)量選取和樣本里的模式類別有關(guān),因此將競爭層設為6×6 的網(wǎng)格。
經(jīng)過1 000 次的穩(wěn)定訓練后得到收斂。由于輸入數(shù)據(jù)的空間高維性,無法同時可視化所有權(quán)值,所以用SONN 相鄰距離圖來表示相鄰神經(jīng)單元之間的距離。六邊形的點為神經(jīng)單元,線條連接了相鄰的單元。將線條包圍的區(qū)域代表了其間的距離,顏色越深,距離越大,如圖2 所示。
圖2 相鄰神經(jīng)元間距離示意圖Fig.2 Schematic diagram of distance between adjacent neurons
每條航跡相應地分入對應神經(jīng)單元中,一共分成了32 類,與該終端區(qū)內(nèi)的航線數(shù)量相當。每個神經(jīng)單元包含的航跡數(shù)量如圖3 所示。
圖3 各單元內(nèi)的航跡的數(shù)量分布Fig.3 Number of tracks within each unit
在大量數(shù)據(jù)樣本中任意選擇其中一類,繪出其包含的所有航跡,如圖4 所示。
圖4 同一類別的所有航跡走向分布圖Fig.4 Distribution of all tracks in same category
對比航跡走向可發(fā)現(xiàn)在本類中的14 條航跡中,僅存在1 條分類異常的航跡。統(tǒng)計對比了所有類別中的異常航跡數(shù)量,共有37 條,分類正確率達90.75%,屬于可接受的水平。
將剩下的82 條航跡輸入訓練好的網(wǎng)絡,同樣選取了和前面相同分類的航跡,如圖5 所示。
圖5 測試集中同一類別的所有航跡走向分布圖Fig.5 Distribution of all tracks in same category on test set
從圖5 可看出,測試集在航跡高度、空間位置與訓練集相似,可認為該模型正確識別了該類的航跡。其他分組的航跡也大部分可識別,異常航跡數(shù)量約為6條,分類正確率達92.68%。
基于SONN 模式可以較為準確地識別出終端區(qū)空域內(nèi)航跡數(shù)據(jù)對應的飛行航線。與傳統(tǒng)使用的無監(jiān)督學習的K 均值聚類算法相比,SONN 是一種不需要提前確定聚類中心數(shù)量的自組織學習方法。實驗結(jié)果準確,可為更深入研究航跡特征提供基礎(chǔ)。下一步研究可在此基礎(chǔ)上就實驗中識別錯誤的航跡提出改進方法,提高識別正確率;同時,后續(xù)研究還可就特殊天氣造成的航班繞飛的航跡識別做進一步探討與驗證。