王佳旭,那容菲,何雨霖,嚴(yán)子陽,強(qiáng)旭澤,鄭浩楠,張召悅
(中國民航大學(xué),天津 300300)
隨著航空運(yùn)輸需求的增長,空中交通流量不斷增大,空中交通擁擠現(xiàn)象日益嚴(yán)重,管制員工作負(fù)荷不斷加大,空中交通管理監(jiān)控系統(tǒng)面臨著嚴(yán)峻的挑戰(zhàn)。因此,空中交通監(jiān)控預(yù)測需要高精度、實(shí)時(shí)的空中交通流量管理。廣播式自動(dòng)相關(guān)監(jiān)視(ADS-B)技術(shù)的出現(xiàn)給傳統(tǒng)的基于雷達(dá)的監(jiān)視技術(shù)帶來了巨大的變化。ADSB系統(tǒng)基于衛(wèi)星定位和地面/空中數(shù)據(jù)鏈通信,為空中交通管理系統(tǒng)和航空公司提供更安全和高效的空中交通監(jiān)視技術(shù)。ADS-B被認(rèn)為是下一代空中交通監(jiān)視系統(tǒng)的關(guān)鍵部分。
鐘翔關(guān)于天津?yàn)I海機(jī)場的流量分析,研究了各種流量的預(yù)測性;吳璇使用BP神經(jīng)網(wǎng)絡(luò)飛行流量預(yù)測方法對航空運(yùn)輸實(shí)行了短期的預(yù)測;黃海朝采用灰色關(guān)聯(lián)度分析非線性關(guān)聯(lián)度并將篩選后的結(jié)果利用雙向長短期記憶神經(jīng)網(wǎng)絡(luò)對軌道交通客流量進(jìn)行預(yù)測。在時(shí)間序列分析中,因?yàn)椴檎覐?fù)雜結(jié)構(gòu)和匹配對象之間的便利性,空中交通流量預(yù)測可以通過支持向量回歸(SVR)和長短期記憶網(wǎng)絡(luò)(LSTM)2種機(jī)器學(xué)習(xí)方法更好地預(yù)測航路流量。
由于空域中大量飛機(jī)的不間斷沖突,將會(huì)導(dǎo)致空中交通越發(fā)擁擠的情況,為保證空中交通的安全和高效,需要空中交通管理部門不斷學(xué)習(xí),找到解決問題的方法。裝載ADS-B的空中交通管理系統(tǒng)能夠更加有效地解決空中交通擁擠的問題并能提供更安全的空中交通網(wǎng)絡(luò)。
地面監(jiān)測中心包括3部分:存儲(chǔ)ADS-B數(shù)據(jù)的中央云服務(wù)器、用于挖掘數(shù)據(jù)的數(shù)據(jù)處理中心和用于描述所得信息的數(shù)據(jù)可視化裝置,一些基礎(chǔ)的飛行信息和飛機(jī)軌跡都呈現(xiàn)在顯示屏上[1]。此外,這些每天的輸入數(shù)據(jù)首先根據(jù)時(shí)間進(jìn)行切片。之后,切片數(shù)據(jù)通過數(shù)據(jù)中心對數(shù)據(jù)進(jìn)行分析和處理,實(shí)現(xiàn)不同時(shí)間粒度的交通流量統(tǒng)計(jì)。
空中交通管理(ATM)主要作用是充分利用已經(jīng)存在的空域和航路,并且確保航班的安全和高效。因此ATM包括3部分:空中交通管制(ATC)、空域管理(ASM),以及空中交通流量管理(ATFM)。
空中交通流量統(tǒng)計(jì)和預(yù)測是基于航空大數(shù)據(jù)平臺(tái)的2個(gè)主要部分,由基于航空大數(shù)據(jù)平臺(tái)的ADSB提供的實(shí)時(shí)信息能夠成為1個(gè)精確的空中交通流量統(tǒng)計(jì)的數(shù)據(jù)來源,由此能夠獲得1個(gè)基于空中交通流量的統(tǒng)計(jì)數(shù)據(jù)的更精確的預(yù)測模型。因此,統(tǒng)計(jì)和預(yù)測情報(bào)可以為未來更智能的航班調(diào)度策略和ATM提供幫助。
空中交通流量是指在一定時(shí)間內(nèi)特定空域的飛機(jī)數(shù)量。航空大數(shù)據(jù)平臺(tái)收集的ADS-B信息可以提供更準(zhǔn)確和全面的綜合信息,由于配備了ADS-B發(fā)射器的飛機(jī)會(huì)自動(dòng)廣播ADS-B信息,使得有充足的數(shù)據(jù)來促進(jìn)空中交通流量的統(tǒng)計(jì)。
ADS-B數(shù)據(jù)處理包括:①航空器呼號處理。當(dāng)空中交通管理自動(dòng)化處理ADS-B相關(guān)數(shù)據(jù)后,提取航空器呼號,為其分配合適的有關(guān)因子,確保大量航跡數(shù)據(jù)正確歸于同一航跡,并且根據(jù)有關(guān)因子處理多條航跡信息。②航空器位置信息處理。提取經(jīng)處理過的ADS-B的經(jīng)緯度和高度位置信息,確保航跡信息都屬于同一個(gè)航空器,能夠精確定位航空器的位置。③二次代碼處理??展茏詣?dòng)化系統(tǒng)對航空器的ADS-B二次代碼信息進(jìn)行處理后,根據(jù)相關(guān)特點(diǎn)對提取出的二次代碼判斷是否有效。④告警信息處理[2]。當(dāng)空中交通管理系統(tǒng)的ADS-B系統(tǒng)的信息收到告警處理時(shí),應(yīng)該對航空器中每個(gè)信息都進(jìn)行相應(yīng)的分析和處理,從而提取出有效的告警信息,通知空中交通管理有關(guān)部門。
預(yù)測任務(wù)領(lǐng)域研究重要組成部分是時(shí)間序列。隨著機(jī)器學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等一系列人工智能算法在時(shí)間序列預(yù)測領(lǐng)域得到了廣泛的應(yīng)用。這些現(xiàn)代算法在探索具有隱藏特征的數(shù)據(jù)方面表現(xiàn)出卓越的性能。在本節(jié)中,分別提出了基于SVR和LSTM的2種預(yù)測模型,利用航空大數(shù)據(jù)平臺(tái)獲取的大量ADS-B數(shù)據(jù)訓(xùn)練2種預(yù)測模型。
輸入數(shù)據(jù)在任何基于預(yù)測器的模型中都扮演著重要的角色。在機(jī)器學(xué)習(xí)和性能預(yù)測中的模型可由數(shù)據(jù)特征的選擇大致確定。根據(jù)相關(guān)工作,選取的特征主要包括日期和時(shí)間等時(shí)間序列特征。由于航路流量是一個(gè)時(shí)間序列,本研究考慮了與時(shí)間相關(guān)的基本特征及一些可能影響航路流量的因素。因此,可以形成1個(gè)包含這些特征的輸入向量x。首先定義2個(gè)向量,表示2種類型的特征,即時(shí)間向量t和影響向量p。
式中:t1、t2、t3分別表示當(dāng)天的時(shí)點(diǎn)、星期的當(dāng)天、月份的當(dāng)天;p1、p2、p3分別表示節(jié)日指數(shù)、季節(jié)指數(shù)和平均流量。
因此,輸入向量x可以表示為
式中:f為航路內(nèi)航班號;r為航路;t、p分別為時(shí)間向量和影響向量。
SVR是SVM的擴(kuò)展,其可以引入回歸問題的有效解決方案。SVR將一個(gè)非線性問題轉(zhuǎn)化為高維空間中的線性問題,并通過核函數(shù),計(jì)算出高維空間的復(fù)雜特征。對于一對(x,y),傳統(tǒng)回歸模型通常通過計(jì)算預(yù)測f(x)和真實(shí)值y之間的差來計(jì)算損失,只有當(dāng)其相同時(shí),損失才為零[3]。相反,SVR假設(shè)可以容忍一個(gè)閾值Q作為其之間的最大差異。SVR問題可以表示為
式中:ω為超平面的法向量;C表示一個(gè)影響模型復(fù)雜度和泛化能力的正則化常數(shù)。
通過確定算法對ω以外的樣本數(shù)據(jù)的懲罰,lQQinsensitive的損失函數(shù)表示為
因此,只有當(dāng)f(x)和y的差值的絕對值大于Q時(shí),才計(jì)算損失。這相當(dāng)于構(gòu)造一個(gè)寬度以2Q為中心的波段f(x)。如果樣本在此范圍內(nèi),回歸結(jié)果為正確的。
LSTM由循環(huán)神經(jīng)網(wǎng)絡(luò)演化而來,其適用于時(shí)間序列中間隔時(shí)間和延遲時(shí)間較長的事件的處理和預(yù)測。優(yōu)點(diǎn)之一是避免了傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)的梯度消失問題。LSTM在自然語言處理、目標(biāo)識別和聲音檢測等領(lǐng)域顯示出巨大的成效。此外,LSTM中還存在一種獨(dú)特的結(jié)構(gòu),稱為門控神經(jīng)元。該結(jié)構(gòu)可以捕獲短期和長期記憶,使得LSTM適用于時(shí)間序列預(yù)測任務(wù)[4]。LSTM網(wǎng)絡(luò)的輸出可以通過以下函數(shù)來計(jì)算
式中:x(t)為模型在t時(shí)刻的輸入;W和b分別為權(quán)矩陣和偏差向量。it、ft、ct、ot表示4個(gè)不同的門,即輸入門、遺忘門、候選門和輸出門。ht表示RNN隱藏層狀態(tài)h=[h1,h2,…,ht]。
基于LSTM的模型體系結(jié)構(gòu)包括3層:LSTM層、全連通層和輸出層。LSTM層的作用是捕獲不同時(shí)間空中交通狀態(tài)之間的時(shí)間相關(guān)性。輸出層以一定的概率使神經(jīng)元失活,提高了網(wǎng)絡(luò)的泛化能力。全連接層用于將輸出形狀重塑為預(yù)期的形式,主動(dòng)功能是整流線性單元(RELU)功能。這是一個(gè)關(guān)于時(shí)間序列的回歸問題,因此,本研究通過計(jì)算均方根誤差(RMSE)和平均絕對誤差(MAE)來比較真實(shí)的統(tǒng)計(jì)流數(shù)據(jù)y和預(yù)測值具體指標(biāo)的定義如下
上述指標(biāo)的值越小,表示所提議的預(yù)測模型的性能越好。
提出的2個(gè)預(yù)測器(基于SVR和基于LSTM)的數(shù)據(jù)集是由2020年10月25日至2020年11月1日的240條線路的每小時(shí)分離流量信息產(chǎn)生的。由于存在異常數(shù)據(jù)情況,任何遠(yuǎn)遠(yuǎn)超過歷史平均值(超過1 000)的交通流量將被視為無效值,并由該時(shí)段內(nèi)的歷史平均值代替。預(yù)測器的輸入是一些選定的特征,如下所示:①一天中的小時(shí)、每小時(shí)內(nèi)的15 min。以15 min為單位,每15 min一統(tǒng)計(jì)。②該日是否為法定假日的歷史平均交通流量。
參數(shù)懲罰C決定了權(quán)重向量的大小,來自RBF的參數(shù)伽馬決定了每個(gè)支持向量對應(yīng)的RBF的寬度。向量的數(shù)量影響訓(xùn)練和預(yù)測的速度。進(jìn)一步影響訓(xùn)練速度和預(yù)測器的準(zhǔn)確性之間的權(quán)衡,為了獲得合適的參數(shù)組合,采用了網(wǎng)格搜索法,通過計(jì)算RMSE得分來選擇最佳組合[5]。
當(dāng)處理大量航路交通流數(shù)據(jù)時(shí),SVR預(yù)測器比基于LSTM的預(yù)測器花費(fèi)更多的時(shí)間。2種預(yù)測模型的結(jié)果分別如圖1和圖2所示。2種預(yù)測器的均方根誤差(RMSE)分別為3.59和2.56,基于LSTM的預(yù)測器的均方根誤差(RMSE)越小,預(yù)測器的性能越好。LSTM預(yù)測器犧牲時(shí)間來提高精度,基于LSTM的模型在緩解異常因素造成的大殘差值方面表現(xiàn)出了較好的性能[6]。
圖1 利用基于SVR的預(yù)測器預(yù)測交通流量和相應(yīng)的殘差
圖2 利用基于LSTM的預(yù)測器預(yù)測交通流量和相應(yīng)的殘差
其中,基于SVR的預(yù)測模型在1 h內(nèi)不同區(qū)間的預(yù)測量分別為61.8%、25.34%、11.23%和2.84%?;贚STM的模型分別占75.36%、13.45%、8.54%和2.34%。殘差分布表明,基于LSTM的模型對交通流誤差有較好的控制。
殘差分布表明,基于LSTM的模型對交通流誤差有較好的控制,并且具有較好的預(yù)測精度。SVR模型和LSTM模型都能很好地捕捉非線性特征與交通流之間的內(nèi)在關(guān)系。LSTM算法得益于獨(dú)特的門結(jié)構(gòu),可以自然地捕獲長期和短期的時(shí)間相關(guān)性。因此,該算法在時(shí)間序列預(yù)測任務(wù)中表現(xiàn)出了良好的性能。
根據(jù)上述實(shí)驗(yàn)可以得到,LSTM模型預(yù)測方法擁有更快、更準(zhǔn)確的預(yù)測結(jié)果,并且空中交通航路點(diǎn)流量預(yù)測模型對航路點(diǎn)分時(shí)段流量和總流量預(yù)測的精度均符合預(yù)期,且對總流量的預(yù)測精度更高。另外,研究還發(fā)現(xiàn)航路點(diǎn)流量時(shí)間序列曲線的趨勢性越明顯,預(yù)測曲線的擬合度越高;時(shí)間序列曲線的波動(dòng)幅度越大,預(yù)測曲線擬合度越差,這說明航路點(diǎn)流量時(shí)間序列趨勢的明顯性直接影響模型的預(yù)測精準(zhǔn)度。