丁新偉,秦 倩,闞 犇,劉騏暢,賈 馳
(1.首都機場集團(tuán)有限公司國際科技部,北京 101300;2.中國民航大學(xué)電子信息與自動化學(xué)院,天津 300300)
隨著中國民航業(yè)整體穩(wěn)健向前發(fā)展,機場依然需要解決航站樓旅客流與綜合交通區(qū)的合理接駁問題,以達(dá)到對航站樓旅客的高效疏散并提高機場運行效率[1-3]。實現(xiàn)航站樓旅客的時空分布預(yù)測,可準(zhǔn)確獲取旅客的人員密度、關(guān)鍵節(jié)點人數(shù)等信息,為綜合交通區(qū)運力的合理調(diào)配提供依據(jù)。航站樓旅客流的預(yù)測本質(zhì)上屬于時空序列預(yù)測問題,即基于歷史時期內(nèi)的客流時空分布數(shù)據(jù),預(yù)測當(dāng)前和未來一段時間內(nèi)的演化情況。目前,專門針對航站樓旅客流預(yù)測的研究較少,主要包括ARIMA 模型[4]、K 近鄰算法[5-7]、支持向量機回歸[8]等,且大多只基于整體或單一區(qū)域的旅客流序列,并只利用了整體或單一區(qū)域的時間信息,未利用空間信息,這樣的結(jié)果很容易由于其他區(qū)域的旅客流變化造成預(yù)測準(zhǔn)確性下降。而在公路、地鐵站等場景的交通流預(yù)測研究中,卷積神經(jīng)網(wǎng)絡(luò)被用于提取交通流的空間特征,但將待預(yù)測區(qū)域劃分為尺寸相同的網(wǎng)格并統(tǒng)計各個網(wǎng)格中的流量,不符合交通流量數(shù)據(jù)的真實空間特征[9]。
針對目前研究的不足,本文提出一種基于神經(jīng)網(wǎng)絡(luò)即結(jié)合圖卷積和門控循環(huán)單元[9-12](GCGRN,graph convolutional gated recurrent network)的航站樓旅客流時空分布預(yù)測方法,結(jié)合航站樓內(nèi)部空間拓?fù)浣Y(jié)構(gòu),挖掘各空間區(qū)域內(nèi)客流變化的內(nèi)在機理,捕獲樓內(nèi)各空間區(qū)域客流變化的時空相關(guān)性;利用登機口變化導(dǎo)致航站樓內(nèi)客流分布改變的條件,提高預(yù)測方法的精度與可解釋性。
根據(jù)航站樓GIS(geographic information system)地圖并結(jié)合樓內(nèi)各個空間區(qū)域與設(shè)施分布特點,將空間區(qū)域簡化為節(jié)點如圖1 所示,相鄰空間區(qū)域使用無向邊相連,生成由節(jié)點和無向邊組成的鄰接拓?fù)鋱DG=(V,E,A),其中V=為節(jié)點集合,N 為節(jié)點數(shù)量,E 為一組無向邊集合,A∈RN×N為根據(jù)每對節(jié)點之間的距離構(gòu)造的鄰接矩陣。特征矩陣Xt∈RN×N為拓?fù)鋱DG 在時間t 的旅客流量。綜上,航站樓旅客流預(yù)測問題可以定義為拓?fù)鋱DG和特征矩陣X 的映射函數(shù)f(),其映射關(guān)系如下
圖1 簡化后的航站樓空間結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the simplified spatial structure of the terminal building
式中:n 表示輸入時間序列的長度,即歷史時刻;T 表示輸出預(yù)測序列的長度。
圖卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)在于提取網(wǎng)絡(luò)中的空間特征,目前圖卷積方法主要分為兩類:基于譜的圖卷積和基于空間域的圖卷積。上述結(jié)構(gòu)屬于拓?fù)鋱D,由節(jié)點和無向邊組成,包含了節(jié)點本身的節(jié)點特征以及節(jié)點間的結(jié)構(gòu)特征,并且可以構(gòu)成拓?fù)鋱D的鄰接矩陣,綜上,采用基于譜的圖卷積方法研究航站樓網(wǎng)絡(luò)的空間特征。
基于譜的圖卷積主要是對圖進(jìn)行傅里葉變換,將圖信號從空間域轉(zhuǎn)為譜域,再對其進(jìn)行卷積運算?;谧V的圖卷積表示如下
式中:L∈RN×N為圖的拉普拉斯矩陣;I∈RN×N為單位矩陣;D∈RN×N為A 的度矩陣,其對角線上的元素是各節(jié)點的度數(shù);U∈RN×N為L 的特征向量矩陣,T 為轉(zhuǎn)置;Θ 為圖卷積核;*φ 表示圖卷積算子;x∈RN表示輸入的旅客流量空間特征向量;Λ=diag(λ0,λ1,…,λN-)1∈RN×N為對角矩陣,其中λi為L 的特征值;Θ(Λ)是一個濾波器,其實質(zhì)是一個對角矩陣。
圖卷積神經(jīng)網(wǎng)絡(luò)模型分為兩個部分:卷積神經(jīng)網(wǎng)絡(luò)(GCN,graph convolutional network)和門控循環(huán)單元(GRU,gated recurrent unit),如圖2 所示。由式(1)可知,將歷史n 個時刻旅客流分布的時間序列數(shù)據(jù)輸入圖卷積網(wǎng)絡(luò),提取網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),得到空間特征;接著再將帶有空間特征的時間序列輸入GRU 中,提取出航站樓內(nèi)待預(yù)測時刻未來T′個時刻的旅客流特征矩陣Y;最后輸入全連接層,輸出預(yù)測結(jié)果。
圖2 旅客流預(yù)測過程拓?fù)鋱DFig.2 Topology of passenger flow forecasting process
1.3.1 空間特征模型
卷積神經(jīng)網(wǎng)絡(luò)在傅里葉變換中加入濾波,作用于頂點及其一階鄰域上,達(dá)到提取頂點間空間特征的目的。如圖3 中,假設(shè)網(wǎng)絡(luò)中的節(jié)點1 是頂點。GCN 模型可以通過中心節(jié)點和其周圍節(jié)點的隱藏關(guān)系來獲取空間特征。采用GCN 模型學(xué)習(xí)空間特征,即
圖3 1 號節(jié)點的鄰接特征Fig.3 Adjacency features of node 1
式中:X 為旅客流量x 的傅里葉變換,即特征矩陣;m表示切比雪夫網(wǎng)絡(luò)(譜卷積網(wǎng)絡(luò)結(jié)構(gòu))第m 層;ReLU為激活函數(shù)=A+I;D 為A 的度矩陣;W 為神經(jīng)網(wǎng)絡(luò)中的可訓(xùn)練權(quán)重矩陣。
1.3.2 時間特征模型
GRU 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,recurrent neural network)的基礎(chǔ)上設(shè)計了門控結(jié)構(gòu),使得信息在隱藏層可以有選擇性地傳遞,并記憶重要信息,以及解決長時間序列訓(xùn)練過程中出現(xiàn)的梯度消失和梯度爆炸問題。GRU 由重置門和更新門兩個部分構(gòu)成,所含參數(shù)少且收斂速度快。狀態(tài)在GRU 中從前向后單向傳輸,且只可以使用當(dāng)前的輸入與之前的上下文信息,GRU結(jié)構(gòu)如圖4 所示,其數(shù)學(xué)表達(dá)式如下
圖4 GRU 結(jié)構(gòu)Fig.4 GRU structure
式中:通過t 的上一時刻隱藏狀態(tài)ht-1和當(dāng)前時刻的旅客流信息xt獲取兩個門控狀態(tài);zt表示更新門,來控制上一時刻信息影響當(dāng)前時刻的程度;rt表示重置門,來控制忽略上一時刻信息的程度;σ 為Sigmoid函數(shù),可將數(shù)據(jù)變換為0~1 范圍內(nèi)的數(shù)值,充當(dāng)門控信號;W(z)和W(r)分別為更新門和重置門中xt的權(quán)重系數(shù)。GRU 將上一時刻的隱藏狀態(tài)和當(dāng)前時刻的旅客流信息作為輸入,以此來獲得下一時刻的旅客流狀態(tài)。獲取當(dāng)前時刻旅客流信息的同時,可保留上一時刻的旅客流信息,且仍有能力提取時間特征。
為了更便捷地實現(xiàn)GCGRN 模型的輸入,將各個時間切片內(nèi)的旅客流作為樣本,對航站樓內(nèi)監(jiān)控攝像頭采集的視頻圖像整合并得到航站樓內(nèi)各個空間區(qū)域旅客流的時間序列,構(gòu)造各個時間切片內(nèi)的旅客流時間分布向量H,方法如下。
選取航站樓內(nèi)能夠覆蓋關(guān)鍵換乘、排隊區(qū)域的監(jiān)控攝像頭,按固定間隔對這些監(jiān)控攝像頭采集的視頻圖像進(jìn)行截圖,每個截圖作為一個時間切片,然后從每個時間切片中得到該時刻、該監(jiān)控攝像頭覆蓋空間區(qū)域內(nèi)的旅客流,并對監(jiān)控攝像頭進(jìn)行編號、排序,構(gòu)造每個時間切片內(nèi)的旅客流時間分布向量H,其分量分別為各個空間區(qū)域在每個時間切片內(nèi)的旅客流,具體步驟如圖5 所示。
圖5 樣本生成步驟流程圖Fig.5 Flow chart of sample generation steps
以航站樓內(nèi)旅客歷史時空分布為基礎(chǔ),選取歷史運營日各時間切片內(nèi)的旅客流分布序列作為訓(xùn)練序列對預(yù)測日的目標(biāo)時刻旅客流預(yù)測,設(shè)計了基于圖卷積神經(jīng)網(wǎng)絡(luò)的時空分布預(yù)測方法。
定義1對鄰接拓?fù)鋱D中的節(jié)點編號,創(chuàng)建兩個維度都是節(jié)點編號的一個二維矩陣,若編號為i,j 的兩個空間區(qū)域相連,則在上述二維矩陣中,(i,j)元素對應(yīng)的數(shù)值為1;若編號為i,j 的兩個空間區(qū)域不相連,則在上述二維矩陣中,(i,j)元素對應(yīng)的數(shù)值為0,將標(biāo)注了各個元素對應(yīng)數(shù)值后的二維矩陣作為區(qū)域鄰接矩陣A。
定義2設(shè)度矩陣可表示為則圖卷積的計算公式為
定義3設(shè)第t 個時刻的空間特征向量與上一個時刻門控循環(huán)單元的狀態(tài)分別經(jīng)過線性變換后相加,經(jīng)Sigmoid 激活函數(shù)處理,得到值域為(0,1)的更新門zt的值如下
式中:xt為第t 個時刻的空間特征向量;W(z)為第t 個時刻的空間特征向量xt的權(quán)重矩陣;ht-1為第t-1 個時刻門控循環(huán)單元的狀態(tài);V(z)為第t-1 個時刻門控循環(huán)單元的狀態(tài)ht-1的權(quán)重矩陣。
同樣地,使用另一組t 個時刻的空間特征向量xt的權(quán)重矩陣W(r)和第t-1 個時刻門控循環(huán)單元的狀態(tài)ht-1的權(quán)重矩陣V(r),得到值域為(0,1)的重置門rt的值如下
對重置門rt的值進(jìn)行線性變換,得到當(dāng)前記憶ht′的值如下
式中,⊙為Hadamard 乘積。再結(jié)合更新門zt的值和當(dāng)前記憶ht′的值,獲得輸出信息ht如下
共進(jìn)行T 組門控循環(huán)單元的操作,對T 組門控循環(huán)單元的輸出信息經(jīng)全連接層進(jìn)行整合,得到航站樓內(nèi)待預(yù)測時刻未來T′時刻的特征矩陣,Y1=(Yt+1,Yt+2,…,Yt+T)′,其中Yt+1,Yt+2,…,Yt+T′分別為待預(yù)測時刻未來T′個時刻的旅客流特征向量。
定義4設(shè)從待預(yù)測時刻開始,未來2 h 內(nèi)有M 架航班起飛,使用每架航班的計劃登機口與前一天使用的登機口數(shù)據(jù),構(gòu)建一個二維矩陣,若某航班當(dāng)天使用的登機口為p,前一天該時間內(nèi)使用的登機口為q,則在上述二維矩陣中,(p,q)元素對應(yīng)的數(shù)值為1;否則,在上述二維矩陣中,(p,q)元素對應(yīng)的數(shù)值為0,將標(biāo)注了各個元素對應(yīng)的數(shù)值后的二維矩陣作為表示登機口變化的鄰接矩陣k。
由航站樓內(nèi)客流分布的歷史數(shù)據(jù),得到前一天中對應(yīng)于待預(yù)測未來T′個時刻的旅客流特征矩陣,Y′=(Y′t+1,Y′t+2,…,Y′t+T)′,其中Y′t+1,Y′t+2,…,Y′t+T′分別為前一天中對應(yīng)于待預(yù)測未來T′個時刻的旅客流特征向量,然后結(jié)合上述表示登機口變化的鄰接矩陣k,分別進(jìn)行K 次圖卷積操作,獲得輸出信息
式中:Si(l)為第l 次迭代產(chǎn)生的旅客流特征向量,S(0)=Y′;
將K 次圖卷積操作的輸出信息經(jīng)全連接層進(jìn)行融合,得到由登機口變化引起的旅客流特征矩陣Y2=其中分別為由登機口變化引起的旅客流特征向量。
建立針對航站樓旅客流預(yù)測的GCGRN 模型,該模型具體步驟如下:
步驟1結(jié)合航站樓內(nèi)各個空間區(qū)域與設(shè)施分布特點,將空間區(qū)域信息簡化為圖結(jié)構(gòu)數(shù)據(jù),并構(gòu)造區(qū)域鄰接矩陣A;
步驟2基于樣本生成中的旅客流時間分布向量H 和步驟1 獲得的區(qū)域鄰接矩陣A,通過圖卷積網(wǎng)絡(luò)在圖結(jié)構(gòu)數(shù)據(jù)上進(jìn)行圖卷積操作,獲得空間特征向量;
步驟3將上述步驟2 由圖卷積網(wǎng)絡(luò)提取的空間特征向量輸入門控循環(huán)單元中,提取出航站樓內(nèi)待預(yù)測時刻未來T′個時刻的旅客流特征矩陣Y1,如圖6 所示;
圖6 待預(yù)測時刻的旅客流特征矩陣示意圖Fig.6 Schematic diagram of the passenger flow characteristic matrix at the moment to be predicted
步驟4由航班計劃及航班歷史數(shù)據(jù),得到待預(yù)測時刻未來2 h 內(nèi)起飛航班使用的登機口p 及該航班前一天使用的登機口q,構(gòu)造表示登機口變化的鄰接矩陣k,將前一天對應(yīng)于待預(yù)測時刻的未來T′個時刻的旅客流特征矩陣輸入圖卷積網(wǎng)絡(luò)進(jìn)行圖卷積操作,獲得由登機口變化引起的旅客流特征矩陣Y2,如圖7所示;
圖7 由登機口變化引起的旅客流特征矩陣示意圖Fig.7 Schematic diagram of the passenger flow characteristic matrix caused by the change of the boarding gate
步驟5將步驟3 獲得的航站樓內(nèi)待預(yù)測時刻未來T′個時刻的旅客流特征矩陣Y1和步驟4 獲得的由登機口變化引起的旅客流特征矩陣Y2進(jìn)行融合,通過不同的權(quán)重加權(quán)求和得到最終預(yù)測的旅客流特征矩陣如下
式中:F1、F2為權(quán)重系數(shù)且F1+F2=1。F1表示旅客攜帶行李量;F2表示航班信息,不同時間段內(nèi)航班信息,不同旅客攜帶行李量不同,以此為限制條件進(jìn)行自動迭代,尋找最優(yōu)F1、F2權(quán)重值。
本實驗使用Python 3.7 基于PyTorch 1.7.1 實現(xiàn),使用Windows10 操作系統(tǒng),CPU 為Intel Xeon E5-2680 v4@2.40GHz*14,GPU 為NVIDIAGeForceRTX3080Ti,內(nèi)存64 GB。
為了驗證GCGRN 模型預(yù)測效果,將最終預(yù)測的旅客流與真實旅客流進(jìn)行比較,并利用均方根誤差[10](RMSE,root mean squard error)、平均絕對誤差[10](MAE,mean absolute error)以及擬合優(yōu)度R2[13]作為評價指標(biāo),對比較結(jié)果進(jìn)行衡量,3 種評價指標(biāo)數(shù)值越小表示模型預(yù)測效果越好。
為了探究2.2 節(jié)建立的GCGRN 模型在旅客流預(yù)測的適用性,本文從方法維度進(jìn)行驗證分析。選擇某大型機場5 天運行日作為預(yù)測日,將每日劃分為48個時段,并與傳統(tǒng)K 近鄰(KNN,K-nearest neighbor)模型[5-7]、自回歸求和滑動平均(ARIMA,autoregressive integrated moving average)模型[4]、支持向量機(SVM,support vector machine)模型[8]以及待預(yù)測時刻的旅客流特征矩陣Y1與由登機口變化引起的旅客流特征矩陣Y2分別單獨作用時作對比。
某天各預(yù)測方法仿真對比圖,如圖8 所示。5 日平均評價指標(biāo)均方根誤差RMSE、平均絕對誤差MAE 及擬合優(yōu)度R2如表1 所示。
表1 5 日平均評價指標(biāo)Tab.1 Five-day average evaluation index
圖8 不同預(yù)測方法預(yù)測值與真實值對比Fig.8 Comparison of the predicted value of different models with the actual value
由圖8 和表1 可以看出,待預(yù)測時刻的旅客流特征矩陣Y1與由登機口變化引起的旅客流特征矩陣Y2分別單獨作用時,預(yù)測精度均不如GCGRN 模型,且KNN 模型的評價指標(biāo)RMSE 與MAE 均小于ARIMA模型并均相差2.0,擬合優(yōu)度R2比ARIMA 模型高2.66個百分點,說明KNN 模型對航站樓旅客流預(yù)測效果好于ARIMA 模型,這是由于ARIMA 模型只適用于平穩(wěn)的時間序列,對于像航站樓旅客流這種非線性且復(fù)雜的實際問題,預(yù)測效果就會大打折扣。SVM 模型雖然能較好地解決非線性時間序列問題,各項評價指標(biāo)都優(yōu)于ARIMA 模型且與KNN 模型十分接近,但不易確定模型參數(shù),預(yù)測精度取決于核函數(shù),參數(shù)調(diào)整費時費力,難以幫助航站樓對資源進(jìn)行實時配置。
相較于上述傳統(tǒng)模型,GCGRN 融合圖卷積神經(jīng)網(wǎng)絡(luò)與門控循環(huán)單元,將歷史運營日的各時間切片內(nèi)的旅客流時間分布序列作為訓(xùn)練序列來對預(yù)測日各時間段旅客流進(jìn)行預(yù)測。該模型極大程度地規(guī)避了天氣、節(jié)假日等一系列外界因素對航站樓旅客流造成的影響,較其他模型具有更高的預(yù)測準(zhǔn)確率。
從以上3 種評價指標(biāo)來看,GCGRN 的評價指標(biāo)RMSE 與MAE 均低于其他3 種模型,以MAE 為例,其值低于其他3 種模型的均差為4.507,且擬合優(yōu)度R2為4 種模型最高,平均提高7.58 個百分點,證明了GCGRN 對航站樓旅客流預(yù)測具有更好的效果。
本文從時間和空間兩個維度對航站樓旅客流進(jìn)行建模,構(gòu)建了基于圖卷積神經(jīng)網(wǎng)絡(luò)的航站樓旅客時空分布預(yù)測模型,并提出利用門控循環(huán)單元提取時間特征。最后結(jié)合某機場航站樓實際旅客流數(shù)據(jù)開展航站樓旅客流的預(yù)測探究,研究表明:
(1)GCGRN 模型充分利用航站樓內(nèi)部的空間拓?fù)浣Y(jié)構(gòu),深度挖掘航站樓內(nèi)各空間區(qū)域內(nèi)客流變化的內(nèi)在機理,更好地捕獲了航站樓內(nèi)各空間區(qū)域客流變化的時空相關(guān)性;
(2)GCGRN 模型利用了登機口變化導(dǎo)致航站樓內(nèi)客流分布改變的條件,使得預(yù)測方法的精度更高,可解釋性更強,機場運營方可依據(jù)本方法調(diào)整登機口以調(diào)控客流分布,提高服務(wù)質(zhì)量。
GCGRN 模型雖然對航站樓旅客流提供良好的預(yù)測效果,但不同時間、地點以及航班計劃均會影響聚集效果。未來隨著機場路側(cè)綜合交通帶來的數(shù)據(jù)完善與補充并建立更加完善的航站樓旅客特征體系,可以進(jìn)一步提升基于GCGRN 模型航站樓旅客流預(yù)測模型的精確度與普適度。