趙嶷飛,馬樂川,王紅勇(中國民航大學(xué)天津市空管運(yùn)行規(guī)劃與安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津 300300)
基于貝葉斯網(wǎng)絡(luò)的空中交通延誤傳播分析
趙嶷飛,馬樂川,王紅勇
(中國民航大學(xué)天津市空管運(yùn)行規(guī)劃與安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津 300300)
從機(jī)場網(wǎng)絡(luò)的角度研究延誤傳播問題。貝葉斯網(wǎng)絡(luò)是一種分析傳播問題的有效方法,基于貝葉斯網(wǎng)絡(luò)的延誤模型,構(gòu)造出延誤傳播的機(jī)場網(wǎng)絡(luò)模型。通過計(jì)算網(wǎng)絡(luò)中條件概率,最終得到聯(lián)合概率,用于分析機(jī)場之間延誤傳播的影響。實(shí)驗(yàn)數(shù)據(jù)表明,當(dāng)某一機(jī)場產(chǎn)生離場延誤時(shí),這一延誤不會(huì)消失,而是經(jīng)過時(shí)間的推移傳播到其他機(jī)場,造成其他機(jī)場的延誤。
貝葉斯網(wǎng)絡(luò);航班延誤;延誤傳播
隨著中國民航事業(yè)高速發(fā)展,機(jī)場吞吐量與航班量大幅度增加,導(dǎo)致全國范圍內(nèi)的機(jī)場均有航班延誤現(xiàn)象發(fā)生。航班流量大的機(jī)場,由于空域和機(jī)場資源限制,是航班延誤問題多發(fā)區(qū)。航班班次排名前10的機(jī)場,幾乎同時(shí)也是航班延誤排名前10的機(jī)場。這些機(jī)場起降的航班數(shù)量約占全國航班總量的50%,卻占據(jù)不正常航班中的81%。由于全國大部分機(jī)場的延誤直接或間接受到這些機(jī)場的影響,因此,研究樞紐機(jī)場的延誤成為減少航班延誤的關(guān)鍵。近十年來,航班延誤及其波及分析模型成為民航領(lǐng)域的一個(gè)研究熱點(diǎn)。Clarke和Abdelghany分別于1997年和2004年提出了各自的延誤波及分析模型,兩個(gè)模型對(duì)由于GDP (ground delay program)或者其他因素引起的航班延誤的后續(xù)波及進(jìn)行了分析[1]。目前國內(nèi)研究航班延誤主要從航空公司角度出發(fā),通過收集整理某一航空公司所有航班的運(yùn)行數(shù)據(jù),運(yùn)用延誤模型進(jìn)行分析。
本文從機(jī)場運(yùn)行的角度出發(fā),選擇機(jī)場間延誤航班作為研究對(duì)象。通過處理全國航班時(shí)刻,篩選出北京、上海、廣州3大機(jī)場的到港延誤、離港延誤的時(shí)間。通過構(gòu)建貝葉斯網(wǎng)絡(luò),綜合先驗(yàn)知識(shí)和延誤樣本數(shù)據(jù),計(jì)算出聯(lián)合概率分布表,通過數(shù)據(jù)量化出廣州、上海2個(gè)機(jī)場的離場延誤對(duì)于北京首都機(jī)場到港延誤的影響。研究結(jié)果有助于挖掘機(jī)場之間延誤傳播的內(nèi)在機(jī)理,實(shí)現(xiàn)延誤傳播的科學(xué)預(yù)測,為及時(shí)、科學(xué)的實(shí)施延誤管理提供依據(jù)。
1.1 基本概念
貝葉斯網(wǎng)絡(luò)(BN)是一種基于網(wǎng)絡(luò)結(jié)構(gòu)的有向圖解描述,是用來表示變量集合連接概率的圖形模型,適用于表達(dá)和分析不確定和概率性事物,可從不完全或不確定的知識(shí)或信息中做出推理。一個(gè)貝葉斯網(wǎng)絡(luò)是一個(gè)有向無環(huán)圖(directed acyclic graph,DAG),由代表變量節(jié)點(diǎn)及連接這些節(jié)點(diǎn)有向邊構(gòu)成。節(jié)點(diǎn)代表隨機(jī)變量,節(jié)點(diǎn)間的有向邊代表了節(jié)點(diǎn)間的相互關(guān)系(由父節(jié)點(diǎn)指向其后代節(jié)點(diǎn)),用條件概率進(jìn)行表達(dá)關(guān)系強(qiáng)度,沒有父節(jié)點(diǎn)的用先驗(yàn)概率進(jìn)行信息表達(dá)。節(jié)點(diǎn)變量可以是任何問題的抽象,如測試值、觀測現(xiàn)象、意見征詢等[2]。
1.2 貝葉斯網(wǎng)絡(luò)的特點(diǎn)
根據(jù)其基本原理,貝葉斯網(wǎng)絡(luò)具有如下特點(diǎn)[3]。
1)貝葉斯網(wǎng)絡(luò)具有堅(jiān)實(shí)的概率理論基礎(chǔ),同時(shí)具有直觀的知識(shí)表示形式。
2)貝葉斯網(wǎng)絡(luò)與一般知識(shí)表示方法不同,它是對(duì)于問題域的建模。因此當(dāng)條件或行為等發(fā)生變化時(shí),不用對(duì)模型進(jìn)行修正。
3)貝葉斯網(wǎng)絡(luò)能夠處理不完備數(shù)據(jù)集。貝葉斯網(wǎng)絡(luò)反映的是整個(gè)數(shù)據(jù)域中數(shù)據(jù)間的概率關(guān)系,即使缺少某一數(shù)據(jù)變量仍然可以建立精確的模型。
4)貝葉斯網(wǎng)絡(luò)是根據(jù)因果關(guān)系進(jìn)行學(xué)習(xí)的。在數(shù)據(jù)分析處理中獲得變量域的理解,便于處理各種不確定性信息。
5)貝葉斯網(wǎng)絡(luò)與貝葉斯統(tǒng)計(jì)相結(jié)合能夠充分利用領(lǐng)域知識(shí)和樣本數(shù)據(jù)的信息。
綜上所述,應(yīng)用貝葉斯網(wǎng)絡(luò)建模進(jìn)行數(shù)據(jù)分析,能夠很好地解決民航數(shù)據(jù)普遍存在的信息量大、有缺失、直觀因果關(guān)系不明確、知識(shí)隱藏等問題。
建立航班延誤的過程實(shí)際上就是構(gòu)造貝葉斯網(wǎng)絡(luò)的過程。構(gòu)造貝葉斯網(wǎng)絡(luò)一般分為3個(gè)步驟[4]:①確定變量集及其對(duì)應(yīng)的值域;②確定網(wǎng)絡(luò)結(jié)構(gòu),即給出有向無環(huán)圖Г;③給出局部概率分布P(Xi|Π(Xi)),它表達(dá)了節(jié)點(diǎn)同其父節(jié)點(diǎn)的相關(guān)關(guān)系——條件概率,沒有任何父節(jié)點(diǎn)的條件概率為其先驗(yàn)概率。這3個(gè)步驟通常是交叉進(jìn)行,而不是簡單地按順序完成。下面具體描述基于貝葉斯網(wǎng)絡(luò)的航班延誤模型的建立。
2.1 數(shù)據(jù)定義
根據(jù)中國民航局《民航航班正常統(tǒng)計(jì)辦法》,在班期時(shí)刻表公布的離站時(shí)間后15 min(北京、浦東、廣州以及境外機(jī)場30 min,虹橋、深圳機(jī)場25 min,成都、昆明機(jī)場20 min)之內(nèi)正常起飛未發(fā)生返航、改航和備降等不正常情況的航班;在班期時(shí)刻表公布的到達(dá)時(shí)間前后10 min之內(nèi)落地的航班,均屬于正常航班。不符合正常航班條件的航班為不正常航班[5]。
本文采用飛友網(wǎng)提供的全國某天航班實(shí)際運(yùn)行數(shù)據(jù),并進(jìn)行預(yù)處理:第1步,由于北京、上海、廣州是我國3大樞紐機(jī)場,三大機(jī)場之間的延誤傳播現(xiàn)象更為明顯,因此選其為研究對(duì)象;第2步,篩選出3大樞紐機(jī)場的進(jìn)、離港航班時(shí)刻;第3步,分別對(duì)進(jìn)、離港航班的延誤時(shí)間進(jìn)行統(tǒng)計(jì),實(shí)際起飛時(shí)間大于計(jì)劃起飛時(shí)間30 min即為離場延誤,實(shí)際到達(dá)時(shí)間大于計(jì)劃到達(dá)時(shí)間10 min即為進(jìn)場延誤,計(jì)算實(shí)際飛行時(shí)間,計(jì)算出平均航路飛行時(shí)間。
2.2 航班延誤模型的變量及其對(duì)應(yīng)的值域
通過分析,可知北京發(fā)生到達(dá)延誤是多個(gè)因素共同作用的結(jié)果。因此,在建立延誤模型時(shí),選取廣州至北京航班的離場延誤、上海至北京航班的離場延誤、時(shí)間段作為北京到達(dá)延誤的影響因素,其相應(yīng)的變量集[4]確定如下
X={ZGGGDepDelay,ZSSSDepDelay,T};
其中,ZGGGDepDelay表示廣州至北京航班的離場延誤,ZSSSDepDelay表示上海虹橋至北京航班的離場延誤,T表示時(shí)間段。
各變量對(duì)應(yīng)的值域分別為
ZGGGDepDelay:{<=30 min,30~60 min,60~90 min,>90 min};
ZSSSDepDelay:{<=30 min,30~60 min,60~90 min,>90 min};T:{8:00—10:00,10:00—12:00,12:00—14:00,14:00—16:00,16:00—18:00,18:00—20:00,20:00—22:00,22:00—24:00}
模型中的變量及其對(duì)應(yīng)值域是在分析目前對(duì)北京到達(dá)延誤及其各成因之間關(guān)系的研究成果的基礎(chǔ)上確定的。
2.3 延誤模型的網(wǎng)絡(luò)結(jié)構(gòu)
根據(jù)上述模型變量之間的相互關(guān)系,將貝葉斯網(wǎng)絡(luò)與航班延誤模型相結(jié)合,該模型的網(wǎng)絡(luò)結(jié)構(gòu)描述如圖1所示[6]。
圖1 延誤模型網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Net structure of delay model
圖1中每個(gè)節(jié)點(diǎn)表示一個(gè)變量,節(jié)點(diǎn)之間的有向弧表示各變量之間的因果關(guān)系。
2.3.1 時(shí)間段與廣州離場延誤之間關(guān)系
將時(shí)間段與廣州離場延誤關(guān)系從圖1中分離出來,如圖2所示。
圖2 時(shí)間段與廣州離場延誤之間的關(guān)系Fig.2 Relationship between time slot and Guangzhou departure delay
在本文所建立的航班延誤模型中,根據(jù)已確定的模型變量及其對(duì)應(yīng)值域可知,廣州離場延誤有4個(gè)值,時(shí)間段有8個(gè)值,則兩者之間的條件概率表中會(huì)出現(xiàn)4×8種條件概率。得到時(shí)間段與廣州離場延誤之間的條件概率如表1所示。
表1 廣州離場延誤與時(shí)間段的條件概率Tab.1 Conditional probability of Guangzhou departure delay and time slot
2.3.2 時(shí)間段與上海離場延誤之間關(guān)系
將時(shí)間段上海離場延誤關(guān)系從圖1中分離出來,如圖3所示
圖3 時(shí)間段與上海離場延誤之間的關(guān)系Fig.3 Relationship between time slot and Shanghai departure delay
根據(jù)已確定的模型變量及其對(duì)應(yīng)值域可知,上海離場延誤有4個(gè)值,時(shí)間段有8個(gè)值,則他們兩者之間的條件概率表中會(huì)出現(xiàn)4×8種條件概率。得到時(shí)間段與上海離場延誤之間的條件概率如表2所示。2.3.3 時(shí)間段與北京到達(dá)延誤之間關(guān)系
將時(shí)間段與廣州、上海至北京到達(dá)延誤關(guān)系從圖1中分離出來,如圖4所示。
根據(jù)已確定的模型變量及其對(duì)應(yīng)值域可知,時(shí)間段有8個(gè)值,北京到達(dá)延誤有5個(gè)值,則兩者之間的條件概率表中會(huì)出現(xiàn)5×8種條件概率。得到北京到達(dá)延誤與時(shí)間段之間的條件概率如表3所示。
表2 上海離場延誤與時(shí)間段的條件概率Tab.2 Conditional probability of Shanghai departure delay and time slot
圖4 時(shí)間段與北京到達(dá)延誤之間的關(guān)系Fig.4 Relationship between time slot and Beijing arrival delay
表3 北京到達(dá)延誤與時(shí)間段的條件概率Tab.3 Conditional probability of Beijing arrival delay and time slot
2.3.4 延誤模型聯(lián)合分布下的條件概率
獲取延誤模型在上述3個(gè)影響因素聯(lián)合分布下的條件概率,實(shí)質(zhì)上是一個(gè)貝葉斯學(xué)習(xí)的過程。具體推導(dǎo)概率p(d|ZGGGDepDelay,ZSSSDepDelay,T)的求法如下[4]:
對(duì)(1)式中的p(ZGGGDepDelay,ZSSSDepDelay,T|d)運(yùn)用條件獨(dú)立性,得到:
由(2)式可知,要計(jì)算概率p(d|ZGGGDepDelay,ZSSSDepDelay,T)的值,需要知道某些先驗(yàn)概率及條件概率。通過已經(jīng)處理好的3大機(jī)場延誤時(shí)刻數(shù)據(jù)進(jìn)行分析,還需要北京機(jī)場各個(gè)時(shí)間段延誤的概率分布,在表4中列出。
表4 北京機(jī)場各個(gè)時(shí)間段延誤的概率分布Tab.4 Probability distribution of every time slot in Beijing airport
根據(jù)已確定的網(wǎng)絡(luò)結(jié)構(gòu),利用局部概率分布可以得到網(wǎng)絡(luò)中各變量間的聯(lián)合概率分布。就本網(wǎng)絡(luò)而言,各變量間的聯(lián)合概率可以表示如下:
通過上述計(jì)算好的聯(lián)合概率分布,可以求出p(d,ZGGGDepDelay,ZSSSDepDelay,T)。由于上海至北京的平均飛行時(shí)間為1 h 45 min;廣州至北京的平均飛行時(shí)間為2 h 45 min,因此,應(yīng)基于飛行時(shí)間選擇時(shí)間段。本文中,若計(jì)算北京某一時(shí)間段內(nèi)到達(dá)延誤發(fā)生概率,對(duì)應(yīng)的由上海始發(fā)航班向前推一個(gè)時(shí)間段,廣州始發(fā)航班向前推兩個(gè)時(shí)間段。若選擇8∶00—10∶00時(shí)間段,由于在此之前,廣州、上海沒有航班起飛,因此北京到達(dá)延誤的概率為零。
下面通過一個(gè)實(shí)際算例來說明計(jì)算過程。
上海離場正常(<30 min),廣州離場正常(<30 min),通過查詢各屬性的條件概率表,在各個(gè)時(shí)間段北京到達(dá)正常(<10 min)的概率如下:
由上述概率可以看出,當(dāng)上海、廣州離場都正常,到達(dá)北京的航班在12:00—14:00這個(gè)時(shí)間段內(nèi)正點(diǎn)的概率為0.8%,而在14:00—16:00這個(gè)時(shí)間段內(nèi)正點(diǎn)的概率為56.7%。
通過反復(fù)的計(jì)算,就可以知道網(wǎng)絡(luò)中任意傳播概率。由于篇幅限制,以下僅列出部分概率表。
1)當(dāng)上海離場正點(diǎn)時(shí),廣州離場延誤時(shí)間為30~60 min,北京到達(dá)延誤時(shí)間為20~30 min,各時(shí)間段的概率,如表5所示。
表5 概率分布1Tab.5 Probability distribution No.1
2)當(dāng)廣州離場正點(diǎn)時(shí),上海離場延誤時(shí)間為30~60 min,北京到達(dá)延誤時(shí)間為20~30 min,各時(shí)間段的概率,如表6所示。
表6 概率分布2Tab.6 Probability distribution No.2
3)當(dāng)上海、廣州離場延誤時(shí)間均為30~60 min,北京到達(dá)延誤時(shí)間為10~20 min,各時(shí)間段的概率,如表7所示。
表7 概率分布3Tab.7 Probability distribution No.3
4)當(dāng)上海、廣州離場延誤時(shí)間均為30~60 min,北京到達(dá)延誤時(shí)間為20~30 min,各時(shí)間段的概率,如表8所示。
表8 概率分布4Tab.8 Probability distribution No.4
表5表示不考慮上海離場延誤,只考慮廣州離場延誤對(duì)于北京到達(dá)延誤的影響,在16∶00—18∶00這個(gè)時(shí)間段內(nèi),北京到達(dá)延誤受到的影響最大。而在這個(gè)時(shí)間段內(nèi)到達(dá)北京的航班,其起飛時(shí)間應(yīng)在12:00—14:00,而通過對(duì)比實(shí)際航班信息,在這個(gè)時(shí)間段中,廣州至北京航班中發(fā)生離港延誤,從而導(dǎo)致北京到達(dá)的延誤。
表6表示不考慮廣州離場延誤,只考慮上海離場延誤對(duì)于北京到達(dá)延誤的影響,在14:00—16:00這個(gè)時(shí)間段內(nèi),北京到達(dá)延誤受到的影響最大。而在這個(gè)時(shí)間段內(nèi)到達(dá)北京的航班,其起飛時(shí)間應(yīng)在12:00—14:00,而通過對(duì)比實(shí)際航班信息,在這個(gè)時(shí)間段中,上海至北京航班中大部分發(fā)生離港延誤。
表7、表8表示當(dāng)上海、廣州離場均發(fā)生延誤時(shí),在各個(gè)時(shí)間段,北京發(fā)生輕度到達(dá)延誤與中度到達(dá)延誤的概率。從表中可以看到,在18:00—20:00這個(gè)時(shí)間段內(nèi),北京同時(shí)受到上海與廣州離場延誤的影響最大。
通過以上數(shù)據(jù)分析,可以得出以下結(jié)論:當(dāng)起飛機(jī)場產(chǎn)生離場延誤,這些延誤不會(huì)消失在航路上,而是會(huì)隨著時(shí)間的推移,沿航路傳播到下一個(gè)節(jié)點(diǎn)——目的地機(jī)場,造成目的地機(jī)場產(chǎn)生到達(dá)延誤。由于在不同的時(shí)間段內(nèi),起飛機(jī)場產(chǎn)生的離場延誤等級(jí)不同,因此會(huì)影響到到達(dá)延誤的等級(jí)。
通過建立貝葉斯網(wǎng)絡(luò),可以分析2個(gè)甚至多個(gè)機(jī)場之間離場航班延誤對(duì)到達(dá)航班延誤的影響。貝葉斯網(wǎng)絡(luò)模型不僅具有嚴(yán)格的概率理論基礎(chǔ),而且其網(wǎng)絡(luò)結(jié)構(gòu)也可以將各元素之間的關(guān)系直觀地表示出來,能夠清晰準(zhǔn)確地分析延誤傳播情況。
本文通過對(duì)北京、上海、廣州3大樞紐機(jī)場到達(dá)延誤與離港延誤數(shù)據(jù)統(tǒng)計(jì);通過學(xué)習(xí)貝葉斯網(wǎng)絡(luò),建立到達(dá)延誤與離港延誤的網(wǎng)絡(luò)結(jié)構(gòu),計(jì)算出各種情況下概率值,從而對(duì)北京的到達(dá)延誤受到的影響進(jìn)行分析。進(jìn)而得出結(jié)論:當(dāng)某一機(jī)場產(chǎn)生離場延誤時(shí),這一延誤不會(huì)消失,而是經(jīng)過時(shí)間的推移傳播到其他機(jī)場,造成其他機(jī)場的延誤。
[1]徐 濤,丁建立,王建東,趙學(xué)健.基于貝葉斯網(wǎng)絡(luò)的航班延誤與波及分析模型[J].系統(tǒng)仿真學(xué)報(bào),2009,15(21):4818-4822.
[2]何丕廉,劉玉潔.基于貝葉斯網(wǎng)絡(luò)的航班延誤與波及預(yù)測[D].天津:天津大學(xué),2009.
[3]曹衛(wèi)東,丁建立,劉玉潔.基于貝葉斯網(wǎng)絡(luò)的航班離港延誤預(yù)警分析[J].計(jì)算機(jī)應(yīng)用研究,2008,11(25):3389-3390.
[4]黃席樾,劉 利.道路交通事故統(tǒng)計(jì)分析及預(yù)測模型研究[D].重慶:重慶大學(xué),2004.
[5] 中國民用航空局.航空發(fā)(2003)96號(hào),民航航班正常統(tǒng)計(jì)辦法[S]. 2003.
[6]XU N,DONOHUE G,LASKEY K B.Estimation of delay propagation in the national aviation system using Bayesian networks[J].USA/Europe Air Traffic Management Research and Development Seminar,2005,1-11.
[7] 李俊生,丁建立.基于貝葉斯網(wǎng)絡(luò)的航班延誤傳播分析[J].航空學(xué)報(bào),2008,6(29):1598-1604.
(責(zé)任編輯:黃 月)
Analysis of air traffic delay propagation based on Bayesian networks
ZHAO Yi-fei,MA Le-chuan,WANG Hong-yong
(Tianjin Key Laboratory for Air Traffic Operation Planning and Safety Technology,CAUC,Tianjin 300300,China)
Based on Bayesian networks delay model,is the delay spread airport network modelis.By calculating the conditional probability of network,finally get the joint probability,is used to analyze the effects of delays propagation between the airport.The experiment data show that,when an airport departure delays produced,the delay will not disappear,but after a time spread to other airports,causing other airport delays.
Bayesian networks;flight delay;delay propagation
V351
A
1674-5590(2013)01-0027-05
2012-05-04;
2012-08-10
國家科技支撐計(jì)劃項(xiàng)目(2011BAH24B10);國家自然科學(xué)基金(60832011);中國民用航空局科技基金項(xiàng)目(MHRD201018);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)(ZXH2009A004,ZXH2010C010)
趙嶷飛(1971—),男,湖南常德人,教授,博士,研究方向?yàn)榭罩薪煌ㄒ?guī)劃與管理.