文 超,李 津,李忠燦,智利軍,田 銳,宋邵杰
(1.西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 611756;2.中土集團(tuán)福州勘察設(shè)計(jì)研究院有限公司,福州 350013;3.中國(guó)國(guó)家鐵路集團(tuán)有限公司調(diào)度指揮中心,北京 100844;4.中國(guó)鐵路廣州局集團(tuán)有限公司調(diào)度所,廣州 510088)
鐵路調(diào)度指揮是鐵路運(yùn)營(yíng)管理和列車(chē)運(yùn)行控制的中樞,擔(dān)負(fù)著組織指揮鐵路列車(chē)運(yùn)行和日常生產(chǎn)活動(dòng)的重要任務(wù)。列車(chē)調(diào)度員需要根據(jù)各種實(shí)時(shí)信息和預(yù)定的規(guī)則來(lái)實(shí)現(xiàn)相應(yīng)的調(diào)整目標(biāo),而基于調(diào)度員經(jīng)驗(yàn)的傳統(tǒng)人工為主的調(diào)度方法已經(jīng)難以適應(yīng)當(dāng)前復(fù)雜的運(yùn)輸組織需求。智能鐵路已成為世界鐵路發(fā)展的重點(diǎn)方向,智能行車(chē)調(diào)度是我國(guó)鐵路當(dāng)前及未來(lái)一定時(shí)期內(nèi)發(fā)展的關(guān)鍵技術(shù)。中國(guó)工程院“智能高鐵戰(zhàn)略研究(2035)”重大咨詢項(xiàng)目認(rèn)為:智能行車(chē)調(diào)度是我國(guó)智能高鐵中期(2021—2025)要實(shí)現(xiàn)的目標(biāo)[1]。為了保障鐵路運(yùn)輸服務(wù)的安全性、連續(xù)性、高效性與準(zhǔn)時(shí)性,亟需高效準(zhǔn)確的決策支持方法來(lái)提升調(diào)度員決策水平和效度。
實(shí)現(xiàn)海量數(shù)據(jù)可挖掘、設(shè)備狀態(tài)可診斷、行車(chē)安全可預(yù)警、復(fù)雜路網(wǎng)運(yùn)營(yíng)變化可感知、發(fā)展趨勢(shì)可推斷、輔助決策可支撐,提升鐵路的智能決策水平,提高決策效度是智能鐵路亟待解決的關(guān)鍵科學(xué)問(wèn)題,是“交通強(qiáng)國(guó)、鐵路先行”戰(zhàn)略的迫切需要和必然要求。數(shù)據(jù)科學(xué)及人工智能給解決鐵路運(yùn)輸組織大規(guī)模和實(shí)時(shí)性復(fù)雜決策支持問(wèn)題帶來(lái)了新的契機(jī)。機(jī)器學(xué)習(xí)方法作為人工智能的核心,無(wú)需以先驗(yàn)知識(shí)為基礎(chǔ),而是從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并構(gòu)造模型來(lái)逼近鐵路運(yùn)輸生產(chǎn)實(shí)際情況,已經(jīng)在鐵路運(yùn)輸領(lǐng)域凸顯了優(yōu)勢(shì)[2,3]。推理與推薦系統(tǒng)、計(jì)算機(jī)視覺(jué)、知識(shí)表達(dá)與模式識(shí)別等人工智能方法和技術(shù)已經(jīng)在我國(guó)鐵路運(yùn)輸安全、客票、旅客服務(wù)等領(lǐng)域取得了初步應(yīng)用。
列車(chē)調(diào)度調(diào)整一直以來(lái)都是制約調(diào)度指揮自動(dòng)化的瓶頸問(wèn)題[4]。目前普遍認(rèn)為基于機(jī)器學(xué)習(xí)方法的調(diào)度決策方案比經(jīng)驗(yàn)決策和傳統(tǒng)數(shù)學(xué)優(yōu)化模型更具實(shí)用性和科學(xué)性[5,6],但當(dāng)前世界鐵路調(diào)度指揮智能化還有很長(zhǎng)的路要走。加速機(jī)器學(xué)習(xí)方法在鐵路列車(chē)調(diào)度指揮中的應(yīng)用進(jìn)程,提高調(diào)度決策的智能化和自動(dòng)化水平,將有效助力我國(guó)鐵路行業(yè)發(fā)展。為全面梳理以機(jī)器學(xué)習(xí)方法在鐵路列車(chē)調(diào)度指揮中的研究現(xiàn)狀,明確未來(lái)研究的重點(diǎn)和方向,本文系統(tǒng)總結(jié)了近10 年來(lái)機(jī)器學(xué)習(xí)方法在鐵路列車(chē)調(diào)度調(diào)整方面的研究成果,以期為相關(guān)研究及發(fā)展實(shí)踐提供一定參考。
在列車(chē)實(shí)際運(yùn)行過(guò)程中,鐵路系統(tǒng)內(nèi)外部的各種隨機(jī)因素干擾,會(huì)導(dǎo)致列車(chē)運(yùn)行的實(shí)際狀態(tài)偏離預(yù)定值、運(yùn)行秩序紊亂的情況時(shí)有發(fā)生。列車(chē)調(diào)度員是管轄區(qū)段行車(chē)工作的統(tǒng)一指揮者,負(fù)責(zé)及時(shí)收集并分析晚點(diǎn)列車(chē)相關(guān)的各種信息,根據(jù)列車(chē)運(yùn)行態(tài)勢(shì)分析與評(píng)估列車(chē)晚點(diǎn)原因和狀態(tài),預(yù)測(cè)和估計(jì)列車(chē)晚點(diǎn)演化態(tài)勢(shì),并根據(jù)經(jīng)驗(yàn)和規(guī)則制定相應(yīng)的列車(chē)運(yùn)行調(diào)整策略,組織列車(chē)盡快恢復(fù)正常運(yùn)行秩序。圖1 所示為鐵路列車(chē)調(diào)度調(diào)整的一般流程。
如圖1所示,列車(chē)調(diào)度員在進(jìn)行調(diào)度調(diào)整及制定列車(chē)運(yùn)行調(diào)整決策時(shí),需要以海量的列車(chē)運(yùn)行信息為基礎(chǔ)。圖2 所示為鐵路列車(chē)調(diào)度調(diào)整的數(shù)據(jù),鐵路列車(chē)運(yùn)行控制系統(tǒng)、行車(chē)安全監(jiān)控系統(tǒng)等調(diào)度指揮邊界接口系統(tǒng)(圖中①)采集并提供基礎(chǔ)數(shù)據(jù),提取列車(chē)運(yùn)行實(shí)時(shí)狀態(tài)、固定和移動(dòng)設(shè)備運(yùn)用狀態(tài)、列車(chē)運(yùn)行環(huán)境信息等調(diào)度決策信息(圖中②),上述信息被匯總到鐵路調(diào)度指揮系統(tǒng)(圖中③)供調(diào)度員決策使用。綜合分析、語(yǔ)義識(shí)別等方法已經(jīng)廣泛應(yīng)用于鐵路列車(chē)調(diào)度數(shù)據(jù)的獲取、篩選、聚合、可視化等數(shù)據(jù)融合過(guò)程[7-9]。
圖1 鐵路列車(chē)調(diào)度調(diào)整的一般流程
圖2 鐵路列車(chē)調(diào)度調(diào)整的數(shù)據(jù)
機(jī)器學(xué)習(xí)方法是實(shí)現(xiàn)人工智能的重要途徑,被廣泛應(yīng)用于多個(gè)領(lǐng)域,其核心目標(biāo)是使用算法來(lái)解析數(shù)據(jù),進(jìn)而基于數(shù)據(jù)模擬人類的學(xué)習(xí)、決策和預(yù)測(cè)行為。機(jī)器學(xué)習(xí)的主要研究?jī)?nèi)容為讓機(jī)器自動(dòng)從數(shù)據(jù)中學(xué)習(xí)規(guī)則并不斷改善自身性能。根據(jù)學(xué)習(xí)策略的不同,機(jī)器學(xué)習(xí)方法一般可以分為有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)[10]。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的研究方向,其概念源于模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)研究。
有監(jiān)督學(xué)習(xí)的數(shù)據(jù)集包含了樣本特征與標(biāo)簽,在訓(xùn)練過(guò)程中,需要選擇合適的函數(shù)模型,通過(guò)計(jì)算模型的預(yù)測(cè)值與真實(shí)值之間的誤差來(lái)優(yōu)化模型參數(shù)。常見(jiàn)的有監(jiān)督學(xué)習(xí)算法有線性回歸、邏輯回歸、支持向量機(jī)、支持向量回歸、隨機(jī)森林等。無(wú)監(jiān)督學(xué)習(xí)的數(shù)據(jù)樣本集僅包含特征,算法需要自行發(fā)現(xiàn)數(shù)據(jù)的模態(tài)來(lái)優(yōu)化模型。常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)算法有主成分分析、K 均值算法、關(guān)聯(lián)分析算法等。強(qiáng)化學(xué)習(xí)也稱為增強(qiáng)學(xué)習(xí),其算法通過(guò)與環(huán)境的交互來(lái)學(xué)習(xí)解決問(wèn)題的策略,進(jìn)而達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)。常見(jiàn)的強(qiáng)化學(xué)習(xí)算法有Q-learning、近端策略優(yōu)化算法等。近年來(lái),學(xué)者們提出了大量先進(jìn)的深度學(xué)習(xí)算法,并在諸多領(lǐng)域取得了遠(yuǎn)超先前機(jī)器學(xué)習(xí)技術(shù)的分析效果,常見(jiàn)的深度學(xué)習(xí)算法有卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等。
本文重點(diǎn)分析機(jī)器學(xué)習(xí)方法在調(diào)度調(diào)整三個(gè)主要方面的應(yīng)用研究,具體為:
(1)列車(chē)晚點(diǎn)狀態(tài)分析與評(píng)估。旨在評(píng)估和闡釋列車(chē)歷史運(yùn)行信息,使用數(shù)據(jù)聚合和數(shù)據(jù)挖掘技術(shù),幫助調(diào)度員了解列車(chē)運(yùn)行晚點(diǎn)的一般規(guī)律。
(2)列車(chē)晚點(diǎn)傳播預(yù)測(cè)。著重于運(yùn)用機(jī)器學(xué)習(xí)方法研究鐵路列車(chē)晚點(diǎn)的傳播過(guò)程,包括列車(chē)晚點(diǎn)狀態(tài)和恢復(fù)的預(yù)測(cè)。
(3)列車(chē)運(yùn)行調(diào)整智能化決策。綜合相關(guān)行車(chē)調(diào)度業(yè)務(wù)規(guī)則、機(jī)器學(xué)習(xí)算法和計(jì)算建模程序?qū)崿F(xiàn)調(diào)度決策的自動(dòng)制定。
通過(guò)對(duì)線路晚點(diǎn)規(guī)律的掌握,列車(chē)調(diào)度員可以在晚點(diǎn)發(fā)生時(shí)正確識(shí)別晚點(diǎn)恢復(fù)的關(guān)鍵影響因素,從而制定相應(yīng)的對(duì)策,實(shí)現(xiàn)列車(chē)延誤的快速消解。晚點(diǎn)狀態(tài)分析與評(píng)估是列車(chē)晚點(diǎn)預(yù)測(cè)及列車(chē)運(yùn)行調(diào)整的理論基礎(chǔ),其主要研究?jī)?nèi)容為:基于鐵路列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),提取并分類統(tǒng)計(jì)列車(chē)晚點(diǎn)、初始晚點(diǎn)、連帶晚點(diǎn),運(yùn)用描述性統(tǒng)計(jì)、繪制分布曲線、關(guān)聯(lián)、聚類等方法探索數(shù)據(jù)蘊(yùn)含的規(guī)律,從宏觀上探明高速列車(chē)晚點(diǎn)分布的基本規(guī)律,如列車(chē)的晚點(diǎn)時(shí)空、時(shí)長(zhǎng)分布規(guī)律等,并將這些規(guī)律應(yīng)用于列車(chē)運(yùn)行過(guò)程控制及晚點(diǎn)預(yù)測(cè)中,調(diào)度員可以根據(jù)列車(chē)在區(qū)間的歷史和實(shí)時(shí)狀態(tài)以及列車(chē)在后續(xù)車(chē)站、區(qū)間的晚點(diǎn)分布規(guī)律,對(duì)列車(chē)的運(yùn)行狀態(tài)進(jìn)行預(yù)判。
現(xiàn)代統(tǒng)計(jì)模型是最簡(jiǎn)單和基本的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,也是晚點(diǎn)分析最常用的方法,其目的在于對(duì)數(shù)據(jù)進(jìn)行聚合和總結(jié),幫助調(diào)度員直觀地了解特定車(chē)站、列車(chē)或區(qū)間的晚點(diǎn)總體或詳細(xì)信息。描述性統(tǒng)計(jì)方法[11,12]、分布擬合[13,14]等都被應(yīng)用于晚點(diǎn)致因、晚點(diǎn)分布、連帶晚點(diǎn)的建模?;诹熊?chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),對(duì)數(shù)正態(tài)分布、韋伯分布、伽馬分布等統(tǒng)計(jì)模型被用于擬合高速列車(chē)的晚點(diǎn)致因及影響列車(chē)數(shù)和影響總時(shí)間[15,16]。
為了挖掘深層次的列車(chē)晚點(diǎn)規(guī)律,一些更高級(jí)的機(jī)器學(xué)習(xí)方法被應(yīng)用于晚點(diǎn)分析中。Markovi?等[17]率先使用支持向量回歸建立列車(chē)晚點(diǎn)和鐵路系統(tǒng)的各種特征(基礎(chǔ)設(shè)施、時(shí)刻表和列車(chē))的功能關(guān)系,旨在幫助調(diào)度員評(píng)估鐵路系統(tǒng)的各種變化對(duì)列車(chē)晚點(diǎn)的影響。Murali[18]基于模擬的列車(chē)晚點(diǎn)數(shù)據(jù),提出了一種晚點(diǎn)估計(jì)方法,該方法定義了列車(chē)晚點(diǎn)與列車(chē)組合、運(yùn)行參數(shù)和網(wǎng)絡(luò)拓?fù)渲g的函數(shù)關(guān)系。Lee 等[19]提出了基于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的監(jiān)督?jīng)Q策樹(shù)方法,用于發(fā)現(xiàn)影響連帶晚點(diǎn)的關(guān)鍵因素,該模型由數(shù)據(jù)預(yù)處理與分析、決策樹(shù)構(gòu)建、關(guān)鍵晚點(diǎn)因子的分析、延遲時(shí)空拓?fù)浞治鏊膫€(gè)階段組成。Cerreto 等[20]使用KMeans 聚類方法識(shí)別了丹麥哥本哈根以北的一條高鐵線路周期性晚點(diǎn)模式,通過(guò)分析經(jīng)常性晚點(diǎn)列車(chē)的運(yùn)行規(guī)律,查找列車(chē)重復(fù)晚點(diǎn)原因。張琦等[21]提出了一種高速鐵路列車(chē)連帶晚點(diǎn)的特征識(shí)別方法,該方法綜合考慮了連帶晚點(diǎn)的實(shí)際值、預(yù)測(cè)值和影響值等因素,將列車(chē)晚點(diǎn)分為嚴(yán)重、潛在、消散、一般四種類型,提高了列車(chē)連帶晚點(diǎn)的辨識(shí)度。
列車(chē)的運(yùn)行過(guò)程是一個(gè)時(shí)變的過(guò)程,受到大量外界因素的干擾以及行車(chē)人員決策的雙重影響。列車(chē)晚點(diǎn)的分布具有較大的隨機(jī)性,但從歷史數(shù)據(jù)能夠挖掘相關(guān)設(shè)備、天氣、作業(yè)組織造成晚點(diǎn)的相應(yīng)概率是關(guān)鍵,這樣就能推導(dǎo)并形成列車(chē)在相關(guān)影響因素下的一般規(guī)律,從而為行車(chē)指揮提供一定的指導(dǎo)。由于概率統(tǒng)計(jì)模型多是基于單變量分析,且模型形式也比較簡(jiǎn)單,因此其描述和預(yù)測(cè)性能往往很有限。目前,主要是運(yùn)用現(xiàn)代統(tǒng)計(jì)、聚類等機(jī)器學(xué)習(xí)方法研究列車(chē)晚點(diǎn)狀態(tài)分析與評(píng)估問(wèn)題,未見(jiàn)神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等高級(jí)機(jī)器學(xué)習(xí)方法的應(yīng)用。
2.2.1 列車(chē)晚點(diǎn)傳播過(guò)程分析
晚點(diǎn)傳播預(yù)測(cè)是研究者非常關(guān)注的問(wèn)題,其主要內(nèi)容為:根據(jù)列車(chē)的歷史和當(dāng)前運(yùn)行狀態(tài),通過(guò)研究事件和時(shí)間驅(qū)動(dòng)下列車(chē)晚點(diǎn)狀態(tài)的演化過(guò)程,預(yù)測(cè)列車(chē)未來(lái)在各站的到達(dá)/出發(fā)時(shí)刻以及區(qū)間運(yùn)行時(shí)間。準(zhǔn)確的晚點(diǎn)傳播預(yù)測(cè)可以幫助調(diào)度員更好地預(yù)判和估計(jì)列車(chē)運(yùn)行態(tài)勢(shì)、相關(guān)調(diào)度決策的預(yù)期效果、列車(chē)晚點(diǎn)可恢復(fù)的程度等,進(jìn)而通過(guò)制定合理的調(diào)度決策更高效地實(shí)現(xiàn)調(diào)整目標(biāo)。當(dāng)前列車(chē)晚點(diǎn)傳播預(yù)測(cè)的研究主要集中在晚點(diǎn)致因及持續(xù)時(shí)長(zhǎng)預(yù)測(cè)、晚點(diǎn)狀態(tài)演化預(yù)測(cè)、晚點(diǎn)恢復(fù)預(yù)測(cè)等幾個(gè)方面,也是國(guó)內(nèi)外學(xué)者研究鐵路列車(chē)調(diào)度問(wèn)題時(shí)最熱衷、成果產(chǎn)出最豐富的領(lǐng)域[22-24]。
晚點(diǎn)發(fā)展與列車(chē)運(yùn)行環(huán)境的影響密切相關(guān),晚點(diǎn)傳播的過(guò)程受到當(dāng)前列車(chē)的晚點(diǎn)程度、可利用的冗余時(shí)間以及調(diào)度工作人員采取的運(yùn)行調(diào)整策略三方面的影響。當(dāng)調(diào)度工作人員采取積極的運(yùn)行調(diào)整措施時(shí),可以有效地緩解晚點(diǎn)程度以達(dá)到晚點(diǎn)時(shí)長(zhǎng)縮短甚至回歸正點(diǎn)狀態(tài)。
列車(chē)晚點(diǎn)傳播除了上述縱向傳播過(guò)程外,還同時(shí)具有橫向影響傳播特征。列車(chē)晚點(diǎn)狀態(tài)通過(guò)列車(chē)間的相互制約關(guān)系橫向傳播,前行列車(chē)的晚點(diǎn)導(dǎo)致后行列車(chē)的連帶晚點(diǎn)[14]。要研究晚點(diǎn)的傳播過(guò)程并實(shí)現(xiàn)晚點(diǎn)的預(yù)測(cè),需要先探明列車(chē)狀態(tài)間的時(shí)空依賴關(guān)系,從已知列車(chē)運(yùn)行實(shí)績(jī)中建立晚點(diǎn)傳播模型,預(yù)測(cè)未來(lái)的晚點(diǎn)狀態(tài)。圖3(a)為列車(chē)狀態(tài)橫縱向影響的示意圖,圖中時(shí)刻t對(duì)應(yīng)的縱軸左邊是已經(jīng)兌現(xiàn)的運(yùn)行圖,列車(chē)n-1 在車(chē)站S2的晚點(diǎn)可能引起列車(chē)n-1 在S3、S4及以后各站的晚點(diǎn)(縱向傳播),也可能引起列車(chē)n及后行列車(chē)在各站的晚點(diǎn)(橫向傳播),此時(shí)需要根據(jù)列車(chē)n-1 及其前行列車(chē)的已知狀態(tài)去預(yù)測(cè)列車(chē)n-1 及其后行列車(chē)的晚點(diǎn)狀態(tài);圖3(b)中時(shí)間軸右側(cè)的晚點(diǎn)狀態(tài)預(yù)測(cè)需同時(shí)考慮其前方多狀態(tài)的影響,圖中箭頭為列車(chē)狀態(tài)的順向推導(dǎo)和演化,分別代表了列車(chē)晚點(diǎn)的橫向傳播和縱向傳播的迭代和推演過(guò)程。近年來(lái),機(jī)器學(xué)習(xí)方法被廣泛應(yīng)用于捕捉列車(chē)間的相互制約關(guān)系、列車(chē)運(yùn)行狀態(tài)與運(yùn)行環(huán)境之間的關(guān)系、列車(chē)運(yùn)行時(shí)間-空間作用過(guò)程等研究中。
圖3 考慮多列車(chē)的列車(chē)運(yùn)行狀態(tài)時(shí)空依賴關(guān)系及晚點(diǎn)傳播過(guò)程預(yù)測(cè)
2.2.2 列車(chē)晚點(diǎn)影響預(yù)測(cè)
實(shí)現(xiàn)鐵路行車(chē)故障的影響預(yù)測(cè)將能夠?yàn)檎{(diào)度員預(yù)測(cè)列車(chē)晚點(diǎn)提供基礎(chǔ)依據(jù),可以幫助調(diào)度人員估計(jì)線路恢復(fù)正常運(yùn)行的時(shí)間,并適當(dāng)?shù)刂匦掳才帕熊?chē)運(yùn)行。Huang 等[25]提取了故障影響晚點(diǎn)列車(chē)運(yùn)行序列,運(yùn)用K-Means 聚類算法,根據(jù)故障的強(qiáng)度、發(fā)生時(shí)段及行車(chē)間隔將列車(chē)晚點(diǎn)故障聚類為4 個(gè)不同的類別,可以用于列車(chē)晚點(diǎn)致因的特征分類。Oneto 等[26]以意大利鐵路網(wǎng)實(shí)際維修記錄、外部天氣數(shù)據(jù)和運(yùn)營(yíng)商的經(jīng)驗(yàn)為研究基礎(chǔ),應(yīng)用決策樹(shù)方法構(gòu)建了一個(gè)基于規(guī)則的故障恢復(fù)時(shí)間預(yù)測(cè)模型,該模型具有足夠的可解釋性,有助于列車(chē)調(diào)度員合理評(píng)估局部鐵路網(wǎng)絡(luò)的可用性。Zilko 等[27]利用非參數(shù)貝葉斯網(wǎng)絡(luò)建立了一個(gè)概率模型來(lái)估計(jì)鐵路中斷持續(xù)時(shí)間,該模型在很大程度上依賴于由歷史數(shù)據(jù)生成的因變量的經(jīng)驗(yàn)分布準(zhǔn)確性。為了適應(yīng)實(shí)時(shí)更新的信息,進(jìn)一步提出了基于Copula-Bayesian 網(wǎng)絡(luò)方法的故障時(shí)間預(yù)測(cè)模型[28],該模型通過(guò)建立中斷長(zhǎng)度與各影響因素之間的依賴關(guān)系來(lái)產(chǎn)生準(zhǔn)確預(yù)測(cè)。湯軼雄等[29]以初始晚點(diǎn)時(shí)間、影響列車(chē)數(shù)、晚點(diǎn)致因?yàn)樽宰兞浚偼睃c(diǎn)時(shí)間為因變量,運(yùn)用支持向量回歸模型實(shí)現(xiàn)了故障的晚點(diǎn)時(shí)長(zhǎng)預(yù)測(cè),能夠?yàn)檎{(diào)度員的調(diào)度決策提供行車(chē)故障可能持續(xù)時(shí)長(zhǎng)的信息支持。綜上,在列車(chē)晚點(diǎn)致因分析方面,既有研究仍較為缺乏,沒(méi)有對(duì)不同致因類型引起的晚點(diǎn)影響進(jìn)行細(xì)分,缺乏不同類型晚點(diǎn)情況下的晚點(diǎn)狀態(tài)描述和晚點(diǎn)程度的量化標(biāo)準(zhǔn),需要應(yīng)用機(jī)器學(xué)習(xí)方法對(duì)晚點(diǎn)致因和不同類型初始晚點(diǎn)影響建模進(jìn)行進(jìn)一步研究,以推進(jìn)列車(chē)運(yùn)行精細(xì)化管理的實(shí)施。
2.2.3 列車(chē)晚點(diǎn)狀態(tài)演化預(yù)測(cè)
列車(chē)晚點(diǎn)狀態(tài)演化的預(yù)測(cè),通常是以預(yù)測(cè)列車(chē)在車(chē)站到發(fā)時(shí)刻為突破口,基于列車(chē)運(yùn)行數(shù)據(jù)挖掘列車(chē)運(yùn)行狀態(tài)影響要素對(duì)列車(chē)運(yùn)行過(guò)程的作用,建立相應(yīng)的機(jī)器學(xué)習(xí)模型以實(shí)現(xiàn)列車(chē)運(yùn)行狀態(tài)的推演和預(yù)測(cè)。線性回歸方法被廣泛應(yīng)用于晚點(diǎn)預(yù)測(cè)問(wèn)題建模,Wang 等[30]基于列車(chē)運(yùn)行歷史數(shù)據(jù)和實(shí)時(shí)信息建立了兩種線性回歸模型,使用列車(chē)在車(chē)站的出發(fā)時(shí)間估計(jì)列車(chē)晚點(diǎn)。Li 等[31]運(yùn)用參數(shù)回歸模型和非參數(shù)回歸模型預(yù)測(cè)了列車(chē)短時(shí)停站時(shí)間。Guo 等[32]將列車(chē)運(yùn)行看作是一系列的離散事件,基于京滬高速鐵路5個(gè)車(chē)站的運(yùn)行實(shí)績(jī)建立了晚點(diǎn)預(yù)測(cè)的線性回歸模型。近年來(lái),支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)模型被初步嘗試用來(lái)分析和預(yù)測(cè)晚點(diǎn)[17]。Kecman 和Goverde[33]運(yùn)用統(tǒng)計(jì)學(xué)習(xí)技術(shù),構(gòu)建了三種列車(chē)過(guò)程時(shí)間預(yù)測(cè)的全局模型:穩(wěn)健回歸、回歸樹(shù)模型和隨機(jī)森林模型,并基于線性回歸的魯棒性,對(duì)特定的列車(chē)、車(chē)站或區(qū)段的局部模型進(jìn)行了校準(zhǔn)。Pongnumkul等[34]以泰國(guó)國(guó)家鐵路六個(gè)月的列車(chē)歷史旅行時(shí)間數(shù)據(jù)為研究基礎(chǔ),使用最鄰近節(jié)點(diǎn)算法實(shí)現(xiàn)了晚點(diǎn)旅客列車(chē)到站時(shí)間預(yù)測(cè),該模型的缺點(diǎn)是難以應(yīng)用于大型數(shù)據(jù)集。馬爾科夫模型和貝葉斯網(wǎng)是列車(chē)晚點(diǎn)狀態(tài)預(yù)測(cè)研究領(lǐng)域應(yīng)用最廣泛的方法。運(yùn)用基于列車(chē)運(yùn)行數(shù)據(jù)的馬爾科夫模型預(yù)測(cè)晚點(diǎn),其重點(diǎn)是狀態(tài)轉(zhuǎn)移矩陣的構(gòu)建[35],Barta 等[36]利用大量的歷史晚點(diǎn)數(shù)據(jù),提出了馬爾可夫鏈模型用以預(yù)測(cè)貨運(yùn)列車(chē)在連續(xù)車(chē)站的晚點(diǎn)情況。Gaurav 等[37]建立了一個(gè)N 階馬爾可夫晚點(diǎn)預(yù)測(cè)框架,使用隨機(jī)森林回歸和嶺回歸作為預(yù)測(cè)模型進(jìn)行了實(shí)驗(yàn)。Corman 等[38]構(gòu)建了列車(chē)晚點(diǎn)時(shí)間預(yù)測(cè)的貝葉斯網(wǎng)絡(luò)模型,實(shí)現(xiàn)了30 分鐘以內(nèi)的列車(chē)晚點(diǎn)時(shí)間預(yù)測(cè),揭示列車(chē)運(yùn)行的動(dòng)態(tài)特性。Oneto 等[39]提出了一種基于深度極值機(jī)的列車(chē)晚點(diǎn)預(yù)測(cè)系統(tǒng)來(lái)預(yù)測(cè)晚點(diǎn),該系統(tǒng)考慮了外部天氣數(shù)據(jù)的影響。線性回歸、梯度提升回歸樹(shù)、決策樹(shù)、隨機(jī)森林等4種機(jī)器學(xué)習(xí)方法被用來(lái)預(yù)測(cè)考慮天氣影響下的列車(chē)晚點(diǎn),模型比較結(jié)果顯示隨機(jī)森林的預(yù)測(cè)精度最高[40]。在神經(jīng)網(wǎng)絡(luò)模型應(yīng)用方面,Yaghini 等[41]提出了一種高精度的人工神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)伊朗鐵路客運(yùn)列車(chē)的晚點(diǎn),并將3種不同的數(shù)據(jù)輸入方式及3 種體系結(jié)構(gòu)的預(yù)測(cè)結(jié)果與決策樹(shù)和多分類邏輯回歸等常用預(yù)測(cè)方法進(jìn)行了比較。Oneto等[42,43]將列車(chē)晚點(diǎn)預(yù)測(cè)映射為多元回歸問(wèn)題,建立了一種基于前饋神經(jīng)網(wǎng)絡(luò)的極限學(xué)習(xí)機(jī)晚點(diǎn)預(yù)測(cè)模型,并進(jìn)一步通過(guò)引入外部天氣數(shù)據(jù)的影響以及閾值調(diào)整技術(shù)對(duì)模型進(jìn)行了改進(jìn)。張琦等[21]構(gòu)建了基于小波神經(jīng)網(wǎng)絡(luò)的列車(chē)連帶晚點(diǎn)預(yù)測(cè)模型,利用列車(chē)晚點(diǎn)波動(dòng)的線性組合方程及其結(jié)構(gòu)向量進(jìn)行列車(chē)連帶晚點(diǎn)影響值的量化。孫略添等[44]應(yīng)用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對(duì)技術(shù)站列車(chē)晚點(diǎn)時(shí)間進(jìn)行精確預(yù)測(cè),同時(shí)指出該方法適用于晚點(diǎn)歷史數(shù)據(jù)較多、大規(guī)模、對(duì)運(yùn)到期限要求較高的技術(shù)站。
近年來(lái),深度學(xué)習(xí)方法被逐步應(yīng)用于列車(chē)晚點(diǎn)預(yù)測(cè)建模。Oneto 等[45]提出了基于機(jī)器學(xué)習(xí)方法的晚點(diǎn)預(yù)測(cè)系統(tǒng)Train Delay Prediction Systems(TDPS),該系統(tǒng)運(yùn)用大數(shù)據(jù)技術(shù)和深度極限學(xué)習(xí)機(jī)算法,集成了異構(gòu)數(shù)據(jù)源。通過(guò)從大量歷史列車(chē)運(yùn)行數(shù)據(jù)中提取信息,訓(xùn)練列車(chē)晚點(diǎn)預(yù)測(cè)模型,建立了基于數(shù)據(jù)驅(qū)動(dòng)的動(dòng)態(tài)列車(chē)晚點(diǎn)預(yù)測(cè)系統(tǒng)。根據(jù)列車(chē)運(yùn)行狀態(tài)更新訓(xùn)練數(shù)據(jù)集,TDPS 實(shí)現(xiàn)了列車(chē)運(yùn)行狀態(tài)的實(shí)時(shí)預(yù)測(cè)。Wen 等[46]基于列車(chē)運(yùn)行實(shí)績(jī),長(zhǎng)短記憶深度學(xué)習(xí)模型被用于預(yù)測(cè)列車(chē)晚點(diǎn)時(shí)間,挖掘列車(chē)運(yùn)行各要素對(duì)列車(chē)運(yùn)行的作用規(guī)律,開(kāi)啟了深度學(xué)習(xí)用于列車(chē)晚點(diǎn)預(yù)測(cè)的研究。Huang 等[47]提出了一種結(jié)合三維卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的深度學(xué)習(xí)方法,針對(duì)4條具有不同運(yùn)行特征的線路進(jìn)行了預(yù)測(cè)分析,結(jié)果表明該方法具有較高的精度和較強(qiáng)的魯棒性。
另外,列車(chē)晚點(diǎn)影響是晚點(diǎn)嚴(yán)重程度的重要度量指標(biāo)。建立晚點(diǎn)影響模型能夠有效地預(yù)測(cè)晚點(diǎn)的發(fā)生概率以及影響程度,可以協(xié)助列車(chē)調(diào)度員進(jìn)行晚點(diǎn)預(yù)測(cè)和判斷晚點(diǎn)傳播的影響范圍,從而制定合理的列車(chē)運(yùn)行調(diào)整方案。典型機(jī)器學(xué)習(xí)方法,如極端梯度提升被用來(lái)預(yù)測(cè)晚點(diǎn)影響列車(chē)數(shù)、支持向量回歸模型被用來(lái)預(yù)測(cè)晚點(diǎn)總影響時(shí)間,對(duì)武廣高鐵列車(chē)晚點(diǎn)影響的測(cè)試和驗(yàn)證表明模型能夠?yàn)檎{(diào)度員估計(jì)晚點(diǎn)影響,度量晚點(diǎn)嚴(yán)重程度提供依據(jù)[48]。
綜上,列車(chē)運(yùn)行晚點(diǎn)狀態(tài)的變化受到外界運(yùn)行環(huán)境和鐵路系統(tǒng)內(nèi)部各要素的綜合影響,是一個(gè)非常復(fù)雜的過(guò)程,列車(chē)運(yùn)行晚點(diǎn)預(yù)測(cè)所要考慮的要素眾多。一系列的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法和以卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)等為代表的高級(jí)機(jī)器學(xué)習(xí)方法已經(jīng)廣泛應(yīng)用于列車(chē)晚點(diǎn)時(shí)間的預(yù)測(cè)。已有研究建立了一套用于列車(chē)晚點(diǎn)預(yù)測(cè)的高級(jí)機(jī)器學(xué)習(xí)模型體系,經(jīng)過(guò)對(duì)不同線路、不同數(shù)據(jù)量情況下的模型驗(yàn)證發(fā)現(xiàn),高級(jí)機(jī)器學(xué)習(xí)方法取得了較好的晚點(diǎn)預(yù)測(cè)效果,但各類機(jī)器學(xué)習(xí)方法的適用條件和應(yīng)用情景、所考慮的列車(chē)運(yùn)行不同特征量、推廣可行性等還是值得深入研究的問(wèn)題,還沒(méi)有得到通用性較好的模型和算法。更為重要的是,現(xiàn)有的研究主要是基于靜態(tài)數(shù)據(jù)的,沒(méi)有基于實(shí)時(shí)數(shù)據(jù)進(jìn)行列車(chē)晚點(diǎn)狀態(tài)動(dòng)態(tài)推演的高效算法。
2.2.4 列車(chē)晚點(diǎn)恢復(fù)預(yù)測(cè)
列車(chē)晚點(diǎn)恢復(fù)建模能夠幫助調(diào)度員掌握相關(guān)調(diào)度策略的晚點(diǎn)恢復(fù)效果、冗余時(shí)間利用情況等,實(shí)現(xiàn)對(duì)列車(chē)晚點(diǎn)恢復(fù)的預(yù)測(cè),提高調(diào)度調(diào)整效果。列車(chē)晚點(diǎn)恢復(fù)建模的重點(diǎn)是建立冗余時(shí)間利用模型,難點(diǎn)是提取冗余時(shí)間的分布規(guī)律及冗余時(shí)間的利用效率,最大限度地利用冗余時(shí)間消解晚點(diǎn)。
Khadilkar[49]研究了晚點(diǎn)分布概率,通過(guò)分析歷史數(shù)據(jù)知印度鐵路平均晚點(diǎn)恢復(fù)率為0.13 min/km,并在晚點(diǎn)恢復(fù)模型中以此值表示晚點(diǎn)恢復(fù)的能力,但是這個(gè)平均值很難反映列車(chē)在每個(gè)區(qū)間、車(chē)站的晚點(diǎn)恢復(fù)能力,這將影響模型的預(yù)測(cè)能力。Yang 等[50]運(yùn)用統(tǒng)計(jì)方法建立了列車(chē)晚點(diǎn)期望模型,并提出了鐵路冗余時(shí)間沖突分配的方法。Steven 等[23]用統(tǒng)計(jì)模型分析了晚點(diǎn)列車(chē)的冗余時(shí)間利用情況,但在分析列車(chē)晚點(diǎn)恢復(fù)時(shí),假定了冗余時(shí)間利用率最大的理想情況。Jiang 等[51]基于武廣高鐵的列車(chē)運(yùn)行實(shí)績(jī),比較了多類機(jī)器學(xué)習(xí)模型用于初始晚點(diǎn)恢復(fù)預(yù)測(cè)的效果,建立了有最佳效果的初始晚點(diǎn)恢復(fù)預(yù)測(cè)的隨機(jī)森林模型。?ahin等[52]使用從土耳其國(guó)家鐵路收集到的歷史數(shù)據(jù),建立了一個(gè)馬爾可夫鏈模型估計(jì)列車(chē)晚點(diǎn)傳播和恢復(fù)。Huang 等[53]基于武廣高鐵列車(chē)運(yùn)行數(shù)據(jù)建立了緩沖時(shí)間分配的數(shù)據(jù)驅(qū)動(dòng)模型;嶺回歸機(jī)器學(xué)習(xí)模型被用來(lái)解析考慮車(chē)站緩沖時(shí)間方案、區(qū)間緩沖時(shí)間方案、晚點(diǎn)嚴(yán)重程度等要素的列車(chē)晚點(diǎn)恢復(fù)規(guī)律;根據(jù)緩沖時(shí)間的利用率,該模型重新分配緩沖時(shí)間,為緩沖時(shí)間的優(yōu)化配置提供了新的解決思路。所提出的機(jī)器學(xué)習(xí)模型綜合考慮了運(yùn)行圖的執(zhí)行效果指標(biāo),如緩沖時(shí)間利用率和晚點(diǎn)概率等。Martin[54]提出了運(yùn)用預(yù)測(cè)推理和機(jī)器學(xué)習(xí)方法來(lái)提高鐵路系統(tǒng)可靠性,認(rèn)為運(yùn)用貝葉斯推理進(jìn)行晚點(diǎn)預(yù)測(cè)時(shí)可以考慮冗余時(shí)間的布局,但該研究并沒(méi)有闡釋具體方法應(yīng)用。胡雨欣等[55]以高速列車(chē)初始晚點(diǎn)時(shí)間、站停冗余時(shí)間和區(qū)間冗余時(shí)間等為變量,使用多層感知器和循環(huán)神經(jīng)網(wǎng)絡(luò)建立了高速列車(chē)晚點(diǎn)恢復(fù)時(shí)間預(yù)測(cè)機(jī)器學(xué)習(xí)模型,預(yù)測(cè)精度對(duì)比發(fā)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)的效果要優(yōu)于多層感知器模型。
在采用機(jī)器學(xué)習(xí)方法研究冗余時(shí)間利用問(wèn)題時(shí),需要使用大量的晚點(diǎn)恢復(fù)數(shù)據(jù)和冗余時(shí)間運(yùn)用數(shù)據(jù),而這些數(shù)據(jù)的獲得又有一定難度,因此,基于機(jī)器學(xué)習(xí)的列車(chē)晚點(diǎn)恢復(fù)預(yù)測(cè)研究仍較缺乏。挖掘不同晚點(diǎn)情景下的冗余時(shí)間恢復(fù)效率、基于冗余時(shí)間利用數(shù)據(jù)建立冗余時(shí)間利用與重布局的數(shù)據(jù)驅(qū)動(dòng)模型將是研究的重點(diǎn)方向。運(yùn)用機(jī)器學(xué)習(xí)方法建立車(chē)站及區(qū)間晚點(diǎn)時(shí)間恢復(fù)模型,探明車(chē)站、區(qū)間的冗余時(shí)間布局方案對(duì)于一定晚點(diǎn)的恢復(fù)能力具有重要的實(shí)際意義,有助于發(fā)現(xiàn)不同調(diào)度調(diào)整策略作用下列車(chē)運(yùn)行晚點(diǎn)恢復(fù)及效果,能夠?yàn)榱熊?chē)運(yùn)行調(diào)度決策提供決策支持。將列車(chē)運(yùn)行實(shí)績(jī)與列車(chē)調(diào)度命令數(shù)據(jù)結(jié)合、結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)融合建模是提高列車(chē)晚點(diǎn)恢復(fù)決策和實(shí)現(xiàn)調(diào)度知識(shí)自動(dòng)化要解決的關(guān)鍵問(wèn)題。
對(duì)于列車(chē)運(yùn)行調(diào)整決策問(wèn)題的研究主要集中在列車(chē)運(yùn)行沖突消解、列車(chē)運(yùn)行計(jì)劃調(diào)整、動(dòng)態(tài)網(wǎng)絡(luò)調(diào)度等方面。國(guó)內(nèi)外既有研究主要集中于運(yùn)用數(shù)學(xué)優(yōu)化模型求解列車(chē)運(yùn)行沖突檢測(cè)及消解、運(yùn)行圖編制優(yōu)化問(wèn)題[56,57],建立以最小晚點(diǎn)影響[58]、最小列車(chē)晚點(diǎn)時(shí)間[59]、最短列車(chē)運(yùn)行時(shí)間[60]等為優(yōu)化目標(biāo)的列車(chē)運(yùn)行調(diào)整模型,但這些模型必須在計(jì)算性能和解決方案質(zhì)量之間進(jìn)行權(quán)衡。同時(shí),由于列車(chē)運(yùn)行調(diào)整決策模型涉及的約束條件多、參數(shù)多、優(yōu)化目標(biāo)多,使得精準(zhǔn)建模和求解極為困難。列車(chē)運(yùn)行調(diào)整智能化決策研究的主要內(nèi)容如表1所示。
表1 列車(chē)運(yùn)行調(diào)整智能化決策研究的主要內(nèi)容
列車(chē)運(yùn)行調(diào)度調(diào)整過(guò)程常被作為馬爾科夫決策過(guò)程來(lái)處理,通過(guò)推導(dǎo)列車(chē)的運(yùn)行狀態(tài)變化規(guī)律得到可能的調(diào)度決策方案[61]。Dündar[62]基于調(diào)度人員在10 個(gè)工作日內(nèi)解決的331 個(gè)沖突記錄,建立了一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型來(lái)模擬列車(chē)調(diào)度員進(jìn)行沖突消解。Oneto 等[63]以列車(chē)晚點(diǎn)和相關(guān)代價(jià)最小化為目標(biāo),研究了列車(chē)越行預(yù)測(cè)的問(wèn)題,并基于隨機(jī)森林方法開(kāi)發(fā)了一個(gè)混合預(yù)測(cè)模型。上述研究基于調(diào)度員歷史決策合理的假設(shè),著重于調(diào)度員歷史決策方案的再現(xiàn),沒(méi)有考慮到調(diào)度決策制定過(guò)程中眾多的動(dòng)態(tài)變化因素的影響,因此,其決策方案的優(yōu)化性能有限。強(qiáng)化學(xué)習(xí)結(jié)合了動(dòng)態(tài)規(guī)劃和監(jiān)督學(xué)習(xí)的原理,尤其適用于解決列車(chē)運(yùn)行調(diào)整問(wèn)題。?emrov 等[64]提出了一種基于Qlearning 算法的單線鐵路列車(chē)運(yùn)行調(diào)整方法,其基本原理為:通過(guò)算法與環(huán)境交互,獲得并解釋其從環(huán)境中獲得增強(qiáng)信號(hào),進(jìn)而選擇使所獲得的獎(jiǎng)勵(lì)之和最大化的動(dòng)作,并以此逐步生成合理的列車(chē)運(yùn)行調(diào)整方案,模型的獎(jiǎng)勵(lì)函數(shù)為使列車(chē)總晚點(diǎn)最小。Khadilkar[65]將該研究拓展到雙線鐵路上,并以印度鐵路網(wǎng)的兩條線路為例,驗(yàn)證了該算法在實(shí)際中的適用性,結(jié)果表明:這種方法可以在與啟發(fā)式方法相當(dāng)?shù)挠?jì)算時(shí)間內(nèi)處理大型調(diào)度問(wèn)題實(shí)例,同時(shí)具有更好的實(shí)用性與決策質(zhì)量。模糊神經(jīng)網(wǎng)絡(luò)作為模糊理論和神經(jīng)網(wǎng)絡(luò)的融合,吸取了模糊邏輯和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),部分避免了兩者的缺點(diǎn)。Sun 等[66]通過(guò)對(duì)高速鐵路列車(chē)運(yùn)行控制程序的詳細(xì)分析,提出了一種基于模糊神經(jīng)網(wǎng)絡(luò)的列車(chē)運(yùn)行調(diào)整模型,并通過(guò)引入變步長(zhǎng)的改進(jìn)BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)算法,完成了自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊推理系統(tǒng)的訓(xùn)練工作。Agent 方法作為一種解決動(dòng)態(tài)環(huán)境中不確定性問(wèn)題的有力技術(shù),在交通系統(tǒng)領(lǐng)域的應(yīng)用正在迅速興起。Narayanaswami 等[67]提出了一種結(jié)合Agent 和無(wú)監(jiān)督學(xué)習(xí)方法的動(dòng)態(tài)調(diào)度模型,通過(guò)引入一個(gè)基于實(shí)時(shí)系統(tǒng)參數(shù)的動(dòng)態(tài)調(diào)度計(jì)算框架對(duì)模型進(jìn)行改進(jìn),并將其與混合整數(shù)線性規(guī)劃方法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明:Agent 算法在求解復(fù)雜鐵路網(wǎng)絡(luò)調(diào)度問(wèn)題時(shí),其計(jì)算時(shí)間較精確的模型有很大的減少,體現(xiàn)出其在解決大規(guī)模復(fù)雜的調(diào)度問(wèn)題方面的潛力。D-Agent 方法被用來(lái)研究沖突消解并支持調(diào)度員基于多源信息及異構(gòu)數(shù)據(jù)進(jìn)行列車(chē)沖突檢測(cè),支持列車(chē)運(yùn)行調(diào)度決策[68,69]。
瑞士鐵路運(yùn)營(yíng)公司在既有調(diào)度指揮系統(tǒng)的基礎(chǔ)上,自主研發(fā)了瑞士鐵路調(diào)度指揮控制系統(tǒng)(Railway Control System,RCS),與既有調(diào)度指揮系統(tǒng)形成功能上的兼容互補(bǔ),是目前最先進(jìn)的列車(chē)運(yùn)行與調(diào)度管理系統(tǒng)[70]。RCS 系統(tǒng)根據(jù)歷史運(yùn)行數(shù)據(jù)、當(dāng)前列車(chē)運(yùn)行狀態(tài)、列車(chē)運(yùn)行可能的運(yùn)行情景等對(duì)列車(chē)運(yùn)行進(jìn)行精確預(yù)測(cè),并生成無(wú)運(yùn)行沖突的調(diào)度決策,該系統(tǒng)為瑞士提高路網(wǎng)利用效率和運(yùn)輸服務(wù)質(zhì)量做出了重要貢獻(xiàn)。這也讓世界看到了基于鐵路實(shí)時(shí)和歷史數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)實(shí)現(xiàn)調(diào)度決策知識(shí)自動(dòng)化、支持調(diào)度決策及列車(chē)運(yùn)行的應(yīng)用前景。
從上述研究分析可以看出,機(jī)器學(xué)習(xí)方法為鐵路列車(chē)運(yùn)行調(diào)整智能化決策提供了有效的解決渠道,已經(jīng)成為鐵路智能化調(diào)度決策研究的主要方法,將先進(jìn)的機(jī)器學(xué)習(xí)方法應(yīng)用于調(diào)度策略效果評(píng)估、調(diào)度決策知識(shí)自動(dòng)化仍然是研究的主要難點(diǎn)和關(guān)鍵,但目前利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)調(diào)度策略的優(yōu)選、智能化調(diào)度策略生成等的研究仍比較缺乏,構(gòu)建列車(chē)調(diào)度調(diào)整的自動(dòng)化知識(shí)庫(kù),建立列車(chē)調(diào)度調(diào)整策略的推薦系統(tǒng),為調(diào)度員實(shí)時(shí)列車(chē)調(diào)度提供決策支持是亟待解決的問(wèn)題。
綜上所述,機(jī)器學(xué)習(xí)方法已經(jīng)廣泛應(yīng)用于鐵路調(diào)度指揮領(lǐng)域,在晚點(diǎn)分析、預(yù)測(cè)分析、智能調(diào)度模型構(gòu)建等方面取得了較為豐碩的研究成果(見(jiàn)表2)。
表2 近十年機(jī)器學(xué)習(xí)方法在鐵路列車(chē)運(yùn)行調(diào)整領(lǐng)域研究文獻(xiàn)匯總
續(xù)表2
研究側(cè)重點(diǎn)和相關(guān)文獻(xiàn)的發(fā)表趨勢(shì)如圖4、圖5所示。
圖4 相關(guān)研究關(guān)鍵詞云
圖5 既有研究特征分析
通過(guò)對(duì)上述研究的回顧,可知機(jī)器學(xué)習(xí)應(yīng)用于鐵路列車(chē)調(diào)度調(diào)整問(wèn)題的既有研究呈現(xiàn)以下特征及存在的問(wèn)題:
(1)機(jī)器學(xué)習(xí)方法應(yīng)用于鐵路調(diào)度調(diào)整問(wèn)題基于的數(shù)據(jù)以列車(chē)運(yùn)行計(jì)劃運(yùn)行圖、實(shí)際運(yùn)行圖為主,氣象數(shù)據(jù)、到發(fā)線運(yùn)用數(shù)據(jù)、設(shè)備故障數(shù)據(jù)等作為補(bǔ)充數(shù)據(jù)在部分研究中得以應(yīng)用并有效提高了模型精度。在既有研究中,相關(guān)數(shù)據(jù)不全面是主要的因素之一,比如有列車(chē)運(yùn)行數(shù)據(jù)而沒(méi)有設(shè)備運(yùn)用數(shù)據(jù)、有客流數(shù)據(jù)而沒(méi)有氣象數(shù)據(jù)等,所建立的模型存在較大的缺陷。
(2)從圖5(a)可以看出,機(jī)器學(xué)習(xí)方法在鐵路列車(chē)調(diào)度調(diào)整問(wèn)題的研究呈現(xiàn)較為明顯的增長(zhǎng)趨勢(shì),尤其伴隨大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)方法的快速發(fā)展,深度學(xué)習(xí)應(yīng)用于列車(chē)運(yùn)行晚點(diǎn)智能預(yù)測(cè)與列車(chē)運(yùn)行調(diào)整決策方面的成果已經(jīng)逐步顯現(xiàn),可以預(yù)期將有較為豐富的研究成果產(chǎn)出。
(3)從圖4 和圖5(b)可以看出,高速鐵路調(diào)度指揮是研究的重點(diǎn)領(lǐng)域、晚點(diǎn)預(yù)測(cè)是當(dāng)前的研究熱點(diǎn)問(wèn)題,傳統(tǒng)機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)分析以及統(tǒng)計(jì)分析等方法已經(jīng)在既有研究中得到了廣泛的應(yīng)用。
(4)在列車(chē)晚點(diǎn)分析方面,機(jī)器學(xué)習(xí)方法(如關(guān)聯(lián)、聚類等)表現(xiàn)出較大的潛力[71],可以用于挖掘大數(shù)據(jù)中隱含的列車(chē)晚點(diǎn)機(jī)理,但當(dāng)前該領(lǐng)域的研究仍是以傳統(tǒng)統(tǒng)計(jì)分析為主導(dǎo),處理的數(shù)據(jù)也較為有限,運(yùn)用深度學(xué)習(xí)方法挖掘更大規(guī)模和高維度列車(chē)運(yùn)行相關(guān)復(fù)合數(shù)據(jù)的工作還有待加強(qiáng)。
(5)列車(chē)晚點(diǎn)致因及持續(xù)時(shí)長(zhǎng)預(yù)測(cè)受到鐵路系統(tǒng)內(nèi)外部諸多因素的影響,需要針對(duì)不同的故障類型收集故障報(bào)告、天氣情況、相關(guān)調(diào)度命令等信息。受限于數(shù)據(jù)獲取及處理的難度,且目前設(shè)備故障數(shù)據(jù)、天氣數(shù)據(jù)等與列車(chē)運(yùn)行數(shù)據(jù)的粒度和采集間隔相差較大,增加了建模的難度,降低了模型的精度。
(6)現(xiàn)有運(yùn)用數(shù)學(xué)優(yōu)化方法和一般機(jī)器學(xué)習(xí)方法研究列車(chē)晚點(diǎn)狀態(tài)演化及時(shí)間的預(yù)測(cè)問(wèn)題已經(jīng)很充分,運(yùn)用深度學(xué)習(xí)分析列車(chē)之間的相互作用關(guān)系并建立列車(chē)晚點(diǎn)精確預(yù)測(cè)模型,是列車(chē)晚點(diǎn)智能化預(yù)測(cè)領(lǐng)域新的研究趨勢(shì)。相關(guān)模型與算法在晚點(diǎn)預(yù)測(cè)方面雖然已經(jīng)體現(xiàn)了較好的性能,但列車(chē)分類型晚點(diǎn)傳播預(yù)測(cè)的研究還明顯偏少,相應(yīng)的標(biāo)志性成果還有待深化,預(yù)測(cè)不同程度晚點(diǎn)情況下的發(fā)展態(tài)勢(shì)從而輔助調(diào)度員的調(diào)度策略制定研究是當(dāng)前研究的短板。
(7)在列車(chē)運(yùn)行調(diào)整智能化決策方面,國(guó)內(nèi)外學(xué)者已經(jīng)提出了多種結(jié)合機(jī)器學(xué)習(xí)方法的模型解決調(diào)度優(yōu)化問(wèn)題,但相關(guān)研究仍較為缺乏,將更多既有的高性能預(yù)測(cè)模型應(yīng)用于輔助決策系統(tǒng)構(gòu)建是下一步需要重點(diǎn)研究的內(nèi)容。既有研究的重點(diǎn)多是放在模型構(gòu)建和模擬驗(yàn)證上,還未有研究成果在實(shí)際應(yīng)用中部署和實(shí)施,如何將機(jī)器學(xué)習(xí)模型應(yīng)用于智能化調(diào)度指揮是亟待解決的難題。
“數(shù)據(jù)+算力+算法”引領(lǐng)的智能制造,帶來(lái)了工具革命,也帶來(lái)了以智能化提高決策科學(xué)性、精準(zhǔn)化為標(biāo)志的決策革命。通過(guò)人工智能等手段優(yōu)化決策的準(zhǔn)確性、及時(shí)性、科學(xué)性已成為重要?jiǎng)?chuàng)新途徑[72]。通過(guò)鐵路智能化提高鐵路運(yùn)輸組織效率、保障鐵路運(yùn)輸安全已成為各國(guó)鐵路發(fā)展的必由之路[73]。法國(guó)、德國(guó)、美國(guó)、加拿大、日本、韓國(guó)等國(guó)家鐵路相繼提出了數(shù)字化與智能化發(fā)展的戰(zhàn)略規(guī)劃。實(shí)現(xiàn)列車(chē)運(yùn)行態(tài)勢(shì)智能感知和沖突自動(dòng)消解,支撐調(diào)度智能化是世界智能鐵路發(fā)展的迫切需求。阿里研究院發(fā)布的《2020 年十大科技趨勢(shì)》中第一個(gè)趨勢(shì)是“人工智能從感知智能向認(rèn)知智能演進(jìn)”[74]。鐵路運(yùn)輸系統(tǒng)“智能+”決策革命是鐵路智能化發(fā)展的必然趨勢(shì),結(jié)合鐵路行車(chē)組織理論、經(jīng)驗(yàn)和既有技術(shù),基于鐵路多源數(shù)據(jù),以數(shù)據(jù)科學(xué)、人工智能為主要手段的智能調(diào)度集中系統(tǒng),是實(shí)現(xiàn)鐵路行車(chē)組織理論和技術(shù)革新的有效途徑。
鐵路運(yùn)輸系統(tǒng)尤其是列車(chē)運(yùn)行過(guò)程是一個(gè)隨機(jī)+可控的系統(tǒng),從列車(chē)運(yùn)行實(shí)績(jī)及相關(guān)數(shù)據(jù)中探索并發(fā)現(xiàn)隨機(jī)干擾事件的發(fā)生概率、相關(guān)調(diào)度調(diào)整策略可能的效果是鐵路調(diào)度調(diào)整決策的關(guān)鍵問(wèn)題。而機(jī)器學(xué)習(xí)方法尤其是以深度學(xué)習(xí)為代表的高級(jí)機(jī)器學(xué)術(shù)方法在挖掘大規(guī)模數(shù)據(jù)并發(fā)現(xiàn)其規(guī)律方面具有顯著優(yōu)勢(shì),其在鐵路列車(chē)運(yùn)行調(diào)整領(lǐng)域還有大量工作要開(kāi)展,如:
(1)引入多源異構(gòu)數(shù)據(jù)構(gòu)建機(jī)器學(xué)習(xí)模型。當(dāng)前大部分既有機(jī)器學(xué)習(xí)模型都是基于列車(chē)運(yùn)行所產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)(如車(chē)站的到達(dá)和出發(fā)時(shí)間)構(gòu)建的。近年來(lái)隨著鐵路信息化建設(shè)的不斷發(fā)展,與列車(chē)運(yùn)行相關(guān)的大量數(shù)據(jù)也得到了有效的記錄和保存,其中包含了諸多不同來(lái)源的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)。利用先進(jìn)的數(shù)據(jù)分析方法,完成各種類型數(shù)據(jù)的清洗與加工,基于多源異構(gòu)數(shù)據(jù)構(gòu)建不同預(yù)測(cè)目標(biāo)的機(jī)器學(xué)習(xí)模型是未來(lái)研究的重點(diǎn)。以列車(chē)運(yùn)行圖數(shù)據(jù)為基本數(shù)據(jù),考慮列車(chē)運(yùn)行所涉及的氣象、信聯(lián)閉設(shè)備、到發(fā)線運(yùn)用、車(chē)底運(yùn)用等數(shù)據(jù),將能夠挖掘更豐富的列車(chē)運(yùn)行規(guī)律,建立的列車(chē)運(yùn)行調(diào)度調(diào)整模型將更能貼近列車(chē)運(yùn)行實(shí)際,更好地指導(dǎo)調(diào)度指揮決策。
(2)列車(chē)晚點(diǎn)程度量化和分級(jí)能夠?yàn)檎{(diào)度員掌握全局運(yùn)輸態(tài)勢(shì)提供依據(jù)。研究列車(chē)晚點(diǎn)分級(jí)模型,確定列車(chē)晚點(diǎn)程度并實(shí)現(xiàn)不同程度晚點(diǎn)的預(yù)測(cè)將能夠提升鐵路調(diào)度調(diào)整的精細(xì)化水平。
(3)列車(chē)運(yùn)行晚點(diǎn)預(yù)測(cè)依然是研究的熱點(diǎn)和難點(diǎn)。高效準(zhǔn)確的預(yù)測(cè)是機(jī)器學(xué)習(xí)模型應(yīng)用于調(diào)度生產(chǎn)實(shí)際的關(guān)鍵所在,雖然當(dāng)前Boosting、Bagging 和Stacking 等典型集成學(xué)習(xí)技術(shù)已經(jīng)得到了較為廣泛的應(yīng)用,但不斷改進(jìn)算法、提升模型的計(jì)算能力和精度仍是一個(gè)重要的研究方向。列車(chē)運(yùn)行晚點(diǎn)分類預(yù)測(cè)對(duì)于提升調(diào)度決策水平具有重要意義,分別建立初始晚點(diǎn)、連帶晚點(diǎn)的預(yù)測(cè)模型,能夠輔助調(diào)度員根據(jù)一定的初始晚點(diǎn)制定合理的調(diào)度策略以盡可能控制連帶晚點(diǎn)及其影響程度和影響范圍。列車(chē)運(yùn)行晚點(diǎn)的實(shí)時(shí)預(yù)測(cè)是一個(gè)對(duì)模型抽象能力和求解速度要求很高的問(wèn)題,需要不斷尋求能夠盡可能貼近運(yùn)輸生產(chǎn)實(shí)際的高效模型和算法。
(4)列車(chē)運(yùn)行調(diào)度調(diào)整自動(dòng)化是重要的發(fā)展趨勢(shì)。基于列車(chē)運(yùn)行數(shù)據(jù),建立列車(chē)運(yùn)行調(diào)度調(diào)整的數(shù)據(jù)驅(qū)動(dòng)模型,挖掘列車(chē)運(yùn)行調(diào)度調(diào)整的模式及自動(dòng)化知識(shí),根據(jù)歷史、當(dāng)前及未來(lái)可能的運(yùn)輸態(tài)勢(shì)實(shí)現(xiàn)列車(chē)運(yùn)行調(diào)度策略的自動(dòng)優(yōu)選,將能夠輔助調(diào)度員的調(diào)度調(diào)整決策,提高列車(chē)運(yùn)行調(diào)度調(diào)整的決策質(zhì)量并逐步實(shí)現(xiàn)調(diào)度調(diào)整的自動(dòng)化。
(5)建立基于機(jī)器學(xué)習(xí)的鐵路調(diào)度調(diào)整智能化系統(tǒng)。以列車(chē)運(yùn)行相關(guān)歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)為基礎(chǔ),以基于機(jī)器學(xué)習(xí)的列車(chē)調(diào)度調(diào)整系列模型為底層模型,實(shí)現(xiàn)鐵路列車(chē)晚點(diǎn)可視化、晚點(diǎn)預(yù)測(cè)、晚點(diǎn)恢復(fù)、調(diào)度策略智能化優(yōu)選等?;跈C(jī)器學(xué)習(xí)的鐵路調(diào)度調(diào)整智能化系統(tǒng)將是我國(guó)鐵路智能調(diào)度的重要保障。
(6)探索高級(jí)機(jī)器學(xué)習(xí)方法的更多應(yīng)用。當(dāng)前機(jī)器學(xué)習(xí)方法在列車(chē)運(yùn)行調(diào)整智能化決策方面的應(yīng)用還較為有限,并且還有很多先進(jìn)的機(jī)器學(xué)習(xí)算法尚未使用或應(yīng)用不足,需要針對(duì)調(diào)度指揮工作實(shí)際需要,基于不同機(jī)器學(xué)習(xí)算法特性開(kāi)發(fā)更多的模型與方法,并嘗試將其與既有鐵路調(diào)度系統(tǒng)相結(jié)合,盡可能貼近列車(chē)運(yùn)行實(shí)際過(guò)程,考慮盡可能多的因素,以提升鐵路調(diào)度指揮決策與控制自動(dòng)化水平,降低相關(guān)作業(yè)人員負(fù)荷,提高鐵路運(yùn)輸效率和服務(wù)質(zhì)量。
從大規(guī)模復(fù)雜路網(wǎng)建設(shè)過(guò)渡到精細(xì)化管理的網(wǎng)絡(luò)化運(yùn)營(yíng)已是我國(guó)鐵路運(yùn)營(yíng)的重要特征,實(shí)現(xiàn)海量數(shù)據(jù)可挖掘、設(shè)備狀態(tài)可診斷、行車(chē)安全可預(yù)警、復(fù)雜路網(wǎng)運(yùn)營(yíng)變化可感知、發(fā)展趨勢(shì)可推斷、輔助決策可支撐,提升鐵路的智能決策水平,提高決策效度是智能鐵路亟待解決的關(guān)鍵科學(xué)問(wèn)題。鐵路運(yùn)輸系統(tǒng)海量數(shù)據(jù)信源多樣,列車(chē)運(yùn)行過(guò)程中產(chǎn)生的大量列車(chē)運(yùn)行實(shí)際數(shù)據(jù)尚未被充分挖掘和運(yùn)用,鐵路列車(chē)運(yùn)行調(diào)整仍然是以個(gè)人經(jīng)驗(yàn)為基礎(chǔ)的人工決策為主。如何基于海量多源數(shù)據(jù),運(yùn)用數(shù)據(jù)科學(xué)和人工智能提升鐵路調(diào)度指揮決策的效度,提升決策水平、降低作業(yè)人員工作負(fù)荷是鐵路智能調(diào)度決策面臨的巨大挑戰(zhàn)。
本文全面回顧了近10年機(jī)器學(xué)習(xí)方法在鐵路列車(chē)運(yùn)行調(diào)整領(lǐng)域應(yīng)用的主要研究成果,將列車(chē)運(yùn)行調(diào)整問(wèn)題分為列車(chē)晚點(diǎn)狀態(tài)分析與評(píng)估、列車(chē)晚點(diǎn)傳播預(yù)測(cè)和列車(chē)運(yùn)行調(diào)整智能化決策三個(gè)方面,分別總結(jié)和分析了機(jī)器學(xué)習(xí)方法在上述三方面問(wèn)題的應(yīng)用情況??偨Y(jié)了既有研究的特征,并在此基礎(chǔ)上展望了機(jī)器學(xué)習(xí)方法在鐵路列車(chē)運(yùn)行調(diào)整研究方面的最新動(dòng)向。
機(jī)器學(xué)習(xí)方法能夠克服傳統(tǒng)數(shù)學(xué)模型難以應(yīng)用于生產(chǎn)實(shí)踐的問(wèn)題,在當(dāng)前國(guó)家大數(shù)據(jù)戰(zhàn)略的驅(qū)動(dòng)下,基于機(jī)器學(xué)習(xí)的調(diào)度指揮自動(dòng)化系統(tǒng)必將為鐵路行車(chē)指揮決策提供有效支撐。近10年來(lái)機(jī)器學(xué)習(xí)方法在鐵路列車(chē)運(yùn)行調(diào)整方面的研究呈現(xiàn)較為明顯的增長(zhǎng)趨勢(shì),深度學(xué)習(xí)應(yīng)用于列車(chē)運(yùn)行晚點(diǎn)智能預(yù)測(cè)與列車(chē)運(yùn)行調(diào)整決策方面的成果已經(jīng)逐步顯現(xiàn)。高級(jí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的列車(chē)運(yùn)行調(diào)整智能決策理論以及列車(chē)運(yùn)行調(diào)整知識(shí)自動(dòng)化等智能化理論將是未來(lái)的發(fā)展重點(diǎn)。