• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于司機操縱模式學習的列車節(jié)能自動駕駛研究

    2019-06-08 12:44:31李國華劉堯黃晉劉炎
    湖南大學學報·自然科學版 2019年4期
    關(guān)鍵詞:節(jié)能優(yōu)化機器學習

    李國華 劉堯 黃晉 劉炎

    摘? ?要:基于優(yōu)秀司機運行記錄數(shù)據(jù),提出一種基于機器學習技術(shù)的列車節(jié)能優(yōu)化駕駛方法架構(gòu),利用層次分解的思想結(jié)合集成機器學習方法從優(yōu)秀司機的駕駛?cè)罩緮?shù)據(jù)中挖掘出隱藏的優(yōu)秀司機駕駛模式,分別對速度信息和檔位信息進行學習預測,以實現(xiàn)列車節(jié)能優(yōu)化自動駕駛決策,并選用實際鐵路線路和機車數(shù)據(jù)進行了試驗驗證.試驗結(jié)果表明,在保證列車安全、準點、平穩(wěn)等約束條件下,本文列車節(jié)能優(yōu)化駕駛方案相比司機平均水平可節(jié)能約7%.

    關(guān)鍵詞:列車操縱;節(jié)能優(yōu)化;司機操縱模式;機器學習

    中圖分類號:U29-39? ? ? ? ? ? ? ?文獻標志碼:A

    Study on Train Energy-efficient Automatic Driving

    from Learning Human Driver Patterns

    LI Guohua1,2,LIU Yao3,HUANG Jin3,LIU Yan3

    (1. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 610031,China;

    2. China Academy of Railway Sciences Co Ltd, Beijing 100081, China;

    3. School of Software, Tsinghua University, Beijing 100084, China)

    Abstract: Based on the data of excellent driver's operation records,a framework of energy-saving driving optimization was proposed using machine learning technology. Hierarchical decomposition was applied to integrated machine learning method to excavate the hidden driving patterns from the driving log data of excellent drivers. The learning and forecasting of speed information and gear information were separately carried out to realize the automatic driving decision for energy-saving optimization of a train,and the actual railway lines and locomotive data were used for experimental verification. The test results show that under the constraints of ensuring the safety, punctuality and stability of the train, the energy-saving driving program of the train can save about 7% energy when compared with the average level drivers.

    Key words: train operation;energy-saving optimization;driver patterns;machine learning

    到2015年底,中國鐵路的總營業(yè)運行里程已經(jīng)達到12.1萬公里,居世界第一位.與此同時鐵路交通的能源消耗量大,僅2015年鐵路的能源消耗折算成標準煤就高達1 569.47萬噸,鐵路運輸已經(jīng)成為我國交通運輸中耗能最大的部門之一.在能源消耗方面,以內(nèi)燃列車為例,目前在我國運營的內(nèi)燃列車總量達到1.1萬臺以上,如果列車能夠節(jié)能3%,預計全國可以節(jié)約燃油15.6萬噸/年,節(jié)約資金約12.8億元/年[1],同時也可以減少大量的碳排放.

    由于鐵路列車運行的特殊性,影響列車節(jié)能的因素眾多,但當列車的運行交路、列車編組、運行圖、限速、列車基本參數(shù)等因素確定之后,優(yōu)化列車的操縱方式就是列車降低能耗的最有效方式.司機是列車的直接操縱者,司機的駕駛水平良莠不齊,在同一條線路同樣列車參數(shù)情況下不同司機駕駛的能耗有很大的差別.將能耗最低排名前20%的駕駛數(shù)據(jù)對應的司機稱為優(yōu)秀司機.結(jié)合優(yōu)秀司機的駕駛經(jīng)驗,基于主動節(jié)能的列車控制優(yōu)化系統(tǒng),來指導甚至替代司機操作,可以普遍提高司機水平、顯著節(jié)能,同時列車節(jié)能優(yōu)化駕駛對于解放人力、減小污染、提高列車準點率和安全性等方面有著重要的作用和意義.

    鐵路列車節(jié)能優(yōu)化駕駛問題需要考慮眾多復雜的約束條件,而且數(shù)據(jù)常常是高度非線性的,操縱檔位在任意時刻的組合變化情況多,是一個非線性有復雜約束的動態(tài)最優(yōu)化問題.線路數(shù)據(jù)和列車數(shù)據(jù)是高維度的自然數(shù)據(jù),這也意味著整個優(yōu)化的搜索空間巨大,并且有必要對特征進行降維處理.另一方面操縱序列節(jié)點間的關(guān)聯(lián)性比較大(不滿足無后效性),計算當前操縱檔位需要全面考慮前后操縱檔位,因此列車節(jié)能優(yōu)化駕駛問題在規(guī)定的較短時間內(nèi)難以求得優(yōu)化檔位序列的最優(yōu)解.同時對于列車操縱控制系統(tǒng)的實時性要求較高,很多優(yōu)化方法無法直接應用來求解,對其進行研究有較大的現(xiàn)實意義,并且對于其他類似系統(tǒng)也有參考意義.

    針對列車節(jié)能優(yōu)化駕駛問題,從Ichikawa[2]于

    1968年首次提出列車節(jié)能優(yōu)化控制問題以來,國內(nèi)外學者提出了諸多理論研究和解決問題的方案.Khmelnitsky[3]使用最大化原理構(gòu)建一個可以獲得分析最優(yōu)解的數(shù)值算法,來開發(fā)決定列車牽引或制動的系統(tǒng)使得能夠最大限度的減少列車在給定時間給定線路上的能量消耗;Phil[4]通過Pontryagin原理,進行了關(guān)鍵方程的推導,結(jié)合Kuhn-Tucker公式找到列車最佳駕駛策略條件和最佳的切換次數(shù),并應用于列車節(jié)能優(yōu)化駕駛;Howlett等[5]在2001年利用Euler-Lagrange和Kuhn-Tucker代數(shù)方程來構(gòu)建列車節(jié)能優(yōu)化最佳控制場景,并取得了較好的效果;Vu[6]通過研究列車最優(yōu)化控制條件,提出列車節(jié)能優(yōu)化駕駛的必要條件,然后通過列車模型進行解析求解,獲得節(jié)能操縱檔位;Chang等[7]將遺傳算法引入到列車節(jié)能優(yōu)化控制的研究中,在保障列車準時性、平穩(wěn)性、安全性的情況下,以最小化總能耗為優(yōu)化目標,并實驗證明遺傳算法為這種多約束多優(yōu)化目標的問題提供了良好、可靠和快速的解決方案;Lechelle等[8]使用遺傳算法解決了多約束條件下的列車節(jié)能優(yōu)化駕駛,開發(fā)出來的OptiDrive計算仿真工具可以實現(xiàn)7%以上的節(jié)能效果;國內(nèi)學者Su

    等[9]綜合考慮在連續(xù)車站的時刻表和列車能耗,通過提出的數(shù)學模型計算在連續(xù)車站間的約束時間內(nèi)的最優(yōu)速度運行曲線;Feng 等[10]在研究城市地鐵節(jié)能優(yōu)化操縱問題中通過最大值原理分析出列車在各種不同類型坡道上的速度曲線以及檔位操作模式的變換次數(shù),然后提出節(jié)能駕駛速度曲線的分析方法,最后使用序列化二項式規(guī)劃的方法進行求解;Li等[11]使用“坡段三分法”將列車節(jié)能優(yōu)化駕駛問題轉(zhuǎn)換為傳統(tǒng)的優(yōu)化問題,使用遺傳算法進行尋優(yōu),同時對方案進行模擬仿真,驗證了其有效性;Yang等[12]結(jié)合時刻表和列車的牽引和制動操作,研究列車的最優(yōu)駕駛方式,并提出這種求解方式將成為以后的新趨勢.本文針對現(xiàn)有研究方法的不足之處,利用集成學習的優(yōu)秀泛化能力,提出一種基于集成學習與分層結(jié)構(gòu)的列車節(jié)能優(yōu)化駕駛解決方案.利用集成學習方法,結(jié)合數(shù)據(jù)不均衡處理與特征選擇技術(shù),同時在預測過程中加入安全調(diào)控策略,在滿足列車安全、平穩(wěn)、準點等約束條件下,有較好的優(yōu)化效果和較高的計算效率,達到了列車節(jié)能優(yōu)化駕駛的目的.

    1? ?列車節(jié)能優(yōu)化駕駛問題

    列車的節(jié)能優(yōu)化駕駛問題往往具有高維度、非線性、求解組合復雜多變的特點,同時在列車運行過程中,也會有諸多因素影響列車的能耗.如圖1所示,其中人為因素和附加因素一般是不可控的,運行線路、列車屬性、列車狀態(tài)、列車編組是可確定因素.列車節(jié)能優(yōu)化駕駛的目標就是在上述因素的約束下計算出最節(jié)能的列車駕駛方式.

    由于列車的操作檔位是控制列車運行的唯一方式,同時列車能量消耗也是操作檔位的直接體現(xiàn),所以要分析列車的節(jié)能優(yōu)化駕駛就需要研究列車的檔位能耗.不同列車的不同檔位對應的能量消耗一般不相同,圖2和圖3分別表示HXN3列車的牽引檔位能耗曲線和制動檔位能耗曲線,圖中橫坐標為檔位,縱坐標為能耗,能耗單位kg/s代表某一檔位持續(xù)一秒所消耗的燃油(能量).由圖中曲線可以看出,對于列車的牽引檔位,檔位越高能耗越高,對于列車的制動檔位,不同的制動檔位能耗相同.了解列車的檔位能耗對應關(guān)系有助于分析和理解優(yōu)秀司機的操作方式,同時可以計算出檔位操作序列的能耗,為后續(xù)的試驗評估提供方法和依據(jù).

    為簡化問題,僅考慮沿列車運行軌道方向上列車所受到的力,列車的運動受力方程如下:

    式中:v是列車的運行速度;s為列車所處的位置(一般使用公里標來代表);ds為列車運行的距離;t為列車的運行時刻時間;dt為列車運行ds所花的時間;F表示列車沿軌道方向上所受的力;m為列車質(zhì)量;ρ為質(zhì)量的影響因子;dv為列車的速度變化;

    f(s)代表列車在s處受到的牽引力或制動力;Rb(v)代表列車在運行過程中與鐵軌摩擦產(chǎn)生的阻力;

    Rl(v)代表列車運行過程中影響因素最大的三個線路環(huán)境因素(坡段、隧道、彎道)的合力.

    列車的節(jié)能優(yōu)化駕駛問題就是在特定條件下計算出控制列車運行的盡可能節(jié)能的控制序列,依據(jù)列車動力學式(1),提出列車節(jié)能優(yōu)化駕駛的優(yōu)化目標如式(2)所示,約束條件如式(3)與式(4)所示:

    式(2)中:f(s)為列車操縱檔位控制的牽引力或制動力;列車所處位置s(公里標)和速度v作為列車運行的實時狀態(tài)變量;OE為列車總能耗;φ(f)為列車的控制檔位;λ為常量系數(shù).約束式(3)中:f(s)表示列車的牽引力或制動力;v(s)表示列車在s處的速度,vlimit(s)由線路限速信息決定,列車在任何時刻都不允許超限速運行.約束式(4)中:OT表示列車實際運行時間T和預定時刻表時間T的差值, T一般由線路的時刻表信息確定,需要小于預定的時間偏差參數(shù)Tdeviation(一般為3 min);sstart為列車的運行開始位置;send為運行結(jié)束位置;vstart為起始運行速度;vend為終止運行速度,sstart、send、vstart和vend需要在優(yōu)化計算前預先設定,作為列車運行過程中的邊界條件.

    本文將時間因素OT作為優(yōu)化問題的約束條件之一,而沒有作為優(yōu)化目標,由此降低問題的復雜度,使得優(yōu)化的目標只有一個,即求出在各種約束條件下使列車的能耗盡可能低的檔位操作序列.

    2? ?基于集成學習的列車節(jié)能優(yōu)化駕駛方案

    針對列車節(jié)能優(yōu)化駕駛問題中高維、多約束、非線性、實時性要求高等難點,本文提出一種基于集成學習和分層結(jié)構(gòu)的列車節(jié)能優(yōu)化駕駛解決方案,使用離線訓練到在線預測的思想,最終得到的可以控制列車運行的檔位操作序列是具有時間屬性的離散檔位的集合.

    2.1? ?問題分析與設計思路

    為研究優(yōu)秀司機的駕駛方式,分析了大量司機的駕駛?cè)罩緮?shù)據(jù)(從列車行駛記錄儀中獲得),發(fā)現(xiàn)在司機的駕駛行為中有許多共同之處,如圖4所示,圖中橫軸為公里標,左側(cè)縱軸為檔位,右側(cè)縱軸為速度,曲線①為列車檔位,曲線②為列車運行速度,曲線③為線路加算坡度.從圖中可以看出,在相同的線路上列車的運行方式和司機駕駛機車的方式類似的模式,并且多數(shù)情況下這些相似的駕駛模式易于識別.因此從大量優(yōu)秀司機(駕駛數(shù)據(jù)能耗最低排名前20%的司機為優(yōu)秀司機,其余為普通司機)的駕駛?cè)罩緮?shù)據(jù)中發(fā)現(xiàn)優(yōu)秀司機共有的駕駛方式,對于解決機車節(jié)能駕駛非常有價值.

    2.2? ?分層思想

    在本文解決方案分層的思路中,首先從優(yōu)秀司機的駕駛?cè)罩緮?shù)據(jù)中挖掘出“粗粒度”的不同分段下列車運行速度信息,進而將分段繼續(xù)細分,再挖掘被細化的分段中“細粒度”的檔位信息.列車節(jié)能優(yōu)化駕駛解決方案分層思路如圖5所示,預測階段分為速度層和檔位層,在速度層首先使用分類模型預測列車應該有的速度變化模式,然后利用上一步結(jié)果根據(jù)回歸模型去預測速度變化模式中每一個速度變化應該運行的距離長度,在檔位層同樣使用分類模型預測列車應該有的檔位變化模式,利用上一步結(jié)果根據(jù)回歸模型去預測檔位變化模式中每一個檔位應該運行的距離長度,最終得到的檔位信息集合,經(jīng)過簡單的牽引計算轉(zhuǎn)換即可得到有時間屬性、可以控制列車運行的節(jié)能優(yōu)化檔位操縱序列.

    2.3? ?總體設計

    依據(jù)上述分析,提出基于集成學習的列車節(jié)能優(yōu)化駕駛框架,采用離線模型訓練和在線預測相結(jié)合的手段,離線模型訓練階段從優(yōu)秀司機的駕駛歷史數(shù)據(jù)中使用集成學習方法學習到優(yōu)秀司機的駕駛方式;在線預測階段使用離線訓練好的模型以分層組織的方式對新數(shù)據(jù)進行預測,首先預測列車的運行速度信息,然后通過速度信息預測列車的檔位操作序列,解決方案中分層思想很好地解決了操作檔位難以直接預測的問題.

    為了保證速度信息預測和檔位信息預測的效果,采取集成學習的方法,通過多種集成學習算法的試驗對比選擇隨機森林和Bagging(Bootstrap aggregating)[15]集成學習算法集成REPTree(Decision Tree with Reduced Error Pruning)[16]作為分類器和回歸器(隨機森林和Bagging算法均為優(yōu)秀的集成學習算法).最后在預測過程中加入安全保障策略和檔位處理方法,得到可以控制機車運行、具有時間屬性的離散檔位序列,這些檔位序列中包含了優(yōu)秀司機的駕駛方式,從而達到節(jié)能優(yōu)化駕駛的目的.基于集成學習的列車節(jié)能優(yōu)化駕駛框架如圖6所示,整個框架分為離線模型訓練階段和在線預測階段,具體介紹如下.

    2.3.1? ?離線模型訓練階段

    1)數(shù)據(jù)預處理.首先處理獲得的優(yōu)秀司機駕駛?cè)罩緮?shù)據(jù)和對應的線路數(shù)據(jù),其中線路數(shù)據(jù)將按照不同的坡段類型被分段處理,司機的駕駛?cè)罩緮?shù)據(jù)根據(jù)線路分段和模型訓練需求被切割為不同的樣本訓練數(shù)據(jù).然后針對數(shù)據(jù)特點使用數(shù)據(jù)不均衡處理算法,對數(shù)據(jù)進行上采樣操作,一定程度上解決了數(shù)據(jù)不均衡問題.最后對訓練數(shù)據(jù)集進行特征選擇操作,只選取最有用的特征,這樣可以排除部分特征的干擾,同時加快模型的訓練和計算速度.

    2)速度信息預測模型訓練.該階段利用訓練數(shù)據(jù)集中相應的訓練數(shù)據(jù)進行機器學習模型的訓練.將速度信息的預測分為速度變化模式預測和速度趨勢運行長度預測兩部分,集成學習算法分別為隨機森林(用于分類預測)和Bagging算法(用于回歸預測).本階段的主要產(chǎn)物為速度變化模式預測模型和速度趨勢運行長度模型.

    3)檔位信息預測模型訓練.該階段與速度信息預測模型訓練相同,也是使用隨機森林(用于分類預測)和Bagging算法(用于回歸預測)訓練檔位信息預測模型,在訓練數(shù)據(jù)集中需要考慮更多的特征屬性,包括列車速度的相關(guān)信息等.本階段主要產(chǎn)物為檔位變化模式預測模型和檔位運行長度模型.

    2.3.2? ?在線預測階段

    1)數(shù)據(jù)預處理.預測階段的數(shù)據(jù)預處理,首先從列車上的相關(guān)設備獲取列車相關(guān)參數(shù)和線路相關(guān)參數(shù),并進行預處理,按照訓練數(shù)據(jù)集的特征準備數(shù)據(jù),數(shù)據(jù)格式應同訓練階段數(shù)據(jù)格式一致.

    2)速度信息預測.首先使用速度變化模式預測模型預測速度的變化模式,然后將速度變化模式信息作為一部分輸入特征,利用速度趨勢運行長度模型預測速度趨勢運行長度,由此可知道列車在某一區(qū)段的運行速度模式和以某一速度趨勢運行的

    距離.

    3)檔位信息預測.該階段將速度信息作為部分特征輸入,使用檔位變化模式預測模型預測檔位變化信息,將檔位信息作為特征輸入使用檔位運行長度預測模型預測檔位運行的距離,由此得到列車的操作檔位和應用該檔位行駛的距離.

    4)安全策略調(diào)控及檔位后處理.在預測的過程中,我們會加入安全策略對速度信息預測和檔位信息預測進行調(diào)控,防止出現(xiàn)速度過高和速度過低的情況.同時將預測得到的檔位和檔位應行駛的距離通過計算轉(zhuǎn)換為可以控制機車運行的帶有時間屬性的離散操縱檔位序列,同時對這些檔位做一些后處理操作,保證檔位的平穩(wěn)切換.

    分層組織的第一層速度信息預測和第二層檔位信息預測是基于集成學習的列車節(jié)能優(yōu)化駕駛框架核心的部分,利用集成學習分類算法預測速度或檔位的操作模式,集成學習回歸算法預測每種模式中某種速度或者檔位的運行距離.

    在鐵路系統(tǒng)中,交通調(diào)度等因素主要體現(xiàn)在列車前方信號燈的組合變化上,如雙黃燈表示將要進入側(cè)線行駛,則需要按側(cè)線道岔限速規(guī)劃行車曲線.如果不能反映在信號燈變化上的調(diào)度信息,如臨時電話調(diào)度指令等,則可通過交互單元屏幕交互輸入站間時刻的增減,進而影響曲線規(guī)劃中的時刻表和平均速度等特征.

    3? ?數(shù)據(jù)預處理與特征選擇

    3.1? ?列車運行線路數(shù)據(jù)預處理

    從列車運行控制記錄裝置LKJ設備中獲取到原始線路數(shù)據(jù),需要對線路數(shù)據(jù)進行預處理操作,主要包含線路加算坡度計算、根據(jù)加算坡度的線路預分段操作、線路短分段合并三部分.

    在2.1節(jié)中介紹了列車運行線路環(huán)境和加算坡度的概念,通過對線路信息加算,可以得到以10 m為單元的能夠代表整條線路環(huán)境因素的加算坡度實值序列,線路加算坡度示意信息如表1所示.

    根據(jù)加算坡度對線路進行預分段,將整條線路拆分為不同坡段類型的路段集合.通過研究加算坡度值的分布范圍,確定了6種坡段類型,如表2所示,包含陡上坡、緩上坡、平坡、緩下坡、陡下坡和超陡下坡.

    除了要考慮每一個坡段的坡度信息還需要考慮它們的長度信息.本文定義的短分段標準為分段長度小于等于列車長度的一半.對于連續(xù)的短分段合并,將多個連續(xù)長度小于等于列車長度一半的分段進行合并,合并后分段的加算坡度值為短分段的加算坡度值求平均值,同時根據(jù)新的坡度值得到新的坡段類型;對于兩個長分段夾短分段情況的合并,當短分段左側(cè)的分段長度小于右側(cè)的分段長度時短分段合并到右側(cè)分段,當短分段左側(cè)的分段長度大于右側(cè)的分段長度時短分段合并到左側(cè)分段,合并后分段的加算坡度值為短分段與長分段加算坡度值求平均值,同時根據(jù)新的坡度值得到新的坡段類型.

    圖7為模擬仿真試驗線路上一小段的線路分段示意圖,圖中虛線為分段的加算坡度,實線為線路的分段,加算坡度值和線路分段的類型相對應,這些線路分段基本代表了整個線路的環(huán)境因素影響.

    列車日志數(shù)據(jù)包括列車基本參數(shù)和列車運行數(shù)據(jù),可以從列車上的列車運行監(jiān)控裝置LKJ和列車控制與管理系統(tǒng)TCMS設備上獲得,LKJ中主要記錄了運行線路、列車調(diào)度、列車所處位置和對應的速度等信息,TCMS中主要記錄司機操作機車的檔位等數(shù)據(jù).為方便后續(xù)計算和分析,將列車的運行數(shù)據(jù)以速度的持續(xù)時間進行切割,速度的持續(xù)時間設置為0.5 s.將線路分段數(shù)據(jù)與機車運行數(shù)據(jù)進行映射,列車運行數(shù)據(jù)按照分段分割.

    3.2? ?基于SMOTE的數(shù)據(jù)不均衡處理

    SMOTE (Synthetic Minority Oversampling Technique)[13]合成少數(shù)過采樣技術(shù),相對于簡單隨機復制樣本數(shù)據(jù)的隨機過采樣,SMOTE可以合成小樣本的數(shù)據(jù),構(gòu)造原始數(shù)據(jù)集中沒有的新數(shù)據(jù),這樣一定程度上可以避免訓練模型的過度擬合問題,可以加大訓練模型的泛化能力.

    通過分析基于集成學習的列車節(jié)能優(yōu)化駕駛問題的訓練數(shù)據(jù)集,發(fā)現(xiàn)這些數(shù)據(jù)存在較大的數(shù)據(jù)不均衡問題,代表性低的小樣本數(shù)據(jù)可能被機器學習算法當成噪聲數(shù)據(jù)處理掉.為解決上述問題,針對這兩類分類問題都做了SMOTE算法的上采樣操作.

    針對訓練預測速度變化模式模型訓練數(shù)據(jù)集和訓練預測檔位變化模式模型訓練數(shù)據(jù)集,處理樣本數(shù)最少的30個類別,用于生成合成數(shù)據(jù)樣本的最近鄰數(shù)目為5,上采樣倍率為0.5(上采樣到最多樣本數(shù)類別樣本數(shù)的0.5倍).以訓練速度變化模式的數(shù)據(jù)集為例,SMOTE算法上采樣前后的數(shù)據(jù)分布對比如圖8所示,從圖中可以看出過采樣后基本沒有特別不均衡的數(shù)據(jù),將采樣倍率設置為0.5以防止模型出現(xiàn)過擬合問題,以及避免類別之間的樣本重疊和邊界過于模糊加大分類算法進行分類的難度.

    3.3? ?基于CFS的特征選擇

    在訓練預測模型過程中綜合考慮了影響列車運行和能耗的因素,這樣也導致冗余和無效的特征被加入.因此利用CFS(Correlation-based Feature Selection)[14]對訓練數(shù)據(jù)集進行特征選擇操作.

    影響列車駕駛能耗的因素眾多,在初步分析中這些因素都應被考慮為機器學習中的特征,同時基于集成學習的列車節(jié)能優(yōu)化駕駛解決方案的分層結(jié)構(gòu),將每個步驟的輸出類別都加入到后續(xù)階段數(shù)據(jù)集的特征數(shù)據(jù).圖9所示為基礎特征集,分為列車屬性特征和線路屬性特征,線路屬性不僅考慮列車當前所處的坡段,由于前后坡段也會影響列車的節(jié)能運行及司機的操縱,所以將前后坡段也考慮在內(nèi).

    使用基于CFS的特征選擇算法,結(jié)合Best-first搜索,對用于機器學習模型預測的訓練數(shù)據(jù)進行特征選擇操作.特征選擇處理主要應用在速度變化模式中速度變化運行距離和檔位變化模式中檔位運行距離的回歸預測任務上,經(jīng)過CFS特征選擇,維數(shù)分別降低到19維和23維.

    4? ?基于集成學習的模型訓練及預測分析

    4.1? 基于隨機森林的速度模式和檔位模式預測

    速度變化模式和檔位變化模式的分類預測是基于集成學習的列車節(jié)能優(yōu)化駕駛的速度層、檔位層第一階段的步驟.對于這兩部分的分類預測,本文中選擇隨機森林算法進行實現(xiàn),隨機森林算法如算法1所示.其中Vote代表多數(shù)投票,整個隨機森林的泛化能力由單棵決策樹的分類能力和隨機森林中決策樹與決策樹之間的相關(guān)度來決定.

    算法1:隨機森林算法

    Input:數(shù)據(jù)集D=(xi,yi),i=1,…,n,特征集M,隨機森林子樹個數(shù)k

    1? ? ?for i ← to n do

    2? ? ?對D進行bcotstrap抽樣,生成訓練數(shù)據(jù)集Di

    3? ? ?利用Di訓練決策樹Ti

    4? ? ? a.從M中選擇子特征集m

    5? ? ? b.在決策樹每個節(jié)點上使用Gini指數(shù)來確定最佳分裂點

    6? ? ? c.決策樹自由生長,不進行剪枝

    Output:決策樹集合Ti,i = 1,…,k

    7? ? ? 對于測試數(shù)據(jù)d,根據(jù)決策樹集合T,預測分數(shù)h(d): h(d)

    =vote{Ti(d)}k? ?i=1

    return h(d)

    對于隨機森林中多棵決策樹的訓練,如果對每棵決策樹賦予相同的權(quán)重,一定程度會降低整個分類模型的分類效果.因此使用加權(quán)隨機森林(Weighted Random Forest, WRF)進行分類預測.WRF是使隨機森林從不平衡數(shù)據(jù)集中能夠很好地學習的一種方法,使用代價敏感學習的思路.由于隨機森林的預測結(jié)果往往傾向于樣本數(shù)多的類別,所以將小樣本數(shù)據(jù)類別分類錯誤設置更大的懲罰,WRF會將小樣本數(shù)據(jù)集分配更大的權(quán)重(即更大的分錯代價),大樣本數(shù)據(jù)集分配小的權(quán)重.

    4.2? ?基于Bagging和REPTree的速度模式長度和

    檔位長度預測

    經(jīng)過試驗對比選擇Bagging集成學習算法集成REPTree來進行速度變化模式中速度變化運行距離和檔位變化模式中檔位的運行距離的回歸預測.

    同隨機森林一樣,Bagging算法也是使用自主法(bootstrap sampling)來進行隨機有放回抽樣.Bagging算法與隨機森林的不同之處在于Bagging算法在決策樹生成的過程中沒有使用隨機的特征選擇.在預測階段Bagging算法與隨機森林算法相同,使用多數(shù)投票法或求均值得到分類或回歸的最終結(jié)果.

    本文使用Bagging集成學習算法來集成REPTree基分類器,作為速度變化模式中某速度變化運行長度和檔位變化模式中某檔位運行長度的回歸預測算法.這兩部分的回歸預測是基于集成學習的列車節(jié)能優(yōu)化駕駛方案中速度層、檔位層的第二階段步驟.對于速度變化模式中速度變化的運行距離和檔位變化模式中檔位的運行距離,為方便計算與分析,沒有使用真實的距離實值進行回歸預測,而是使用其所在區(qū)段中距離所占百分比進行回歸預測,有效避免了不同坡度的長度相差過大造成的預測誤差.在回歸預測中預測結(jié)果不能保證絕對準確,針對這種情況在該階段會對預測的距離百分占比做微調(diào),將區(qū)段內(nèi)的百分比預測值按照數(shù)值比例進行放大或縮小,使得區(qū)段內(nèi)所有預測比例之和達到100%.

    在最后進行檔位序列預測與計算時,由于線路坡段長度固定且已知,通過速度變化所占區(qū)段百分比和檔位變化所占區(qū)段的百分比即可計算出相應檔位的運行距離,這樣通過簡單的計算就可獲得最終有時間屬性的離散檔位序列.

    4.3? ?安全保障策略設計

    為防止列車運行過程中超限速,設計超限速的安全保障策略,如圖10所示,具體過程如下:

    1)從限速減閾值(8 km/h)的C點(坡段或限速結(jié)束點的分界點)通過原始檔位增加2檔與原始曲線相交于D點.

    2)從C點通過原始檔位增加2檔通過反求操

    作(使用列車的牽引計算模型,從后往前計算)計算到此限速段的開始位置B點,該過程中列車速度保持在限速減去閾值以下.

    3)從B點通過檔位尋找,找到使列車加速度大于0的檔位,使用這個檔位反求直到與原始曲線相交于A點.

    為防止列車速度過低而停車,設計速度過低安全保障策略,如圖11所示,具體過程如下:

    1)在分界點低速限制值加上閾值(8 km/h)的C點處,通過C點之后速度曲線的變化趨勢(加速或減速)選擇合適的檔位,使得新速度曲線與原始速度曲線相交于D點.

    2)從C點通過原始檔位減少2檔的檔位通

    過反求操作計算得到低于低速閾值的起始點位置B點.

    3)從B點通過檔位尋找,找到加速度小于0的檔位,使用該檔位反求直到與原始曲線相交于A點.

    5? ?試驗設計與分析

    5.1? ?試驗設計

    本文借助于本課題組研究的貨運機車節(jié)能優(yōu)化駕駛半實物仿真平臺進行模擬仿真,模擬列車在真實情況下的運行環(huán)境,主要結(jié)構(gòu)如圖12所示,圖中右上角的機箱為車載優(yōu)化器,在仿真過程中會從LKJ與TCMS設備中獲得列車的基本參數(shù)與線路信息,在試驗環(huán)境中使用這些數(shù)據(jù)計算列車的節(jié)能優(yōu)化操縱序列,然后將節(jié)能優(yōu)化操縱序列輸入到車載優(yōu)化器中,最后在半實物仿真平臺中進行列車的模擬運行.整個半實物仿真平臺形成一個閉環(huán),可完全模擬出列車在線路上可能出現(xiàn)的各種情況.

    本文進行模擬仿真與試驗的列車為HXN3型內(nèi)燃機車,試驗線路是沈陽鐵路局蘇家屯車站到本溪車站路段,總長度為65.4 km.在此線路上選取633條優(yōu)秀司機的駕駛數(shù)據(jù)作為預測模型的訓練數(shù)據(jù)集,通過分段切割,訓練預測列車速度變化模式模型的訓練集樣本有14 841個,訓練預測列車速度變化模式中速度變化距離模型的訓練集樣本有28 765個,訓練預測列車檔位變化模式模型的訓練集樣本有27 624個,訓練預測列車檔位變化模式中檔位運行距離模型的訓練集樣本有36 748個.同時選取了若干優(yōu)秀司機的駕駛數(shù)據(jù)作為對比分析與測試數(shù)據(jù)集.

    5.2? ?試驗結(jié)果與分析

    5.2.1? ?集成學習模型訓練試驗分析

    本文使用分類的精確率(Precision)、召回率(Recall)、F度量(F-measure)3個指標來評估分類器的分類效果,這3個指標越高表示模型的分類效果越好.其中,Precision代表模型在某一類別上分類正確樣本數(shù)占模型預測所有這類樣本數(shù)的比例;Recall代表模型在某一類別上分類正確樣本數(shù)占此類別所有的樣本數(shù),可用于評估模型預測某類別的可信度;F-measure是將精確率和回歸率合并考慮的一種評估方法,如式(5)所示:

    F-measure = ? ? ? ? ? ? (5)

    對于回歸模型的評估,使用機器學習領域常用的相關(guān)系數(shù)(Correlation Coefficient,CC)、平均絕對誤差(Mean Absolute Error,MAE)、根平均平方誤差(Root Mean Squared Error,RMSE)、相對絕對誤差(Relative Absolute Error,RAE)和根相對平方誤差(Root Relative Squared Error,RRSE)進行評估.其中,CC用于衡量真實值與預測值之間的相關(guān)度;MAE用于衡量預測值與最終真實結(jié)果之間的接近程度;RMSE是一種用于數(shù)值預測的通用誤差度量方式,與MAE相比RMSE放大了大誤差;RAE可以在不同單位測量誤差的模型之間比較誤差;RRSE用于在不同單位測量誤差的模型之間比較相對平方誤差.對于上述評估指標,CC值越高回歸預測模型越好,MAE、RMSE、RAE、RRSE均表示誤差,值越低模型預測效果越好

    為了方便表述,在以下的試驗分析中用M1表示預測列車速度變化模式模型,M2表示預測列車速度變化模式中速度變化距離模型,M3表示預測列車檔位變化模式模型,M4表示預測列車檔位變化模式中檔位運行距離模型.

    對于模型M1和M3,選取隨機森林作為分類算法,將隨機森林與分類效果較好的REPTree、Bagging(REPTree)、Adaboost(REPTree)、FURIA(Fuzzy Unordered Rule Induction Algorithm)、BayesNet五種算法進行對比.其中Adaboost(REPTree)為基于Boosting的自適應增強集成學習算法,基分類器為REPTree;FURIA為基于模糊歸納的規(guī)則學習算法;BayesNet為基于Bayes公式構(gòu)建概率化推理圖形化網(wǎng)絡的機器學習算法.

    模型M1與M3的訓練結(jié)果數(shù)據(jù)對比如表3和表4所示.從表中可以看出隨機森林算法在M1、M3兩種分類情景中均有更好的表現(xiàn).

    在試驗中對隨機森林和加權(quán)隨機森林這兩種模式進行對比分析,基于模型M1進行對比試驗,通過修改隨機森林的子樹個數(shù)來對比WRF與RF的訓練效果,共進行子樹個數(shù)從10到200的數(shù)據(jù)對比,如圖13所示.由圖可知WRF在子樹個數(shù)大于50之后模型的訓練效果小范圍內(nèi)明顯優(yōu)于RF.

    對于模型M2和M4,選取Bagging(REPTree)作為回歸算法,與REPTree、隨機森林、線性回歸、Bagging(LR)四種回歸算法進行對比.其中線性回歸(Linear Regression,LR)為利用線性回歸方程的最小二乘函數(shù)進行建模的一種回歸分析方式;Bagging (LR)為使用Bagging對LR集成的集成學習方法.

    模型M2和M4的訓練結(jié)果數(shù)據(jù)對比如圖14和圖15所示,其中左側(cè)縱坐標為CC指標,右側(cè)縱坐標為MAE指標.可以看出Bagging(REPTree)集成學習算法在M2、M4回歸應用場景中都有較好的

    通過以上的模型算法對比分析可以發(fā)現(xiàn)隨機森林和回歸算法Bagging(REPTree)在預測上表現(xiàn)較好,這對后續(xù)列車節(jié)能優(yōu)化駕駛操縱序列的預測有著非常重要的作用,四個模型最終訓練結(jié)果如表5所示.

    5.2.2? ?列車節(jié)能優(yōu)化駕駛檔位操作序列預測試驗分析

    在列車的節(jié)能優(yōu)化駕駛操縱序列分析過程中將對比優(yōu)秀司機的駕駛檔位序列與基于集成學習的列車節(jié)能優(yōu)化駕駛模型預測的檔位操縱序列,同時分析在這兩種不同的檔位操縱序列情況下列車的速度運行情況.在相同的試驗線路(蘇家屯-本溪)下,選取多組不同列車參數(shù)的試驗數(shù)據(jù)進行對比分析.多數(shù)情況下駕駛效果基本和優(yōu)秀司機相同,如圖16與圖17所示,其中圖16(a)、17(a)為速度對比曲線,圖16(b)、17(b)為檔位對比曲線,曲線②為優(yōu)秀司機駕駛的檔位序列和列車運行速度曲線,曲線③為列車節(jié)能優(yōu)化駕駛模型預測的檔位序列和列車運行速度曲線,曲線①為線路限速,從圖中可以看出本文的解決方案基本達到優(yōu)秀司機的駕駛水平.

    在一些極特殊情況下模型會出現(xiàn)錯誤的預測,這些錯誤的預測會導致列車的速度過高或過低出現(xiàn)行駛安全風險,如圖18和圖20所示,通過在4.3節(jié)中超限速安全保障策略和速度過低保障策略的調(diào)整,可以完全杜絕這類情況,保障列車的安全運行,策略調(diào)整后的列車運行曲線圖如圖19和圖21所示.

    5.2.3? ?列車節(jié)能優(yōu)化駕駛能耗與時間試驗分析

    通過半實物仿真平臺以及檔位和單位能耗的對應關(guān)系計算列車駕駛能耗,列車操縱檔位序列中檔位單元為每檔位0.5 s,這樣根據(jù)檔位操縱序列即可得到整個檔位序列的能耗值.在列車駕駛能耗分析階段將列車優(yōu)化能耗與普通司機駕駛列車能耗進行對比,并計算所能達到的節(jié)能百分比,如式(6)所示.

    式中:Em為基于集成學習的列車節(jié)能優(yōu)化駕駛能耗;Eh為普通司機的駕駛平均能耗;p為節(jié)能百分比,若值為正則表示節(jié)能,若值為負數(shù)則表示更加耗能.選取10組對比數(shù)據(jù),最終方案能夠達到平均節(jié)能7.156%的水平.

    對于列車的運行時間,一般要求列車到站時間與時刻表時間不能超過正負3 min,需要重點考慮.將優(yōu)化模型預測產(chǎn)生的檔位序列運行時間與列車運行線路上的時刻表進行對比,計算兩者的時間偏差,時間偏差計算如公式(7)所示.

    ΔT = Tm - Ts? ? ? ? ? ? ? ? (7)

    式中:Tm為優(yōu)化模型預測產(chǎn)生的檔位序列運行時間;Ts為時刻表時間,當ΔT小于0,表示列車提前到站,當ΔT大于0,表示列車晚點到站.同樣使用油耗對比中的10組數(shù)據(jù)進行試驗,從試驗對比數(shù)據(jù)中可以看出基于集成學習的列車節(jié)能優(yōu)化駕駛時間與標準時刻表時間的時間偏差沒有超過3 min的,能夠達到列車節(jié)能優(yōu)化駕駛的時間約束條件要求.

    6? ?結(jié)? ?論

    本文基于列車的動力學模型,通過運行線路環(huán)境因素和司機的駕駛?cè)罩緮?shù)據(jù)分析了可能影響列車運行能耗的因素,提出一種基于集成學習的列車節(jié)能優(yōu)化駕駛方法.其中,基于SMOTE算法和CFS算法的列車節(jié)能優(yōu)化駕駛訓練數(shù)據(jù)集的處理方法解決了數(shù)據(jù)中存在的不均衡問題;基于分層結(jié)構(gòu)的集成學習組織方法通過分層的方式組織隨機森林和Bagging(REPTree)集成學習算法,形成速度層與檔位層兩層結(jié)構(gòu),分別進行分類預測和回歸預測.以HXN3型機車在沈陽鐵路局蘇家屯到本溪線路為例進行了試驗設計與分析,從模型訓練評估、優(yōu)化檔位操作序列仿真、能耗與時間表現(xiàn)3個方面對試驗結(jié)果進行對比與分析,論證了方案的可行性.

    參考文獻

    [1]? ? HUANG J,DENG Y,YANG Q,et al. An energy-efficient train control framework for smart railway transportation [J]. IEEE Transactions on Computers,2016,65(5):1407—1417.

    [2]? ? ICHIKAWA K. Application of optimization theory for bounded state variable problems to the operation of train [J]. Bulletin of JSME,1968,11(47):857—865.

    [3]? ? KHMELNITSKY E. On an optimal control problem of train operation [J]. IEEE Transactions on Automatic Control,2000,45(7): 1257—1266.

    [4]? ? PHIL H. The optimal control of a train [J]. Annals of Operations Research,2000,98(1/4):65—87.

    [5]? ? HOWLETT P G,LEIZAROWITZ A . Optimal strategies for vehicle control problems with finite control sets [J]. Dynamics of Continuous Discrete & Impulsive Systems,2001,8(1):41—69.

    [6]? ? VU X. Analysis of necessary conditions for the optimal control of a train: new necessary conditions for energy-efficient train control [M]. VDM Publishing,2009:16—28.

    [7]? ? CHANG C S,SIM S S. Optimising train movements through coast control using genetic algorithms [J]. IEE Proceedings-Electric Power Applications,1997,144(1): 65—73.

    [8]? ? LECHELLE S A,MOUNEIMNE Z S. OptiDrive:a practical approach for the calculation of energy-optimised operating speed profiles[C]//Proceedings of IET Conference on Railway Traction Systems (RTS 2010). Birmingham: IET,2010:22—23.

    [9]? ? SU S,LI X,TANG T,et al. A subway train timetable optimization approach based on energy-efficient operation strategy [J]. IEEE Transactions on Intelligent Transportation Systems,2013,14(2): 883—893.

    [10]? FENG Q,HU J,LI H. Design of experimental platform for urban rail vahicle braking system[C]//2010 Chinese Control and Decision Conference.Singapore:IEEE,2010: 4430—4434.

    [11]? LI Y S,HOU Z S. Study on energy-saving control for train based on genetic algorithm [J]. Journal of System Simulation,2007,19(2):384—387.

    [12]? YANG X,LI X,NING B,et al. A survey on energy-efficient train operation for urban rail transit [J]. IEEE Transactions on Intelligent Transportation Systems,2016,17(1): 2—13.

    [13]? CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE: synthetic minority over-sampling technique [J]. Journal of Artificial Intelligence Research,2002,16(1):321—357.

    [14]? HALL M A. Correlation-based feature selection for machine learning[D]. Hamilton:Department of Computer Science,Waikato University,1998:19—27.

    [15]? BREIMAN L. Bagging predictors [J]. Machine Learning,1996,24(2):123—140.

    [16]? QUINLAN J R. Simplifying decision trees [J]. International Journal of Man-Machine Studies,1987,27(3):221—234.

    猜你喜歡
    節(jié)能優(yōu)化機器學習
    火力發(fā)電廠熱動系統(tǒng)節(jié)能優(yōu)化措施探究
    論現(xiàn)代建筑電氣照明節(jié)能的優(yōu)化設計
    居業(yè)(2016年6期)2017-02-05 00:59:04
    基于詞典與機器學習的中文微博情感分析
    基于機器學習的圖像特征提取技術(shù)在圖像版權(quán)保護中的應用
    基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
    時代金融(2016年27期)2016-11-25 17:51:36
    前綴字母為特征在維吾爾語文本情感分類中的研究
    科教導刊(2016年26期)2016-11-15 20:19:33
    基于支持向量機的金融數(shù)據(jù)分析研究
    關(guān)于空調(diào)制冷系統(tǒng)的節(jié)能優(yōu)化
    科技視界(2016年16期)2016-06-29 20:33:24
    機器學習理論在高中自主學習中的應用
    大數(shù)據(jù)技術(shù)在凝結(jié)水變頻節(jié)能優(yōu)化中的應用
    科技視界(2016年9期)2016-04-26 11:42:25
    甘孜县| 建德市| 黔东| 汉源县| 翁牛特旗| 忻城县| 广宁县| 望江县| 香河县| 天峻县| 基隆市| 铁岭市| 璧山县| 斗六市| 青岛市| 比如县| 萍乡市| 独山县| 巩义市| 克山县| 莫力| 玉林市| 慈利县| 临高县| 炉霍县| 当阳市| 图木舒克市| 墨江| 洛扎县| 山丹县| 德惠市| 咸阳市| 共和县| 台前县| 田阳县| 临武县| 丰镇市| 阿拉善左旗| 嘉兴市| 新宁县| 建昌县|