黃子昊,李紅波,張 超,徐東昇
(中車株洲電力機(jī)車研究所有限公司,湖南 株洲 412001)
基于大數(shù)據(jù)的智慧能源系統(tǒng)目前已成為業(yè)界關(guān)注的熱點(diǎn)之一[1-3]。能量管理系統(tǒng)通過(guò)對(duì)海量數(shù)據(jù)的采集、整理和分析,提煉出能量管理策略,以提高能量管理水平,提升系統(tǒng)整體效益。為了進(jìn)一步優(yōu)化能源系統(tǒng)性能,實(shí)現(xiàn)能量實(shí)時(shí)管理,能源數(shù)據(jù)的實(shí)時(shí)性至關(guān)重要[4-6]。當(dāng)能量管理系統(tǒng)包含較多分散布置的設(shè)備時(shí),受物理距離影響,中心控制系統(tǒng)接收設(shè)備能源數(shù)據(jù)時(shí)普遍存在通信延時(shí)現(xiàn)象。延時(shí)會(huì)劣化中心控制系統(tǒng)的控制性能,其中閉環(huán)控制類功能對(duì)延時(shí)尤為敏感[7]。通信系統(tǒng)的性能在極大程度上決定了能源管理系統(tǒng)能夠?qū)崿F(xiàn)的控制功能。
城市軌道交通(簡(jiǎn)稱“城軌”)作為高能耗產(chǎn)業(yè),急需引入能量管理系統(tǒng)來(lái)優(yōu)化系統(tǒng)能耗。城軌能量管理系統(tǒng)通過(guò)數(shù)據(jù)采集與監(jiān)控(supervisory control and data acquisition, SCADA)系統(tǒng)來(lái)監(jiān)控地面設(shè)備能源數(shù)據(jù),主要涉及地鐵主變電站、牽引站和降壓變電所等場(chǎng)所[8-9]。列車通過(guò)車載網(wǎng)絡(luò)通信系統(tǒng)實(shí)現(xiàn)不同車廂和設(shè)備間的數(shù)據(jù)互通和總集[10-11],之后再通過(guò)無(wú)線通信將數(shù)據(jù)傳給地面[12-14]。目前車地?zé)o線通信被廣泛應(yīng)用于列車運(yùn)行調(diào)度、隧道及弓網(wǎng)檢測(cè)等領(lǐng)域。但無(wú)線信號(hào)傳輸易受外界干擾,與有線通信相比,延時(shí)和丟包現(xiàn)象尤為突出[15-16]。若在城軌能量管理系統(tǒng)中引入閉環(huán)控制,例如通過(guò)控制列車運(yùn)行狀態(tài)或能饋設(shè)備運(yùn)行參數(shù)來(lái)改善能量流狀態(tài),那么車載數(shù)據(jù)的延時(shí)和丟包將會(huì)劣化能量管理算法效果,甚至?xí)绊懗擒壞茉聪到y(tǒng)的穩(wěn)定運(yùn)行。
列車功率曲線屬于時(shí)間序列數(shù)據(jù),在固定運(yùn)行模式下存在一定規(guī)律,如牽引階段速度較低時(shí)功率近似線性增加、惰行階段功率平穩(wěn)等,這是預(yù)測(cè)方法能用于通信延時(shí)補(bǔ)償?shù)幕A(chǔ)。時(shí)間序列預(yù)測(cè)常采用統(tǒng)計(jì)回歸模型,其差分原始序列數(shù)據(jù)后,再將序列表示為白噪聲,與之前數(shù)據(jù)點(diǎn)移動(dòng)、平均地組合;但差分操作丟失了數(shù)據(jù)絕對(duì)值,而列車功率絕對(duì)值隱含了當(dāng)前列車運(yùn)行模式這一重要信息,故統(tǒng)計(jì)回歸模型不適合用于預(yù)測(cè)列車功率。神經(jīng)網(wǎng)絡(luò)可以逼近任意非線性函數(shù),能夠預(yù)測(cè)時(shí)間序列數(shù)據(jù)。列車瞬時(shí)功率與鄰近時(shí)刻功率相關(guān),因此本文提出一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)(long-term and short-term memory network ,LSTM)的神經(jīng)網(wǎng)絡(luò)列車功率在線預(yù)測(cè)方法,其利用預(yù)測(cè)時(shí)間點(diǎn)前的功率數(shù)據(jù)來(lái)預(yù)測(cè)列車功率。
基于LSTM的神經(jīng)網(wǎng)絡(luò)[17]是一種改進(jìn)型時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)算法,其拓?fù)涫且粭l由數(shù)個(gè)相同神經(jīng)元依次連接而成的鏈?zhǔn)骄W(wǎng)絡(luò)。神經(jīng)元基本結(jié)構(gòu)中包含3個(gè)功能結(jié)構(gòu),即遺忘門、輸入門和輸出門,見(jiàn)圖1。圖中,Xt為t時(shí)刻神經(jīng)元的時(shí)序數(shù)據(jù)輸入;ht為t時(shí)刻神經(jīng)元的時(shí)序數(shù)據(jù)輸出;St為輸出狀態(tài)記憶單元,用于傳遞歷史信息。
圖1 LSTM神經(jīng)單元拓?fù)鋱DFig. 1 Topology of LSTM neural unit
當(dāng)神經(jīng)元按時(shí)間順序鏈?zhǔn)竭B接后,t時(shí)刻神經(jīng)元輸入包括(t-1)時(shí)刻神經(jīng)元輸出h(t-1)、輸出狀態(tài)記憶單元數(shù)據(jù)S(t-1)以及Xt。神經(jīng)元遺忘門、輸入門和輸出門的輸出分別如下:
式中:σ——Sigmoid函數(shù),其輸出范圍為[0,1];w——對(duì)應(yīng)函數(shù)的權(quán)重;b——對(duì)應(yīng)函數(shù)的偏置;下標(biāo)中 ,t代表時(shí)刻,f代表遺忘門,o代表輸出門。
Sigmoid函數(shù)用于控制信息的遺忘程度,其輸出1表示信息全部流通,0表示信息全部遺忘,介于0和1之間表示信息部分遺忘。LSTM神經(jīng)網(wǎng)絡(luò)通過(guò)這種方式來(lái)實(shí)現(xiàn)信息的傳遞和遺忘。單個(gè)神經(jīng)元中,遺忘門、輸入門和輸出門Sigmoid函數(shù)的參數(shù)分別控制這些門之間信息的遺忘程度。LSTM神經(jīng)網(wǎng)絡(luò)通過(guò)多個(gè)神經(jīng)元的鏈?zhǔn)竭B接,實(shí)現(xiàn)時(shí)序信號(hào)間的信息記憶通路。圖2示出3層LSTM神經(jīng)網(wǎng)絡(luò)拓?fù)洌渲袌A圈代表LSTM神經(jīng)單元。t時(shí)刻將3個(gè)連續(xù)時(shí)序信號(hào)X(t-2),X(t-1)和Xt依次輸送至鏈?zhǔn)竭B接的輸入層,通過(guò)鏈?zhǔn)竭B接的隱藏層后,輸出層輸出(t+1)時(shí)刻的預(yù)測(cè)數(shù)據(jù)X(t+1)。
圖2 LSTM神經(jīng)網(wǎng)絡(luò)拓?fù)銯ig. 2 Topology of LSTM network
本文的列車功率數(shù)據(jù)源于某市地鐵現(xiàn)場(chǎng)試驗(yàn)。該試驗(yàn)共持續(xù)了3天,期間每天安排一位司機(jī)駕駛列車在線路上往返運(yùn)行6趟,并利用4G無(wú)線通信模塊進(jìn)行車地通信。列車傳動(dòng)控制單元(driver control unit,DCU)模塊通過(guò)4G通信模塊每隔100 ms將當(dāng)前列車實(shí)時(shí)功率數(shù)據(jù)發(fā)送給地面4G通信模塊。圖3示出連續(xù)3天司機(jī)每天在同一區(qū)間往返運(yùn)行6趟的列車功率曲線(曲線間以開(kāi)動(dòng)時(shí)刻進(jìn)行對(duì)齊)。為便于指代,將18次試驗(yàn)按時(shí)序進(jìn)行編號(hào),其中第一天司機(jī)a的試驗(yàn)編號(hào)為1~6,第二天司機(jī)b的試驗(yàn)編號(hào)為7~12,第三天司機(jī)c的試驗(yàn)編號(hào)為13~18。
圖3 列車3天的功率曲線Fig. 3 Train power curves in 3 days
列車功率曲線大致可分為牽引階段、惰行階段和制動(dòng)階段。以司機(jī)a的試驗(yàn)為例,其功率曲線具體如下:
(1)牽引階段。司機(jī)在零時(shí)刻將司控器控制手柄推至全牽引位,列車進(jìn)入牽引加速階段,其功率近似線性增加;當(dāng)列車運(yùn)行速度逼近運(yùn)行上限時(shí),司機(jī)減小牽引運(yùn)行級(jí)位,牽引功率下降。
(2)惰行階段。列車運(yùn)行速度達(dá)到上限,司機(jī)將司控器切換至惰行位。列車功率迅速降低到100 kW附近(具體功率范圍主要由列車輔助用電決定,同時(shí)受地形上下坡影響),列車速度緩慢下降。
(3)制動(dòng)階段。列車即將到站,司機(jī)將司控器切換至制動(dòng)位并調(diào)整制動(dòng)級(jí)位,直至列車平穩(wěn)進(jìn)站、完成停車。
由圖3可以看出,各司機(jī)的行駛習(xí)慣差異較大。如,司機(jī)a開(kāi)行時(shí)間最長(zhǎng),司機(jī)c開(kāi)行時(shí)間最短;司機(jī)b和司機(jī)c在惰行期間通過(guò)短時(shí)間改變列車運(yùn)行級(jí)位來(lái)對(duì)列車速度進(jìn)行調(diào)整。
同一司機(jī)重復(fù)開(kāi)行的列車功率曲線特性也存在差異。要求各位司機(jī)盡可能保持駕駛習(xí)慣不變,在此前提下,在總運(yùn)行時(shí)間不超過(guò)120 s的行駛過(guò)程中,同一司機(jī)在6次重復(fù)開(kāi)行過(guò)程中制動(dòng)起始時(shí)刻最大相差了10 s;司機(jī)b和c的牽引、制動(dòng)特性在不同的重復(fù)開(kāi)行趟次中存在較大差異,這是由于動(dòng)態(tài)調(diào)整了列車運(yùn)行級(jí)位所致。
縱觀列車功率曲線,除了因司機(jī)切換列車運(yùn)行級(jí)位狀態(tài)而導(dǎo)致的功率變化,大部分時(shí)間列車功率大致保持平穩(wěn)變化,而這是對(duì)列車實(shí)施功率實(shí)時(shí)預(yù)測(cè)的可行性基礎(chǔ)。
本節(jié)基于圖2的LSTM網(wǎng)絡(luò)拓?fù)鋪?lái)設(shè)計(jì)列車功率預(yù)測(cè)模型,設(shè)計(jì)前先進(jìn)行數(shù)據(jù)預(yù)處理和數(shù)據(jù)集設(shè)置。
為了消除不同數(shù)據(jù)間取值范圍造成影響,先對(duì)所有列車功率數(shù)據(jù)進(jìn)行歸一化處理:
式中:Pnorm——?dú)w一化功率;P——功率原始數(shù)據(jù);Pmin——功率最小值,本文Pmin=-3 200 kW;Pmax——功率最大值,本文Pmax= 4 200 kW。
數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。本文數(shù)據(jù)集包含了3位司機(jī)各重復(fù)6次共18組試驗(yàn)數(shù)據(jù),每組試驗(yàn)數(shù)據(jù)包含1 000多個(gè)連續(xù)時(shí)序數(shù)據(jù)。其中,訓(xùn)練集采用第1, 2, 7, 8, 13組數(shù)據(jù)用于模型擬合訓(xùn)練;驗(yàn)證集采用第14組數(shù)據(jù),用于評(píng)估訓(xùn)練模型的準(zhǔn)確率,以避免模型過(guò)擬合;測(cè)試集采用剩余的12組數(shù)據(jù),用于評(píng)價(jià)模型性能。
由于列車功率在不同運(yùn)行階段下的絕對(duì)值相差較大。為了定量分析預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)的偏差程度,本文采用代表歸一化數(shù)據(jù)絕對(duì)誤差的方均根誤差(root mean square error, RMSE)δ作為評(píng)價(jià)指標(biāo)。
本文基于Keras深度學(xué)習(xí)框架來(lái)搭建LSTM模型,其后臺(tái)為TensorFlow。LSTM模型參數(shù)包括輸入層神經(jīng)元數(shù)量、隱藏層神經(jīng)元數(shù)量、激活函數(shù)、損失函數(shù)和優(yōu)化函數(shù)。
3.3.1 輸入層神經(jīng)元數(shù)量
預(yù)測(cè)采用連續(xù)輸入x個(gè)點(diǎn)預(yù)測(cè)第(x+1)點(diǎn)的滾動(dòng)預(yù)測(cè)方法。為了確定輸入層神經(jīng)元個(gè)數(shù)x的取值,用訓(xùn)練集和驗(yàn)證集數(shù)據(jù)訓(xùn)練不同輸入層神經(jīng)元個(gè)數(shù)神經(jīng)網(wǎng)絡(luò)。不同輸入層神經(jīng)元的預(yù)測(cè)誤差如圖4所示。
圖4 預(yù)測(cè)模型輸入點(diǎn)數(shù)和預(yù)測(cè)誤差Fig. 4 Input number of predictive model and predictive error
預(yù)測(cè)誤差隨著輸入點(diǎn)數(shù)增加而減小,但若輸入點(diǎn)數(shù)過(guò)多,輸入數(shù)據(jù)中遇到信號(hào)丟包的概率也會(huì)增大;且當(dāng)輸入點(diǎn)數(shù)大于3后,預(yù)測(cè)誤差區(qū)別不大,基本可認(rèn)為處于同一水平,說(shuō)明瞬時(shí)功率與該時(shí)刻前兩點(diǎn)數(shù)據(jù)關(guān)系最大。綜合考慮,本文采用輸入5點(diǎn)預(yù)測(cè)第6點(diǎn)的預(yù)測(cè)方式。
3.3.2 隱藏層神經(jīng)元數(shù)量
隱藏層神經(jīng)元數(shù)量若過(guò)少,則無(wú)法提供足夠的擬合能力;若過(guò)多,則訓(xùn)練時(shí)間長(zhǎng),容易引起過(guò)擬合。為防止模型無(wú)法為不同輸入層神經(jīng)元個(gè)數(shù)提供足夠的擬合能力,在通過(guò)驗(yàn)證集防止過(guò)擬合的前提下,本文選擇隱藏層神經(jīng)元數(shù)量為28,略大于經(jīng)驗(yàn)公式的[18]。
3.3.3 激活函數(shù)
激活函數(shù)采用雙曲正切函數(shù)tanh,其與Sigmoid函數(shù)曲線類似,但值域?yàn)?-1,1),且收斂速度比Sigmoid的更快[19]。
3.3.4 損失函數(shù)
損失函數(shù)采用均方誤差函數(shù)(mean square error,MSE)。MSE為RMSE的平方,兩者均可用于評(píng)估誤差,僅存在量綱區(qū)別,3.2節(jié)采用RMSE是為了保持和列車功率的量綱一致。
3.3.5 優(yōu)化函數(shù)
優(yōu)化函數(shù)采用默認(rèn)的Adam函數(shù)。
預(yù)測(cè)效果評(píng)估包括3方面:通信參數(shù)指標(biāo)、預(yù)測(cè)效果、掉包工況預(yù)測(cè)效果。
3.4.1 通信參數(shù)指標(biāo)
預(yù)測(cè)算法用于補(bǔ)償通信延時(shí)和解決丟包問(wèn)題,只有明確通信延時(shí)和丟包指標(biāo)后再評(píng)價(jià)預(yù)測(cè)效果,這樣預(yù)測(cè)評(píng)估才有意義。為了模擬城市軌道交通跨城環(huán)境,通過(guò)Ping命令測(cè)試2個(gè)相距40 km的4G模塊的通信情況。通信測(cè)試時(shí),發(fā)送760個(gè)數(shù)據(jù)包,結(jié)果成功接收到747個(gè)數(shù)據(jù)包,丟失13個(gè)數(shù)據(jù)包,丟包率為1.71%。Ping命令最短耗時(shí)為147 ms,最長(zhǎng)耗時(shí)為277 ms,平均耗時(shí)175 ms。由于Ping命令是雙方應(yīng)答式通信,因此,可認(rèn)為單向數(shù)據(jù)傳輸平均耗時(shí)約87.5 ms。
車地實(shí)驗(yàn)時(shí),車載DCU經(jīng)傳感器采樣到數(shù)據(jù)包生成并發(fā)出、地面接收數(shù)據(jù)包并解析都需要額外的時(shí)間,且平均延時(shí)長(zhǎng)于87.5 ms。為了便于分析,將列車數(shù)據(jù)傳輸延時(shí)與采樣時(shí)間保持一致,設(shè)為100 ms,與本次列車試驗(yàn)數(shù)據(jù)采集間隔一致。列車連續(xù)發(fā)送n個(gè)數(shù)據(jù)點(diǎn),當(dāng)接收方接收第(n-1)個(gè)數(shù)據(jù)點(diǎn)時(shí),列車此時(shí)真實(shí)數(shù)據(jù)為第n點(diǎn),延時(shí)誤差為相鄰數(shù)據(jù)點(diǎn)的差值。
3.4.2 預(yù)測(cè)效果
預(yù)測(cè)模型輸出的列車功率數(shù)據(jù)和實(shí)際數(shù)據(jù)分別如圖5和圖6所示。可以看出,當(dāng)列車功率特性平穩(wěn)時(shí),預(yù)測(cè)誤差總體較小。列車功率存在突變點(diǎn)時(shí),預(yù)測(cè)誤差增大。列車狀態(tài)切換時(shí),預(yù)測(cè)數(shù)據(jù)在功率拐點(diǎn)處存在1個(gè)點(diǎn)的滯后。
圖5 實(shí)際功率和預(yù)測(cè)功率及預(yù)測(cè)誤差Fig. 5 Actual and predictive power, predictive error
圖6 實(shí)際功率和預(yù)測(cè)功率(局部)Fig. 6 Actual and predictive power (partial enlarged view)
為了對(duì)比通信延時(shí)誤差和預(yù)測(cè)誤差,分別計(jì)算各次試驗(yàn)的延時(shí)誤差和預(yù)測(cè)誤差RMSE(圖7)。圖7同時(shí)展示了司機(jī)駕駛行為對(duì)功率特性的影響??梢钥闯觯緳C(jī)a(試驗(yàn)序號(hào)1~6)的數(shù)據(jù)變化較為平緩,平均延時(shí)誤差最小,預(yù)測(cè)優(yōu)化效果較為穩(wěn)定;司機(jī)b(試驗(yàn)序號(hào)7~12)的牽引加速曲線后半段差異較大,且惰行存在短時(shí)加速,平均延時(shí)誤差高;司機(jī)c(試驗(yàn)序號(hào)13~18)的牽引加速曲線每次都存在較大差異,且牽引加速功率偏低,可通過(guò)后續(xù)惰行階段的頻繁加速來(lái)彌補(bǔ)。
圖7 延時(shí)數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)RMSEFig. 7 RMSE of delayed and predictive data
圖7中,優(yōu)化效果最差的為試驗(yàn)10和試驗(yàn)15,原始數(shù)據(jù)見(jiàn)圖3(b)和圖3(c)中實(shí)線。經(jīng)查驗(yàn),試驗(yàn)10惰行階段50 s時(shí)刻附近存在多個(gè)超出正常惰行功率3倍的突變點(diǎn);試驗(yàn)15在惰行階段初期持續(xù)惰行20 s(超出正常惰行功率300 kW)和制動(dòng)階段都存在多次功率突變,劣化了預(yù)測(cè)效果。
由于訓(xùn)練數(shù)據(jù)參與了預(yù)測(cè)模型的訓(xùn)練,為公平起見(jiàn),從結(jié)果中去除6組訓(xùn)練數(shù)據(jù)(試驗(yàn)序號(hào)1, 2, 7, 8,13, 14),得到的延時(shí)數(shù)據(jù)平均RMSE值為0.007 9,預(yù)測(cè)數(shù)據(jù)為0.006 2。換算為功率值,延時(shí)數(shù)據(jù)平均功率誤差為58.73 kW,預(yù)測(cè)數(shù)據(jù)為45.88 kW。預(yù)測(cè)數(shù)據(jù)相對(duì)于延時(shí)數(shù)據(jù)誤差改善了21.8%。
3.4.3 掉包工況預(yù)測(cè)效果
實(shí)際通信場(chǎng)景中,通信數(shù)據(jù)偶發(fā)掉包也是需要考慮的問(wèn)題。假設(shè)n時(shí)刻應(yīng)當(dāng)接收數(shù)據(jù)包n,若沒(méi)有收到,則視為掉包。從延時(shí)的角度考慮,當(dāng)前最新數(shù)據(jù)仍為之前時(shí)刻接收的數(shù)據(jù)包(n-1),故掉包可以等效于增加一個(gè)數(shù)據(jù)包的延時(shí)。預(yù)測(cè)算法在掉包時(shí),可將上一時(shí)刻的預(yù)測(cè)結(jié)果作為實(shí)際數(shù)據(jù)輸入預(yù)測(cè)模型,對(duì)當(dāng)前時(shí)刻數(shù)據(jù)進(jìn)行滾動(dòng)預(yù)測(cè)。
圖8示出不同丟包點(diǎn)數(shù)下的預(yù)測(cè)數(shù)據(jù)和延時(shí)數(shù)據(jù)的RMSE。當(dāng)丟包點(diǎn)數(shù)分別為0, 1和2時(shí),等效通信延時(shí)分別為100 ms, 200 ms和300 ms;延時(shí)誤差隨著丟包點(diǎn)數(shù)的增加而急劇上升,分別為58.73 kW,103.60 kW和146.99 kW;預(yù)測(cè)數(shù)據(jù)分別45.88 kW,75.70 kW和109.03 kW,相對(duì)于延時(shí)誤差減小了21.8%, 26.9%和25.8%。
圖8 不同丟包點(diǎn)數(shù)下的預(yù)測(cè)數(shù)據(jù)和延時(shí)數(shù)據(jù)RMSEFig. 8 RMSE of predictive and delayed data with different dropout points
為彌補(bǔ)通信導(dǎo)致的延時(shí)和丟包誤差,本文設(shè)計(jì)了一種基于LSTM的列車功率在線滾動(dòng)預(yù)測(cè)方法,其通過(guò)控制列車運(yùn)行狀態(tài)、能饋設(shè)備運(yùn)行參數(shù)或其他能源設(shè)備狀態(tài)參數(shù),提高城軌列車能量管理系統(tǒng)數(shù)據(jù)的實(shí)時(shí)性,實(shí)時(shí)改善能量流,提升能源系統(tǒng)整體效率,從而提高能量管理水平。采用該方法后,延時(shí)功率誤差可降低21.8%~26.9%。
受限于城軌列車的現(xiàn)場(chǎng)試驗(yàn)條件,本文未能實(shí)地測(cè)量列車在不同線路位置時(shí)(高架、隧道)通信參數(shù)的差異,線路和乘客對(duì)實(shí)際通信的影響也有待進(jìn)一步研究。后續(xù)將研究自動(dòng)駕駛策略下列車功率的預(yù)測(cè)算法,并增加其他相關(guān)信息(如線路條件、列車速度和工況),以提高預(yù)測(cè)精度。