孫 敏 彭 磊 李慧云
1(中國科學院深圳先進技術研究院 深圳 518055)
2(南昌航空大學 南昌 330063)
近年來,隨著經濟的快速發(fā)展,市民使用小汽車的數(shù)量也快速上升,這使得大城市停車難的問題越來越嚴重,同時也加劇了城市交通的擁堵。研究報告顯示,擁擠交通中有 30% 是由尋找停車位的汽車造成[1]。而在尋找車位的同時,也增加了不必要的尾氣排放。因此,當前全國各地都在積極開展城市級停車誘導系統(tǒng)的建設工作。
停車誘導系統(tǒng)通過給車輛提供停車場位置和可用車位數(shù)量等相關信息,幫助車輛快速停車,緩解停車難問題[2-4]。在停車誘導系統(tǒng)中,可用車位預測是非常重要的一部分,車輛需要在距離目的地一定距離時知道:當他到達目的地時,周邊停車場可用的車位數(shù)量??捎密囄活A測技術可以避免出現(xiàn)車輛到達停車場入口時才發(fā)現(xiàn)滿位而無法停放的情況,同時起到引導車輛停往車位更寬松的停車場的作用。顯然,可用車位預測是一個典型的時間序列預測問題。當前可以采用自回歸積分移動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)、小波神經網絡等實現(xiàn)精準的短時預測。但需要指出的是,該類方法的高精度是建立在一個基本條件上,即預測步數(shù)量足夠少,一般是 1~3 個預測步長。如果預測步數(shù)量增加,那么預測精度將出現(xiàn)大幅下降。
由于城市交通環(huán)境的復雜性,往往在車輛啟動時就需要了解目的地周邊當前停車場的可用車位情況,并預測當車輛到達時的可用車位情況。這個時間長度一般會超過 30 min。如果直接使用當前的預測技術,一般是將預測步的時間周期調整變長,如 10 min 為一個預測步。這樣雖然可將30 min 調整成 3 個預測步,但由于每 10 min 給出一個預測值,實際上 30 min 僅能給出 3 個預測值。顯然,這個結果嚴重丟失了該時間區(qū)間內更為詳細的車位變化特征,對停車誘導系統(tǒng)的誘導精度帶來很大的負面影響。
目前對可用停車位的實時預測,常見的方法主要分為兩類:一類是以 ARIMA 為代表的傳統(tǒng)時間預測模型[5],另一類是神經網絡預測方法[6,7]。其中,傳統(tǒng)時間序列預測模型主要通過將時間序列數(shù)據(jù)分解,對于不平穩(wěn)序列則還需要通過差分等手段將非平穩(wěn)時間序列轉換為平穩(wěn)時間序列,從而實現(xiàn)預測[8,9]。這種預測容易受模型參數(shù)的影響,有效性會逐漸降低。神經網絡方法主要通過先對海量數(shù)據(jù)進行迭代訓練,再擬合數(shù)據(jù)特征,進而實現(xiàn)預測。相關研究中,Sun 等[10]和 Yong等[11]研究通過誤差逆向傳播算法訓練的多層前饋神經網絡模型來預測車位占有率,雖然實現(xiàn)了停車位預測,但魯棒性差,而且計算時需消耗大量的時間;后來有研究人員[12-14]利用小波神經網絡能很好地擬合非線性復雜系統(tǒng)特性,雖對可用停車位進行短期預測,預測速度和穩(wěn)定性也都得到了很大的提高,但也只是單點預測;Zheng 等[15]通過使用回歸樹、神經網絡和支持向量機建立組合模型,實現(xiàn)停車位連續(xù)變化狀態(tài)的預測,但隨著實時數(shù)據(jù)的增加,動態(tài)組合模型切換運算所付出的時間成本也很昂貴。
以上所提到的方法均不能很好地解決可用停車位波動區(qū)間預測的問題。其中,大部分方法側重于點的預測,雖有少部分方法考慮區(qū)間范圍內的變化與趨勢,但計算時間成本也很高。
針對這一問題,本文提出了一種預測方法——模糊長短期記憶神經網絡(Fuzzy Long Short-Term Memory Network Prediction On Parking Spaces,F(xiàn)LOPS),可以在較長預測時間周期內保持數(shù)據(jù)變化特征,并適用于較大時間跨度(>30 min)條件下的高精度預測。該方法由 3 個主要步驟構成:(1)基于模糊信息?;?Fuzzy Information Granulation,F(xiàn)IG)方法對停車場歷史數(shù)據(jù)進行海量關鍵信息提取[16],構造預設預測周期的特征集;(2)構造特征集的長短期記憶神經網絡(Long Short-Term Memory Network,LSTM),并對未來 1~3 個預測步進行特征集預測;(3)基于 3 次樣條插值對得到的特征集預測結果進行插值重構,由此得到預測時間周期內的停車位連續(xù)變化結果。
對可用停車位的連續(xù)變化狀態(tài)預測,包括可用停車位數(shù)目變化預測和停車高峰的時間預測。本文主要分為 3 個部分:(1)基于模糊信息?;臄?shù)據(jù)變換,獲取時間序列數(shù)據(jù)對應的特征數(shù)據(jù)集;(2)基于 LSTM 神經網絡的區(qū)間預測模型,預測可用停車位數(shù)目的變化特征;(3)基于 3 次樣條插值的重構算法,獲得可用泊位的連續(xù)變化狀態(tài)。
可用泊位是一個隨時間變化而不斷變化的數(shù)據(jù)。面對一個如此巨大的非線性時間序列數(shù)據(jù),本文通過做壓縮將關鍵信息提取出來,獲得對應的特征數(shù)據(jù)集合。在本文中,使用基于模糊信息粒化(FIG)方法對可用停車位的時間序列重構及?;?。其中,模糊信息?;菍A繑?shù)據(jù)進行關鍵信息提取的有效方法。對時間序列進行模糊信息?;饕譃?2 個過程:
(1)將時間序列分割成若干個小子序列,作為操作窗口;
(2)對產生的每一個窗口進行模糊化,生成一個個模糊集,即模糊信息粒。
處理后的數(shù)據(jù)樣本能夠保持原樣本數(shù)據(jù)特征,得到一系列更小的樣本區(qū)間,便于后續(xù)進行數(shù)據(jù)的計算。
停車場的時間序列數(shù)據(jù)X,如公式(1)所示。
數(shù)據(jù)變換得到具有模糊信息的特征矩陣,用于預測可用停車位數(shù)目變化特征,本文考慮有記憶模式的預測模型,這能將之前時刻的數(shù)據(jù)關聯(lián)起來具有更好的效果。
長短期記憶神經網絡(LSTM)是一種特殊的循環(huán)神經網絡,是做時間序列分析的常用方法。它能夠克服傳統(tǒng)循環(huán)神經網絡在反向傳播中遇到的梯度爆炸和衰減的缺點,并通過在隱藏層加入記憶單元,將時間序列的短長期相互關聯(lián)起來,控制有關信息的刪除與存儲,以此構成記憶網絡。本文的記憶單元結構如圖 1 所示,主要由輸入門、輸出門、遺忘門和存儲單元組成。其中,門是一種讓信息選擇式通過的方法,其含有sigmoid 函數(shù),以決定存儲單元狀態(tài)中哪些部分需要輸出,并經過 tanh 函數(shù)得到想要輸出的數(shù)據(jù)。
圖1 長短期記憶神經網絡記憶單元Fig. 1 Structure of memory unit of long short-term memory network
在本文中,LSTM 預測模型包含多個 LSTM記憶單元。其中,選擇“Min-Max Normalization”進行數(shù)據(jù)歸一化處理;選擇“adam”作為優(yōu)化器;選擇“mean squared error” 作為損失函數(shù)。特征矩陣X和為模型輸入,其中可用泊位數(shù)量變化的預測由矩陣X來實現(xiàn),而峰值時間的預測由矩陣來實現(xiàn)。利用 LSTM 隱藏層迭代計算得到,未來第k+1 個粒化窗口的可用泊位數(shù)量變化Pk+1=(startk+1, lowk+1, upk+1, endk+1)和對應的峰值時刻算法流程如下:
?
LSTM 神經網絡模型預測得到 startk+1、lowk+1、upk+1、endk+1和(其中 startk+1和endk+1是第k+1 個?;翱趦鹊钠鹗键c和終止點對應的可用停車位數(shù)量,對應的=60T)預測特征數(shù)據(jù)之后,便得到可用停車位數(shù)目的變化特征。這些特征數(shù)據(jù)在數(shù)值分布上是離散的,插值就是通過這些離散的數(shù)據(jù),去確定某一類已知函數(shù)的參數(shù)或尋找某個近似函數(shù),使得到的近似函數(shù)與已知數(shù)據(jù)有較高的擬合程度,最后求取“斷鏈”處的模擬值,實現(xiàn)曲線重構。
因此,為將這些特征數(shù)據(jù)重構得到預測區(qū)間內可用停車位數(shù)目的連續(xù)變化狀態(tài),本文采用 3次樣條插值進行相應數(shù)據(jù)處理。這是因為,與更高次樣條相比,它只需較少的計算和存儲,且較穩(wěn)定,在靈活性和計算速度之間進行了合理的折中。插值重構過程具體如下:
(1)對第k+1 個粒子窗口內的時間進行升序排列、劃分區(qū)間,并確定對應時刻的可用停車位數(shù)值。
其中,
本文選擇廣東省深圳市羅湖區(qū)寶琳珠寶中心地上停車場的停車數(shù)據(jù)作為實驗數(shù)據(jù),統(tǒng)計時間為 2016年7月3日至7月5日,原始可用停車位數(shù)據(jù)如圖 2 所示。其中,數(shù)據(jù)的采樣頻率為每分鐘記錄一次未占用停車位的數(shù)據(jù),因此每天會有 1 440 個數(shù)據(jù)點。
圖2 2016.07.03—2016.07.05 停車曲線Fig. 2 Sample parking curve from 3 to 5 July 2016
根據(jù) FIG 理論,本文將時間粒度T設定為30 min,即選擇每 30 個點作為一個?;翱?,則每天對應 48 個粒化窗口。在每個?;翱趦冉⒛::;蟮慕Y果如圖 3 所示。其中,圖中每條柱體都是由特征數(shù)據(jù) start、low、up 和 end 四個值構成;空心柱體表示在這個時間段內,可用停車位數(shù)量是增加的;實心柱體則表示在這個時間段內可用停車位減少。在每一個?;翱谥?,可用泊位數(shù)都是在最大值 up 和最小值 low 之間波動,同時數(shù)據(jù)量也由每天的 1 440個降低到 192(48×4)個。由此,便獲得可用停車位的模糊特征數(shù)據(jù),用于預測可用停車位數(shù)目變化特征。
預測可用停車位數(shù)目變化特征數(shù)據(jù)是建立在LSTM 神經網絡的模型基礎上。神經網絡有很多參數(shù)需要設置,如何調整模型的超參數(shù)以及如何設置模型的結構以聚合最佳參數(shù)是非常重要的。本文分兩次實現(xiàn)對未來停車位的數(shù)目變化預測和峰值時間預測。其中,用于停車位數(shù)目變化預測的網絡,輸入層和輸出層的神經元個數(shù)都為 4,隱藏層LSTM 的神經元個數(shù)為 10。而用于峰值時間預測的網絡,輸出層神經元個數(shù)為 2,其他層不變。首先,利用 2016.07.03—2016.07.05 的停車特征數(shù)據(jù)訓練 LSTM 神經網絡,也就是經過 FIG 變化后的X、矩陣,網絡訓練次數(shù)為 100 次,當超過訓練次數(shù)則終止訓練;然后,將訓練好的網絡模型保存,并利用該模型對可用停車位變化特征數(shù)據(jù)預測。
本文使用 2016.07.06 的數(shù)據(jù)進行測試,把前3 個時刻的特征數(shù)據(jù),即可用停車位數(shù)目變化以及峰值時間數(shù)據(jù)作為輸入,迭代預測下一個時刻的特征數(shù)據(jù),實驗結果如圖 4 所示。圖 4 中,曲線反映了實際停車位數(shù)目變化與預測值的對比情況,start、up、low、end 整體預測的平均絕對誤差為 2.26。
圖3 2016 年7月6號模糊?;Y果圖Fig. 3 Fuzzy information granulation result picture in July 6th 2016
預測得到下一時刻可用停車位的特征數(shù)據(jù),這只是其中 4 個點對應的可用停車位和出現(xiàn)的時間。為了讓用戶清楚地知道未來 10 min 內目標停車場可用停車位的連續(xù)變化,本文用 3 次樣條插值算法,重構出可用停車位的連續(xù)變化狀態(tài)曲線。如圖 5 所示,每 10 min 是一個預測區(qū)間,在 17:00—17:30 共有三個區(qū)間,每個區(qū)間插值得到預測時間段內可用停車位的連續(xù)變化狀態(tài)。
圖4 特征數(shù)據(jù)集的預測結果Fig. 4 Prediction result on feature data
圖5 特征數(shù)據(jù)集重構Fig. 5 Feature data reconstruction
圖5 中曲線“original”為真實的可用停車位情況。從圖 5 對比可以看到,當時間步長都為10 min 時,使用 LSTM 神經網絡預測只能得到一個點,且區(qū)間的變化趨勢只能把各點直接相連;而本文提出的區(qū)間變化趨勢預測模型 FLOPS,不僅能知道區(qū)間內每個點的可用停車位信息情況,而且精確度比 LSTM 好,同時還能知道區(qū)間內何時出現(xiàn)停車高峰,能夠讓用戶掌握更多的停車信息。接下來,對二者進行均方根誤差對比,結果如圖 6 所示。結合特征數(shù)據(jù)重構對比圖(圖 5)和誤差分析圖(圖 6)不難發(fā)現(xiàn),F(xiàn)LOPS 和 LSTM 對區(qū)間端點的預測都比較準確,但在時間步長相同時,LSTM 網絡對區(qū)間內的值的預測效果明顯不足,均方根誤差波動很大,單獨使用 LSTM 網絡的平均均方根誤差(RMSE)為 6.57,而 FLOPS 的平均均方根誤差為 2.86。
同樣地,LSTM 網絡要實現(xiàn)區(qū)間趨勢的預測,需要付出更多預測步的代價,預測結果如圖7 所示。從圖 7 可以看到,在預測周期為 10 min時,F(xiàn)LOPS 方法與 LSTM 的預測準確度近似,但 FLOPS 只需 1 步就可以預測區(qū)間趨勢,計算消耗 0.054 s;而 LSTM 需要 10 步才能完成區(qū)間預測,且需要 1 min 才給出一個預測值,計算消耗 0.56 s,具體的計算代價如圖 8 所示。因此,在預測準確度相近的情況下,本文所提出的FLOPS 具有更好的計算性能優(yōu)勢。
現(xiàn)階段對停車場泊位預測的研究,主要集中在傳統(tǒng)的時間序列預測方法和神經網絡模型。在 Yu 等[9]研究中,ARIMA 模型對可用停車位的預測,均方根誤差為 4.47,本文提出的方法FLOPS 均方根誤差為 2.86;Sharma 等[13]用小波神經網絡做可用停車位的預測,系統(tǒng)均方根誤差為 3.08;且小波神經網絡模型完成一天的預測計算消耗 13.3 s,而本方法 FLOPS 計算消耗時間為 8.9 s。因此,本文提出的將 LSTM 網絡應用于可用泊車位的預測方法,不僅提高了預測的精度,還提高了計算速度,具有較大的實際應用價值。本文的不足之處是,未根據(jù)不同用車時間對停車數(shù)據(jù)進行更細的劃分,如工作日和非工作日時市民用車情況大不同,可針對二者細分預測模型,這樣應該可以進一步提高模型的預測準確度。
圖6 LSTM 和 FLOPS 誤差結果對比Fig. 6 RMSE comparison of LSTM and FLOPS
圖7 重構結果對比Fig. 7 Comparison of reconstructed results
圖8 計算時間代價Fig. 8 Computer overhead comparison
本文提出了一種可以在較長預測時間周期內保持數(shù)據(jù)變化特征的預測方法,適用于較大時間跨度(>30 min)條件下的高精度預測。該方法使用模糊信息?;乃枷氆@取特征數(shù)據(jù)集,通過 LSTM 網絡對特征數(shù)據(jù)集進行預測,而后再結合 3 次樣條插值將特征數(shù)據(jù)集重構整個預測區(qū)間停車位的連續(xù)變化狀態(tài)。從仿真結果可以看出,該方法在相同預測時間步的可用車位預測上,比傳統(tǒng)預測方法具有更高的精度;在保持相近預測精度的條件下,比傳統(tǒng)預測方法具有更高的計算效率。在未來的工作中,我們會考慮更多維度因素,如天氣、大型活動等突變因素對停車帶來的影響,以進一步提高預測準確度。