李艷 楊立生
摘? ?要:共享單車因借還方便,較好地解決了城市中最后一公里的難題,然其需求量受天氣、地理環(huán)境等因素影響。本文根據(jù)共享單車借還車量的數(shù)據(jù)特征,搭建了BP神經(jīng)算法模型,以工作日的不同時段作為變量,選擇合適的激活函數(shù)與性能函數(shù)。該模型在一定程度上能夠預(yù)測共享單車的需求量,以期優(yōu)化單車調(diào)度,利于城市出行。
關(guān)鍵詞:共享單車? BP神經(jīng)網(wǎng)絡(luò)? Tan-Sigmoid函數(shù)
Abstract: Shared bicycle is convenient because it is easy to borrow and return, which solves the problem of the last mile in the city, but its demand is affected by factors such as weather and geographical environment. Based on the data characteristics of shared bicycles borrowed and returned, this paper builds a BP neural algorithm model, using different time periods of the working day as variables, and selects the appropriate activation function and performance function. The model can predict the demand for shared bicycles to a certain extent, with a view to optimizing bicycle scheduling and facilitating urban travel.
Key Words: Shared bicycle; BP neural network; Tan-Sigmoid function
共享單車能解決了“最后一公里”的騎行難題,符合低碳出行理念,受到城市居民的青睞。共享單車可停放在任意地點,帶來方便的同時也帶來時空供需失衡問題[1]。由于共享單車的需求差異,不同地區(qū)的單車會出現(xiàn)供不應(yīng)求及無人問津兩種極差。因此,研究共享單車的時空需求、優(yōu)化單車調(diào)度迫在眉睫。
查閱資料可發(fā)現(xiàn)國內(nèi)外研究者對有樁“公共自行車”的資源分配問題研究較為完善,大致可分為兩類:(1)研究公共自行車用車的影響因素;(2)研究優(yōu)化調(diào)度公共自行車的方法[2-3]。然這些研究都是基于公共自行車存在集中站點的基礎(chǔ)上的,不適用于共享單車。共享單車分散于城市中,它的起止位置僅與用戶個人的使用目的有關(guān),流動性較強。因此,為了系統(tǒng)研究城市內(nèi)共享單車借還量的影響因素,并提出可行性高的優(yōu)化策略,本文針對共享單車的特點,基于BP神經(jīng)網(wǎng)絡(luò)分析共享單車供需缺口,進(jìn)一步優(yōu)化各個區(qū)域共享單車的投放量。
1? BP神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種類人腦的機器學(xué)習(xí)技術(shù),通常包括輸入層、輸出層和隱含層,輸入的特征向量通過隱含層變換達(dá)到輸出層,在輸出層得到分類結(jié)果,故神經(jīng)網(wǎng)絡(luò)在一開始也被稱為感知器。然感知器模型只適用于兩層神經(jīng)網(wǎng)絡(luò),不能對隱含層的參數(shù)進(jìn)行調(diào)整,基于此Rumelhart和McCelland等人提出了基于反向傳播的學(xué)習(xí)算法,即BP神經(jīng)網(wǎng)絡(luò)[4-6]。
BP神經(jīng)網(wǎng)絡(luò)可分成正向傳播和反向傳播兩部分。正向傳播時,信號從輸入層輸入,經(jīng)隱含層進(jìn)行處理,最后傳向輸出層輸出。當(dāng)輸出與期望值不相符時,則將誤差信號按原來正向傳播的通路反向傳回,并修改隱含層的各個神經(jīng)元的權(quán)系數(shù),使誤差信號達(dá)到最小值。實質(zhì)上,BP算法就是一個求取誤差函數(shù)最小值問題[7-8]。
2? 數(shù)據(jù)預(yù)處理
同一區(qū)域內(nèi)各個時段的借還車量是不同的,以一個禮拜作為一個整體來看,可將工作日和休息日分開預(yù)測。本文以工作日為例,早上7點之前和晚上23點以后,共享單車的借還車量很少,可作為一個整體時間段來進(jìn)行預(yù)測,再將7點與23點之間的時間以2h作為一個劃分,分成8個時間段。調(diào)用某個地區(qū)某一周工作日中各時段共享單車的借還量,數(shù)據(jù)如表1所示。
根據(jù)表1中的數(shù)據(jù)可看出,早上7點到9點之間為共享單車車輛使用高峰,其次為下午17點到19點之間,這是因為城市居民早晚上下班高峰引起的,符合城市生活的規(guī)律。然而數(shù)據(jù)中周一及周二的下午與晚上明顯的低于周三周四,調(diào)研得知當(dāng)天該區(qū)域天氣狀況較差。由此可知,共享單車的借還量與多種情況相關(guān),所以在輸入訓(xùn)練樣本時要選取更多的數(shù)據(jù),以期得到更準(zhǔn)確的共享單車預(yù)測量。
3? 共享單車優(yōu)化模型建立
一般而言,共享單車都安裝了GPS定位,可實時監(jiān)測并記錄車輛位置、騎行范圍、車輛借還的區(qū)域和時間等數(shù)據(jù),因此可通過分析這些數(shù)據(jù),預(yù)測各區(qū)域各時段的借還車量,優(yōu)化共享單車的車輛調(diào)度。先選取其中一個區(qū)域,統(tǒng)計在該區(qū)域各時段共享單車流量,再與該區(qū)域的實際需求量進(jìn)行對比。根據(jù)共享單車歷史借還車數(shù)據(jù),可分開預(yù)測共享單車的借車需求和還車需求,這樣各個區(qū)域借還車的差值就是該區(qū)域需要調(diào)度的共享單車數(shù)量。
本文采用BP神經(jīng)網(wǎng)絡(luò)算法對共享單車各區(qū)域進(jìn)行需求預(yù)測。若輸入用X表示,輸出用Y表示,權(quán)值用W表示。第k層第1個神經(jīng)元的輸出,可通過該神經(jīng)元的輸入經(jīng)過激活函數(shù)得到:
3.1 設(shè)計輸入與輸出
設(shè)計輸入與輸出變量,輸出為某區(qū)域工作日的共享單車借還車數(shù)量,同一區(qū)域內(nèi),待預(yù)測的共享單車借還需求與相同時段的借還車數(shù)量相關(guān),由此輸入變量可選取相同時段的歷史借還車使用量,如表1所示。
3.2 激活函數(shù)
共享單車借還車量是非線性變化的,需在神經(jīng)網(wǎng)絡(luò)的隱含層與輸出層的神經(jīng)元之間選取合適的激活函數(shù),為實現(xiàn)輸入到輸出的非線性映射,激活函數(shù)可選取非線性的Sigmoid函數(shù)。Sigmoid函數(shù)為S型生長曲線,可將一個實數(shù)映射到(0,1)的區(qū)間,具有平滑、易于求導(dǎo)的優(yōu)點,然反向傳播時,容易出現(xiàn)梯度消失的情況。另外,Sigmoid函數(shù)的輸出恒為正值,會影響收斂速度,故本文采用Sigmoid函數(shù)的改進(jìn)版Tan-Sigmoid函數(shù)作為激活函數(shù),公式如下。
在公式(9)中,x為上層神經(jīng)元的輸入,其函數(shù)如圖1所示。Tan-Sigmoid函數(shù)是S型飽和函數(shù),以零為中心,值域為(-1,1),收斂速度快,且可微性更好。
3.3 性能函數(shù)
性能函數(shù)是用來計算輸出結(jié)果與期望值之間的誤差的,能直接反映預(yù)測的準(zhǔn)確性,通常用均方根誤差(RMSE)、均方誤差(MSE)、平均絕對誤差(MAE)進(jìn)行衡量。
RMSE用來衡量參數(shù)估計值與真值之間的均方根,如公式(10)所示。
通常情況下,與均方誤差(MSE)和平均絕對誤差(MAE)相比較,均方根誤差(RMSE)能更準(zhǔn)確地衡量預(yù)測精度,RMSE越小,模型預(yù)測的越準(zhǔn)確。
基于搭建的共享單車預(yù)測模型,預(yù)測某區(qū)域未來相同時間段的共享單車需求量,其預(yù)測結(jié)果如表2所示。
4? 結(jié)語
共享單車被推出至今,避免了有樁公共自行車借還車不便的缺陷,很好地解決了城市中最后一公里的難題。若企業(yè)能根據(jù)需求量對各個城市進(jìn)行合理投放,將能最大化利用共享單車的資源。本文根據(jù)共享單車借還車量的數(shù)據(jù)特征,搭建了BP神經(jīng)算法模型,從設(shè)計輸入輸出變量到激活函數(shù)、性能函數(shù)的選擇一一進(jìn)行了介紹,未來可結(jié)合天氣、日期、城市的人文特征等多方面因素進(jìn)行研究,進(jìn)而得到更精準(zhǔn)的需求預(yù)測,以期達(dá)到共享單車供需平衡。
參考文獻(xiàn)
[1] 楊軍,趙繼新,易安軍,等.基于BP神經(jīng)網(wǎng)絡(luò)算法的共享單車需求預(yù)測[J].西部交通科技,2019(2):155-158.
[2] 田雨.基于神經(jīng)網(wǎng)絡(luò)的共享單車避讓行為的建模與仿真[J].科學(xué)技術(shù)創(chuàng)新,2017(30):137-138.
[3] 楊鴻麟,曹小曙,李濤,等.城市居民使用共享單車的行為意愿及影響因素分析—以西安市為例[J]. 干旱區(qū)資源與環(huán)境, 2019(6):78-83.
[4] Mccelland P, Lash J A, Hathaway D R. Identification of major autolytic cleavage sites in the regulatory subunit of vascular calpain II. A comparison of partial amino-terminal sequences to deduced sequence from complementary DNA.[J].1989,264(29):17428-31.
[5] Kook H, Goldman F, Padley D, et al. Reconstruction of the immune system after unrelated or partially matched T-cell-depleted bone marrow transplantation in children: immunophenotypic analysis and factors affecting the speed of recovery.[J]. 1996, 88(3):1089.
[6] Boyang Li, Chen Liu. Parallel BP Neural Network on Single-chip Cloud Computer[C]// 2015 IEEE 17th International Conference on High Performance Computing and Communications, 2015 IEEE 7th International Symposium on Cyberspace Safety and Security, and 2015 IEEE 12th International Conference on Embedded Software and Systems. IEEE, 2019.
[7] Zhenpeng Liu, Yupeng He, Wensheng Wang,等. DDoS Attack Detection Scheme Based on Entropy and PSO-BP Neural Network in SDN[J]. 中國通信, 2019(7).
[8] Bo Li, Xitian Tian, Min Zhang. Thermal error modeling of machine tool spindle based on the improved algorithm optimized BP neural network[J]. International Journal of Advanced Manufacturing Technology, 2019(9).