李貞鎬,
(清華大學(xué) 電子工程系,北京 100084)
隨著大城市全球化進(jìn)程的加快和地域時(shí)差的影響,需要深夜工作的人數(shù)持續(xù)增加。特別是對于世界經(jīng)濟(jì)同步增長的大城市來講,為保障夜間出行人群使用大眾交通工具的需求,開設(shè)深夜公交線路顯得尤為重要。當(dāng)前,中國的大城市大都設(shè)有深夜公交路線,但普遍存在運(yùn)營效率低、運(yùn)輸成本高、涵蓋范圍不夠等諸多問題[1]。隨著大城市人口不斷增加,利用建設(shè)衛(wèi)星城疏導(dǎo)人群是一種趨勢。以上海為例,設(shè)有松江、嘉定、安亭、金山衛(wèi)和吳淞等衛(wèi)星城,但連接這些衛(wèi)星城的深夜公交線路卻非常缺乏。
近年來,計(jì)算機(jī)技術(shù)迅猛發(fā)展,特別是以智能終端和社交媒體為代表的各種信息渠道的出現(xiàn)和信息的生產(chǎn)、流通、保有量的持續(xù)增長,大數(shù)據(jù)的概念越來越受到人們的重視[2]。
因?yàn)榇髷?shù)據(jù)中存在大量的無效信息,所以從中篩選出有用的信息非常重要。可視化作為大數(shù)據(jù)分析中最重要環(huán)節(jié)之一,其目的就是大數(shù)據(jù)分析結(jié)果可以通過視覺上容易理解的方式表達(dá)和傳遞[3]。可視化作為大數(shù)據(jù)中提取有價(jià)值信息的核心技術(shù),是大數(shù)據(jù)處理過程中必不可少的環(huán)節(jié)。而且,隨著大數(shù)據(jù)處理和分析技術(shù)的發(fā)展,對既有大眾交通線網(wǎng)進(jìn)行有效的評價(jià)及優(yōu)化,促進(jìn)城市交通智能化管理健康發(fā)展。
大多數(shù)公交線路評價(jià)方法選取重復(fù)度為評價(jià)指標(biāo),但該方法在計(jì)算過程中對評價(jià)區(qū)間距離的定義不明確,而且,根據(jù)被選為評價(jià)基準(zhǔn)的線路不同,其評價(jià)結(jié)果之間具有巨大的差異[4]??紤]區(qū)域均衡性的公交線路評價(jià)模型,目的是為了達(dá)到整個(gè)公交系統(tǒng)的均衡分布,確保公交線網(wǎng)較高的覆蓋程度,適合以城市整體公交線網(wǎng)的評估[5]。
本文在上海市深夜公交線網(wǎng)優(yōu)化的基礎(chǔ)上,利用可視化分析軟件,結(jié)合區(qū)域間均衡性模型方法和Dijkstra模型,研究基于移動(dòng)數(shù)據(jù)及出租車移動(dòng)數(shù)據(jù)的城市深夜公交線網(wǎng)評價(jià)及優(yōu)化系統(tǒng),分析上海既有深夜公交線網(wǎng)的問題并提出改進(jìn)方案,為設(shè)計(jì)更高效的深夜公共交通線路提供有效的依據(jù)。
公交線路的重復(fù)度是指在大眾交通工具的運(yùn)營中更有效的管理公交線路,即乘客使用起來更為便利的角度指定的評價(jià)指標(biāo),表示公交線路在特定區(qū)域或區(qū)間內(nèi)的集中程度的指標(biāo)。公交線路的過度重復(fù)會影響公交運(yùn)營的效率,還會影響乘客選擇乘坐路線[6]。
大多數(shù)公交線路的重復(fù)度評價(jià)方法是依據(jù)特定線路的區(qū)間長度,選取該區(qū)間內(nèi)運(yùn)營多少公交線路為判斷指標(biāo),但這種方法在計(jì)算過程中具有一定的問題[7]。
首先,對評價(jià)區(qū)間距離的定義不明確。有的是計(jì)算整個(gè)線路的重復(fù)度,有的則是分成n個(gè)小區(qū)間進(jìn)行計(jì)算。這2種方法的結(jié)果存在一定的差異,區(qū)間距離越小,重復(fù)線路越多,重復(fù)度指標(biāo)也隨即偏高。其次,根據(jù)被選為公交路線評價(jià)對比基準(zhǔn)的線路不同,重復(fù)度評價(jià)結(jié)果也不同。總地來說,考慮到該方法不能徹底解決公交線路重復(fù)度評價(jià)中的問題,因此,本文研究選取考慮區(qū)域均衡性的公交線路評價(jià)模型。
在本文研究中,使用的數(shù)據(jù)集為上海移動(dòng)網(wǎng)絡(luò)供應(yīng)商提供的2014年8月1日—31日的數(shù)據(jù)統(tǒng)計(jì)。數(shù)據(jù)集是針對全市設(shè)置的各個(gè)基站每10 min的數(shù)據(jù)量與對應(yīng)的基站接收數(shù)據(jù)次數(shù)組成的三維矩陣?;镜臄?shù)據(jù)集總共包含20億條,總?cè)萘繛? GB,數(shù)據(jù)集容量雖然很龐大,但其信息的來源具有很高的可靠性。
深夜公交移動(dòng)需求量分析中使用的數(shù)據(jù)信息主要包括3種:
1)上海市主要移動(dòng)網(wǎng)絡(luò)供應(yīng)商用戶的追蹤數(shù)據(jù)集,每一個(gè)數(shù)據(jù)項(xiàng)記錄用戶名,每一次手機(jī)業(yè)務(wù)的開始和結(jié)束的時(shí)間、連接的基站編號以及消耗的流量等,數(shù)據(jù)集有超過19.6億條記錄,覆蓋38萬個(gè)基站。
2)上海出租車運(yùn)營公司提供的數(shù)據(jù)集,記錄了上海市1.3萬輛出租車的移動(dòng)軌跡數(shù)據(jù),采用經(jīng)緯度標(biāo)示,時(shí)間跨度為1個(gè)月(2014年8月1日—31日),時(shí)間精度為1 min。
3)上海市地圖,由百度地圖下載,處理數(shù)據(jù)中選用精度為200 m。
本文對既有深夜公交線路進(jìn)行評價(jià)時(shí),主要考慮了線路的重復(fù)性和覆蓋程度,選用深夜公交線路的區(qū)域分布均勻程度為評價(jià)指標(biāo)。在評價(jià)時(shí),通過每個(gè)區(qū)域人口對比該區(qū)域深夜公交線路數(shù)量比值的差異,分析了深夜公交線路的區(qū)域均衡程度。
為了更好地觀察移動(dòng)需求量的變化,本文以移動(dòng)數(shù)據(jù)的變化量代替移動(dòng)數(shù)據(jù)量。并且根據(jù)實(shí)際測量,經(jīng)過某一地區(qū)的公交線路周圍移動(dòng)數(shù)據(jù)變化量除以該地區(qū)移動(dòng)人口數(shù)量的結(jié)果,作為公交線路均衡性的判定指標(biāo)[8]。
A=∑Dt+1-Dt/S
U=A/B
(1)
其中,A為按時(shí)間測定的區(qū)域內(nèi)平均移動(dòng)數(shù)據(jù)變化量,D為按時(shí)間測定的移動(dòng)數(shù)據(jù)量,t為時(shí)間(每隔10 min),S為區(qū)域面積,U為某一地區(qū)的公交線路分布均勻程度,B為人口。
單個(gè)公交線路的重復(fù)度Ri=1.0表示該公交線路從起點(diǎn)到終點(diǎn)的整個(gè)路段只有這一條線路,線路重復(fù)次數(shù)越多,重復(fù)度Ri的數(shù)值也相應(yīng)提升,該值還可以作為公交線路之間相互影響的指標(biāo)[9]。
(2)
其中,ni,b為從區(qū)域i到區(qū)域b的公交線路數(shù)量,nb,i為從區(qū)域b到區(qū)域i的公交線路數(shù)量,Ntotal為城市所有公交數(shù)量。
假設(shè)乘客深夜利用公交出行時(shí),一般離最近公交站的移動(dòng)距離不會超過1 km。對應(yīng)每個(gè)公交站的移動(dòng)需求量是通過以該公交站的坐標(biāo)為中心、半徑為1 km的范圍內(nèi),所有基站接收的數(shù)據(jù)量之和除于以該范圍內(nèi)的所有公交站數(shù)量(包括圓心處的公交站),具體指標(biāo)為[10]:
(3)
其中,St=n為每個(gè)公交站的移動(dòng)需求量,Dr=1為1 km范圍內(nèi)所有基站接收的數(shù)據(jù)量之和,Sn為1 km范圍內(nèi)所有公交站數(shù)量。
每個(gè)公交線路的移動(dòng)需求量是通過上述方法獲取的公交站移動(dòng)需求量選取該路線經(jīng)過的公交站進(jìn)行整合后,除以該路線的公交站數(shù)量[11]。
(4)
其中,Lt=n為深夜公交線路的移動(dòng)需求量,St=m為每個(gè)公交站的移動(dòng)需求量,Sn為深夜公交線路上的公交站數(shù)量。
通過以上2個(gè)指標(biāo)就可以綜合地判斷公交線路的合理性。St-n和Lt-n數(shù)據(jù)越大,說明該公交站和公交線的利用率很高,反過來,如果St-n和Lt-n數(shù)據(jù)很低,甚至達(dá)到0,則說明該公交站選址和公交路線的選線都存在問題,需要進(jìn)行優(yōu)化。
公交線路一般要求運(yùn)輸能力高,要注重提高效率。優(yōu)化算法中通??紤]路徑、通行量、換乘、道路、車輛、效益、政策等諸多因素[12]。由于本文研究的優(yōu)化對象為深夜運(yùn)營的公交線網(wǎng),因此只考慮了線路通行量和路徑長度2個(gè)因素,算法采用了Dijkstra模型。
G=(V,E,R,WT,WL)
(5)
其中,G為有向賦權(quán)圖,V為網(wǎng)絡(luò)上所有節(jié)點(diǎn)即公交站點(diǎn)的集合,E為有向圖中所有邊的集合,R為有向圖中所有頂點(diǎn)的集合,WT為節(jié)點(diǎn)的非負(fù)權(quán)值集合,WL為節(jié)點(diǎn)的非負(fù)權(quán)值集合,表示在相應(yīng)線路的線路長度權(quán)值。
在Dijkstra算法中,頂點(diǎn)集本文選取了地圖中所有的道路交叉點(diǎn)和線路方向變化的轉(zhuǎn)折點(diǎn),以及根據(jù)前面分析模塊中得到的移動(dòng)需求量大的296個(gè)新增公交站點(diǎn)。邊集則是根據(jù)百度地圖中顯示的實(shí)際路況而建立的拓?fù)潢P(guān)系。
目前,上海深夜可利用的交通工具是公交和出租車2種。上海有39條深夜公交線路。平均運(yùn)營時(shí)間及配車時(shí)間范圍為11∶40—04∶10,經(jīng)過的車站數(shù)量為800多個(gè)。線路平均行駛距離為20 km左右,最長線路的長度約為25 km,其中,21%的線路把火車站或者機(jī)場設(shè)為起始站和終點(diǎn)站。還有大部分的線路的出發(fā)點(diǎn)也都在這2個(gè)地點(diǎn)的附近。所以,可以看出深夜公交主要是充當(dāng)著運(yùn)送來往上海和其他城市之間人群的功能。為了更好地體現(xiàn)分析結(jié)果,本文把深夜移動(dòng)需求量和既有深夜公交線路進(jìn)行了疊加,并通過將信息放在地圖上展現(xiàn)結(jié)果。
如圖1所示,離市中心較遠(yuǎn)的A、B、D 3個(gè)區(qū)有非常大的深夜移動(dòng)需求,但是卻沒有公交線路覆蓋。既有的公交線路僅覆蓋城市的核心地區(qū)。另外,C區(qū)雖然距離市中心只有10多公里,移動(dòng)需求量也很大,但公交線路基本沒有覆蓋該地區(qū)。
圖1 上海深夜移動(dòng)需求量和既有深夜公交線路
此外,本文研究還對深夜出租車的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了分析,從圖2可以看出,出租車的分布與移動(dòng)需求之間也存在很大差異,有大量出租車移動(dòng)數(shù)據(jù)量的區(qū)域公交線路分布不夠。這從另一個(gè)方面也說明了優(yōu)化設(shè)計(jì)公交線路的重要性和緊迫性。
圖2 上海深夜出租車移動(dòng)數(shù)據(jù)和既有深夜公交線路
為了能夠最大限度地進(jìn)行均勻分配可用資源,本文研究將評價(jià)上海各區(qū)域內(nèi)線路的重復(fù)度。
目前,深夜運(yùn)營的公交線路所經(jīng)過的行政區(qū)域數(shù)量共計(jì)12個(gè)(上海是分成17個(gè)行政區(qū)域),根據(jù)數(shù)據(jù)變化量,把該12個(gè)行政區(qū)域合并為7個(gè)研究區(qū)域,如圖3所示,并對每個(gè)研究區(qū)域內(nèi)的公交線路密度進(jìn)行評價(jià)。
圖3 上海深夜公交線路區(qū)域分布
根據(jù)表1所示結(jié)果顯示,利用每個(gè)研究區(qū)域內(nèi)的有移動(dòng)需求的總量對該區(qū)域面積做平均,可以看到,該平均值在3、4、5這3個(gè)區(qū)域明顯高于其他區(qū)域,這與現(xiàn)在的公交線路分布的密度是相互對應(yīng)的。但是,從移動(dòng)需求總量來看,區(qū)域6和區(qū)域1的移動(dòng)需求量分別為43和50,很顯然具有更大的移動(dòng)需求。這表明線路的密度與移動(dòng)需求存在不匹配的地方,而且相關(guān)公交線路能夠連接的地區(qū)也不夠。
表1 研究區(qū)域公交線路密度評價(jià)結(jié)果
對各線路的車站周圍的數(shù)據(jù)量進(jìn)行分析,求出各車站及路線周邊的數(shù)據(jù)變化量。對所有公交線路的公交站移動(dòng)需求量進(jìn)行了細(xì)致的分析。
以一個(gè)月的時(shí)間跨度,對全部39條公交的往返線路的每個(gè)公交站的移動(dòng)需求量進(jìn)行了統(tǒng)計(jì),圖4為該數(shù)據(jù)的分布。結(jié)果顯示,799個(gè)公交站中大量的公交站的一個(gè)月的移動(dòng)需求量并不大,其中,有42個(gè)站一個(gè)月內(nèi)的總移動(dòng)需求是0。只有少數(shù)線路有較大的需求量,很顯然,說明公交站的設(shè)計(jì)總體上存在較大的問題。
圖4 各路線的公交站移動(dòng)需求量
另外,還對39條公交的往返線路移動(dòng)需求量進(jìn)行了分析,如圖5所示,很容易發(fā)現(xiàn)整個(gè)39條線路的移動(dòng)需求量分布不均勻,顯現(xiàn)出較大的非均衡性,甚至有些公交線路的移動(dòng)需求量非常低。39條線路的移動(dòng)需求量的均值為33 502,而方差達(dá)到了31 305,說明在公交線路的規(guī)劃上存有較大的優(yōu)化空間。
圖5 各路線周邊的公交站數(shù)據(jù)變化量
在優(yōu)化公交線網(wǎng)時(shí),為了能夠最大限度地覆蓋所有上海市深夜移動(dòng)需求量高的站點(diǎn),從所有站點(diǎn)中選取移動(dòng)需求量最高的2 000個(gè)公交站點(diǎn),其中包括既有站點(diǎn)和新增站點(diǎn)。另外,還考慮了出租車數(shù)據(jù)量高的地區(qū),相應(yīng)地調(diào)整了其中一部分公交站點(diǎn)。
考慮到公交線路需要覆蓋城市大部分區(qū)域,即使有些區(qū)域相互之間移動(dòng)需求量很低,也要把這些區(qū)域連接起來[13]。優(yōu)化結(jié)果顯示,新的深夜公交線網(wǎng)(見圖6)基本覆蓋了所有的深夜移動(dòng)需求量和出租車移動(dòng)數(shù)據(jù)量高的地方,而且新的公交線路(見圖7)比起既有的深夜公交線路更能滿足上海市深夜出行的需求。
圖6 新的深夜公交線網(wǎng)
圖7 新的深夜公交線路
在Dijkstra模型中計(jì)算線路權(quán)重時(shí),主要考慮了通行量和路徑長度。為了讓公交線路更多地覆蓋移動(dòng)需求量高的節(jié)點(diǎn),在計(jì)算過程中,2個(gè)節(jié)點(diǎn)之間的權(quán)重不僅和它們之間的距離有關(guān),而且和路徑上的公交站移動(dòng)需求量信息有關(guān)[14]。在利用Dijkstra模型時(shí),不能直接處理節(jié)點(diǎn)帶有權(quán)值的有向圖的路徑搜索,而需要將2個(gè)節(jié)點(diǎn)的移動(dòng)需求量的總和按一定的比值融合到兩點(diǎn)間的距離中,這樣就能將該模型簡化成最短路徑算法[15]。
本文建立的評價(jià)模型為考慮區(qū)域均衡性的深夜公交線路評價(jià)模型,目的是為了達(dá)到整個(gè)深夜公交系統(tǒng)的均衡分布,確保深夜公交線網(wǎng)的覆蓋程度。在評價(jià)過程中,選擇整個(gè)城市的深夜公交線網(wǎng)為研究對象,根據(jù)上海主要移動(dòng)網(wǎng)絡(luò)供應(yīng)商提供的移動(dòng)數(shù)據(jù),將上海12個(gè)行政區(qū)域分成7個(gè)研究區(qū)域,分析深夜公交線路的重復(fù)率與覆蓋程度。該評價(jià)的重點(diǎn)主要放在深夜公交線路的分布上,具體路線選擇及換乘等因素沒有考慮。另外,在本次研究中引入了大數(shù)據(jù),利用上海市移動(dòng)供應(yīng)商和出租車公司提供的乘客移動(dòng)信息,經(jīng)過篩選與整合之后,選用可視化工具對上海市深夜移動(dòng)需求量分析結(jié)果進(jìn)行了可視化顯示,結(jié)果發(fā)現(xiàn),與考慮區(qū)域均衡性的深夜公交線路評價(jià)結(jié)果有一些出入,說明了既有深夜公交線路的不合理性。
公交路線的分布狀況與該區(qū)域的乘客及道路環(huán)境也有密切的關(guān)系。本文利用Dijkstra模型對既有深夜公交線路優(yōu)化時(shí),只考慮了2個(gè)公交站之間的移動(dòng)需求量。因?yàn)楣粚儆诖蟊娊煌üぞ?即使是人口稀少的區(qū)域也要實(shí)現(xiàn)與其他區(qū)域之間的交通連接。所以,要根據(jù)評價(jià)分析結(jié)果進(jìn)行增加公交站點(diǎn)或延長公交路線時(shí),需要進(jìn)行相應(yīng)的調(diào)整。本文研究評價(jià)及優(yōu)化方法與去除既有不合理公交線路方法相比,更適合于增加公交線路的方案。
[1] HAN J H.BTRNDP investigation of the bus route network[J].Journal of the Korean Traffic Society,2005,23(8):19-29.
[2] OH J H.Big data visualization and visualization process[D].[S.1]:Korean Journal of Multimedia Institute,2014.
[3] YOO J U.The visualization of big data[D].[S.1.]:South Korea Consulting Association,2011.
[4] CH I M.Study on the location of a bus station considering bus routes[D].Philadelphia,USA:University of Pennsylvania,2007.
[5] HONG Z X.Research on route design[D].Gwangju,Korean:University of Kwangju,2006.
[6] 袁長偉,吳群琪,袁華智,等.考慮軌道交通作用效應(yīng)的城市公交線網(wǎng)優(yōu)化方法[J].公路交通科技,2014,31(8):119-125.
[7] 費(fèi) 騰,張立毅,陳 雷.混合Levy變異與混沌變異的改進(jìn)人工魚群算法[J].計(jì)算機(jī)工程,2016,42(7):146-152,158.
[8] 馮正勇.衰落信道數(shù)據(jù)包傳輸跨層優(yōu)化模型改進(jìn)[J].計(jì)算機(jī)工程,2016,42(11):125-130.
[9] 蔡 彪,庹先國,桑 強(qiáng),等.復(fù)雜網(wǎng)絡(luò)中基于三角環(huán)吸引子的社區(qū)檢測[J].計(jì)算機(jī)工程,2016,42(9):197-201.
[10] 沈記全,孔祥君.基于改進(jìn)蟻群優(yōu)化算法的QoS區(qū)間數(shù)服務(wù)組合方法[J].計(jì)算機(jī)工程,2016,42(7):181-188,193.
[11] 程憲寶.基于改進(jìn)簡化粒子群優(yōu)化的多目標(biāo)跟蹤算法[J].計(jì)算機(jī)工程,2016,42(8):282-288.
[12] 楊興地.中小城市常規(guī)公交線網(wǎng)優(yōu)化方法研究[J].交通信息與安全,2013,31(5):55-61.
[13] 李淑慶.重慶市主城區(qū)公交線網(wǎng)優(yōu)化標(biāo)準(zhǔn)研究[J].交通信息與安全,2010(5):43-45.
[14] 史葦杭,林 楠.一種聯(lián)合的時(shí)序數(shù)據(jù)特征序列分類學(xué)習(xí)算法[J].計(jì)算機(jī)工程,2016,42(6):196-200,207.
[15] 郭羽含,楊曉翠.綠色供應(yīng)鏈網(wǎng)絡(luò)構(gòu)建的雙階段綜合優(yōu)化方法[J].計(jì)算機(jī)工程,2016,42(10):192-200.