• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于手機數據的城市交通大區(qū)OD分布估計
      ——以舊金山市為例

      2016-12-14 23:28:04航,孫黎,王
      城市交通 2016年1期
      關鍵詞:手機用戶大區(qū)小汽車

      龔 航,孫 黎,王 璞

      (中南大學交通運輸工程學院,湖南長沙410075)

      基于手機數據的城市交通大區(qū)OD分布估計
      ——以舊金山市為例

      龔 航,孫 黎,王 璞

      (中南大學交通運輸工程學院,湖南長沙410075)

      在大數據時代,手機數據因普及率高、采集成本低等優(yōu)點逐漸受到人們的重視。手機通信運營商在為手機用戶提供通信服務的同時會記錄每次服務的時空信息,因此利用手機數據可以挖掘出用戶的位置信息,并應用于城市居民出行OD分布估計。提出以手機數據為基礎對城市交通大區(qū)之間OD分布進行估計的方法。利用居民手機數據估計美國舊金山市各交通大區(qū)之間的出行分布,并結合居民出行調查數據對估計結果進行檢驗。結果顯示基于手機數據的出行估計具有較高的可靠性。

      交通規(guī)劃;交通需求預測;手機數據;OD分布估計;舊金山市

      0 引言

      手機已經成為人們日常生活的必需品。當一個手機用戶使用手機通話、發(fā)送(接收)短信、瀏覽網頁時,為其服務的手機基站以及服務時間均被記錄下來,形成手機賬單數據。手機數據具有采集方便、實時性高等特點。隨著計算機技術的快速發(fā)展,對海量手機數據的采集與挖掘已成為可能,大數據分析開始逐漸成為解決交通調查問題一種嶄新、有效的途徑[1-2]。使用手機數據對居民出行進行預測已取得眾多成果。文獻[3]發(fā)現,居民出行有很高的可預測性,出行者位置預測的準確率最高可達93%;文獻[4]提出行為空間(Behavior Space)的概念,并利用特征向量進行特征行為分析,預測出行者在各個時段的位置等。這些研究成果為使用手機數據預測交通OD提供了理論依據。通過對手機數據的分析挖掘來獲取交通信息,越來越受到研究者的關注[5-7]。

      本文利用手機數據提取交通信息,提出一種有效的方法來估計城市交通大區(qū)間的OD,并以美國舊金山市為例,將估計得到的出行需求OD和實際調查數據進行對比以驗證方法的有效性。

      1 OD分布估計方法

      1.1 利用手機數據估計交通出行的原理

      手機賬單數據記錄了某一時刻、某一基站向用戶提供的通訊服務,可由此獲得用戶的時間位置記錄。通過Voronoi圖確定每個手機基站所服務的區(qū)域,這些由基站所劃分的多邊形區(qū)域被稱為基站小區(qū)。

      由于手機用戶何時何地使用手機存在不確定性,故用戶的位置信息可能存在缺失。如圖1所示,一個手機用戶被觀察到先后在基站小區(qū)B和C使用了手機,但是出行的起點和終點可能位于基站小區(qū)A和D,在這種情況下部分出行信息會缺失。但是,基站小區(qū)A和B可能同屬于交通大區(qū)I,基站小區(qū)C和D可能同屬于交通大區(qū)II,出行信息缺失所造成的影響在研究交通大區(qū)間出行需求時會有所減少。因為交通大區(qū)覆蓋的面積較大,當用戶進行交通大區(qū)之間的出行時,大區(qū)之間的較遠距離會使出行時間更長,用戶的位置變化會更加明顯,在較長時間內用戶使用手機的可能性也會增加,所以實際出行的起訖點和手機數據記錄的出行起訖點會有更大的可能分別屬于同一大區(qū)。因此,盡管使用手機數據只能捕捉到用戶出行中的部分信息,但仍然可以記錄大部分交通大區(qū)之間的出行。

      1.2 篩選手機用戶

      圖1 手機用戶出行路徑模擬Fig.1 Travel route simulation of a mobile phone user

      由于需要足夠多的時間位置記錄才能挖掘手機用戶出行特征,進而保證交通需求預測的準確性。因此,第一次篩選選取有足夠多時間位置記錄的手機用戶。

      第二次篩選需選取具有住址信息的手機用戶,以便知悉其住址所在基站小區(qū)。21:00—7:00被認為是用戶的在家時間。用戶的時間位置記錄中在該時段內出現次數最多的基站小區(qū),可被定義為手機用戶住址所在的小區(qū)。如果該時段內用戶沒有時間位置記錄,則無法確定該用戶的住址小區(qū)。

      1.3 估算基站小區(qū)間的出行總量

      使用手機數據估計居民出行特征時,需要觀察手機用戶在不同時刻的位置,這需要較長時間內連續(xù)的用戶位置記錄。為獲取用戶在不同區(qū)域出行的高精度數據,只選取位置在較短時間窗內發(fā)生變化的時間位置記錄。為保證居民出行信息的提取,需選取足夠長的時間窗,并且將一次出行定義為一個時間窗之內發(fā)生的位置變化。

      在估算各個基站小區(qū)間的出行量時,由于手機用戶只占全體居民的一部分,手機數據中所包含的用戶也只是所有手機用戶中的一部分,所以當對每個基站小區(qū)間的居民出行特征進行估算時需要進行擴縮樣。如果一個用戶在選定時段內相鄰兩次時間位置記錄發(fā)生改變(即有不同基站為其服務),且這兩次位置記錄的時間間隔小于一個時間窗,則認為該用戶進行了一次出行。任意兩個基站小區(qū)的出行量

      式中:Fij指一個時間窗內由小區(qū)i至小區(qū)j的手機用戶出行總量;N代表篩選后的手機用戶總量;代表用戶n在該時段內由小區(qū)i至小區(qū)j的出行量。

      通過數據篩選,被篩選出的每個手機用戶都有一個住址所在基站小區(qū),對各個基站小區(qū)內的手機用戶數量進行求和,可以得到每個小區(qū)的手機用戶總量。每個基站小區(qū)的居民人口和手機用戶間的擴縮樣系數

      通過對用戶、小區(qū)的逐級求和并進行擴縮樣處理,得到基站小區(qū)間的居民出行總量

      式中:ODall表示基站小區(qū)間的出行總量;代表小區(qū)k的用戶n在某時段由小區(qū)i至小區(qū)j的出行量;是第k個小區(qū)的手機用戶總量;A為小區(qū)總量。

      1.4 估算基站小區(qū)間小汽車出行量

      得到基站小區(qū)之間的出行總量后,需要從中挑選出小汽車出行,包括單獨駕車出行和拼車出行。將出行方式劃分為小汽車出行和其他出行方式(步行、自行車、公共交通等),各個小區(qū)的小汽車使用比例[8]

      計算得到每個小區(qū)的小汽車使用比例后,將該小區(qū)的手機用戶按照VURsta隨機分為小汽車出行者和其他交通方式出行者,則小區(qū)i和小區(qū)j之間的小汽車出行量

      根據研究區(qū)域的每日出行總量和出行量在時間上的分布,可以估算出小區(qū)間每小時的小汽車出行量

      1.5 計算交通大區(qū)間小汽車出行量

      在獲得每個小區(qū)間小汽車出行量后,將每個小區(qū)歸并到相應的交通大區(qū)中,同時對各個小區(qū)間的出行進行歸并。若兩個基站小區(qū)屬于不同交通大區(qū),則二者間的出行記為交通大區(qū)之間的出行;若兩個基站小區(qū)同屬于一個交通大區(qū),則認為二者間的出行為交通大區(qū)內部出行。最終得到研究區(qū)域內的交通大區(qū)OD。

      2 舊金山市交通大區(qū)OD分布估計

      2.1 數據

      本文使用的數據主要包含手機數據和實際通勤數據兩種。手機數據用來獲得用戶位置并估計其出行,實際通勤數據用來檢驗估計結果的準確性。由于獲得的手機數據覆蓋了美國加州整個灣區(qū),而實際通勤數據只覆蓋舊金山市,因此將舊金山市作為研究對象。舊金山市是加州第四大城市,人口85萬,市區(qū)面積119 km2。所使用的舊金山市路網數據包含高速公路和主干路,共有2 823條路段和1 144個道路交叉口(見圖2)。

      本文所使用的手機數據來自文獻[6-7],由美國某通訊運營商提供,包含40多萬用戶在3個星期的3.7億多條手機記錄,涉及手機基站892個(見圖3)。為保證服務區(qū)域的有效性,根據灣區(qū)行政邊界對位于邊界上的基站小區(qū)進行修正。

      2.2 OD分布估計步驟

      2.2.1 手機用戶篩選

      原始手機數據來自于429 598個手機用戶,對每一個用戶建立時間位置記錄表(見表1)。按照手機記錄超過10條的標準[6]進行第一次篩選,共篩選出369 614個手機用戶。

      圖2 舊金山市路網和基站小區(qū)Fig.2 Road networks and base station tracts of San Francisco

      表1中,記錄1—5為早高峰時段的手機記錄。記錄1和記錄2的時間差大于1 h,而記錄2和記錄3位置未發(fā)生改變,故記錄1—3無效;記錄3—5有效,記錄3—4與記錄4—5分別記為一次出行。記錄8—10為晚間記錄,72號基站出現次數最多,故將其作為用戶的住址小區(qū)。第二次篩選共得到326 565個用戶。

      圖3 灣區(qū)及舊金山市手機基站小區(qū)Fig.3 Base station tracts of BayArea and San Francisco

      表1 用戶手機時間位置記錄示例Tab.1 Examples of mobile phone users'space-time records

      圖4 舊金山市居民早高峰時段出行時長分布Fig.4 Distribution of travel time for San Francisco residents in the morning peak period

      2.2.2 基站小區(qū)間出行量

      高峰時段是一天出行集中的時段,最容易反映交通存在的問題又不失一般性,故選擇早高峰時段作為研究時段。根據文獻[6-7],選取早上6:00—10:00作為早高峰時段。利用舊金山市出租汽車GPS數據計算得到每條路段實際行駛時間,對舊金山市早高峰所有出行按照最短路徑算法選擇路徑,得到每次出行所需時間。由圖4可以看出,舊金山市的出行時間均小于30 min。在保證出行信息能夠提取的情況下,選取1 h作為一個時間窗,并且定義一次出行是指在規(guī)定時段(6:00—10:00)1 h內發(fā)生的位置變化。

      使用時間位置記錄表計算每個手機用戶的出行量,運用公式(1),(2),(3)得到灣區(qū)基站小區(qū)間的居民出行總量。

      2.2.3 灣區(qū)各小區(qū)間早高峰小汽車出行量

      灣區(qū)人口數據中包含每個基站小區(qū)駕車單獨出行和拼車出行的居民人口比例,加州地區(qū)拼車出行的平均人數為2.25人[9]。運用公式(4)得到每個小區(qū)的小汽車使用比例(見圖5)。由圖5可見,舊金山市小汽車使用比例低于灣區(qū)郊區(qū)。

      美國人均日出行次數約為4次,灣區(qū)每天產生約2 200萬人次的出行[9]。根據出行量在時間上的分布,可以估算出灣區(qū)每小時出行量Wh[10]。經計算,灣區(qū)早高峰每小時小汽車出行量達847 056車次。依照公式(6)得到基站小區(qū)之間早高峰每小時的小汽車出行量。

      2.2.4 提取與舊金山市有關的出行

      通過以上步驟獲得了整個灣區(qū)基站小區(qū)間的早高峰每小時小汽車出行量根據以下條件挑選出與舊金山市相關的出行起點小區(qū)和終點小區(qū)均在舊金山市內的出行起點小區(qū)和終點小區(qū)一個在市內一個在市外的進出城出行出行起點小區(qū)和終點小區(qū)均在舊金山市外的過境出行

      在起點小區(qū)和終點小區(qū)內隨機取一個交叉口作為出行起訖點,采用Dijkstra算法計算這些出行所使用的路徑。對于進城出行,將進入舊金山市的第一個基站小區(qū)為起點小區(qū);對于出城出行,將出舊金山市前的最后一個基站小區(qū)作為終點小區(qū);對于過境出行,選取進入舊金山市的第一個小區(qū)和出舊金山市前的最后一個小區(qū)作為起點和終點小區(qū)。最終共得到與舊金山市有關的小汽車出行量111 143車次,其中市內出行和進出城出行共106 609車次,市內出行33 340車次,過境出行4 534車次。

      2.2.5 基站小區(qū)OD歸并到交通大區(qū)

      交通大區(qū)一般會以行政區(qū)域劃分,或者以明顯的山川河流劃分[11]。由于舊金山市沒有更小的行政區(qū)劃,也沒有對交通產生明顯影響的山川河流界限,因此按照方位大致將幾個基站小區(qū)合并成一個交通大區(qū)(見圖6)。對各個基站小區(qū)間的出行進行歸并,得到交通大區(qū)之間的早高峰出行量(見圖7a)。

      2.3 獲得交通調查數據中交通大區(qū)通勤OD分布

      鑒于早高峰出行近似等于早高峰通勤出行,所以使用舊金山市的通勤數據來檢驗手機數據估計的結果。舊金山市的通勤OD數據來自美國人口普查局網站(www.census.gov),由街區(qū)尺度上的居民家庭位置和工作位置構成[12]。由于居民出行會采取不同出行方式,例如單獨駕車、拼車、公共交通、自行車和步行等,根據出行方式劃分數據,可以利用類似于公式(4)的方式得到每個人口小區(qū)的小汽車使用比例

      為了方便將人口小區(qū)(即街區(qū))歸納到交通大區(qū)中,這些通勤OD被投影到舊金山市路網的道路交叉口上。投影規(guī)則為選取距離每個街區(qū)形心最近的道路交叉口,然后基于舊金山灣區(qū)每小時出行總量Wh,調整早高峰通勤OD中小汽車出行量,最終得到早高峰每小時的小汽車通勤OD[13-14]。

      實際調查獲得的通勤出行總量為140 986車次,其中市內出行和進出城出行共124 595車次,市內出行31 293車次,過境出行16 391車次。最后,將舊金山市路網中1 144個交叉口歸屬到9個交通大區(qū)中,得到基于人口普查數據的舊金山市交通大區(qū)通勤出行量(見圖7b)。

      2.4 檢驗

      將得到的結果分為全部出行、市內出行和進出城出行以及市內出行三種情況進行T檢驗。由于過境出行量只涉及舊金山市主要出入口道路所在的少數幾個小區(qū),故本文不對過境出行進行檢驗。T檢驗可以檢測兩個樣本差異的顯著性,在此用來檢驗交通調查數據與手機數據估計結果的差異。本文取顯著性水平α=0.05,兩個樣本設定為配對樣本。由表2可見,三種情況下p值均大于顯著性水平0.05,故可以認為沒有顯著差異,從而驗證了手機數據估計結果的可靠性。

      圖5 灣區(qū)各基站小區(qū)小汽車使用比例Fig.5 Private vehicle using rate within each tower station tract in the BayArea

      圖6 舊金山市交通大區(qū)劃分Fig.6 Mega TrafficAnalysis Zones in San Francisco

      對大區(qū)之間出行量進行對比,發(fā)現大部分估計值與調查值相差不大,但也存在個別偏差較大的情況,例如圖7右側中間大區(qū)與一些大區(qū)間的出行量相差較大。原因可能在于該大區(qū)手機數據采樣率較低,對估計結果影響較大。

      3 結語

      本文介紹了一種利用手機數據估計OD分布的方法,對舊金山市早高峰時段的交通大區(qū)OD分布進行估計,并與實際調查數據進行對比,證明了使用海量手機數據估計城市OD分布的可行性和可靠度。利用手機數據預測居民出行,提供了一種更加便捷、低成本的途徑來實現城市交通調查。手機數據具有實時性強、覆蓋率高等優(yōu)勢,可以實現城市交通問題的及時反饋、實時處理,進一步提高交通管理的智能化水平。但是,由于手機數據本身稀疏、無規(guī)律,以及本文使用的數據采樣率偏低、時間跨度短、忽略了擴縮樣誤差等原因,部分大區(qū)間交通需求預測存在較大偏差。未來研究可從以下方面對該方法進行改進,提高運用手機數據估計城市通勤OD的準確性:1)使用采樣率更高、時間跨度更大的手機賬單數據;2)運用浮動車GPS數據等多元數據對方法進行修正;3)使用記錄更加詳細、數據密度更高的手機信令數據。

      圖7 交通大區(qū)出行OD分布對比Fig.7 Comparison between obtained OD with surveyed OD

      [1]丘建棟,陳蔚,宋家驊,段仲淵,趙再先.大數據環(huán)境下的城市交通綜合評估技術[J].城市交通,2015,13(3):63-70.Qiu Jiandong,Chen Wei,Song Jiahua,Duan Zhongyuan,Zhao Zaixian.Comprehensive Assessment of Urban Transportation Using Big Data[J].Urban Transport of China,2015,13(3):63-70.

      [2]王璞,黃智仁,龔航.大數據時代的交通工程[J].電子科技大學學報,2013,42(6):806-816.Wang Pu,Huang Zhiren,Gong Hang.Transportation Engineering in the Big Data Era[J].Journal of University of Electronic Science and Technology of China,2013,42(6):806-816.

      [3]Song C,Qu Z,Blumm N,et al.Limits of Predictability in Human Mobility[J].Science,2010,327(5968):1018-1021.

      表2 T檢驗結果Tab.2 T-test results

      [4]Eagle N,PentlandAS.Eigenbehaviors:Identifying Structure in Routine[J].Behavioral Ecology and Sociobiology,2009,63(7):1057-1066.

      [5]楊飛.基于手機定位的交通OD數據獲取技術[J].系統(tǒng)工程,2007,25(1):42-48.Yang Fei.The Technology of Acquisition Traffic OD Based on Mobile Location-based Data[J].Systems Engineering,2007,25(1):42-48.

      [6]Wang P,Hunter T,Bayen A M,et al.Understanding Road Usage Patterns in Urban Areas[J].Scientific Reports,2012,2(12):1-6.

      [7]Wang J,Wei D,He K,et al.Encapsulating Urban Traffic Rhythms into Road Networks[J].Scientific Reports,2014,4(7488):4141.

      [8]Caliper Website.Travel Demand Modeling[EB/OL].[2015-10-05].http://www.caliper.com/TCTravelDemand.htm.

      [9]University of South Florida.State Averages for Private Vehicle Occupancy,Carpool Size and VehiclesPer100Workers[EB/OL].[2015-10-05].http://www.nctr.usf.edu/clearinghouse/censusavo.htm.

      [10]United States Department of Transportation.National Household Travel Survey[EB/OL].[2015-10-05].http://www.rita.dot.gov/bts/sites/rita.dot.gov.bts/files/subject_areas/national_household_travel_survey/index.html.

      [11]中國百科網.交通規(guī)劃的基礎內容與客流OD矩陣估計[EB/OL].2013[2015-10-05].http://www.chinabaike.com/t/10383/2013/0827/1461602.html.

      [12]US Census Bureau.The 2010 Census[EB/OL].[2015-10-05].http://www.census.gov/geo/www/tiger/tgrshp2010/tgrshp2010.html.

      [13]Xu Z,Sun L,Wang J,Wang P.The Loss of Efficiency Caused by Agents'Uncoordinated Routing in Transport Networks[J].Plos One,2014,9(10):e111088-e111088.

      [14]Sun L,Liu L,Xu Z,et al.Locating Inefficient Links in a Large-scale Transportation Network[J].Physica A:Statistical Mechanics and ItsApplications,2015,419:537-545.

      Using Mobile Phone Data to Estimate Trip Distribution of Urban Mega Traffic Analysis Zones:A Case Study in San Francisco

      Gong Hang,Sun Li,Wang Pu
      (School of Traffic and Transportation Engineering,Central South University,Changsha,Hunan,410075)

      When stepping into Big Data Era,mobile phone data attract more and more attentions by transportation domain because of its high penetration rate and low collecting cost.Mobile phone operators record temporal and spatial information of users when providing services.This new data stream turns to be a promising resource to estimate trip distribution pattern due to the fact that each record is able to provide the space-time information.This paper proposes a method to estimate OD distribution among urban mega traffic analysis zones based on mobile phone data mining.A case study of San Francisco,US is selected to implement mobile phone data mining-based OD extraction by proposed method.The outcome is further statistically validated by household survey data.Results reveal that the proposed mobile phone data miningbased approach is able to generate a promising result.

      transportation planning;travel demand prediction;mobile phone data;OD estimation;San Francisco

      1672-5328(2016)01-0037-06

      U491.1

      A

      10.13813/j.cn11-5141/u.2016.0106

      2015-08-25

      龔航(1990—),男,河南信陽人,碩士研究生,主要研究方向:交通規(guī)劃、數據挖掘等。E-mail:gonghang@csu.edu.cn

      猜你喜歡
      手機用戶大區(qū)小汽車
      可愛的小汽車
      幼兒100(2023年33期)2023-09-22 07:17:44
      涪陵:工業(yè)大區(qū)打開綠色新場景
      當代黨員(2022年9期)2022-05-20 13:35:21
      小汽車
      幼兒100(2021年12期)2021-04-25 12:49:52
      智利第一大區(qū)HNX礦區(qū)IOCG型銅礦床地質特征
      礦產勘查(2020年8期)2020-12-25 02:47:00
      拼一拼
      啟蒙(3-7歲)(2020年6期)2020-06-02 07:53:42
      基于藍牙技術的藍牙路況測險儀設計研究
      基于安卓手機用戶行為的人口學信息預測
      電子制作(2019年10期)2019-06-17 11:45:22
      基于手機用戶認知視角的“雙十一”期間網絡廣告效果研究
      新聞傳播(2016年1期)2016-07-12 09:25:08
      數 字
      意林(2013年22期)2013-05-14 21:31:08
      聚集力量 蓄勢待發(fā)——力至優(yōu)各大區(qū)隆重召開年會
      中國儲運(2012年3期)2012-06-02 08:21:42
      葵青区| 巩留县| 晋城| 雅江县| 青川县| 安丘市| 托克逊县| 利川市| 云阳县| 汾阳市| 于都县| 浦县| 米脂县| 朝阳市| 镇平县| 斗六市| 嵊泗县| 龙山县| 天水市| 安吉县| 中宁县| 内丘县| 乌拉特前旗| 登封市| 嵊泗县| 大化| 新竹市| 城市| 广河县| 和硕县| 天柱县| 兴业县| 田东县| 衡山县| 海门市| 古田县| 中阳县| 威远县| 武夷山市| 若羌县| 托克托县|