杜嬌+陸容天
摘要:居民出行信息是進行城市交通規(guī)劃與管理的重要基礎(chǔ)數(shù)據(jù)來源。傳統(tǒng)的獲取居民出行信息的方法存在周期長、效率低、有效樣本低等缺陷,現(xiàn)在手機保有量已超過90%,而且手機通過與基站之間進行信息交換來進行定位,所以利用手機通訊記錄數(shù)據(jù)來研究居民出行信息是可行的,而且具有成本低時效性高的特點。但是手機通訊記錄中存在乒乓切換數(shù)據(jù),剔除乒乓切換數(shù)據(jù)對于利用手機通訊記錄研究居民出行信息尤為重要。本文主要針對基站切換序列與出行鏈并不完全對應(yīng)的三種情況提出了剔除乒乓切換的三種方法,并用實例驗證了方法的可行性。
Abstract: Resident travel information is an important basic data source for urban transportation planning and management. The traditional method of obtaining residents' travel information has shortcomings such as long cycle, low efficiency and low effective sample. Now, the mobile phone holdings has exceeded 90%, and the mobile phone positions through information exchange with the base station. Therefore, it is feasible to study the residents travel information through mobile communication data, which has the characteristics of low cost and low efficiency. But there is ping-pong communication data in mobile phone records, so excluding ping-pong switching data is particularly important for using mobile communication records to study residents travel information. In this paper, three methods of excluding ping-pong switching data are proposed for the three cases where the base station switching sequence does not correspond exactly to the travel chain. The feasibility of the method is verified by an example.
關(guān)鍵詞:手機通訊記錄;基站;乒乓切換;出行鏈
Key words: mobile communication record;base station;ping-pong switch;travel chain
中圖分類號:U491.1 文獻標識碼:A 文章編號:1006-4311(2017)20-0063-03
0 引言
居民出行信息的獲取是交通調(diào)查的主要目的,是交通規(guī)劃的基礎(chǔ),數(shù)據(jù)的時效性、精確度直接影響交通規(guī)劃的效率與科學(xué)性。但是傳統(tǒng)的交通調(diào)查方式存在一定的弊端,所以需要利用新手段——手機,以手機為載體,研究手機通訊記錄數(shù)據(jù),有效提高效率。但是手機通訊記錄數(shù)據(jù)中存在乒乓切換,影響數(shù)據(jù)分析,所以需要將其剔除掉。本文將針對不同類型的數(shù)據(jù)采用不同的剔除方法,最終得到。
1 基本概念
1.1 出行和出行鏈的定義
在交通規(guī)劃中,人、車、貨在從出發(fā)地到目的地的一次移動過程叫做一次出行[1]。在城市交通規(guī)劃中,一般會給出行距離或時間規(guī)定一個下限:移動時間≥5min或移動距離≥400m。這主要是為了剔除在機關(guān)、團體、企事業(yè)單位內(nèi)部、住宅小區(qū)內(nèi)和公園等公共場所內(nèi)的移動過程,因為這類移動不會直接對城市交通產(chǎn)生影響。每次出行有兩個端點,其中出行出發(fā)的地點稱為起點(或O點),目的地稱為訖點(或D點),因此出行調(diào)查也被稱為起訖點調(diào)查(或OD調(diào)查)。如果把某個個體在一段時間內(nèi)所有的出行端點按時間先后順序連接起來,可以形成出行端點構(gòu)成的序列,這種序列一般被稱為出行鏈[1]。出行鏈中的每個點都是出行的端點,每條連線代表一次出行。表1和表2分別是科特迪瓦居民手機通訊記錄數(shù)據(jù)格式與示例、基站位置數(shù)據(jù)格式與示例。
1.2 基站切換序列與出行鏈不對應(yīng)情況
從手機通訊記錄中提取用戶出行鏈的難點在于通訊基站切換序列與出行鏈并不完全對應(yīng),這種不對應(yīng)主要體現(xiàn)在以下三個方面:
①用戶沒有移動,但通訊基站發(fā)生了切換。
造成這種情況的原因主要是當手機處于兩個基站服務(wù)范圍的交界處時,手機通訊會在兩個基站的信號通道之間進行來回切換。當手機處于密集分布的基站范圍時,甚至會在多個基站的通信網(wǎng)絡(luò)系統(tǒng)中切換。一般把手機短時間內(nèi)在兩個或多個基站信號通道上來回切換的現(xiàn)象稱為“乒乓切換”[2]?!捌古仪袚Q”這種噪聲數(shù)據(jù)在手機通訊記錄中是普遍存在的,必須采用合適的方法予以剔除,否則會在生成的用戶出行鏈中出現(xiàn)大量的虛假出行信息,嚴重影響分析結(jié)果的準確性。
②用戶在非出行端點發(fā)生了通訊行為。
這種情況主要發(fā)生在用戶在出行過程中進行了通訊活動(比如駕車時或在公交車上打電話),但本人并沒有在通訊地點進行停留,因此不能將這類通訊發(fā)生的地點看作用戶出行的端點。
③用戶在出行端點沒有發(fā)生通訊行為。
前面兩種情況都會造成出行信息提取過量,而用戶在出行端點沒有發(fā)生通訊行為則會造成出行信息提取缺失。這種情況在手機用戶日常生活中是比較常見的,特別是對于非活躍手機用戶來說,這種現(xiàn)象就更為普遍。
下面將分別針對這三種基站切換序列與出行鏈不對應(yīng)的典型情況,提出相應(yīng)的處理方法。
2 剔除乒乓切換的方法
2.1 根據(jù)出行的定義剔除部分乒乓切換
根據(jù)前述出行定義中對有效出行最短時間的界定,可以首先將間隔時間小于5min的兩次連續(xù)通訊所處的基站編號進行合并。由于無法直接判定用戶到底距離兩個連續(xù)切換基站中的哪一個更近,因此本文采取一種近似的處理方法:首先統(tǒng)計用戶在所有基站發(fā)生通訊行為的次數(shù),然后在兩個連續(xù)切換基站中用通訊次數(shù)更大的基站編號代替通訊次數(shù)較小的基站編號。
2.2 根據(jù)連續(xù)切換序列時長剔除部分乒乓切換
僅使用前述方法并不能完全剔除所有的乒乓切換,因為有時個別用戶雖然在兩個基站之間反復(fù)了多次通訊切換,但其中每次切換的間隔都不小于5min。為處理這種情況,本文首先統(tǒng)計了在兩個基站之間連續(xù)切換三次的基站切換序列(即A-B-A-B)的時間長度,結(jié)果見圖1。從圖中可以看到,切換序列的時間長度分布非常有規(guī)律性:首先快速下降,在40min附近降到最低點,然后在超過160min后開始有所回升。這說明,小于40min的基站切換序列不是正常的出行所造成的(很少有正常的出行者會在40min內(nèi)在兩地之間往返三次),基本可以斷定是乒乓切換;而160min后的回升部分應(yīng)該是正常的多次往返出行所導(dǎo)致的,這部分出行不應(yīng)該被剔除。因此,本文設(shè)定一個40min的閾值,如果有連續(xù)三次切換序列的時間長度小于這個閾值,則認為這種序列是乒乓切換,并對切換基站的編號進行合并處理。
2.3 綜合應(yīng)用示例
通過綜合運用以上兩種方法,本文對手機通訊記錄中的所有個體進行了乒乓切換序列的剔除,然后在繪圖工具中編寫程序?qū)⒚總€留下來的序列對按照一定的順序用點線組合繪制于圖。圖2是一個典型用戶在去除乒乓切換前后通訊基站切換序列的對比。在該圖中,上圖是沒有去除乒乓切換前的基站切換序列可視化效果(不同顏色代表一周中不同的日期),下圖是去除乒乓切換后保留的基站序列。從圖中可以看出,本文提出的方法能夠剔除手機通訊數(shù)據(jù)中絕大部分的乒乓切換序列,并盡可能完整地保留了實際停留地點構(gòu)成的序列。此外,通過觀察圖2中黑色線段構(gòu)成的序列和最下方藍色線段構(gòu)成的序列可以看到,用本文方法去除間隔小于5min的切換后,同時也把部分非停留地點的通訊行為去除掉了,這在一定程度上解決了前面提到的“用戶在非出行端點發(fā)生了通訊行為”的問題。
3 結(jié)語
剔除非居民真實移動的基站切換數(shù)據(jù),是利用手機通訊記錄數(shù)據(jù)研究居民出行行為的基礎(chǔ),本文利用科特迪瓦某一手機用戶通訊記錄數(shù)據(jù)對提出的方法進行綜合利用,得出剔除乒乓切換數(shù)據(jù)前后的對比圖,從對比圖可明顯看出本文提出的剔除方法是可行的。
參考文獻:
[1]郝春福.交通規(guī)劃原理[M].北京:中國鐵道出版社,2004.
[2]袁月明.基于手機切換定位技術(shù)的交通信息提取方法研究[D].北京:北京交通大學(xué),2012.
[3]嚴保杰.交通調(diào)查與分析[M].北京:人民交通出版社,1994.
[4]楊飛.基于手機定位的交通OD數(shù)據(jù)獲取技術(shù)[J].系統(tǒng)工程,2007,25(1):40-48.
[5]羅勇.基于手機位置數(shù)據(jù)的居民出行信息挖掘和分析方法研究[J].北京建筑工程學(xué)院學(xué)報,2012,28(1):40-44.