摘要:獲取公交客流信息是公交運行工作中的基礎(chǔ),不僅為公交的日常調(diào)節(jié)提供了可靠的依據(jù),也為公交的線路網(wǎng)優(yōu)化提供了一定的參考。公交管理部門應(yīng)當(dāng)深入了解居民乘坐公交車出行的交通特點,及時準(zhǔn)確的掌握出行數(shù)據(jù),才能正確的對公交的運營線路和運營規(guī)劃做出正確的調(diào)整。因此,合理的公交IC卡的數(shù)據(jù)分析處理方法,是建立高效的城市交通系統(tǒng)的一條重要途徑。那么面對這些海量的公交數(shù)據(jù),如何進(jìn)行有效的處理和分析正是本文研究的目的。
關(guān)鍵詞:公交;IC數(shù)據(jù);分析處理
隨著信息技術(shù)的飛速發(fā)展,智能交通系統(tǒng)在解決交通問題中顯示著它越來越重要的地位,公交系統(tǒng)也漸漸開始向信息化的方向發(fā)展,IC卡、GPS定位技術(shù)的提出正是信息化發(fā)展的基礎(chǔ)。將IC卡與GPS結(jié)合起來,通過對公交數(shù)據(jù)的分析和處理合理運用城市道路等固有配置,為公交日常調(diào)度提供切實有效的依據(jù),并以此為基礎(chǔ)運用先進(jìn)的管理手段和技術(shù),來保證城市交通系統(tǒng)的高效運行。
一、公交IC卡概述
公交IC卡已經(jīng)在我國越來越多的城市被應(yīng)用,已經(jīng)成為公交收費的一種大勢,這種方式不僅僅給乘客的付款方式提供了新的選擇,也為公交數(shù)據(jù)調(diào)查提供了一種先進(jìn)的調(diào)查手段,通過IC卡我們可以獲得居民的IC卡號、刷卡路線、上車地點和乘客的上下車時間等,也可以得到乘客的基本出行信息。對這些基礎(chǔ)數(shù)據(jù)進(jìn)行分析和處理就可以得到該路線的基本客流量信息。IC卡統(tǒng)計出行數(shù)據(jù)具有高效、便捷、快速、低成本的特點。根據(jù)IC卡提供的信息可以跟蹤了解乘客的出行習(xí)慣,但他的缺點是對使用現(xiàn)金的乘客無法統(tǒng)計。它的系統(tǒng)組成一般包括以下幾個部分:IC卡、車載收費機(jī)、數(shù)據(jù)采集機(jī)、數(shù)據(jù)采集站、客運分公司、IC卡管理中心、IC卡充值點。
二、公交IC卡數(shù)據(jù)倉庫建立及數(shù)據(jù)分析
2.1建設(shè)數(shù)據(jù)基礎(chǔ)倉庫
構(gòu)建公交IC卡數(shù)據(jù)倉庫之前,首先要確定信息體系構(gòu)成,根據(jù)公交IC卡數(shù)據(jù)分析目標(biāo)和數(shù)據(jù)分析過程,可以建立IC卡的數(shù)據(jù)分析系統(tǒng),IC卡數(shù)據(jù)分析系統(tǒng)分為以下四個過程:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)解釋。它又由三個數(shù)據(jù)模塊構(gòu)成,數(shù)據(jù)倉庫模塊、數(shù)據(jù)分析模塊、分析結(jié)果顯示模塊。三個模塊各自承擔(dān)自數(shù)據(jù)采集、分析和處理職能,從而構(gòu)成了完整的公交IC卡數(shù)據(jù)分析系統(tǒng)。數(shù)據(jù)倉庫模塊執(zhí)行數(shù)據(jù)采集和數(shù)據(jù)的預(yù)處理職能,用于結(jié)合通過各個數(shù)據(jù)源獲得的城市公交數(shù)據(jù),并對數(shù)據(jù)進(jìn)行降噪,轉(zhuǎn)化和整合,處理過后的數(shù)據(jù)按主題儲存到不同的表中,數(shù)據(jù)分析模塊是通過計算機(jī)來完成庫中的數(shù)據(jù)進(jìn)行自動分析,分析結(jié)果顯示模塊可根據(jù)用戶指定的運算規(guī)則和算法模型,給出報表或其他形式顯示數(shù)據(jù)分析的結(jié)果,從而幫助運營者做出對城市公交運營的決策。
2.2數(shù)據(jù)倉庫及數(shù)據(jù)分析工具選擇
建立數(shù)據(jù)分析倉庫的目的是對城市公交進(jìn)行分析處理和決策支持,因此選擇數(shù)據(jù)分析倉庫也可是說是選擇數(shù)據(jù)分析的工具,以便于后期數(shù)據(jù)分析。不同的數(shù)據(jù)分析工具有不同的優(yōu)缺點,因此選擇數(shù)據(jù)分析工具時應(yīng)當(dāng)趨合高效的理念。公交IC卡數(shù)據(jù)分析需要運用到多種數(shù)據(jù)來源,因此我們應(yīng)當(dāng)選擇支持不同數(shù)據(jù)分析的數(shù)據(jù)平臺倉庫。大數(shù)據(jù)處理能力,公交IC卡的信息數(shù)據(jù)倉庫數(shù)量相當(dāng)大,分析工具必須具備大數(shù)據(jù)的處理能力,要求數(shù)據(jù)分析工具一定要有較快的數(shù)據(jù)處理速度,數(shù)據(jù)處理能力要和數(shù)據(jù)處理速度相等。分析工具的用戶界面要快捷,讓用戶可自己選擇算法,連接數(shù)據(jù),開始任務(wù),降低人為錯誤發(fā)生率,處理結(jié)果要具備可視化,能通過報表和圖表等方式直面的呈現(xiàn)給用戶。
2.3公交數(shù)據(jù)預(yù)處理
構(gòu)建一個數(shù)據(jù)倉庫,最基礎(chǔ)的就是要有充足的數(shù)據(jù)來源,不僅僅只是傳統(tǒng)的數(shù)據(jù)倉庫,也可以是非結(jié)構(gòu)化的信息,如文本文件,也可以從網(wǎng)絡(luò)上獲得資源,要保證能得出對決策者有用的信息就要保證外部數(shù)據(jù)的完整性、質(zhì)量性。數(shù)據(jù)預(yù)處理是從海量的基礎(chǔ)數(shù)據(jù)中提出有價值的信息或是清理一些雜亂的無效信息,從而避免被錯誤信息誤導(dǎo),改善數(shù)據(jù)質(zhì)量和數(shù)據(jù)分析的速度。
三、基于公交IC卡數(shù)據(jù)采集改進(jìn)
3.1基于系統(tǒng)聚類法的乘客上車點判斷
系統(tǒng)聚類法是最常見的聚類分析方法,但也是最有效的聚類分析方法。它將需要類聚的n個樣本各自看成一個整體,按照事先設(shè)定好的計算方法計各個樣本之間的聚類指數(shù),根據(jù)指數(shù)的大小將分析各個樣本之間的密切指數(shù),將關(guān)系最密切的兩類并成一類,其余樣本不變,在按上述方法重新進(jìn)行計算和歸類,循環(huán)進(jìn)行下去,直到最后n個變量都?xì)w為一類。通過這種方法可以通過最短距離法對IC卡數(shù)據(jù)進(jìn)行聚類和分組,得到樣本數(shù)據(jù),然后進(jìn)行各站到各站的到站時間預(yù)測,將聚類分組中每組第一個樣本刷卡時間與推算的時間進(jìn)行比較,確定各組乘客的上車站點。具體流程如下:公交站IC刷卡信息——最短距離類聚分析——聚類分類——分組中第一個樣本的刷卡時間——與人工預(yù)測時間相比——得到乘客上車地點。
3.2單個乘客刷卡數(shù)據(jù)的下車點判斷
雖然因為公交單一的運行線路,以及下車不用刷卡等因素,無法對乘客的下車地點進(jìn)行判斷,但是居民的每日出行都具有一定的規(guī)律性。我們可以通過長期的歸納集合和短期乘客下車點的規(guī)律性,來進(jìn)行乘客下車點的判斷。例如拿工作來說:居民由居住地刷卡上車到達(dá)工作地上下車,完成第一次出行,工作結(jié)束后,該居民從工作地上車回到居住地,完成第二次出行,由此第二次出行的終點就可以認(rèn)為是第一次出行的終點下車點??偠灾谙喈?dāng)一段時間內(nèi)乘客的乘車路線是保持不變的有一定的規(guī)律性,應(yīng)當(dāng)利用乘客多日的出行數(shù)據(jù)來進(jìn)行分析從而判斷乘客的下車地點。
四、結(jié)語
綜上所述,通過對公交IC流量卡的數(shù)據(jù)分析得知,目前我國對于公交數(shù)據(jù)挖掘技術(shù)和公交數(shù)據(jù)庫的建設(shè)還不夠成熟。公交IC是城市交通運營中的重要一環(huán),只有做好這一環(huán)的工作,完善公交系統(tǒng)的信息化程度,才能有效幫助公交系統(tǒng)運營者做出正確的決斷。交通信息智能化的發(fā)展,可得到的城市交通信息和基礎(chǔ)數(shù)據(jù)將更加豐富,根據(jù)海量的信息我們應(yīng)當(dāng)不斷研究新的算法,從而得到更多,準(zhǔn)確反映城市交通情況的信息,幫助完善城市交通線路規(guī)劃。
參考文獻(xiàn):
[1]陳孟柯.基于公交IC卡數(shù)據(jù)的公共交通客流分析——以南京為例[J].科技視界,2016(22):157-158.
[2]宋竹,秦志光,徐進(jìn),吳斗.基于公交IC卡數(shù)據(jù)的大規(guī)模OD矩陣推導(dǎo)算法研究[J].計算機(jī)應(yīng)用研究,2016,33(07):2007-2013.
[3]馬曉磊,劉從從,劉劍鋒,陳鋒,于海洋.基于公交IC卡數(shù)據(jù)的上車站點推算研究[J].交通運輸系統(tǒng)工程與信息,2015,15(04):78-84.
[4]陳君,楊東援.基于智能調(diào)度數(shù)據(jù)的公交IC卡乘客上車站點判斷方法[J].交通運輸系統(tǒng)工程與信息,2013,13(01):76-80.
作者簡介:劉姣姣,出生年月:19890515,性別:女,民族:漢,籍貫(精確到市):天津市,當(dāng)前職務(wù):工程師,當(dāng)前職稱:助理工程師,學(xué)歷:本科,研究方向:智能卡.