• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      電信運營商大數(shù)據(jù)在交通運輸行業(yè)旅客聯(lián)運場景下的應(yīng)用研究

      2022-05-19 06:25:54許致遠(yuǎn)聯(lián)通數(shù)字科技有限公司北京100032
      郵電設(shè)計技術(shù) 2022年4期
      關(guān)鍵詞:旅客運營商用戶

      許致遠(yuǎn),張 慧,張 鶴(聯(lián)通數(shù)字科技有限公司,北京 100032)

      0 前言

      旅客聯(lián)程運輸(以下簡稱“旅客聯(lián)運”)是建設(shè)現(xiàn)代化交通強國的重要舉措,也是單一客運方式發(fā)展到一定階段后的必然結(jié)果,隨著海量旅客跨域活動的逐漸增多,旅客對高效、安全的聯(lián)程出行提出了越來越緊迫的需求,如何引入數(shù)據(jù)化手段把握整體發(fā)展?fàn)顩r,統(tǒng)一規(guī)劃旅客聯(lián)運體系,成為亟需解決的問題。而電信運營商所承載的用戶數(shù)據(jù),天然具備時空連續(xù)、真實可靠、實時鮮活等優(yōu)勢,為解決旅客聯(lián)運業(yè)務(wù)研究和發(fā)展中的部分問題提供了有效路徑。

      1 旅客聯(lián)運業(yè)務(wù)現(xiàn)狀及需求

      1.1 旅客聯(lián)運術(shù)語解釋

      根據(jù)JT/T 1109-2017《中華人民共和國交通運輸行業(yè)標(biāo)準(zhǔn)》中的定義,旅客聯(lián)運指的是通過2 種或2 種以上對外運輸方式完成的旅客連續(xù)運輸。其發(fā)展目標(biāo)是由單一旅客聯(lián)運承運人或代理人為旅客及其行李全程負(fù)責(zé),旅客全程使用一本票證。

      通俗來說,旅客聯(lián)運是一種客運組織模式,即通過對同一旅客不同運輸方式的多段行程進行統(tǒng)籌規(guī)劃,提高旅客出行效率和滿意度。同時,該組織模式可充分發(fā)揮現(xiàn)行多種客運方式的比較優(yōu)勢,對于加快推進旅客運輸服務(wù)的供給側(cè)結(jié)構(gòu)性改革,推動現(xiàn)代綜合交通運輸體系建設(shè)具有重要意義[1]。

      1.2 我國旅客聯(lián)運業(yè)務(wù)發(fā)展現(xiàn)狀

      2017年2月,國務(wù)院印發(fā)《“十三五”現(xiàn)代綜合交通運輸體系發(fā)展規(guī)劃》,其中第4 項明確提出要“推進旅客聯(lián)程運輸發(fā)展”,要求各省開展專項行動,推進跨運輸方式的客運聯(lián)程系統(tǒng)建設(shè),實現(xiàn)不同客運方式間的有效銜接,以此提升客運服務(wù)安全便捷水平。2020 年11 月,新華社發(fā)布《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十4個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》,其中也指出“發(fā)展旅客聯(lián)程運輸”仍是“十四五”時期交通強國建設(shè)工程的重要舉措之一。

      隨著近年來我國交通運輸行業(yè)的快速發(fā)展,以民航、高鐵、高速公路等為代表的主干旅客運輸方式的整體運能和服務(wù)水平也在不斷提高,現(xiàn)代化、智能化、一體化的旅客綜合運輸體系正在加速形成。已有不少人員聚集度較高、出行頻率較高且經(jīng)濟發(fā)展水平較高的地區(qū),如京津冀、長三角、珠三角等比較成熟的城市群,積極發(fā)展完善了空鐵聯(lián)運、空巴聯(lián)運、公鐵聯(lián)運等旅客聯(lián)運業(yè)務(wù),并取得了一定的成效,滿足了部分跨域旅客對于聯(lián)程出行的日常需求[1]。

      但從總體上來看,我國旅客聯(lián)運業(yè)務(wù)發(fā)展仍處于起步階段,存在發(fā)展水平較低、發(fā)展基礎(chǔ)薄弱、市場主體不成熟、重點環(huán)節(jié)服務(wù)不到位、行業(yè)發(fā)展缺乏共識、基礎(chǔ)設(shè)施不適應(yīng)、信息共享難度較大、法規(guī)標(biāo)準(zhǔn)不協(xié)調(diào)以及體制機制缺乏協(xié)同等諸多困難和問題,亟待進一步的科學(xué)研究、市場優(yōu)化和新技術(shù)支撐。

      1.3 旅客聯(lián)運業(yè)務(wù)對大數(shù)據(jù)的需求

      旅客聯(lián)運是現(xiàn)代綜合交通運輸體系的重要組成部分,其服務(wù)核心是旅客,業(yè)務(wù)需求比較復(fù)雜,僅從對于大數(shù)據(jù)的需求方面來看的話,主要集中在數(shù)據(jù)源、平臺、融合建模以及創(chuàng)新應(yīng)用4個層面上。

      a)數(shù)據(jù)源層面:旅客聯(lián)運是典型的跨部門、跨市場主體的組織行為,其涉及的數(shù)據(jù)源較為分散,既有監(jiān)管部門匯總數(shù)據(jù),也有運營單位實時數(shù)據(jù),還有第三方企業(yè)的業(yè)務(wù)數(shù)據(jù),多源數(shù)據(jù)的采集、采購、存儲、計算是其后續(xù)應(yīng)用的基礎(chǔ)。

      b)平臺層面:區(qū)域性乃至全國性多式聯(lián)運數(shù)據(jù)平臺一直是有缺失的,對于鐵路、公路、航空、水運等聯(lián)運主體間基礎(chǔ)數(shù)據(jù)共享困難,導(dǎo)致銜接時“最后一公里”不暢通等問題,需要通過平臺的共享開放、標(biāo)準(zhǔn)化治理等手段來輔助實現(xiàn)。

      c)融合建模層面:旅客的聯(lián)程出行需求同聯(lián)運基礎(chǔ)資源的匹配程度是旅客聯(lián)運業(yè)務(wù)發(fā)展優(yōu)劣的衡量指標(biāo)之一,融合多源數(shù)據(jù)構(gòu)建出行預(yù)測模式,對于統(tǒng)籌規(guī)劃相關(guān)交通資源會有很大助力,比如旅客出行方式、各方式客流分擔(dān)率、旅客駐留時間等常用模型。

      d)創(chuàng)新應(yīng)用層面:“出行即服務(wù)”是旅客聯(lián)運的重要發(fā)展方向,但在既有技術(shù)條件下,單純依靠公路、鐵路、航空等公共承運方是很難完成旅客端到端的聯(lián)程服務(wù)需求的。因此,以數(shù)據(jù)為媒介提升對旅客全出行鏈的服務(wù)能力,打造提升旅客體驗的創(chuàng)新應(yīng)用顯得尤為重要。

      交通運輸部已籌建全國綜合交通運輸標(biāo)準(zhǔn)化技術(shù)委員會(編號TC571),對于旅客聯(lián)程運輸場景下涉及到的電子客票信息系統(tǒng)互聯(lián)互通技術(shù)規(guī)范進行了編制,一定程度上解決了數(shù)據(jù)源對接和平臺層面信息共享的部分難題。

      2 電信運營商大數(shù)據(jù)特性及應(yīng)用現(xiàn)狀

      2.1 運營商大數(shù)據(jù)的5V特性

      通信運營商大數(shù)據(jù)一直被認(rèn)為是大數(shù)據(jù)界的金礦,按照業(yè)界當(dāng)前的通用評價方法,從體量(Volume)、種類(Variety)、價值(Value)、速度(Velocity)和質(zhì)量(Veracity)這5個維度分析通信運營商大數(shù)據(jù)的特性。

      a)體量大:在體量方面,電信運營商數(shù)據(jù)具有“大而廣”的特點,即數(shù)據(jù)量巨大且覆蓋面廣。截至2020年底,全國移動電話用戶總數(shù)達15.94 億戶,普及率為113.9 部/百人,固定互聯(lián)網(wǎng)寬帶接入用戶總數(shù)達4.84億戶。數(shù)以億計且不斷增長的用戶體量構(gòu)成了電信運營商數(shù)據(jù)應(yīng)用的基石,其采集基本不受地理環(huán)境、空間分布和經(jīng)濟發(fā)展等外部因素影響。

      b)種類多:由于用戶的通信行為、網(wǎng)絡(luò)行為等依賴于電信運營商,故其數(shù)據(jù)類型包括身份、位置、社交、消費、終端、上網(wǎng)等多個維度,涉及結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)等,種類極為豐富,而且各數(shù)據(jù)維度間存在以用戶ID 為主鍵的強關(guān)聯(lián)特征。從數(shù)據(jù)來源區(qū)分,電信運營商大數(shù)據(jù)來源涵蓋O 域(Operation support system,運營支撐系統(tǒng))、B 域(Busi?ness support system,業(yè)務(wù)支撐系統(tǒng))和M 域(Manage?ment support system,管理支撐系統(tǒng))3 大支撐域的內(nèi)部數(shù)據(jù),以及眾多生態(tài)合作伙伴的業(yè)務(wù)數(shù)據(jù)。

      c)價值密度高:一般來說,大數(shù)據(jù)雖然體量巨大,但其價值密度卻遠(yuǎn)遠(yuǎn)低于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中的標(biāo)準(zhǔn)化數(shù)據(jù),需要提煉和深度挖掘才可體現(xiàn)其價值。但由于國內(nèi)已實現(xiàn)100%的通信用戶實名制入網(wǎng),使得電信運營商大數(shù)據(jù)的價值密度相對較高。電信運營商可以使用用戶號碼為唯一ID 來整合各類行為數(shù)據(jù),無需進行漫無目的的大規(guī)模挖掘?qū)嶒?,其刻畫用戶、洞察行為的完整性和便捷性是其他任何行業(yè)數(shù)據(jù)都難以企及的。

      d)存取速度及增速快:電信運營商具備天然的數(shù)據(jù)屬性,在多年處理用戶信息以及消費數(shù)據(jù)的過程中,通過計費、管理、服務(wù)、運營等業(yè)務(wù)平臺的多維度建設(shè),已經(jīng)建成可以快速處理上百PB海量用戶數(shù)據(jù)的計算分析平臺,有豐富的內(nèi)部實踐經(jīng)驗,能夠快速地對外提供數(shù)據(jù)加工、建模計算和挖掘服務(wù)。而且,每時每刻都在不斷產(chǎn)生的海量通信數(shù)據(jù),使得其體量增長速度極快,充分滿足大數(shù)據(jù)價值挖掘的鮮活性要求。

      e)優(yōu)質(zhì)且真實可靠:不同于大部分互聯(lián)網(wǎng)數(shù)據(jù),電信運營商數(shù)據(jù)皆是實名用戶基于實際行為的信息記錄,且為滿足核心業(yè)務(wù)需要,電信運營商內(nèi)部對于各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)化、質(zhì)量稽核、運維管理等皆有較長時間的規(guī)范化實踐,使得該部分?jǐn)?shù)據(jù)可信度和可靠性有很大程度的提升,初步構(gòu)建了干凈高品質(zhì)的數(shù)據(jù)資產(chǎn)庫,這也為數(shù)據(jù)對外服務(wù)奠定了堅實基礎(chǔ)。

      2.2 電信運營商常用數(shù)據(jù)類別

      數(shù)據(jù)是電信運營商的立身之本,對外用于行業(yè)服務(wù)的數(shù)據(jù)主要涵蓋身份、位置、上網(wǎng)、社交、支出、通信、終端和時序8大類[2]。

      a)身份數(shù)據(jù):具備實名制的客戶資料數(shù)據(jù),覆蓋完整且真實準(zhǔn)確,還可基于實際行為進行驗證,可用于判定用戶的信用程度等。

      b)位置數(shù)據(jù):手機CS 域信令具有基站位置更新、開關(guān)機動作以及位置區(qū)切換等信息,相比PS域和話單更容易作為基礎(chǔ)數(shù)據(jù)進行分析,可用于洞察用戶出行特征、遷移動態(tài)、停留時長等。

      c)上網(wǎng)數(shù)據(jù):基于用戶訪問哪些網(wǎng)址、下載哪些應(yīng)用、訪問哪些內(nèi)容等的日志數(shù)據(jù),可了解用戶的出行偏好、線上喜好等。

      d)社交數(shù)據(jù):基于通信交往圈的大小、主被叫和時間序列,可用于分析用戶的社交特征。

      e)支出數(shù)據(jù):基于用戶通信消費數(shù)據(jù),比如流量費用、短信費用、語音費用以及新業(yè)務(wù)費等,了解用戶消費特征及基本信用情況。

      f)通信數(shù)據(jù):通過用戶的通信使用情況,比如本地通話、長途通話等,了解用戶通話行為特征。

      g)終端數(shù)據(jù):識別記錄用戶的移動手機終端型號,了解用戶手機使用特征、換機周期以及消費水平、消費偏好等。

      h)時序數(shù)據(jù):將用戶上網(wǎng)、位置、通話等行為按照時間排列,了解更多規(guī)律性特征以便進行更深度的行業(yè)洞察。

      2.3 電信運營商大數(shù)據(jù)在交通運輸行業(yè)的應(yīng)用情況

      運營商數(shù)據(jù)在交通運輸行業(yè)的應(yīng)用由來已久,早在2009 年就有利用運營商提供的手機信令數(shù)據(jù)開展交通規(guī)劃相關(guān)研究的探索,但當(dāng)時受限于數(shù)據(jù)量、網(wǎng)絡(luò)和技術(shù)水平等原因,還僅限于理論研究,2015 年開始出現(xiàn)高速增長,至今熱度不減。從產(chǎn)學(xué)研用的角度來看,運營商大數(shù)據(jù)在交通運輸行業(yè)的應(yīng)用和實踐已經(jīng)逐步進入成熟期,可用且能發(fā)揮較大效用的場景也已經(jīng)較為明確,其應(yīng)用場景可基本總結(jié)為以下幾個方面(見表1)。

      表1 運營商大數(shù)據(jù)在交通運輸行業(yè)應(yīng)用場景分類

      隨著電信運營商與行業(yè)客戶的進一步磨合,對于交通運輸行業(yè)市場會越來越清晰,逐步聚焦可規(guī)?;瘡?fù)制的應(yīng)用場景,最大限度地挖掘和發(fā)揮自身大數(shù)據(jù)的內(nèi)在價值。

      3 旅客聯(lián)運場景下電信運營商大數(shù)據(jù)應(yīng)用思路

      3.1 總體思路

      旅客聯(lián)運場景本身比較復(fù)雜,一段完整的聯(lián)程出行一般涉及多個城市、多個交通樞紐以及多種交通運輸方式,時間和空間跨度較大,難以進行全方位的分析。因此引入電信運營商大數(shù)據(jù)之后,便可利用其時空連續(xù)、覆蓋范圍廣的優(yōu)勢,從旅客本身的行為特征入手,反向研究聯(lián)程運輸這一組織方式的現(xiàn)狀、問題和發(fā)展方向等,用以輔助宏觀洞察、缺陷發(fā)現(xiàn)、規(guī)劃設(shè)計以及線路優(yōu)化等,最終實現(xiàn)“現(xiàn)象—數(shù)據(jù)—決策—行動—評估—更好的現(xiàn)象”這樣的良性應(yīng)用閉環(huán),讓數(shù)據(jù)助推現(xiàn)實發(fā)展,總體思路如圖1所示。

      圖1 總體思路示意圖

      3.2 關(guān)鍵技術(shù)及應(yīng)用解決路徑

      根據(jù)上文提到的總體應(yīng)用思路,其核心點之一在于如何能用可獲取的數(shù)據(jù)更精準(zhǔn)地反映業(yè)務(wù)現(xiàn)象,這也是體現(xiàn)運營商數(shù)據(jù)資源價值以及數(shù)據(jù)挖掘水平的地方。通過項目實踐和行業(yè)理解,總結(jié)了這一過程中涉及到的5 個關(guān)鍵技術(shù)點,并提出了可落地的解決路徑,具體闡述如下。

      3.2.1 旅客出行鏈提取

      運營商大數(shù)據(jù)要想在旅客聯(lián)運場景下應(yīng)用,首先要做的便是將每個旅客完整的出行鏈(Trip Chain,TC)拆分出來。

      按照交通規(guī)劃業(yè)務(wù)中的常用定義,旅客從出發(fā)地到目的地的移動過程被稱為一次出行。一次出行有2個端點,開始的端點叫起點(即出發(fā)地Origin,簡稱O點),結(jié)束的端點叫訖點(即目的地Destination,簡稱D點),中間過程可能有城際出行、市內(nèi)出行、樞紐換乘等多種交通行為,所以業(yè)界把出行分析也叫作起訖點分析(即OD 分析)。如果把某個旅客個體在一段時間內(nèi)所有的起訖點按照時間順序連接起來,可以形成由出行起訖點構(gòu)成的序列,這種“時間+位置”組成的有序序列被稱為出行鏈[3]。出行鏈中的每個點代表出行的一個端點,每條連線代表一次出行,圖2給出了一次完整的出行鏈?zhǔn)疽?。因此要提取旅客的出行鏈,必須約定好時間和空間范圍。

      圖2 一次完整的出行鏈?zhǔn)疽鈭D

      按照指定的空間尺度(省、市、縣或圈定的某個區(qū)域均可)和時間周期,可以獲取手機終端用戶在這段時間內(nèi)的起始位置,然后根據(jù)該手機終端在運營商基站之間的信令切換數(shù)據(jù)推導(dǎo)出其在空間位置上的移動軌跡,持續(xù)跟蹤至其在某一個駐留點持續(xù)時間大于約定的閾值(如市域一般約定為6 h,縣域約定為2 h等,可根據(jù)實際空間尺度情況進行調(diào)整),最終確定其交通軌跡為一次完整的TC,并將該時空序列數(shù)據(jù)提取出來。在此過程中,可以結(jié)合各POI點的土地屬性,進一步分析用戶軌跡特征,根據(jù)事先設(shè)定好的空間、時間和頻次閾值,將從信令數(shù)據(jù)中提取出來的各軌跡點按照駐留點、移動點等進行劃分,為簡便起見,駐留點之間的變化即可判斷為出行。

      3.2.2 旅客群體劃分

      對于旅客屬性的識別可用于對特定的群體進行觀察分析,比如學(xué)生群體、外來務(wù)工群體、旅游偏好群體等,結(jié)合用戶入網(wǎng)實名制資料及出行特征,可以構(gòu)建初步的群體識別模型,對具備共性行為特征的用戶群進行篩選,條件具備的場景下可進行二次核驗,提高模型的準(zhǔn)確性。

      運營商信令數(shù)據(jù)中具備豐富的數(shù)據(jù)維度來幫助解決此類問題,比如針對學(xué)生群體(主要指成年學(xué)生群體)的判斷,可以聚焦在年齡(身份證第7~14位)、常駐POI是否為高校、常駐時間和天數(shù)等明顯特征;針對外來務(wù)工群體的判斷,可以聚焦在籍貫(身份證前6位)、職駐地、籍貫地與職駐地之間的往返規(guī)律等特征;針對旅游偏好群體的判斷,可以聚焦在職駐地、外地駐留時間、外地景區(qū)POI駐留時間、旅游類APP或網(wǎng)站瀏覽次數(shù)等特征。有了這些基本的判斷依據(jù)之后,便可以根據(jù)數(shù)據(jù)的統(tǒng)計特征進行加工邏輯設(shè)計,選取置信度較高(一般為95%)的置信區(qū)間節(jié)點作為臨界點,并進行多次擬合驗證。按照擬合通過后的加工邏輯對生產(chǎn)數(shù)據(jù)進行加工,生成相應(yīng)的屬性標(biāo)簽。當(dāng)需要對這些特殊群體進行專題分析時,便可以根據(jù)屬性標(biāo)簽進行快速提取。

      重點人群在特定時間段內(nèi)的出行需求受到越來越多的關(guān)注,如每年的春運期間,鐵路部門就針對學(xué)生群體和外來務(wù)工群體制定了相關(guān)的服務(wù)政策,一定程度上對這些群體的集中出行進行了疏解。

      3.2.3 出行方式識別

      旅客出行方式的識別一直是重點也是難點,理論上來說,基于手機信令數(shù)據(jù),結(jié)合飛機、高鐵、汽車等常見交通方式的篩選原理和判定準(zhǔn)則,在算法設(shè)計時預(yù)設(shè)好判定條件,并根據(jù)核驗情況調(diào)整閾值標(biāo)準(zhǔn),便可以進行比較精準(zhǔn)的劃分。但由于運營商基站數(shù)據(jù)本身存在誤差較大、不夠精細(xì)、臟數(shù)據(jù)多等問題,需要較為繁雜的數(shù)據(jù)清洗和業(yè)務(wù)驗證過程。

      根據(jù)旅客聯(lián)程出行時表現(xiàn)出來的駐留位置變動、行駛路徑特征以及行駛速度等,可以將聯(lián)程聯(lián)運中最常用的公路、鐵路、航空3 種主干方式先區(qū)分出來,主要技術(shù)路線可以分為4步[4]。

      a)交通場站POI點歸集。由于旅客出行的3 種主干方式必然會跟相應(yīng)的交通場站發(fā)生關(guān)聯(lián),公路對應(yīng)汽車站或高速收費站、鐵路對應(yīng)火車站(含高鐵站)、航空對應(yīng)機場,且換乘駐留跟過站經(jīng)停也會呈現(xiàn)出完全不同的基站信息,這些特征對基于交通樞紐的聯(lián)運情況分析可以起到很好的輔助作用。因此,可以建立專門的場站POI表單,將所需空間尺度內(nèi)的汽車站、高速收費站、火車站和機場的經(jīng)緯度信息進行統(tǒng)一歸集和動態(tài)更新。

      b)旅客位置與場站中心位置匹配。通過經(jīng)緯度信息,將旅客出行鏈中的端點信息與目標(biāo)場站中心點進行擬合,在有效范圍內(nèi)的保留,有較大出入的非有效出行數(shù)據(jù)暫時剔除。在此過程中需要根據(jù)不同場站的實際規(guī)模進行換算,得到其最佳閾值半徑,比如汽車站有效半徑閾值在150 m~500 m、火車站有效半徑閾值在500 m~2 000 m、機場有效半徑閾值在1 000 m~3 000 m,特大或特小的場站根據(jù)實際情況調(diào)整。

      c)根據(jù)匹配的場站類型初步判斷出行方式。航空方式判定最為簡單,一次出行的2 個端點場站皆為機場,且中間過程無任何行駛路徑,即可判定;鐵路出行的2 個端點皆為火車站;其他起訖點中有汽車站或收費站的都可暫判定為公路出行,更細(xì)致一點可以區(qū)分公共汽車和自駕車,但區(qū)分可信度不像航空和鐵路方式那么準(zhǔn)確。

      d)根據(jù)行駛速度校驗出行方式判斷結(jié)果。旅客選擇這3 種主干交通工具的行駛速度差距較大,一般來說,民航最快、鐵路次之、公路最慢,因此最后一步可以根據(jù)起訖點間距離跟花費時間,大致推算出行駛速度,同經(jīng)驗閾值進行對比,以此作為二次核驗依據(jù)。

      通過以上方法,可較為簡便且準(zhǔn)確地從海量的信令數(shù)據(jù)中將聯(lián)程旅客的出行方式先一一甄別出來,運算量和成本較低,基本可以滿足大規(guī)??臻g尺度下的數(shù)據(jù)分析要求。

      3.2.4 熱門路線計算

      在點到點之間總有一條線路因受歡迎或需求量大等原因聚集大部分的旅客,分析這個問題可以為聯(lián)運設(shè)施規(guī)劃和調(diào)配提供參考。基于運營商大數(shù)據(jù)進行熱門路線的發(fā)現(xiàn)和識別需要對軌跡數(shù)據(jù)進行較深度的挖掘,目前主要采用DBScan這種較為成熟高效的聚類算法來實現(xiàn)[5]。

      一般識別、計算過程可簡單分為4個步驟。

      第1步:從提取的出行鏈中截取所有滿足條件的出行軌跡數(shù)據(jù)。

      第2步:使用最短描述軌跡方法合并連續(xù)時間相同經(jīng)緯度的數(shù)據(jù),得到用戶的駐留點P~(p1,p2,…,pn)。

      第3步:按照時間順序依次連接用戶的駐留位置點,得到用戶的出行軌跡段數(shù)據(jù)Trj,如Tr1=(p1p2)、Tr2=(p2p3)。

      第4步:采取分布式DBScan 聚類方法對大量軌跡段進行聚類計算,具體計算公式如下:

      式中:

      dper——軌跡段Tr1與Tr2的垂直距離

      dang——軌跡段Tr1與Tr2的角度距離

      dpar——軌跡段Tr1與Tr2的平行距離

      最終得到聚類后的軌跡段合集并進行最短續(xù)接軌跡端的遞歸計算,熱門軌跡計算過程示意圖如圖3所示。

      圖3 熱門軌跡計算過程示意圖

      根據(jù)各最短路徑的相應(yīng)人數(shù)即可進行TOP 排序,涉及場站為起訖點的熱門路徑計算也類似。

      3.2.5 旅客流量預(yù)測

      電信運營商大數(shù)據(jù)具有很強的時空屬性,所以利用該類數(shù)據(jù)進行客流量預(yù)測時,更趨向于進行時間序列預(yù)測。但時間序列很容易受到各種偶然因素的影響,呈現(xiàn)出不規(guī)則的波動狀態(tài),其分析方法只適用于近期以及短期的預(yù)測,而且預(yù)測效果并不盡如人意,比如平滑法、自回歸模型、移動平均模型、自回歸移動平均模型、差分自回歸移動平均模型等,需要在生產(chǎn)環(huán)境中不斷地調(diào)參優(yōu)化。

      目前常用的是差分自回歸移動平均模型,也叫ARIMA 模型,它是自回歸移動平均模型的升級版,表達式如式(2),記為ARMA()p,q,主要針對非平穩(wěn)時間序列進行預(yù)測[6]。

      式中:

      Zt——t時刻的預(yù)測值

      a——均值

      βi——第i個權(quán)重

      p——自回歸階數(shù)

      q——移動平均階數(shù)

      ARIMA(p,d,q)為ARMA(p,q)結(jié)合有限次差分運算而來,以便將非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列,其中d是差分階數(shù),通過修正這些參數(shù)構(gòu)成多元線性回歸函數(shù),差分法的計算公式如下所示。

      所以可以基于ARIMA()p,d,q模型,經(jīng)過時間序列平穩(wěn)性檢驗、時間序列隨機性檢驗和模型識別與定階3 個基本步驟,將相關(guān)的3 個參數(shù)計算出來,并進行模型擬合驗證。該模型在準(zhǔn)實時人口數(shù)據(jù)預(yù)測方面具有較高的精度,也因此在交通運輸行業(yè)應(yīng)用比較廣泛,但仍具有一定的局限性,需要同具體場景下的其他數(shù)據(jù)進行聯(lián)合檢驗使用,以提高預(yù)測的準(zhǔn)確性。

      4 中國聯(lián)通全量數(shù)據(jù)應(yīng)用實踐

      作為通信運營商,中國聯(lián)通早在2010年就提出了數(shù)據(jù)大集中戰(zhàn)略。2012 年開始組建全國數(shù)據(jù)中心,實現(xiàn)了31省全網(wǎng)數(shù)據(jù)的統(tǒng)一集中匯聚與管理。其“一點集中,服務(wù)全國”的優(yōu)勢為各個空間尺度下交通運輸行業(yè)的相關(guān)分析和應(yīng)用提供了便利條件。

      基于以上應(yīng)用思路,本文進行了以下幾個層面的應(yīng)用探索和實踐,以此來驗證運營商數(shù)據(jù)賦能旅客聯(lián)運場景的可行性。

      4.1 三級空間尺度下的旅客出行特征分析

      按照空間尺度劃分標(biāo)準(zhǔn),將旅客出行按全國、省、市進行3 個級別的流動分析和指標(biāo)監(jiān)測,幫助各級交通運輸管理部門宏觀掌握旅客出行的數(shù)量和發(fā)展趨勢,而且可以基于信令數(shù)據(jù)統(tǒng)計T-1 小時時段內(nèi)的實時出行人口數(shù)量,相比傳統(tǒng)統(tǒng)計方式更加即時、鮮活。

      以全國范圍為例,管理部門一般主要聚焦在旅客出行數(shù)量和熱門排行2個層面上,以區(qū)縣流動OD為基礎(chǔ),對于整體的旅客出行鏈進行特征分析,為后續(xù)進行聯(lián)程聯(lián)運規(guī)劃或問題發(fā)現(xiàn)打好基礎(chǔ)。

      a)旅客出行數(shù)量層面:主要關(guān)注在當(dāng)日旅客出行總量、實時出行人數(shù)、按小時人數(shù)趨勢以及省內(nèi)、省際出行分布情況等方面,按不同的時間范圍和空間范圍統(tǒng)計分析旅客出行數(shù)量,將這幾個數(shù)據(jù)指標(biāo)所代表的現(xiàn)實意義進行了詳細(xì)分析,結(jié)合信令數(shù)據(jù)內(nèi)容構(gòu)建了區(qū)縣級的小時軌跡表、日軌跡表等,對應(yīng)各指標(biāo)維度進行口徑判定和持續(xù)矯正,旅客出行數(shù)量統(tǒng)計表說明見表2。

      表2 旅客出行數(shù)量統(tǒng)計表說明

      b)熱門排行層面:從全國范圍上看旅客出行軌跡會呈現(xiàn)一個很大規(guī)模的宏觀態(tài)勢,很難快速地進行更深的研究,那么對于一些旅客聚集度較高、重合度較高的OD 進行二次分析便會有事半功倍的效果,因此對全國熱門的出行目的地、熱門交通樞紐(主要指火車站、汽車站和機場)、熱門省際出行OD、熱門城市出行OD 以及熱門中轉(zhuǎn)城市等數(shù)據(jù)指標(biāo)的拆分可以提高對旅客出行特征的認(rèn)知水平,同樣本文也進行了數(shù)據(jù)口徑的研究,熱門排行統(tǒng)計表說明見表3。

      表3 熱門排行統(tǒng)計表說明

      任意選取某一日數(shù)據(jù),以2021年4月1日為例,將上述數(shù)據(jù)指標(biāo)按照梳理好的口徑定義進行了計算,原始數(shù)據(jù)來自中國聯(lián)通數(shù)據(jù)中心,為全量中國聯(lián)通用戶數(shù)據(jù),具體計算結(jié)果如表4所示。

      表4 2021-04-01旅客出行數(shù)量及熱門排行榜

      將計算結(jié)果同有關(guān)部門統(tǒng)計數(shù)據(jù)及其他渠道獲取的數(shù)據(jù)進行了對標(biāo)分析,除少數(shù)指標(biāo)有量級出入外,大部分?jǐn)?shù)據(jù)擬合度較好。當(dāng)然,某一天的數(shù)據(jù)不能完全說明模型的可靠性。本文建立了幾個核心指標(biāo)的稽核機制,以自動化對比方式按天進行核對,以此反推實時數(shù)據(jù)口徑的合理性,并根據(jù)異常數(shù)據(jù)情況進行模型口徑的調(diào)整,目前已經(jīng)可以較為準(zhǔn)確地為需求方提供服務(wù)。

      4.2 客運方式及旅客聯(lián)程出行洞察分析

      優(yōu)化旅客聯(lián)運的基礎(chǔ)是對其所依賴的運輸方式現(xiàn)狀的掌握,因此對全國及各省鐵路、道路客運、水運、航空展開了分方式客運量分析與預(yù)測,結(jié)合出行旅客屬性以及出行時間、距離等規(guī)律分布情況,展開多方式聯(lián)程出行分析,實現(xiàn)全國聯(lián)程情況概覽。

      該部分應(yīng)用主要聚焦在公路、鐵路、水路等主干客運方式概況和旅客聯(lián)程出行現(xiàn)狀分析2 個方面,依賴于出行方式識別、旅客流量預(yù)測等算法模型的性能和準(zhǔn)確度,是從旅客出行鏈出發(fā)進行研判的重要內(nèi)容。

      a)主干客運方式概況。以旅客軌跡數(shù)據(jù)為基準(zhǔn),根據(jù)出行方式識別算法構(gòu)建相關(guān)模型,推算出不同的主干運輸方式下旅客的屬性特征和行為特征等,幫助需求方對單一客運方式進行分析,主干客運方式統(tǒng)計表說明見表5。

      表5 主干客運方式統(tǒng)計表說明

      b)旅客聯(lián)程出行現(xiàn)狀?;趯Ω鲉我恢鞲煽瓦\方式的分析,對空空、空鐵、空巴、鐵鐵、鐵空、鐵巴等聯(lián)合使用2 種出行方式的旅客情況進一步展開分析,將其存在聯(lián)程出行特征的軌跡拆分出來,統(tǒng)計其距離、時長、速度等核心指標(biāo)數(shù)據(jù),并對旅客聯(lián)程過程中的換乘次數(shù)、時長等影響旅客滿意度的指標(biāo)單獨進行統(tǒng)計計算,旅客聯(lián)程出行統(tǒng)計表說明如表6所示。

      表6 旅客聯(lián)程出行統(tǒng)計表說明

      任意選取一日數(shù)據(jù),以2021年4月1日為例,我們將上述數(shù)據(jù)指標(biāo)按照梳理好的口徑定義進行了計算,具體計算結(jié)果如表7 所示,基本能與其他渠道相關(guān)數(shù)據(jù)保持一致。

      表7 2021-04-14主干客運及旅客聯(lián)程出行數(shù)據(jù)分析

      4.3 春運期間客運專題分析

      2019 年春運大數(shù)據(jù)分析工作中,相關(guān)研究機構(gòu)首次增加了旅客聯(lián)程運輸場景下的分析并得到了初步的研究成果,對于當(dāng)年以及后續(xù)的春運工作安排也起到了一定的輔助作用。

      2021 年春運從2021 年1 月28 日 到2021 年3 月8日,期間利用中國聯(lián)通全量數(shù)據(jù)對客運量等指標(biāo)進行了統(tǒng)計與預(yù)測,并針對春運期間返鄉(xiāng)、返程、復(fù)工、聯(lián)運等專題性指標(biāo)展開分析,輔助春運期間交通運輸行業(yè)管理部門進行客運監(jiān)管與交通資源分配調(diào)度決策,同時根據(jù)出行者屬性及偏好特征區(qū)分農(nóng)民工、大學(xué)生等不同群體,實現(xiàn)特定群體的出行分析。該部分?jǐn)?shù)據(jù)分析結(jié)果也得到了主管部門的大力支持和認(rèn)可,春運旅客聯(lián)程運輸分析統(tǒng)計指標(biāo)說明見表8。

      表8 春運旅客聯(lián)程運輸分析統(tǒng)計指標(biāo)說明

      以2021 年3 月8 日春運最后一天的數(shù)據(jù)為例,將上述數(shù)據(jù)指標(biāo)按照梳理好的口徑定義進行了計算,具體結(jié)果如表9 所示,為主管部門及時了解春運進展提供了多維數(shù)據(jù)參考。

      表9 2021-03-18旅客聯(lián)程運輸數(shù)據(jù)分析結(jié)果

      5 結(jié)束語

      電信運營商大數(shù)據(jù)天然的時空連續(xù)性是很多行業(yè)大數(shù)據(jù)所無法比擬的,也是其在交通運輸行業(yè)中受到多方關(guān)注的主要原因,基于時空特性的研究也取得了很多突破性的進展,并得以在實際項目中應(yīng)用和驗證,旅客聯(lián)運場景便是其一。但由于旅客聯(lián)運業(yè)務(wù)本身發(fā)展仍處于初期,且電信運營商數(shù)據(jù)本身和相關(guān)數(shù)據(jù)處理技術(shù)也有一定的局限性,雙方都有待進一步發(fā)展完善。相信在具體應(yīng)用場景下的不斷磨合探索,必然會對2個行業(yè)的數(shù)字化轉(zhuǎn)型進程有所進益。

      猜你喜歡
      旅客運營商用戶
      非常旅客意見簿
      我是人
      故事大王(2018年3期)2018-05-03 09:55:52
      關(guān)注用戶
      商用汽車(2016年11期)2016-12-19 01:20:16
      關(guān)注用戶
      商用汽車(2016年6期)2016-06-29 09:18:54
      給小旅客的禮物
      空中之家(2016年1期)2016-05-17 04:47:43
      關(guān)注用戶
      商用汽車(2016年4期)2016-05-09 01:23:12
      取消“漫游費”只能等運營商“良心發(fā)現(xiàn)”?
      消費者報道(2016年3期)2016-02-28 19:07:30
      第一章 在腐敗火上烤的三大運營商
      IT時代周刊(2015年9期)2015-11-11 05:51:43
      三大運營商換帥不是一個簡單的巧合
      IT時代周刊(2015年9期)2015-11-11 05:51:27
      三大運營商換帥
      IT時代周刊(2015年9期)2015-11-11 05:51:24
      云霄县| 玛曲县| 屯昌县| 武山县| 平武县| 股票| 保山市| 石景山区| 繁峙县| 泽州县| 中山市| 离岛区| 远安县| 崇阳县| 明溪县| 梧州市| 武陟县| 吉安县| 老河口市| 烟台市| 大埔县| 邹平县| 鞍山市| 青浦区| 灌云县| 霍林郭勒市| 永城市| 安泽县| 正定县| 福清市| 阿拉善右旗| 汪清县| 沽源县| 和田县| 三台县| 开阳县| 宾阳县| 清河县| 韩城市| 城口县| 安溪县|