• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      社會交通中的社會信號分析與感知

      2021-07-25 17:49:28陳虹宇呂宜生陳圓圓王飛躍
      自動化學(xué)報 2021年6期
      關(guān)鍵詞:數(shù)據(jù)源社交交通

      陳虹宇 艾 紅 王 曉 呂宜生 陳圓圓 王飛躍

      交通作為城市建設(shè)的重要領(lǐng)域,其發(fā)展高度標(biāo)志著城市的現(xiàn)代化程度.20 世紀(jì)第二次世界大戰(zhàn)后,各國交通隨經(jīng)濟(jì)不斷增長而迅速發(fā)展,其中以道路交通為代表的城市交通發(fā)展尤為顯著.然而隨著城市化進(jìn)程加快、城市人口和車輛數(shù)量激增,我國各大中城市道路交通逐漸出現(xiàn)了擁堵、事故以及污染等諸多問題,各類公共交通的積極探索和大力推廣未能有效緩解普遍存在的不良交通狀況,引起了交通領(lǐng)域研究人員的廣泛關(guān)注.為逐漸改善交通污染情況、完善交通安全保障、提升交通運(yùn)行效率,各國專家學(xué)者從20 世紀(jì)60、70 年代便開始積極尋找解決方法,在通訊、傳感、控制及計算機(jī)等領(lǐng)域的發(fā)展推動下,最終在上世紀(jì)末就“智能交通”這一整體發(fā)展目標(biāo)達(dá)成共識,提出構(gòu)建智能交通系統(tǒng)以整合交通數(shù)據(jù)信息,并進(jìn)行了許多積極的探索與實踐.智能交通系統(tǒng)(Intelligent transportation systems,ITS)是未來交通系統(tǒng)的發(fā)展方向,它是將先進(jìn)的信息技術(shù)、數(shù)據(jù)通訊傳輸技術(shù)、電子傳感技術(shù)、控制技術(shù)及計算機(jī)技術(shù)等有效地集成運(yùn)用于整個地面交通管理系統(tǒng)而建立的一種在大范圍內(nèi)、全方位發(fā)揮作用的,實時、準(zhǔn)確、高效的綜合交通運(yùn)輸管理系統(tǒng).在智能交通研究的早期階段,受限于采集設(shè)備、技術(shù)條件和經(jīng)費(fèi)資金等因素,研究數(shù)據(jù)多來源于現(xiàn)實世界的物理檢測設(shè)備.目前,相關(guān)研究技術(shù)已發(fā)展成熟并得到廣泛應(yīng)用,但物理檢測設(shè)備存在的時空覆蓋范圍有限、運(yùn)營維護(hù)成本較高且更新速度較慢等特點,使其所得數(shù)據(jù)無法全面實時地反映實際交通狀況以及突發(fā)性交通事件信息.

      進(jìn)入21 世紀(jì)以來,軟硬件系統(tǒng)和設(shè)備的快速發(fā)展完善和算法技術(shù)的持續(xù)更新優(yōu)化,為智能交通的進(jìn)一步研究和發(fā)展帶來了新的機(jī)遇.一方面,智能手機(jī)等便攜移動設(shè)備的廣泛普及以及移動互聯(lián)網(wǎng)和通信技術(shù)的快速發(fā)展,使得普羅大眾群體成為遍布于城市各個角落的無數(shù)“社會傳感器”[1?3].相比于傳統(tǒng)人為布設(shè)的物理傳感器,其能夠在一定程度上突破客觀因素的限制,通過人類自發(fā)的日?;顒訛楦黝I(lǐng)域研究提供日漸豐富且多種多樣的數(shù)據(jù)[4].另一方面,系統(tǒng)設(shè)備的更新為數(shù)據(jù)處理和應(yīng)用技術(shù)的優(yōu)化提供了良好的發(fā)展基礎(chǔ),進(jìn)而促進(jìn)了數(shù)學(xué)、計算機(jī)科學(xué)、交通學(xué)、語言學(xué)乃至社會學(xué)等學(xué)科領(lǐng)域的交叉融合.同時,大數(shù)據(jù)時代為數(shù)據(jù)挖掘、自然語言處理、深度學(xué)習(xí)等新興技術(shù)的研究創(chuàng)造了前所未有的海量信息資源.因此,總體來看,智能交通研究的數(shù)據(jù)來源已從固定的物理空間逐步拓展到廣闊的網(wǎng)絡(luò)空間乃至復(fù)雜的社會空間,數(shù)據(jù)類型也由準(zhǔn)確的結(jié)構(gòu)化數(shù)據(jù)向模糊的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變.近十年來,作為與城市生活息息相關(guān)的用戶共享信息載體,Twitter、微博、滴滴出行和高德地圖等在線平臺的涌現(xiàn)也積累了大量交通相關(guān)的模糊非結(jié)構(gòu)化數(shù)據(jù),例如用戶對交通事故的描述和交通系統(tǒng)的看法等文字或圖片.這類數(shù)據(jù)對交通系統(tǒng)管控、交通決策制定等交通服務(wù)的提升優(yōu)化具有重要研究價值,能夠補(bǔ)充、完善甚至替代物理檢測設(shè)備所采集的結(jié)構(gòu)化數(shù)據(jù).因此,豐富的社會信號[5]為社會交通領(lǐng)域的出現(xiàn)和發(fā)展創(chuàng)造了良好的研究環(huán)境.

      目前,針對社會交通領(lǐng)域的綜述文獻(xiàn)并不多.Zheng 等[6]在社會交通領(lǐng)域發(fā)展的初期,針對近年來交通相關(guān)研究數(shù)據(jù)在類型和結(jié)構(gòu)的巨大變化,對該領(lǐng)域應(yīng)用與研究方向的影響進(jìn)行分析闡述.Lv 等[7]以圖形和文字的形式分別展示了領(lǐng)域內(nèi)研究人員、機(jī)構(gòu)和國家層面的合作模式,并分析與概述了近年來的研究方向及成果.經(jīng)過對國內(nèi)外現(xiàn)有的豐富研究成果的調(diào)研發(fā)現(xiàn),數(shù)據(jù)來源的多樣性、內(nèi)容的復(fù)雜性及結(jié)構(gòu)的多變性能夠在極大程度上決定相關(guān)研究的方向、內(nèi)容及方法.因此,本文選擇在當(dāng)前社會交通領(lǐng)域研究發(fā)展較為成熟的情況下,以該領(lǐng)域的研究數(shù)據(jù)為核心,對相關(guān)研究方法與應(yīng)用進(jìn)行更加詳細(xì)的分析與總結(jié),并明確指出該領(lǐng)域在下一階段的發(fā)展方向.

      本文主要分析與歸納了社會交通領(lǐng)域內(nèi)針對城市交通的已有研究工作,并對該領(lǐng)域的研究發(fā)展趨勢進(jìn)行展望.全文內(nèi)容安排如下:第1 節(jié)總述社會交通的發(fā)展背景、作用意義和研究現(xiàn)狀;第2 節(jié)分類介紹社會交通主要研究數(shù)據(jù)的來源、類型、所含信息及發(fā)展趨勢;第3 節(jié)分階段闡述數(shù)據(jù)處理過程所涉及的技術(shù)方法;第4 節(jié)分層說明社會交通研究與應(yīng)用的主要內(nèi)容和方向;第5 節(jié)分析與歸納當(dāng)前研究的不足與挑戰(zhàn)并展望未來的發(fā)展趨勢.

      1 社會交通

      “社會交通”這一概念由王飛躍于2014 年在文獻(xiàn)[5]中首次明確提出,用于描述在線交互式社會信號推動下涌現(xiàn)的智能交通新形態(tài)及其研究范式.文中,他指出了五個潛在的研究方向,包括:1)使用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和自然語言處理等方法進(jìn)行大數(shù)據(jù)和社交信號的交通分析;2)基于社交媒體、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)乃至萬物聯(lián)網(wǎng)的交通眾包機(jī)制;3)除基于位置服務(wù)(Location-based services,LBS)外的新服務(wù),如交通知識自動化.特別是基于決策的服務(wù)(Decision-based services,DBS)、基于任務(wù)的服務(wù)(Task-based services,TBS)、基于信息或智能的服務(wù)(Information or intelligence-based services,IBS)及基于知識的服務(wù)(Knowledge-based services,KBS);4)用于交通控制和管理的基于互聯(lián)網(wǎng)的代理技術(shù);5)更多其他研究和發(fā)展的實際應(yīng)用和反饋.與以社會學(xué)為研究重心的交通社會學(xué)不同,社會交通更側(cè)重于交通方面的研究.其隸屬于交通(工程)科學(xué),在以往僅考慮工程因素的研究基礎(chǔ)上增加對社會因素的分析,同時結(jié)合交通社會學(xué)與交通工程學(xué)的原理與研究方法,強(qiáng)調(diào)在交通系統(tǒng)中利用在線和交互式大數(shù)據(jù)進(jìn)行實時計算或嵌入式應(yīng)用等研究與應(yīng)用.因此,應(yīng)將社會交通定義為基于交通工程學(xué)與交通社會學(xué)的交叉學(xué)科.

      基于且不限于上述研究方向,社會交通能夠利用駕駛員、乘客、行人等群體在交通出行時相互作用的社會屬性,為其提供包括道路交通管制、交通資源調(diào)度和交通出行規(guī)劃等服務(wù).根據(jù)相關(guān)文獻(xiàn)調(diào)研,當(dāng)前社會交通的研究目標(biāo)可大致概括為:利用海量在線交互的社會信號進(jìn)一步提高智能交通系統(tǒng)的運(yùn)行效率.并且,其主要研究范圍為受復(fù)雜社會因素顯著影響的城市交通.然而,隨著研究范圍的不斷擴(kuò)大及程度的逐步深入,現(xiàn)有真實數(shù)據(jù)因公開數(shù)量有限、信息缺失嚴(yán)重以及數(shù)據(jù)融合困難等問題,已無法滿足社會交通領(lǐng)域內(nèi)日益豐富多樣的研究需求,這使得研究人員萌生了人工完善、補(bǔ)全甚至生成數(shù)據(jù)的研究思路,這一研究思路逐漸成為引導(dǎo)社會交通發(fā)展的新興研究趨勢.

      2 數(shù)據(jù)

      大量、準(zhǔn)確、可靠的數(shù)據(jù)是高效開展研究工作的基礎(chǔ).由于城市交通狀況的變化受各方面復(fù)雜因素的影響(見表1),因此相關(guān)研究對數(shù)據(jù)的要求較多.然而,傳統(tǒng)交通研究所用數(shù)據(jù)主要來自現(xiàn)實物理空間中的硬件檢測設(shè)備,其存在時空覆蓋范圍有限、實時更新速度慢、運(yùn)營維護(hù)成本高以及數(shù)據(jù)信息有限或缺失等問題,導(dǎo)致可利用有效數(shù)據(jù)不足.同時,數(shù)據(jù)壁壘廣泛存在于不同數(shù)據(jù)源之間,阻礙數(shù)據(jù)利用率的進(jìn)一步提升.在當(dāng)今大數(shù)據(jù)時代背景下,網(wǎng)絡(luò)空間不斷涌現(xiàn)出各類多樣的開源跨媒體異構(gòu)數(shù)據(jù),使得研究數(shù)據(jù)的來源由物理空間逐步拓展到網(wǎng)絡(luò)空間,為不同問題的解決提供豐富且充足的信息知識以作為研究依據(jù).且更進(jìn)一步地,便攜移動設(shè)備的普及和網(wǎng)絡(luò)通訊技術(shù)的發(fā)展將用戶關(guān)系等復(fù)雜的社會信息引入社會交通對網(wǎng)絡(luò)空間的研究范疇,進(jìn)而推動了社會交通這一新興研究領(lǐng)域的產(chǎn)生與發(fā)展[5?6].因此,本文將首先按照由“實”到“虛”的發(fā)展變化趨勢對社會交通領(lǐng)域的研究數(shù)據(jù)來源進(jìn)行闡述.

      表1 影響城市交通狀況變化的因素Table 1 Factors affecting the change of urban traffic conditions

      2.1 真實數(shù)據(jù)來源

      由于智能交通的研究逐步突破了物理和網(wǎng)絡(luò)空間,并在復(fù)雜交互式社會信號的推動下形成社會交通這一熱點領(lǐng)域,故本文將按照對應(yīng)所屬空間將現(xiàn)有應(yīng)用頻度較高的數(shù)據(jù)源劃分為物理空間數(shù)據(jù)源和網(wǎng)絡(luò)空間數(shù)據(jù)源.并根據(jù)數(shù)據(jù)來源的變化過程,分別簡要介紹各自所含數(shù)據(jù)的類型、信息、特點、應(yīng)用、挑戰(zhàn)或研究趨勢等內(nèi)容.

      2.1.1 物理空間數(shù)據(jù)源

      物理空間數(shù)據(jù)主要來源于現(xiàn)實物理世界中傳統(tǒng)的傳感設(shè)備[8?12]、配備GPS 和無線通訊設(shè)備的浮動車[13?15]以及移動通訊終端[16?18]等媒介,以及近年來迅速發(fā)展的共享單車[19?20]、公共巴士[10,21?22]、地鐵[22?35]等交通基礎(chǔ)設(shè)施系統(tǒng)和移動通信系統(tǒng).其中,作為相對完善的交通基礎(chǔ)設(shè)施智能系統(tǒng),城市地鐵系統(tǒng)是應(yīng)用于社會交通研究的典型及主要數(shù)據(jù)源之一.其基于地鐵系統(tǒng)的智能卡片記錄,主要包含進(jìn)出站信息及對應(yīng)時間記錄等描述移動軌跡和狀態(tài)的數(shù)據(jù).這類結(jié)構(gòu)化數(shù)據(jù)雖然相對準(zhǔn)確可靠,但由于所含信息內(nèi)容較少,難以精準(zhǔn)描述乘客的具體移動路線和過程.

      目前,大部分相關(guān)研究將其作為用于數(shù)據(jù)真實性對比驗證的輔助數(shù)據(jù)源,以進(jìn)一步確保研究結(jié)果的可靠性.Zhang 等[12]基于社交媒體數(shù)據(jù)和遙感數(shù)據(jù)進(jìn)行探究,提出一種多視圖學(xué)習(xí)方法來識別城市中的危險交通位置,并通過真實數(shù)據(jù)證明了提出方法的準(zhǔn)確有效性.同時,領(lǐng)域內(nèi)的專家學(xué)者們也在積極探索新興的物理空間數(shù)據(jù)來源,例如城市中隨處可見共享單車和日漸普及的輕軌、地鐵.基于北京市路網(wǎng)數(shù)據(jù)信息以及摩拜單車軌跡數(shù)據(jù).He 等[20]提出構(gòu)建一個違法停車檢測系統(tǒng),并以案例研究證明其效果優(yōu)于所有基準(zhǔn)方法.Lu 等[22]對新加坡公共交通系統(tǒng)數(shù)據(jù)進(jìn)行探究,提出一個用于游客出行識別與偏好分析的框架TourSense,并通過真實數(shù)據(jù)驗證了所提出框架的有效性.其他應(yīng)用可參考表2中所引相關(guān)文獻(xiàn).

      2.1.2 網(wǎng)絡(luò)空間數(shù)據(jù)源

      人類的實體活動及社會關(guān)系是影響交通變化的關(guān)鍵因素.因此,社交屬性是以智能交通系統(tǒng)為代表的復(fù)雜社會系統(tǒng)所用研究數(shù)據(jù)的重要特性.本文以數(shù)據(jù)信息內(nèi)容的生產(chǎn)與交換是否基于用戶關(guān)系為依據(jù),將網(wǎng)絡(luò)空間數(shù)據(jù)源進(jìn)一步劃分為非社交類數(shù)據(jù)源和社交類數(shù)據(jù)源.

      1)非社交類數(shù)據(jù)源

      網(wǎng)絡(luò)空間中的非社交類數(shù)據(jù)源通常為在線地圖服務(wù)提供商[26?32]、簽到網(wǎng)站[33?37]、政府部門和公共場所或科研組織機(jī)構(gòu)等官方機(jī)構(gòu)或組織的公開信息發(fā)布網(wǎng)站[11,21,38?50],主要提供包括路網(wǎng)信息、交通事件報告、天氣預(yù)報或公共場所活動預(yù)告等在內(nèi)的文本信息,主要為單向發(fā)布的客觀信息而非用戶間的雙向交互信息.其所含信息能夠在確保真實可靠的前提下包含相對較多類別的內(nèi)容,但局限在于可用開放數(shù)據(jù)集相對較少、數(shù)據(jù)來源較分散且區(qū)域性較強(qiáng).

      依據(jù)這類信息與交通狀態(tài)變化的相關(guān)關(guān)系,可將其作為處理和分析的補(bǔ)充數(shù)據(jù)源以用于提高研究結(jié)果的精確度,這已成為近年來的一種研究趨勢.例如Rodrigues 等[21]提出了一種貝葉斯加法模型,其結(jié)合了智能公交卡記錄數(shù)據(jù)和公共場所官網(wǎng)的信息內(nèi)容,用以預(yù)測公共特殊活動下公共交通的需求總量.Cui 等[32]通過匹配來自Google Places 的興趣點(Point of interest,POI)數(shù)據(jù)和Twitter 的歷史數(shù)據(jù)以獲知每個POI 的對應(yīng)流行度,并使用貝葉斯神經(jīng)網(wǎng)絡(luò)(Bayesian neural network,BNN)模擬個體的日常出行線路并推斷出行目的.其他應(yīng)用可參考表2 中所引相關(guān)文獻(xiàn).

      表2 可用真實數(shù)據(jù)的類別、來源、類型、信息及研究實例Table 2 The categories,sources,data types,information and examples of available data

      2)社交類數(shù)據(jù)源

      網(wǎng)絡(luò)空間中包括Twitter、微博、貼吧、論壇和出行服務(wù)等在線應(yīng)用程序、平臺或網(wǎng)站在內(nèi)的社交媒體(Social media)即為主要的社交類數(shù)據(jù)源.作為一種主要由廣大用戶產(chǎn)生內(nèi)容的新型數(shù)據(jù)來源,其數(shù)據(jù)具有大量、實時、易獲得等特點.近年來,多元化社交媒體的涌現(xiàn)與蓬勃發(fā)展,將交通相關(guān)數(shù)據(jù)涉及的復(fù)雜社會因素引入智能交通的研究范疇.同時,數(shù)據(jù)收集、存儲、處理技術(shù)的快速更新為大量開放且可用數(shù)據(jù)資源的研究帶來可能,極大豐富了交通相關(guān)的各類信息內(nèi)容,尤其是公眾對交通事件、出行方式和交通系統(tǒng)的看法、分析、評價甚至輿情等非結(jié)構(gòu)化數(shù)據(jù)[62?63].目前,相關(guān)研究將社交類數(shù)據(jù)源用于挖掘豐富多樣、全面且有價值的交通相關(guān)信息,以改善交通運(yùn)行狀況、提高交通資源利用率.

      因涉及文本、圖像等多種數(shù)據(jù)類型,社交類數(shù)據(jù)的應(yīng)用場景相對較廣.Hasnat 等[51]探究了Twitter 中基于位置的社交媒體數(shù)據(jù)并提出一種用于理解游客出行目的地選擇的方法,應(yīng)用條件隨機(jī)場(Conditional random field,CRF)模型分析并預(yù)測游客的目的地選擇模式類型.Giancristofaro 等[79]利用Instagram 社交網(wǎng)絡(luò)中的圖片、標(biāo)題及評論數(shù)據(jù),探究圖像和文本數(shù)據(jù)特征的結(jié)合以預(yù)測社交媒體中的交通情緒,最終實驗預(yù)測效果接近于人工分類.其他應(yīng)用可參考表2 中所引相關(guān)文獻(xiàn),具體的應(yīng)用情況將在第4 節(jié)中進(jìn)行詳細(xì)介紹與分析.相應(yīng)地,由于復(fù)雜社會因素的影響,所用數(shù)據(jù)的可靠性是相關(guān)研究需解決的首要問題.此外,用戶產(chǎn)生的非規(guī)范化、模糊、錯誤或缺失的數(shù)據(jù)對當(dāng)前的算法模型同樣提出挑戰(zhàn).

      除上述數(shù)據(jù)源外,調(diào)查問卷[30,32,80?83]、電臺廣播等媒介也能夠提供有效的相關(guān)數(shù)據(jù),但研究和應(yīng)用相對較少,在此不做詳細(xì)介紹.

      2.2 人工數(shù)據(jù)來源

      目前,針對單一數(shù)據(jù)源或數(shù)據(jù)類型的研究已經(jīng)相對成熟,但由于數(shù)據(jù)規(guī)模有限或真實性存疑等問題導(dǎo)致研究結(jié)果的準(zhǔn)確性和實時性存在一定局限.隨著可靠開放數(shù)據(jù)源的逐步擴(kuò)增和數(shù)據(jù)處理算法技術(shù)的不斷優(yōu)化,社會交通研究趨向于對多源異構(gòu)的跨媒體數(shù)據(jù)進(jìn)行融合、處理與分析[84],以實現(xiàn)各類信息的相互補(bǔ)充和驗證,從而逐步提高研究結(jié)果的準(zhǔn)確有效性.即便如此,現(xiàn)有真實有效數(shù)據(jù)的稀疏與缺失以及廣泛存在于不同數(shù)據(jù)源間的數(shù)據(jù)壁壘等研究難點仍然限制著社會交通深入且多樣化的發(fā)展.針對這些問題,近年來先進(jìn)技術(shù)算法的優(yōu)化與提出促使研究人員的解決思路由尋找高質(zhì)量數(shù)據(jù)源轉(zhuǎn)變?yōu)檠a(bǔ)充與完善已有數(shù)據(jù)源,甚至人工生成虛擬的特定所需數(shù)據(jù).即從實際研究需要出發(fā),積極發(fā)揮主觀能動性,利用先進(jìn)算法或模型探究人工數(shù)據(jù)的研究與應(yīng)用潛力.

      人工數(shù)據(jù)的來源不局限于單一物理或網(wǎng)絡(luò)空間,可以是虛擬的軟件算法模型或?qū)嶋H的復(fù)雜工程系統(tǒng).其所含信息內(nèi)容由研究需求決定,相關(guān)數(shù)據(jù)類型包括且不限于數(shù)值、文本和圖像,故具有靈活、豐富、多樣等特點.但同時,對人工數(shù)據(jù)研究與應(yīng)用的發(fā)展一直受信息真實合理性的制約.因此,人工數(shù)據(jù)的研究目前主要基于最新的算法或模型,提升已有數(shù)據(jù)的質(zhì)量或生成大規(guī)??捎脭?shù)據(jù).其中,以生成式對抗網(wǎng)絡(luò)(Generative adversarial networks,GAN)為代表的相關(guān)研究與應(yīng)用已在圖像生成[85]與修復(fù)[86?87]、圖像翻譯[88]和風(fēng)格遷移[89]等研究領(lǐng)域獲得了遠(yuǎn)超以往模型的效果.其中,在圖像視頻領(lǐng)域的應(yīng)用最為廣泛.典型研究實例包括:Ledig 等[86]提出利用GAN 將一張低分辨率模糊的圖片變換成高分辨率清晰的圖片.Wang 等[90]利用合成圖像和真實圖像數(shù)據(jù)用于訓(xùn)練人眼檢測模型.另外,其還用于圖像數(shù)據(jù)補(bǔ)充、圖像風(fēng)格轉(zhuǎn)換及語音語言生成等領(lǐng)域[91].而對于涉及復(fù)雜社會學(xué)因素的社會交通而言,相關(guān)人工數(shù)據(jù)的研究需考慮社會系統(tǒng)的特征規(guī)律或知識經(jīng)驗等信息.且基于此,后續(xù)應(yīng)進(jìn)一步探究特定的跨媒體、多模態(tài)或異構(gòu)人工數(shù)據(jù)的研究與應(yīng)用,包括數(shù)據(jù)信息的統(tǒng)一表征、關(guān)聯(lián)、理解、挖掘乃至生成等方面內(nèi)容,以突破數(shù)據(jù)壁壘、數(shù)據(jù)稀疏與缺失等難題.具體研究技術(shù)方法等相關(guān)內(nèi)容將在第3 節(jié)詳細(xì)介紹.

      3 典型技術(shù)方法

      社會交通研究所用具體技術(shù)主要由數(shù)據(jù)決定,因此,本章節(jié)將根據(jù)常規(guī)的數(shù)據(jù)研究流程按序?qū)Φ湫图夹g(shù)方法進(jìn)行總結(jié)歸納,具體分類及舉例見圖1.

      圖1 常規(guī)數(shù)據(jù)研究流程及相應(yīng)典型技術(shù)方法Fig.1 Routine data research process and corresponding typical technical methods

      3.1 數(shù)據(jù)生成與獲取

      數(shù)據(jù)是科學(xué)研究的基礎(chǔ),準(zhǔn)確、充足和適宜的研究數(shù)據(jù)對高效開展研究具有重要幫助作用.因此,有效的數(shù)據(jù)生成與獲取技術(shù)或方法一直是領(lǐng)域內(nèi)專家學(xué)者研究關(guān)注的熱點.針對當(dāng)前社會交通的研究情況,本文將按照用戶生成數(shù)據(jù)的目的將數(shù)據(jù)生成分為被動式和主動式,并介紹對應(yīng)的數(shù)據(jù)獲取方法.

      3.1.1 被動式生成

      被動式數(shù)據(jù)生成是指用戶被動無目的地產(chǎn)生數(shù)據(jù),數(shù)據(jù)所含信息與研究關(guān)注內(nèi)容非直接相關(guān).一般來說,用戶在這一過程中多為自愿且無意識地提供信息.數(shù)據(jù)的來源包括上一節(jié)所介紹的全部物理空間數(shù)據(jù)源、網(wǎng)絡(luò)空間中全部非社交類數(shù)據(jù)源和部分社交類數(shù)據(jù)源.

      首先,對于物理空間數(shù)據(jù)源,其主要由行人、乘客或駕駛員的交通行為與自身攜帶或車輛裝配的傳感設(shè)備(例如GPS、監(jiān)控攝像頭等)以及公共基礎(chǔ)設(shè)施(如移動通信系統(tǒng)和公交卡系統(tǒng))交互生成與獲取.舉例來說,公共交通刷卡系統(tǒng)能夠獲取并記錄市民出行時通過交通卡刷卡行為生成的移動軌跡數(shù)據(jù)和出行方式信息[21?25].

      其次,對于網(wǎng)絡(luò)空間中的非社交類數(shù)據(jù),其主要由官方組織、機(jī)構(gòu)通過互聯(lián)網(wǎng)單向發(fā)布生成,可通過相關(guān)應(yīng)用程序編程接口(Application programming interface,API)或網(wǎng)絡(luò)爬蟲等途徑獲取所需數(shù)據(jù).例如,利用網(wǎng)絡(luò)爬蟲可以從氣象網(wǎng)站或演出信息網(wǎng)站中抓取由氣象局或演出場館發(fā)布的天氣情況或演出信息等[29].而對于被動式生成的社交類數(shù)據(jù),其由官方或個人用戶自行無目的發(fā)布提供,同樣可通過相應(yīng)的API 或網(wǎng)絡(luò)爬蟲獲取,例如大部分研究均通過API 從Twitter 中獲取交通部門或私人賬號發(fā)布的交通事故信息等.

      3.1.2 主動式生成

      主動式數(shù)據(jù)生成主要指用戶主動有目的地共享數(shù)據(jù),數(shù)據(jù)所含信息由研究關(guān)注內(nèi)容直接決定.具體來說,官方組織、機(jī)構(gòu)或研究人員將間接引導(dǎo)或直接激勵用戶主動提供更具針對性和準(zhǔn)確性的真實數(shù)據(jù),用戶按照數(shù)據(jù)收集要求自愿生成相關(guān)信息,如發(fā)布道路狀況報告、反饋產(chǎn)品或服務(wù)評價.數(shù)據(jù)的來源主要為各類社交類數(shù)據(jù)源,即社交媒體.

      1)眾包.眾包(Crowdsourcing)[92]是典型的主動式數(shù)據(jù)生成方式.在智能交通領(lǐng)域中,眾包一般指利用大規(guī)模移動群體的感知能力完成無法由單一或小規(guī)模個體及計算機(jī)實現(xiàn)的交通相關(guān)復(fù)雜信息收集任務(wù),例如共享單車的車輛故障報告、移動出行服務(wù)的行程評價以及在線地圖的標(biāo)注信息報錯[93?94].Zimmerman 等[93]提出構(gòu)建信息轉(zhuǎn)換系統(tǒng)Tiramisu,其由用戶共享GPS 軌跡與提交問題報告,能夠處理用戶上傳的軌跡并預(yù)測公交實時到達(dá)時間.這些信息收集任務(wù)大多由社交媒體運(yùn)營商根據(jù)自身優(yōu)化發(fā)展目標(biāo)設(shè)置發(fā)布,而用戶則通過社交媒體不斷提供數(shù)據(jù).這些數(shù)據(jù)逐漸積累形成規(guī)??捎^的數(shù)據(jù)集,其同樣可通過相應(yīng)的API 或網(wǎng)絡(luò)爬蟲進(jìn)行獲取.

      但就目前來說,這類眾包數(shù)據(jù)大部分并未對外開放使用且難以利用現(xiàn)有技術(shù)進(jìn)行獲取,而相對易得的數(shù)據(jù)卻又普遍存在內(nèi)容質(zhì)量參差不齊或有效數(shù)量無法滿足研究需要等難題.

      2)人工生成.隨著數(shù)據(jù)挖掘、深度學(xué)習(xí)等領(lǐng)域技術(shù)手段的革新和發(fā)展,研究人員創(chuàng)造性地提出人工生成大量可用數(shù)據(jù),這也屬于主動式數(shù)據(jù)生成方式.生成人工或虛擬數(shù)據(jù)的研究思路為:通過算法擬合、模型構(gòu)建等方式對現(xiàn)有小規(guī)模真實數(shù)據(jù)集的關(guān)鍵信息或特征進(jìn)行挖掘、分析和學(xué)習(xí),進(jìn)而將獲得的知識經(jīng)驗拓展應(yīng)用于大規(guī)模人工數(shù)據(jù)的生成,或直接利用已知規(guī)則、知識等方式產(chǎn)生數(shù)據(jù).人工生成數(shù)據(jù)的數(shù)量、內(nèi)容和表達(dá)形式均由研究需要決定,具有靈活多變的特點.王飛躍教授于2004 年提出基于ACP 理論與方法體系的平行系統(tǒng)的概念和方法,其為一種以人工系統(tǒng)(Artificial systems)、計算實驗(Computing experiments)和平行執(zhí)行(Parallel execution)為核心的復(fù)雜系統(tǒng)計算理論與方法的基本框架.其中,軟件定義的人工系統(tǒng)可通過計算實驗生成大規(guī)模數(shù)據(jù),為人工或虛擬數(shù)據(jù)的研究提供了一種新的思路[95?99].此后,王飛躍教授及其團(tuán)隊還陸續(xù)發(fā)表了一系列關(guān)于人工交通系統(tǒng)的研究成果[96,100?107].另外,研究人員還嘗試通過PARAMICS (Parallel microscopic simulator)[108]、VISSIM[109]、Transworld[105]以及SUMO (Simulation of urban mobility)[47]等交通仿真軟件和生成式對抗網(wǎng)絡(luò)(Generative adversarial network,GAN)等前沿方法[110?112]生成交通數(shù)據(jù),圖2 所示為一種用于交通預(yù)測的GAN 框架示例[111].盡管相關(guān)技術(shù)方法的研究還不夠成熟完善,且所生成數(shù)據(jù)的真實可靠性仍待提高,對各領(lǐng)域數(shù)據(jù)的探究均具有重要意義.

      圖2 一種用于交通預(yù)測的GAN 架構(gòu)示例[111]Fig.2 An example framework of the conditional GAN for traffic prediction[111]

      總體而言,被動式生成的數(shù)據(jù)目前來源較廣且數(shù)量相對較大,相應(yīng)數(shù)據(jù)的獲取技術(shù)手段或方法也較為成熟.然而,可用的有效真實數(shù)據(jù)數(shù)量仍然相對較少,數(shù)據(jù)所含信息的內(nèi)容較為局限且無法完全與研究需要相對應(yīng),研究人員往往需要融合來自多類別數(shù)據(jù)源的數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)充或信息交叉驗證,但又往往還需面對普遍的數(shù)據(jù)壁壘問題.而數(shù)據(jù)的主動式生成方法雖已得到廣泛應(yīng)用,其仍存在可獲得的有效數(shù)據(jù)規(guī)模較小這一研究難點.

      依靠大量用戶生成大規(guī)模真實數(shù)據(jù)仍是目前主要的數(shù)據(jù)生成研究思路,但數(shù)據(jù)生成過程所需的時間、資金或其他資源成本較大,且由大部分信息數(shù)據(jù)表達(dá)形式的差異而形成的數(shù)據(jù)壁壘會阻礙多源異構(gòu)數(shù)據(jù)的融合.未來的數(shù)據(jù)生成方式會更趨向于由小規(guī)模真實樣本數(shù)據(jù)生成大規(guī)模人工或虛擬數(shù)據(jù),重點研究內(nèi)容則將集中于多源異構(gòu)數(shù)據(jù)的融合技術(shù)和有效且多樣人工數(shù)據(jù)的生成技術(shù).

      3.2 數(shù)據(jù)處理與分析

      數(shù)據(jù)準(zhǔn)確、快速且有效的處理與分析是進(jìn)行高效研究與應(yīng)用的關(guān)鍵.由于當(dāng)前應(yīng)用于社會交通領(lǐng)域研究的數(shù)據(jù)類型較多,因此所涉及的數(shù)據(jù)處理與分析技術(shù)算法也相對廣泛.其中,除由數(shù)據(jù)所決定的對應(yīng)基本研究技術(shù)方法外,還包括針對不同研究對象、內(nèi)容和目的所衍生出的一系列基本技術(shù)方法的變體形式.受篇幅所限,本文將主要從研究發(fā)展趨勢這一角度對相應(yīng)技術(shù)方法進(jìn)行簡要劃分和整體概述.

      3.2.1 統(tǒng)計分析

      在社會交通的早期研究中,可用研究數(shù)據(jù)規(guī)模相對較小,數(shù)據(jù)的處理與分析主要為采用統(tǒng)計學(xué)方法對研究對象進(jìn)行數(shù)學(xué)建?;蛄炕治?從而得出數(shù)據(jù)在時間、空間或其他方面的分布特征或規(guī)律性信息,能夠輔助后續(xù)實驗測試過程中參數(shù)的選擇、設(shè)定和調(diào)整.并且進(jìn)一步地,可將所得信息以圖表的形式進(jìn)行簡明直觀地展示和描述[25,39,73,83].目前,社會交通領(lǐng)域內(nèi)僅單獨(dú)采用數(shù)據(jù)統(tǒng)計分析的研究與應(yīng)用相對較少,但仍存在部分研究將其作為數(shù)據(jù)的初步處理與分析過程,主要為其他相關(guān)行業(yè)領(lǐng)域內(nèi)非專業(yè)研究人員的探究使用.

      3.2.2 數(shù)據(jù)挖掘

      隨著計算機(jī)性能的大幅提升以及技術(shù)手段的更新優(yōu)化,可用數(shù)據(jù)呈指數(shù)型爆炸式增長.這促使專家學(xué)者對數(shù)據(jù)所含信息進(jìn)行深入探究、提取及知識轉(zhuǎn)化,數(shù)據(jù)挖掘、深度學(xué)習(xí)等前沿學(xué)科隨之應(yīng)運(yùn)而生.

      廣義的數(shù)據(jù)挖掘[113],是指在大規(guī)模數(shù)據(jù)集中進(jìn)行知識發(fā)現(xiàn)的處理分析過程,或稱為KDD.其步驟組成包括數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘和模式評估或解釋.各步驟過程均可使用包括k最近鄰法(K-nearest neighbor,K-NN)[114?115]、卡爾曼濾波(Kalman filtering)[47,116]、貝葉斯網(wǎng)絡(luò)(Bayesian network)[11,21,30,32]、支持向量機(jī)(Support vector machine,SVM)[72,117]、深度學(xué)習(xí)(Deep learning)[118?123]、自然語言處理(Natural language processing,NLP)[49,52?53,63,72,74,77?78]、仿真模型[47,105,108?109,124]等各類先進(jìn)技術(shù)算法[22,36?37,43?44,51,57,76]進(jìn)行研究.

      在社會交通領(lǐng)域的研究中,數(shù)據(jù)挖掘的研究發(fā)展呈現(xiàn)由單向多、由實向虛的趨勢.在研究初期,研究數(shù)據(jù)主要來自單一數(shù)據(jù)源,例如GPS 等物理空間或網(wǎng)絡(luò)空間的非社交類數(shù)據(jù)源或Twitter 等網(wǎng)絡(luò)空間的社交類數(shù)據(jù)源.其處理思路簡明直接,即根據(jù)數(shù)據(jù)類型特點、所含信息以及對應(yīng)研究技術(shù)的發(fā)展選擇相應(yīng)常規(guī)或改進(jìn)優(yōu)化的技術(shù)算法直接對原始數(shù)據(jù)的直觀信息進(jìn)行處理分析.這一階段的研究主要集中于技術(shù)算法的優(yōu)化,以期逐步提高結(jié)果質(zhì)量或加快運(yùn)算速度.而隨著研究的不斷深入,這種研究思路的局限性逐漸顯現(xiàn),原因主要在于:1)作為復(fù)雜的社會行為之一,交通行為的產(chǎn)生受多方面因素影響,例如節(jié)假日、音樂會、體育賽事等既定事件和不利天氣、交通事故等非既定事件,使得相關(guān)數(shù)據(jù)隱含某些特定規(guī)律性特征.而直接單一的研究思路可能會導(dǎo)致對研究對象特征或重要信息的挖掘與分析片面化.2)在數(shù)據(jù)規(guī)模不足的情況下,由于人為誤差、設(shè)備偏差、數(shù)據(jù)稀疏等主觀或客觀原因,單一數(shù)據(jù)源不能確保數(shù)據(jù)及研究所得結(jié)果的真實有效性.因此,后續(xù)的研究轉(zhuǎn)為嘗試探索新的思路,以期進(jìn)一步提升運(yùn)算速度和結(jié)果精度.鑒于現(xiàn)代交通行為的復(fù)雜特性,研究數(shù)據(jù)的來源逐步從單一數(shù)據(jù)源擴(kuò)展到多源異構(gòu)數(shù)據(jù),即對多個不同類型或不同類別數(shù)據(jù)源進(jìn)行綜合處理與分析,從而推動相關(guān)新興技術(shù)的研發(fā)與應(yīng)用.同時,相關(guān)研究在根據(jù)數(shù)據(jù)類型、內(nèi)容類別等直觀信息進(jìn)行挖掘分析的基礎(chǔ)上,綜合考慮多類有關(guān)影響因素以深入探究研究對象的時間、空間及其他規(guī)律性特征,并據(jù)此填補(bǔ)和完善缺失數(shù)據(jù)甚至生成人工或虛擬數(shù)據(jù)以解決數(shù)據(jù)壁壘問題,為深度數(shù)據(jù)挖掘提供新的可能.

      在單一數(shù)據(jù)源有效數(shù)據(jù)量受限的情況下,多個具有相同類型和結(jié)構(gòu)數(shù)據(jù)源的融合能夠?qū)捎脭?shù)據(jù)進(jìn)行補(bǔ)足或擴(kuò)充,以更好地滿足實驗需要并增強(qiáng)所用算法技術(shù)的泛化能力.而對于多源異構(gòu)數(shù)據(jù)的挖掘應(yīng)用,主要依據(jù)不同類別數(shù)據(jù)源的可信度或重要性區(qū)分側(cè)重地進(jìn)行融合補(bǔ)充或交叉驗證應(yīng)用.常見的多數(shù)據(jù)源結(jié)合形式分別為:社交類與非社交類數(shù)據(jù)源的融合、網(wǎng)絡(luò)空間與物理空間數(shù)據(jù)源的融合.參照文獻(xiàn)[125]可將綜合利用多源異構(gòu)數(shù)據(jù)的現(xiàn)有思路分為三類:1)在研究過程中先將多模態(tài)數(shù)據(jù)源融合,提取及分析相關(guān)數(shù)據(jù)的綜合特征或信息后進(jìn)行進(jìn)一步具體的處理、分析與應(yīng)用,例如文獻(xiàn)[11,19,42?43,50].2)在研究過程中先按照數(shù)據(jù)類型或內(nèi)容類別分別提取、處理與分析多模態(tài)數(shù)據(jù)源的特征或信息,對初步所得結(jié)果進(jìn)行融合后總結(jié)得出結(jié)論或進(jìn)行進(jìn)一步探究應(yīng)用,例如文獻(xiàn)[12,30,32,39,79,82].3)在研究過程中分別處理與分析多模態(tài)數(shù)據(jù)源的特征或信息后,按照數(shù)據(jù)結(jié)構(gòu)或信息內(nèi)容對初步所得結(jié)果分別進(jìn)行同一研究目標(biāo)的具體不同探究與應(yīng)用,例如文獻(xiàn)[21,23?24,54,117].

      對應(yīng)的研究應(yīng)用目的目前主要分為兩類:

      1)數(shù)據(jù)內(nèi)容或結(jié)果的交叉驗證.相關(guān)研究大多數(shù)以新興數(shù)據(jù)源的使用為主要探究內(nèi)容,通過其他多模態(tài)異構(gòu)數(shù)據(jù)源的可靠信息驗證所探究數(shù)據(jù)的內(nèi)容或所得研究結(jié)果的可靠性.例如,將新興多變的社交類數(shù)據(jù)源與傳統(tǒng)穩(wěn)定的非社交類數(shù)據(jù)源交叉驗證[39,41,79,82].

      2)數(shù)據(jù)特征或信息的相互補(bǔ)充.相關(guān)研究大多數(shù)以內(nèi)容可信度或重要性較強(qiáng)的數(shù)據(jù)源為主要挖掘?qū)ο?輔以其他多模態(tài)異構(gòu)數(shù)據(jù)進(jìn)行特征或信息的補(bǔ)充,從而更加全面深入地挖掘與探究相關(guān)研究內(nèi)容,并提升與完善研究結(jié)果的可信性和可行性.例如,將較真實可靠的物理空間數(shù)據(jù)源與豐富復(fù)雜的網(wǎng)絡(luò)空間數(shù)據(jù)源融合互補(bǔ)[15,19?20,23?24,30,32,42?43,50,54,117].對于跨媒體信息的分析與推理,Peng 等[84]從跨媒體統(tǒng)一表征理論與模型、跨媒體關(guān)聯(lián)理解與深度挖掘和跨媒體知識圖譜構(gòu)建與學(xué)習(xí)方法等7 個方面進(jìn)行綜述,歸納總結(jié)了現(xiàn)有研究方法、進(jìn)展、挑戰(zhàn)及發(fā)展方向.

      進(jìn)一步地,可在多源異構(gòu)數(shù)據(jù)融合研究的基礎(chǔ)上進(jìn)行探究,即在綜合分析影響交通行為或狀況變化的多方面因素的同時,將現(xiàn)實世界的真實數(shù)據(jù)及由人工系統(tǒng)或仿真模型所產(chǎn)生的人工或虛擬數(shù)據(jù)相結(jié)合,以擴(kuò)大可用研究數(shù)據(jù)的規(guī)模,從而突破以往研究思路的兩大局限,并實現(xiàn)研究效果的提升以及技術(shù)算法的優(yōu)化[126].但相應(yīng)地,數(shù)據(jù)的真實可靠性仍是目前研究一大挑戰(zhàn).劉昕等[127]在平行系統(tǒng)的基礎(chǔ)上進(jìn)一步探究并提出平行數(shù)據(jù),其中的虛擬數(shù)據(jù)由實際數(shù)據(jù)經(jīng)計算實驗產(chǎn)生.所提出平行數(shù)據(jù)的概念和框架,為數(shù)據(jù)處理、表示、挖掘和應(yīng)用提供了一個新的范式.

      同時,研究人員在不斷發(fā)掘有效且可用的新興數(shù)據(jù)源的基礎(chǔ)上,也積極探索數(shù)據(jù)處理和分析的新思路.Yao 等[60]提出一種用于預(yù)測出租車需求的深度多視圖時空網(wǎng)絡(luò)(Deep multi-view spatial-temporal network,DMVST-Net),同時對時空相關(guān)性進(jìn)行模擬,其結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)、長短時記憶網(wǎng)絡(luò)(Long short term memory,LSTM)以及譜嵌入(Structural embedding)三種技術(shù)對數(shù)據(jù)進(jìn)行處理與分析,并構(gòu)建了對應(yīng)的時間、空間和語義視圖.Chen 等[128]突破以往交通擁堵預(yù)測研究中常用的一維時間序列結(jié)構(gòu),提出使用二維矩陣結(jié)構(gòu)對原始數(shù)據(jù)進(jìn)行建模重構(gòu),以進(jìn)一步突出體現(xiàn)研究對象的隱含特征.

      3.2.3 數(shù)據(jù)可視化處理

      在社會交通領(lǐng)域的研究中,可視化處理作為數(shù)據(jù)處理與分析中一項重要但非必要的研究環(huán)節(jié),其應(yīng)用常與上述前兩類關(guān)鍵必要過程相結(jié)合,根據(jù)實際需要對數(shù)據(jù)信息進(jìn)行拓展探究或知識轉(zhuǎn)化.

      1)可視化處理與統(tǒng)計分析相結(jié)合,即以統(tǒng)計學(xué)圖表等簡明直觀的形式對統(tǒng)計分析結(jié)果進(jìn)行具體描述和展示.其通常僅針對單一數(shù)據(jù)源,由人為觀察初步歸納得出有助于研究開展的變化特征、影響關(guān)系或其他重要信息,從而為高效的數(shù)據(jù)挖掘指明探究切入點[19,25,35?36,39,62,68,73,83].圖3 展示了文獻(xiàn)[35]為探究出租車需求量的空間特性所用數(shù)據(jù)統(tǒng)計結(jié)果.

      圖3 已完成出租車需求量統(tǒng)計結(jié)果[35]Fig.3 The statistical result of fulfilled taxi demands[35]

      2)可視化處理與數(shù)據(jù)挖掘相結(jié)合,即以熱點圖、動態(tài)帶狀圖、關(guān)鍵字云圖等更多樣的形式對數(shù)據(jù)挖掘所得結(jié)果進(jìn)行轉(zhuǎn)換表達(dá),更直接地從多方面揭示數(shù)據(jù)的變化趨勢與規(guī)律、影響關(guān)系以及知識經(jīng)驗.這類可視化處理涉及多種數(shù)據(jù)類型,相對于統(tǒng)計分析結(jié)果的直接輸出展示,其有助于多模態(tài)異構(gòu)數(shù)據(jù)中隱含信息內(nèi)容的協(xié)同表達(dá)與闡述及多領(lǐng)域的研究與應(yīng)用[13,23?24,40,59,65,72,129].圖4 為文獻(xiàn)[24]在分析智能公交卡和社交媒體數(shù)據(jù)后可視化生成的多視角圖.

      圖4 特大城市大數(shù)據(jù)的可視化融合[24]Fig.4 Visual fusion of mega-city big data[24]

      特別地,若將算法模型、仿真交通環(huán)境、人工交通系統(tǒng)或平行交通系統(tǒng)等方法生成的仿真模擬或計算實驗數(shù)據(jù)可視化,則可對確定已知交通場景進(jìn)行整體、全面、具體且直觀地描繪,實現(xiàn)特定環(huán)境中交通情況的重現(xiàn)與分析.另外,還可對隨機(jī)未知環(huán)境中的交通狀態(tài)進(jìn)行預(yù)測,例如交通意外事故、大型自然災(zāi)害等不可預(yù)知事件發(fā)生時的交通狀態(tài),這對于以重大交通事故防范及應(yīng)急預(yù)案的制定、完善與實施為代表的城市交通安全的研究與應(yīng)用具有重要意義.

      此外,由于應(yīng)用場景和用戶群體的不斷變化與擴(kuò)增,為滿足多元化研究及應(yīng)用需要,相關(guān)研究進(jìn)一步提出探究性可視化.其與數(shù)據(jù)挖掘可視化相似,具體形式與內(nèi)容由研究目的決定,主要以交互的方式不斷獲得所需要的特定類型數(shù)據(jù),從而結(jié)合社會群體的力量與智慧探究“以人為本”的智能交通應(yīng)用形式,例如利用手機(jī)應(yīng)用軟件交互式收集用戶共享的實時路況信息.因此其目前主要應(yīng)用于相關(guān)軟件平臺的開發(fā)或智能交通系統(tǒng),為用戶提供所需交通信息[22,54,56,75,130].

      根據(jù)相關(guān)數(shù)據(jù)、內(nèi)容和技術(shù)的研究發(fā)展趨勢,當(dāng)前社會交通的技術(shù)研究熱點集中于包括交通工程學(xué)、數(shù)學(xué)、物理學(xué)、計算機(jī)科學(xué)、信息學(xué)、社會學(xué)等學(xué)科領(lǐng)域的現(xiàn)有研究技術(shù)、方法或思路的集成與融合,以及新技術(shù)算法、模型或框架的提出、優(yōu)化與結(jié)合,從而進(jìn)行人工或虛擬數(shù)據(jù)與跨媒體異構(gòu)數(shù)據(jù)的生成、分析與推理,解決多元知識信息的融合問題.

      4 研究與應(yīng)用

      由于社會交通領(lǐng)域的研究與應(yīng)用內(nèi)容主要取決于可用數(shù)據(jù)源及相關(guān)數(shù)據(jù)處理技術(shù),故本文根據(jù)數(shù)據(jù)的研究發(fā)展趨勢分類介紹研究與應(yīng)用的思路,具體將按照數(shù)據(jù)處理及分析的過程由淺入深進(jìn)行分析闡述.社會交通的早期應(yīng)用主要依賴于物理空間數(shù)據(jù),初步探究交通現(xiàn)象的典型基本特征或變化規(guī)律,從而指導(dǎo)交通相關(guān)交叉學(xué)科的研究或應(yīng)用,例如城市交通規(guī)劃和城市交通系統(tǒng)優(yōu)化.近年來,跨媒體異構(gòu)數(shù)據(jù)的全方位擴(kuò)增、人工數(shù)據(jù)研究的提出以及前沿算法技術(shù)的優(yōu)化革新都為交通問題的探究思路和方法帶來新的靈感和啟發(fā).目前,社會交通的現(xiàn)有應(yīng)用探究主要集中于圖5 所示的三類內(nèi)容,具體內(nèi)容及大致發(fā)展趨勢分別如下.

      圖5 社會交通研究與應(yīng)用的發(fā)展趨勢及分類Fig.5 The development trend and classification of social transportation research and application

      4.1 交通場景中客觀對象或既定事實的性質(zhì)

      新興領(lǐng)域的探究往往從典型研究情景中的單一基本點入手.對應(yīng)于社會交通領(lǐng)域的研究與應(yīng)用,通常表現(xiàn)為對常見交通場景中存在于物理或網(wǎng)絡(luò)空間的交通主體(人或車)[20,22?24,40,65]、行為[25,36?37,58,65,117]、事件[52?54,68?70,72,131?133]乃至輿情[23?24,39,49,57,63,73?75,77,134]等基本組成元素信息的檢測與識別,或?qū)窘M成元素所屬類別或特征屬性的判定.Maghrebi等[58]通過分析墨爾本市區(qū)內(nèi)所發(fā)布的Twitter 數(shù)據(jù)內(nèi)容來檢測用戶的交通出行方式,結(jié)果表明社交媒體數(shù)據(jù)可作為信息的有效補(bǔ)充來源用以幫助出行需求的確定等相關(guān)研究.

      4.2 交通狀態(tài)或現(xiàn)象的潛在成因、影響或經(jīng)驗知識

      作為典型的復(fù)雜系統(tǒng),現(xiàn)代交通系統(tǒng)并非僅由獨(dú)立存在的客觀對象所構(gòu)成,還包括客體對象彼此之間的關(guān)系.因此,將交通場景中客觀對象或既定事實等成分視為獨(dú)立散點的研究與應(yīng)用具有一定的局限性,難以在宏觀層面準(zhǔn)確描述由多方面因素影響的交通狀態(tài)或現(xiàn)象.深入的探究需要依照特定的內(nèi)在聯(lián)系將多個點串聯(lián)成線,并逐漸形成復(fù)雜的關(guān)系網(wǎng)絡(luò),從而在空間尺度上對相關(guān)研究及應(yīng)用進(jìn)行拓展,從整體上揭示交通狀態(tài)或現(xiàn)象的本質(zhì).現(xiàn)有研究主要集中于交通狀態(tài)或現(xiàn)象的變化規(guī)律[25]、隱含關(guān)系[11,41,60,135]或成因影響[15,19,81]等信息的歸納分析,以及普適性知識經(jīng)驗的挖掘.Zhao 等[25]對深圳市的智能交通卡數(shù)據(jù)進(jìn)行探究,提出一個有效獲取個體乘客公共出行模式的數(shù)據(jù)挖掘過程,并使用基于統(tǒng)計學(xué)和無監(jiān)督聚類的方法理解出行模式的隱含規(guī)律和異?,F(xiàn)象.

      4.3 特定情況下的未知交通行為、狀況或需求變化

      進(jìn)一步地,綜合利用所掌握的各方面確定性數(shù)據(jù)信息、相關(guān)關(guān)系或知識經(jīng)驗,能夠推進(jìn)對交通基本對象、常見事件以及正?;虍惓顟B(tài)的變化情況或其他相關(guān)未知信息的探究,即在擴(kuò)大空間研究范圍的基礎(chǔ)上為突破時間尺度局限的深入研究與應(yīng)用起重要輔助作用.其作為社會交通領(lǐng)域當(dāng)前的熱點研究問題,所涉及的典型實際應(yīng)用為交通行為[11,30,32,61]、交通事件[39,44,128,133]、交通狀況[11,21,38,42?43,48,136?138]、交通需求[19,35,60,139]及其他信息的預(yù)測[79,116,140].Lin 等[43]提出構(gòu)建一個主題增強(qiáng)高斯過程聚合模型(Topic-enhanced Gaussian process aggregation model,TEGPAM)的概率框架,對傳統(tǒng)速度傳感數(shù)據(jù)與社交媒體數(shù)據(jù)進(jìn)行融合,以改善道路交通速度預(yù)測結(jié)果.

      結(jié)合跨媒體數(shù)據(jù)的檢測與識別能夠顯著提高感知和獲取信息的全面性和實時性,而大規(guī)模人工或虛擬數(shù)據(jù)的生成與使用則能夠增強(qiáng)技術(shù)方法和所得結(jié)果的泛化性和普適性.同時,綜合利用處理與分析跨媒體數(shù)據(jù)或人工數(shù)據(jù)所得特征規(guī)律或知識經(jīng)驗等信息,有利于整體全面感知與理解交通場景及其成分的變化和內(nèi)在聯(lián)動關(guān)系,為后續(xù)研究與應(yīng)用提供合理有效的依據(jù),從而提高研究結(jié)果的準(zhǔn)確性和可靠性.

      4.4 城市交通的統(tǒng)籌協(xié)調(diào)、管理控制或優(yōu)化提升

      在此基礎(chǔ)之上,上述數(shù)據(jù)的融合研究可應(yīng)用于城市交通的統(tǒng)籌、管控與優(yōu)化,包括信息的雙向傳播、交通狀態(tài)的管控、交通服務(wù)的優(yōu)化及交通資源的規(guī)劃,乃至突發(fā)或特殊公共事件的信息上傳、資訊發(fā)布及相關(guān)應(yīng)急預(yù)案的制定等應(yīng)用,例如交通信號燈的智能調(diào)控、大規(guī)模人群狀態(tài)變化的預(yù)測與應(yīng)對乃至重大傳染病患者移動軌跡的確定、引導(dǎo)與管控等[141?142],這些都對城市的快速且平衡發(fā)展具有重大意義,因而該研究方向?qū)⒅饾u成為未來研究與應(yīng)用的重心.目前,已有許多集成上述單項或多項研究應(yīng)用的應(yīng)用程序、網(wǎng)絡(luò)平臺或智能交通系統(tǒng),為多類用戶群體提供全面的服務(wù)[11,20,50,52,66,69?70,74?75,130,133,136?139,143?149].鄭治豪等[75]開發(fā)了一套基于社交媒體大數(shù)據(jù)的交通感知分析與可視化系統(tǒng),分別利用支持向量機(jī)算法、條件隨機(jī)場算法和事件提取模型實現(xiàn)微博的分類、命名實體識別與交通事件提取等任務(wù),系統(tǒng)可視化模塊見圖6.

      圖6 基于社交媒體大數(shù)據(jù)的交通感知分析與可視化系統(tǒng)[75]Fig.6 A traffic sensing and analyzing system using social media data[75]

      鑒于當(dāng)前研究應(yīng)用的發(fā)展主要受限于可用數(shù)據(jù)的數(shù)量和質(zhì)量,上述應(yīng)用程序、平臺或系統(tǒng)趨于嘗試根據(jù)研究對象的自身性質(zhì)、變化特征以挖掘與利用多源跨媒體數(shù)據(jù),或由相對較少的數(shù)據(jù)中提取有價值的深層隱含信息后通過多種技術(shù)方法的使用與結(jié)合逐步實現(xiàn)知識自動化,又或利用平行系統(tǒng)的ACP方法人工生成大規(guī)??捎糜行?shù)據(jù)以解決這類研究困難,具體可參照文獻(xiàn)[96,100?101,106,150].

      而進(jìn)一步地,由于依據(jù)平行理論在實際系統(tǒng)的基礎(chǔ)上構(gòu)建的人工系統(tǒng),能夠設(shè)計模擬受各類復(fù)雜因素變化影響的交通系統(tǒng),突破了一般應(yīng)用場景的實踐研究局限.因此,通過平行系統(tǒng)進(jìn)行大量的計算實驗?zāi)軌蛎鞔_各類社會交通數(shù)據(jù)的適用場景,并驗證相關(guān)研究成果實際應(yīng)用的有效性,進(jìn)而實現(xiàn)多種復(fù)雜社會場景下的智能決策.

      5 總結(jié)與展望

      目前,社會交通在研究數(shù)據(jù)、方法思路、算法技術(shù)以及實際應(yīng)用等方面均仍存在諸多問題與挑戰(zhàn),領(lǐng)域內(nèi)基本要素如圖7 所示.相關(guān)研究方向和內(nèi)容還較為局限和分散,尚未形成完整且成熟的研究體系.

      圖7 社會交通領(lǐng)域研究的基本要素Fig.7 Basic elements of research in the field of social transportation

      從當(dāng)前來看,充足的可用有效數(shù)據(jù)是社會交通領(lǐng)域研究所需面對的首要挑戰(zhàn),其在數(shù)量和質(zhì)量兩個方面均亟需擴(kuò)增和提升.首先,數(shù)據(jù)的覆蓋范圍和數(shù)量有待擴(kuò)增,主要表現(xiàn)在物理空間中實際數(shù)據(jù)覆蓋范圍有限、數(shù)據(jù)缺失和稀疏問題嚴(yán)重以及網(wǎng)絡(luò)空間中相關(guān)可用社交類數(shù)據(jù)量較少等方面.其次,數(shù)據(jù)的微觀準(zhǔn)確性有待提升,主要表現(xiàn)在物理空間與網(wǎng)絡(luò)空間中數(shù)據(jù)信息可信性難以保證,且跨媒體數(shù)據(jù)間的融合存在壁壘阻礙.針對上述問題,研究人員提出利用仿真軟件及生成式對抗網(wǎng)絡(luò)生成大規(guī)模人工數(shù)據(jù)的思路,以及對跨媒體異構(gòu)數(shù)據(jù)進(jìn)行融合、互補(bǔ)及驗證等方法.相應(yīng)地,對數(shù)據(jù)的探究間接引發(fā)了對用于數(shù)據(jù)處理與分析的算法技術(shù)的挑戰(zhàn),其中包括應(yīng)對同數(shù)據(jù)類型多源數(shù)據(jù)的普適算法或模型的泛化能力、人工數(shù)據(jù)生成模型搭建思路的邏輯合理性,以及融合分析多模態(tài)數(shù)據(jù)的技術(shù)方法的綜合性能.克服上述挑戰(zhàn)的關(guān)鍵在于深入探究前沿技術(shù)算法,對其進(jìn)行優(yōu)化、集成或融合.

      作為交通工程學(xué)與社會學(xué)的交叉學(xué)科,社會交通與城市整體的規(guī)劃、建設(shè)及發(fā)展具有密切的聯(lián)系.然而,社會交通領(lǐng)域內(nèi)的研究與應(yīng)用還未充分發(fā)揮其在推動城市發(fā)展方面的作用.在具體實際應(yīng)用方面,不足之處包括:廣泛且有效的探究并利用社會輿情、人際關(guān)系和群體智慧不足;充分挖掘數(shù)據(jù)信息得出有效知識經(jīng)驗或可行智能決策不足;與城市交通系統(tǒng)較好地融合并形成合理的體系結(jié)構(gòu)不足;與城市的規(guī)劃、調(diào)控及發(fā)展深入結(jié)合不足.為克服上述問題,研究應(yīng)結(jié)合與交通不可分割的社會因素,從而進(jìn)一步推動智能交通系統(tǒng)的未來發(fā)展.Xiong等[151]結(jié)合人類因素和社會因素提出的基于CPSS(Cyber-physical-social systems,CPSS)的交通系統(tǒng),恰好符合王飛躍所指出的下一代以社會為中心的智能交通系統(tǒng)(又稱交通5.0[152])的典型特征,即基于CPSS.同時,作為交通5.0 的基本解決方案,包括ACP 理論等結(jié)構(gòu)框架或理論方法在內(nèi)相關(guān)研究的推廣與應(yīng)用[153]則是未來交通系統(tǒng)發(fā)展的必經(jīng)過程[154],而這一過程需要由大量來自信息、物理和社會空間的數(shù)據(jù)推動.

      大規(guī)模的跨媒體數(shù)據(jù)能夠驅(qū)動社會交通研究的發(fā)展,尤其是需要依靠豐富多樣的數(shù)據(jù)信息來支撐的平行交通系統(tǒng).構(gòu)建實際城市交通系統(tǒng)對應(yīng)的人工交通系統(tǒng),根據(jù)真實數(shù)據(jù)信息利用計算實驗生成虛擬或人工數(shù)據(jù),可對多種具體或特定場景下的交通狀態(tài)變化進(jìn)行模擬與分析,從而為引導(dǎo)城市交通綜合管理走向智能化提供可靠的實驗基礎(chǔ)和指導(dǎo),進(jìn)而逐步實現(xiàn)平行智能交通.此外,為進(jìn)一步擴(kuò)大社會交通的影響效應(yīng),研究人員應(yīng)嘗試拓寬研究思路和范圍,并結(jié)合技術(shù)算法的發(fā)展趨勢[155],發(fā)掘社會交通領(lǐng)域研究與應(yīng)用的更多可能性,例如多人工交通系統(tǒng)的構(gòu)建及協(xié)同運(yùn)行.

      猜你喜歡
      數(shù)據(jù)源社交交通
      社交之城
      英語世界(2023年6期)2023-06-30 06:28:28
      社交牛人癥該怎么治
      意林彩版(2022年2期)2022-05-03 10:25:08
      繁忙的交通
      童話世界(2020年32期)2020-12-25 02:59:14
      社交距離
      你回避社交,真不是因為內(nèi)向
      文苑(2018年17期)2018-11-09 01:29:28
      小小交通勸導(dǎo)員
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價研究
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價算法
      分布式異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化查詢設(shè)計與實現(xiàn)
      太原市| 丹东市| 沽源县| 青海省| 呼玛县| 湖州市| 罗定市| 波密县| 穆棱市| 大关县| 焉耆| 弥勒县| 长春市| 焉耆| 南川市| 通许县| 临高县| 刚察县| 石棉县| 海丰县| 灵山县| 松桃| 叙永县| 佳木斯市| 遂溪县| 博乐市| 当雄县| 钟山县| 阜新| 潼南县| 灌南县| 阳朔县| 鸡西市| 闵行区| 句容市| 九江县| 德州市| 蓝田县| 东丽区| 酉阳| 屯昌县|