李曉峰
(黑龍江外國語學(xué)院 信息工程系,哈爾濱 150025)
基于視頻大數(shù)據(jù)的道路交通數(shù)據(jù)信息價值挖掘模型的研究
李曉峰
(黑龍江外國語學(xué)院 信息工程系,哈爾濱 150025)
由于交通管理視頻監(jiān)控系統(tǒng)正在快速向網(wǎng)絡(luò)化、高清化和智能化演進,針對目前交通信息采集到的數(shù)據(jù)利用率低且雜亂無章,面臨著由此造成的“數(shù)據(jù)洪水”的沖擊,提出了一種以交通視頻大數(shù)據(jù)分析和深度挖掘技術(shù)模型,定義了視頻大數(shù)據(jù)結(jié)構(gòu)化描述文件,提出了一種基于視頻分析的道理交通數(shù)據(jù)價值挖掘算法,對前期生成的視頻結(jié)構(gòu)化數(shù)據(jù)進行統(tǒng)一編碼,并對由若干交叉口組成的目標區(qū)域進行挖掘,挖掘出的數(shù)據(jù)可以自動選擇適于綠波控制的道路干線,將監(jiān)控視頻數(shù)據(jù)轉(zhuǎn)化為包含內(nèi)容語義信息的價值信息文件,從而提升交通監(jiān)控系統(tǒng)的使用效益。
視頻大數(shù)據(jù); 目標分類; 數(shù)據(jù)挖掘; 綠波控制; 信息價值
隨著交通管理監(jiān)控系統(tǒng)的網(wǎng)絡(luò)化和高清化發(fā)展,監(jiān)控視頻數(shù)據(jù)逐步呈現(xiàn)出大數(shù)據(jù)的4個“V”的典型特征。即體量大(Volume),非結(jié)構(gòu)化(Variety),變化快(Velocity),以及總體高價值,單位低價值(Value)。然而,現(xiàn)有交通管理監(jiān)控視頻數(shù)據(jù)往往還是以上述未經(jīng)分析處理的非結(jié)構(gòu)化形式進行存儲,由于存儲設(shè)備的容量有限,視頻數(shù)據(jù)到達一定的時間(一般是30天)后便過期,成為“廢料”,數(shù)據(jù)完全刪除。信息完全丟失,一旦發(fā)生需要調(diào)閱時則毫無辦法,信息的利用價值變得很低。文獻[1]提出了一種解決目前交通中存在的缺乏有效海量數(shù)據(jù)的預(yù)處理技術(shù)和多元異構(gòu)數(shù)據(jù)的融合算法,文獻[2]提出了大數(shù)據(jù)的采集、傳輸、處理和應(yīng)用所需的相關(guān)大數(shù)據(jù)處理技術(shù),是通過系列地使用非傳統(tǒng)工具來對大量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進行處理,從而獲得分析和預(yù)測結(jié)果的一系列大數(shù)據(jù)處理技術(shù)。 本文在此基礎(chǔ)上提出了利用視頻分析技術(shù)對交通視頻大數(shù)據(jù)的進行特征提取,以交通視頻大數(shù)據(jù)分析和深度挖掘技術(shù)模型生成結(jié)構(gòu)化的交通視頻大數(shù)據(jù)描述文件并對由若干交叉口組成的目標區(qū)域進行挖掘,挖掘出的數(shù)據(jù)可以自動選擇適于綠波控制的道路干線,有效提升了交通管理部門利用視頻監(jiān)控系統(tǒng)進行信息研判和交通誘導(dǎo)的能力和效率。
針對交通視頻監(jiān)控,視頻信息的結(jié)構(gòu)化描述重點在于分層次存儲道路交通中典型目標的各類信息。從處理流程上看,首先由任務(wù)管理單元向視頻源發(fā)交通視頻監(jiān)控網(wǎng)絡(luò)發(fā)出視頻調(diào)度信息,調(diào)取視頻流;同時,從數(shù)據(jù)庫中提取視頻的時空信息,就是視頻采集的時間,攝像機ID、視頻采集經(jīng)緯度以及視頻數(shù)據(jù)URL,第二,對原始視頻流進行時基校正和流媒體轉(zhuǎn)發(fā)后,進入是視頻分析池;第三,時基校正后的視頻流進入視頻分析池單元,對視頻進行運動目標檢測,并對該目標進行連續(xù)跟蹤,并確定針對該目標的關(guān)鍵圖像幀;然后對該目標進行分類,第一步判斷該目標是人員還是汽車,進一步根據(jù)需求還可以獲取目標更詳細的分類信息;根據(jù)圖像關(guān)鍵幀,確定關(guān)鍵視頻片段,以關(guān)鍵視頻片段開始結(jié)束時間的形式進行保存,最后將上述信息構(gòu)成視頻結(jié)構(gòu)化描述文件。如圖1所示。
圖1 交通監(jiān)控視頻大數(shù)據(jù)結(jié)構(gòu)化描述工作原理
視頻結(jié)構(gòu)化描述文件包含視頻時空信息、運動目標關(guān)鍵幀信息、目標分類信息、關(guān)鍵視頻片段信息及相應(yīng)的原始視頻信息。由于視頻結(jié)構(gòu)化描述文件內(nèi)包含文字、圖片和視頻等多種數(shù)據(jù)類型,而且圖片和視頻的數(shù)據(jù)量巨大,使用單一文件很難包含所有數(shù)據(jù)[3-4]。因此,本文采用索引-數(shù)據(jù)的方式來構(gòu)造視頻結(jié)構(gòu)化描述文件的數(shù)據(jù)結(jié)構(gòu),索引文件采用XML文件形式,將視頻時空信息、運行目標關(guān)鍵幀的索引信息(關(guān)鍵幀圖像的URL)、目標分類信息、關(guān)鍵視頻片段信息(關(guān)鍵視頻片段的開始和結(jié)束時間)及相應(yīng)的原始視頻索引信息(原始視頻數(shù)據(jù)的URL)存放在XML文件中,將數(shù)據(jù)量較大的關(guān)鍵幀圖像使用獨立文件進行統(tǒng)一存放,而海量數(shù)據(jù)的原始視頻文件則保留在遠程的DVR和視頻存儲器當中。視頻結(jié)構(gòu)化描述文件包含以下內(nèi)容:
(1)、視頻時空信息(VS)
視頻物理信息是視頻數(shù)據(jù)本身的物理屬性,該類信息的主要以文字描述的形式進行保存。其包含的內(nèi)容主要有該視頻時間信息(視頻采集的時間)、視頻空間信息(攝像機ID、采集地點經(jīng)緯度、視頻URL)等等。運動目標關(guān)鍵幀就是運動目標中外觀最清晰,或是目標特征最佳的一幀圖像。
(2)、運動目標關(guān)鍵幀(MT)
運動目標圖像關(guān)鍵幀,通常是反映一段視頻中主要信息內(nèi)容的一幀或若干幀圖像。提取關(guān)鍵幀一般有兩個要求:第一,采用保守的原則:“寧可錯選,不能少選”。第二,計算量盡量小,方法不易過于復(fù)雜。提取圖像關(guān)鍵幀的常用方法有:a) 基于鏡頭邊界的方法;b) 基于內(nèi)容分析的方法;c) 基于運動分析的方法;d) 基于聚類的方法;e) 基于壓縮視頻流提取的方法。運動目標關(guān)鍵幀在文件中以圖像URL形式保存。
(3)、目標分類信息(TC)
系統(tǒng)獲取運動目標關(guān)鍵幀后,通過對提取的運動目標進行識別,判別目標的分類信息。對于智能交通應(yīng)用而言,首先是對目標進行人車分類,根據(jù)需求,還可以判別人和車的細節(jié)屬性,例如人的性別、年齡和外觀;車的車牌、顏色和車型等等。目標屬性分類的具體方法,如表1所示。
表1 目標分類信息表
(4)、關(guān)鍵視頻片段(KV)
關(guān)鍵視頻片段,是以運動圖像關(guān)鍵幀為基準,前后一段時間內(nèi)視頻片段。索引文件中關(guān)鍵以開始和結(jié)束時間的方式保存關(guān)鍵視頻片段信息。
(5)、原始視頻(OV)
索引文件中以視頻數(shù)據(jù)的URL形式來保存原始視頻數(shù)據(jù)信息。
基于視頻大數(shù)據(jù)的道路交通數(shù)據(jù)信息價值挖掘模型利用目標分類識別信息加以實現(xiàn)。
第一步,使用CRBM模型[5]在時間域和空間域上分別構(gòu)造道路交通數(shù)據(jù)信息價值挖掘模型,并合并成為一個深度置信網(wǎng)絡(luò)。
第二步,把一個視頻作為時空深度置信網(wǎng)絡(luò)輸入,進行分層處理,自下向上,逐層累計,在逐漸變大的區(qū)域內(nèi)挖掘出時空模式。該模型的網(wǎng)絡(luò)包括有交替的時空合并層[6-7]。
第三步,在第一層中,輸入為一個nVt幀的視頻,
記做{v(0,v(1),…,v(nVt)}。在每個時間點t,每個空間。
CRBM模型把一幀大小為(ch×nVx×nVy)的圖像v作為輸入,并輸出一組響應(yīng),記做p,其大小為(|W|×nVx×nVy)。其中W是圖像濾波器的集合,并且在所有空間CRBM模型中共享。每個p(t)都代表空間CRBM模型中的一組最大值合并單元[8-9]。
第四步,網(wǎng)絡(luò)的第二層設(shè)置為一個時域合并層,輸入是從空間合并層得到的低分辨率的圖像序列{p(0),p(1),…,p(nVt)},輸出則是一個更短的序列{s(0),s(1),…,s(nSt)}。圖像位置為(i,j)的每個像素都在時間軸上累計,從而形成長度為(|W|×nVt×1)的時間序列SI(i,j)。
第五步,每個時間序SI(i,j)都被輸入到一個CRBM模型里,然后與時域濾波器W′卷積。與空間CRBM模型相類似,時域CRBM模型使用了一系列濾波器W′。
第六步:時域最大值合并層有一共(nPX×nPy)個CRBM模型,因為圖像幀中的每個像素都在不同時間上采集,并通過一個CRBM模型處理。
第七步,給定一個在空間坐標為(i,j)的像素上的時域序列,記做SI(i,j),則時域CRBM模型輸出SO(i,j)為一組更短的序列,其大小為(|W′|×nVt×1)。
第八步,對每個像素重新安排進原始兩維的圖像空間分布。得到的最終的時域空間分布,是一列更短的低分辨率圖像序列{s(0),s(1),…,s(nSt)}。
在對前期視頻數(shù)據(jù)采集的基礎(chǔ)上,本文提出了一種基于視頻分析的道理交通數(shù)據(jù)價值挖掘算法,對前期生成的視頻結(jié)構(gòu)化數(shù)據(jù)進行統(tǒng)一編碼,并對由若干交叉口組成的目標區(qū)域進行挖掘,挖掘出的數(shù)據(jù)可以自動選擇適于綠波控制的道路干線,該算法設(shè)計步驟如下:
(1) 對于任意聯(lián)通的交叉口,對于目標區(qū)域中相鄰交叉口之間的所有路段進行檢測,將滿足預(yù)定條件的路段列入集合L,并將集合L中各路段兩端的交叉口列入集合M,若滿足關(guān)鍵相位車道數(shù)≥α、安全速度≥β千米/小時、交叉口間距≤600米、相鄰交叉口周期差ΔC≤δCmin(δ∈(0,0.3))、路段流量不大于路段飽和流率的80%的條件,則標記路段m1?m2為l12,其兩端的交叉口,記為m1,m2;遍歷控制區(qū)域內(nèi)的路段,得到滿足上述條件的路段集合為L={l12,l14,l17,l16,l45,l34},其端點交叉口集合為M={m1,m2,…,mn1},其中n1表示被標記的交叉口個數(shù)。(參數(shù)α,β在實際應(yīng)用中需根據(jù)實際交通狀況標定,默認值α=3,β=40)。
(2) 將路段集合L={l12,l14,l17,l16,l45,l34}中的路段按其安全速度差異ΔV≤5 km/h的條件分組得到線路,如圖2中,可能會分為子集合L1={l12,l14,l16,l17},L2={l45,l34}。
圖2 控制區(qū)域示意圖
其中A,B,C,D分別為圖3所示車檢器檢測的車流數(shù)據(jù)。將流量比≤φ的交叉口標記為a1,a2,…,an2,將流量比>φ的交叉口記為b1,b2,…,bn3。其中n2表示由兩條干線相交所成的交叉口個數(shù),n3表示由干線與支線相交所成的交叉口個數(shù)。如圖3中:m1,m4為a1,a2;m2,m3,m5,m6,m7為b1,b2,…,b5(參數(shù)φ在實際應(yīng)用中需根據(jù)實際交通狀況標定,默認值為2)。
圖3 干線與支線間流量比示意圖
(4)子集合L1,L2中ai的個數(shù)N(ai)及與交叉口ai相連的交叉口個數(shù)f(ai)。
若N(ai)=0,得到“一”形干線;
若N(ai)=1,f(ai)=4,得到“十”形干線;
若N(ai)=1,f(ai)=3,得到“T”形干線;
若N(ai)=1,f(ai)=2,得到“L”形干線;
若N(ai)=2,得到“土”形干線;
若N(ai)≥3,得到其他類型干線。
(5) 計算干線上下行流向的交通流,取最大流向為綠波方向。如圖4所示。
圖4 上下行示意圖
如上行流量為q(AB)+q(BC),下行流量為q(BA)+q(CB),綠波方向為max(q(AB)+q(BC),q(BA)+q(CB))。
為了使檢測的事件類型更廣、精度更高,系統(tǒng)采用了車輛跟蹤檢測與事件模型檢測相結(jié)合的方法[10]。事件檢測的基本原理如圖5所示。并對交通路口的延誤做了相關(guān)實驗測試,具體測試過程如下:
圖5 交叉路口事件檢測基本原理圖
根據(jù)圖5所示,測試車輛從測試交叉口前一個路口開始行駛,當測試車輛以暢行速度行駛時,觸發(fā)行駛記錄測試系統(tǒng),5-10 s后,再次觸發(fā)行駛記錄測試系統(tǒng),采集得到測試車輛的暢行平均速度v,當測試車輛在測試交叉口前第一次停車時,同時觸發(fā)行駛記錄測試系統(tǒng),當測試車輛通過測試交叉口,到達對向車道停止線時,同時觸發(fā)行駛記錄測試系統(tǒng),系統(tǒng)記錄下測試交叉口行駛距離s及交叉口實際行駛時間T,實驗過程:
在大成城區(qū)確定以下目標區(qū)域:項王路-平安大道,平安大道-西湖路,人民大道-項王路,人民大道-西湖路,發(fā)展大道-項王路,富康路-項王路。
一方面,系統(tǒng)通過采集的車流量數(shù)據(jù)按照協(xié)調(diào)控制干線組織的模型進行計算機解析,分高峰時段和平峰時段劃分出綠波的干線運行,并記錄區(qū)域內(nèi)的車輛行程時間,交叉口總延誤,停車次數(shù),排隊長度。
另一方面,按現(xiàn)有人工劃定的固定綠波路線在相同環(huán)境下運行在高峰時段和平峰時段,并記錄下區(qū)域內(nèi)的車輛行程時間,交叉口總延誤,停車次數(shù),排隊長度。對經(jīng)驗證效果如表2所示。
表2 驗證結(jié)果統(tǒng)計表
該交通事件自動檢測及警告方法可用于評估分析城市公共交通當前運行狀態(tài)并預(yù)測未來的情況,為公共交通管理方案提供演練環(huán)境。停車、排隊與逆向行駛是道路交通發(fā)生頻率較高的幾種事件。當視頻分析得到的檢測信息中包含停車、排隊與逆向行駛信息時,應(yīng)用端軟件除記錄事件的發(fā)生位置外,還將發(fā)出警告信號;此外,還加入了事件條件檢測模型模塊,只要以某時段內(nèi)檢測的交通流量、車輛速度及時間占有率作為輸入,在分析其是否發(fā)生異常變化的基礎(chǔ)上,就能判斷是否發(fā)生了事件,如果有事件,就發(fā)出警告;通過這些功能,交通監(jiān)控中心可以及時發(fā)現(xiàn)并處理各路段的事件。在平行交通系統(tǒng)的基礎(chǔ)上,開展城市交通管理的評價實驗,評價并優(yōu)化常規(guī)需求情況下、增強需求情況下、突發(fā)事件情況下的管理方案。有效提升了交通管理部門利用視頻監(jiān)控系統(tǒng)進行信息研判和交通誘導(dǎo)的能力和效率。
本文提出了一種基于視頻大數(shù)據(jù)的道路交通數(shù)據(jù)信息價值挖掘模型,該模型定義了視頻大數(shù)據(jù)結(jié)構(gòu)化描述文件,對交通監(jiān)控系統(tǒng)產(chǎn)生的海量視頻數(shù)據(jù)進行智能分析和數(shù)據(jù)挖掘,對提取的視頻大數(shù)據(jù)中的層次化價值信息從道路交通數(shù)據(jù)檢測及交通事件自動檢測及警告兩個方面進行挖掘分析,提取的數(shù)據(jù)提升了交通監(jiān)控系統(tǒng)的使用效益,有利于快速實現(xiàn)后續(xù)多種智能分析處理功能,提高交通信息分析和智能交通誘導(dǎo)等工作的性能和效率。
[1] 韓光,趙春霞.一種改進的最大化AUC方法在障礙物檢測中的應(yīng)用. 模式識別與人工智能,2013,23(5):731-737.
[2] Lu K,Zeng X S,Li L,etal.Two-way bandwidth maximization model with proration impact factor for unbalanced bandwidth demands.Journal of Trans- portation Engineering,2014,138(5):527-534.
[3] 魏明,陳學(xué)武,孫博.一種車速截斷對數(shù)正態(tài)分布的車隊離散模型.東南大學(xué)學(xué)報:自然科學(xué)版,2013,43(3):885-886.
[4] Yanqing, D.,Guangming, C.,One, V. and Woolley, M. Big Datain Higher Education: An action research on managing student engagement with business intelligence[A]. Fehmida Hussain. Second International Conference on Emerging Research Paradigm in Business and Social Science.Dubai:Middlesex University,2013.26-28.
[5] 楊海根,芮筱亭,劉怡昕,張建書,何斌.基于MBDyn多體系統(tǒng)可視化仿真平臺研究與設(shè)計.南京理工大學(xué)學(xué)報.2013,37(6):785-791.
[6] 王建中,尹義龍基于動態(tài)信息模型的路徑規(guī)劃方法.計算機工程,2013(9):7-8.
[7] Guang Han, Chunxia Zhao. AUC Maximization Linear Classifier Based on Active Learning and Its Application. Neurocomputing, 2014, 73(7-9): 1272-1280.
[8] Anthony G. Picciano. The Evolution of Big Data and Learning Analytics in American Higher Education.Journalof Asynchronous Learning Networks ,2013,16(3):9-20.
[9] 吳昊.基于關(guān)聯(lián)規(guī)則的道路交通事故數(shù)據(jù)挖掘的研究.吉林:吉林大學(xué),2013:35-58.
[10] 曹斌.數(shù)據(jù)倉庫技術(shù)在智能監(jiān)測與管理系統(tǒng)中的應(yīng)用.武漢:武漢理工大學(xué),2015:40-5.
ResearchonDataMiningModelofRoadTrafficDataBasedonLargeDataofVideo
Li Xiaofeng
(Department of Information Engineering, Heilongjiang International University, Harbin 150025, China)
Because of the traffic management of the video monitoring system is fast to network, high-definition and intelligent development, in view of the current traffic information collected data utilization rate is low and the out of order, facing the resulting data "flood" of the impact, this paper presents a traffic video big data analysis and mining depth model definition video description file, this paper presents an algorithm for mining reasonable traffic data based on the value of video analysis, video structured data on the early formation of a unified encoding, and the target area by the number of intersections of mining, mining the data can be automatically selected for the trunk road green wave control, surveillance video the value of data into information file contains content of semantic information, so as to improve the use efficiency of traffic monitoring system.
Large video data; Target classification; Data mining; Green wave control; Information value
1007-757X(2017)12-0018-04
黑龍江省教育廳科學(xué)技術(shù)研究項目(12543076)
李曉峰(1978-), 男,哈爾濱,副教授,博士研究生,CCF高級會員(E200016287S),ACM會員,IEEE CS會員。研究方向:數(shù)據(jù)挖掘,社會計算,智能算法。
TP391
A
2016.05.05)