商強(qiáng) 林賜云,2? 楊兆升,2 邴其春,4 田秀娟 王樹興
(1.吉林大學(xué) 交通學(xué)院, 吉林 長(zhǎng)春 130022; 2.吉林大學(xué) 吉林省道路交通重點(diǎn)實(shí)驗(yàn)室, 吉林 長(zhǎng)春 130022; 3.山東高速公路股份有限公司, 山東 濟(jì)南 250014; 4.青島理工大學(xué) 汽車與交通學(xué)院, 山東 青島 266520)
基于譜聚類與RS-KNN的城市快速路交通狀態(tài)判別*
商強(qiáng)1林賜云1,2?楊兆升1,2邴其春1,4田秀娟1王樹興3
(1.吉林大學(xué) 交通學(xué)院, 吉林 長(zhǎng)春 130022; 2.吉林大學(xué) 吉林省道路交通重點(diǎn)實(shí)驗(yàn)室, 吉林 長(zhǎng)春 130022; 3.山東高速公路股份有限公司, 山東 濟(jì)南 250014; 4.青島理工大學(xué) 汽車與交通學(xué)院, 山東 青島 266520)
為了提高城市快速路交通狀態(tài)判別的準(zhǔn)確性,構(gòu)建了一種基于譜聚類與隨機(jī)子空間集成K最近鄰(RS-KNN)的交通狀態(tài)判別模型.以地點(diǎn)交通參數(shù)為基礎(chǔ),根據(jù)交通流運(yùn)行特性并結(jié)合中國(guó)道路服務(wù)水平的4個(gè)等級(jí),采用譜聚類算法將交通狀態(tài)劃分為4類;然后使用已分類的交通流數(shù)據(jù)訓(xùn)練RS-KNN模型.通過上??焖俾返膶?shí)測(cè)數(shù)據(jù)完成模型的實(shí)驗(yàn)驗(yàn)證和對(duì)比分析.實(shí)驗(yàn)結(jié)果表明,所提出的模型不僅能夠提高交通狀態(tài)判別的精度,而且具有良好的魯棒性,其判別率比標(biāo)準(zhǔn)KNN模型、BP神經(jīng)網(wǎng)絡(luò)模型和SVM模型分別提高7.3%、4.9%和4.5%.
交通工程;交通狀態(tài)判別;譜聚類;隨機(jī)子空間;K最近鄰
交通狀態(tài)判別是智能交通系統(tǒng)(ITS)的關(guān)鍵功能之一.實(shí)時(shí)準(zhǔn)確的交通狀態(tài)判別能夠直接用于ITS的多個(gè)子系統(tǒng),例如先進(jìn)的出行者信息系統(tǒng)(ATIS)和先進(jìn)的交通管理系統(tǒng)(ATMS),因此,國(guó)內(nèi)外研究人員提出了許多卓有成效的交通狀態(tài)判別方法,其中機(jī)器學(xué)習(xí)算法因其優(yōu)良的性能而受到廣泛關(guān)注.
聚類分析是一類無監(jiān)督機(jī)器學(xué)習(xí)算法,能夠在沒有任何先驗(yàn)知識(shí)的情況下實(shí)現(xiàn)交通流數(shù)據(jù)的模式分類.文獻(xiàn)[1]將高速公路交通流量、速度和占有率作為分類的特征變量,采用凝聚聚類算法劃分交通狀態(tài)類型;文獻(xiàn)[2]以高速公路收費(fèi)數(shù)據(jù)為基礎(chǔ),通過模糊C均值(FCM)聚類算法判別交通狀態(tài);文獻(xiàn)[3]使用SCOOT系統(tǒng)的感應(yīng)線圈數(shù)據(jù),通過FCM聚類算法判別城市道路交通狀態(tài);文獻(xiàn)[4]在FCM聚類算法的基礎(chǔ)上,通過設(shè)定不同交通參數(shù)的權(quán)重,提出參數(shù)權(quán)重聚類方法用于劃分交通狀態(tài);文獻(xiàn)[5]對(duì)比了3種聚類算法在高速公路交通狀態(tài)分類方面的性能,結(jié)果表明K均值聚類算法效果最佳;文獻(xiàn)[6]通過K均值聚類算法識(shí)別高速公路的交通擁擠,獲得了87%的識(shí)別率.
人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVM)作為典型的監(jiān)督機(jī)器學(xué)習(xí)算法,已被廣泛用于交通狀態(tài)判別.文獻(xiàn)[7]提出基于RBF神經(jīng)網(wǎng)絡(luò)的高速公路交通運(yùn)行狀態(tài)判別方法;文獻(xiàn)[8]采用BP神經(jīng)網(wǎng)絡(luò)判別道路交通狀態(tài);文獻(xiàn)[9]將概率神經(jīng)網(wǎng)絡(luò)用于公路交通狀態(tài)判別;文獻(xiàn)[10]提出一種基于優(yōu)化SVM的快速路交通狀態(tài)判別方法;文獻(xiàn)[11]將模糊SVM用于城市道路交通狀態(tài)分類;文獻(xiàn)[12]將3種核函數(shù)的SVM用于城市道路交通狀態(tài)模式識(shí)別,并指出數(shù)據(jù)歸一化的必要性.
近年來,聚類分析與監(jiān)督學(xué)習(xí)相結(jié)合的方法已被用于交通狀態(tài)判別,而且具有較好的效果.文獻(xiàn)[13]提出了基于K均值聚類和多分類SVM的高速公路交通狀態(tài)估計(jì)方法;文獻(xiàn)[14]提出了基于動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的地點(diǎn)交通狀態(tài)估計(jì)方法,其基本原理是通過機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)交通流數(shù)據(jù)的聚類和分類.聚類分析為監(jiān)督學(xué)習(xí)算法提供了必要的先驗(yàn)信息,而監(jiān)督學(xué)習(xí)算法能夠保證交通狀態(tài)判別的實(shí)時(shí)性.譜聚類是一種基于譜圖劃分理論的新型聚類算法,相比傳統(tǒng)的聚類算法(如K均值聚類算法),其優(yōu)點(diǎn)在于計(jì)算復(fù)雜度低,不受樣本空間形狀限制等.目前,譜聚類已成功應(yīng)用于模式識(shí)別的多個(gè)領(lǐng)域[15].此外,集成學(xué)習(xí)已成為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要研究方向,許多研究表明集成學(xué)習(xí)算法在解決眾多分類問題上表現(xiàn)出了優(yōu)越的性能,尤其在提高算法泛化能力方面[16].
為了提高快速路交通狀態(tài)判別的準(zhǔn)確性,文中構(gòu)建了一種基于譜聚類(SC)與隨機(jī)子空間集成K最近鄰(RS-KNN)的快速路交通狀態(tài)判別模型(SC-RS-KNN).首先介紹譜聚類與RS-KNN的基本原理,然后構(gòu)建了SC-RS-KNN交通狀態(tài)判別模型,最后對(duì)模型性能進(jìn)行實(shí)例驗(yàn)證和對(duì)比分析.
譜聚類(SC)包括兩個(gè)不同階段:①使用數(shù)據(jù)集構(gòu)造親和圖;②通過親和圖的最優(yōu)分割,聚類數(shù)據(jù)點(diǎn).親和圖是一個(gè)無向圖G(Z,E,W),其中Z=(z1,z2,…,zn),表示頂點(diǎn),E表示邊,W為相應(yīng)的親和矩陣.ei,j為頂點(diǎn)zi與zj之間的邊,所對(duì)應(yīng)的非負(fù)權(quán)重為wi,j,表示樣本xi和xj之間的親和度.因此,親和圖可用親和矩陣W=[wi,j]表示.通過高斯相似度函數(shù)求解wi,j為
(1)
步驟1 構(gòu)建K最近鄰親和圖,其權(quán)重鄰接矩陣記作W.
步驟2 計(jì)算Laplacian矩陣L,標(biāo)準(zhǔn)化Laplacian矩陣Lsym=D1/2LD1/2.
步驟3 計(jì)算矩陣Lsym的前k個(gè)特征向量值u1,u2,…,uk.將u1,u2,…,uk作為列,構(gòu)造矩陣U∈Rn×k.
步驟5 將矩陣T的每一行向量yi∈Rk(i=1,2,…,n)作為一個(gè)數(shù)據(jù)點(diǎn),通過K均值算法對(duì)yi進(jìn)行聚類得到C1,C2,…,Ck.
集成多個(gè)弱分類器,實(shí)現(xiàn)強(qiáng)分類器的功能.集成學(xué)習(xí)不僅能夠提高算法的魯棒性,而且適用于不平衡數(shù)據(jù)的分類.集成學(xué)習(xí)包括兩個(gè)主要問題:一是集成算法的選擇;二是弱分類器的選擇.常用的集成算法包括AdaBoost、Bagging和隨機(jī)子空間等.文中采用隨機(jī)子空間算法集成K最近鄰分類器.
2.1 K最近鄰
K最近鄰是一種簡(jiǎn)單有效的非參數(shù)分類方法,不僅容易實(shí)現(xiàn),而且直接適用于多分類問題.KNN算法基本步驟如下:
步驟1 找出與待分類對(duì)象d最接近的K個(gè)訓(xùn)練樣本,稱為待分類對(duì)象的K個(gè)“最近鄰”.歐氏距離是度量“最近鄰”的常用標(biāo)準(zhǔn).待分類對(duì)象的特征序列X1=(x11,x12,…,x1n)和訓(xùn)練樣本的特征序列X2=(x21,x22,…,x2n)之間的歐式距離為
(2)
步驟2 分別計(jì)算待分類對(duì)象d屬于每一類的權(quán)重W,d屬于類Cj的權(quán)重為
(3)
其中,sim(dj,d)為待分類對(duì)象d與第i個(gè)最近鄰訓(xùn)練樣本di之間的相似度,
(4)
步驟3 將待分類對(duì)象劃分到權(quán)重最大一類.
2.2 隨機(jī)子空間
隨機(jī)子空間(RS)是一種基于樣本特征空間抽樣的集成學(xué)習(xí)算法,其基本原理是從訓(xùn)練樣本的特征空間中隨機(jī)抽樣,構(gòu)建新的訓(xùn)練集,并訓(xùn)練基分類器(文中采用KNN作為基分類器),通過一定規(guī)則(文中采用多數(shù)投票規(guī)則)融合多個(gè)基分類器的分類結(jié)果,得到最終分類結(jié)果.RS算法能夠有效降低樣本維度,減小分類器之間的相關(guān)性,從而提高整體分類效果.RS算法可總結(jié)為以下3個(gè)步驟:
步驟2 每個(gè)新的數(shù)據(jù)集Fi訓(xùn)練固定學(xué)習(xí)算法,得到訓(xùn)練好的基分類器hi,i=1,2,…,G.
步驟3 通過給定的決策規(guī)則,合成基分類器h1,h2,…,hG,得到最終集成的分類器.
SC-RS-KNN模型的流程主要包括4個(gè)步驟:
步驟1 選擇用于交通狀態(tài)判別的特征變量.根據(jù)文獻(xiàn)[18]的建議,選擇交通流量、速度、占有率、占有率與流量的比值和占有率與速度的比值作為特征變量,因?yàn)檫@些變量在不同交通狀態(tài)下具有較大差異.
步驟2 劃分交通狀態(tài)類型.首先需要確定交通狀態(tài)類型的數(shù)目.目前交通狀態(tài)分類數(shù)目沒有統(tǒng)一標(biāo)準(zhǔn),文中根據(jù)中國(guó)道路服務(wù)水平的4個(gè)等級(jí),采用譜聚類算法,將交通狀態(tài)特征變量數(shù)據(jù)分為4類,分別對(duì)應(yīng)4種交通狀態(tài)類型:順暢、平穩(wěn)、擁擠和擁堵.聚類前需要對(duì)特征變量數(shù)據(jù)進(jìn)行歸一化處理,歸一化公式如下:
(5)
步驟3 構(gòu)造訓(xùn)練集.使用已分類的交通狀態(tài)特征變量數(shù)據(jù)構(gòu)造訓(xùn)練集.訓(xùn)練集的輸入為5個(gè)交通狀態(tài)特征變量,訓(xùn)練集的輸出為相應(yīng)的交通狀態(tài),設(shè)定標(biāo)簽1、2、3、4分別對(duì)應(yīng)順暢狀態(tài)、平穩(wěn)狀態(tài)、擁擠狀態(tài)、擁堵狀態(tài).
步驟4 訓(xùn)練RS-KNN模型.通過隨機(jī)子空間方法提取原訓(xùn)練集的多個(gè)特征子空間,使用特征子空間訓(xùn)練KNN分類器,并通過多數(shù)投票規(guī)則合成各KNN分類器的結(jié)果,輸出最終的交通狀態(tài)類型.
4.1 數(shù)據(jù)來源
實(shí)驗(yàn)數(shù)據(jù)來源于上海南北高架快速路,快速路設(shè)置有24個(gè)檢測(cè)斷面,斷面的每條車道分別設(shè)有線圈檢測(cè)器,檢測(cè)器的統(tǒng)計(jì)間隔為5 min,采集連續(xù)5個(gè)工作日的交通流數(shù)據(jù),包括交通流量、速度和占有率.
文中隨機(jī)選取一個(gè)檢測(cè)斷面數(shù)據(jù)進(jìn)行分析.為了獲取道路斷面的交通狀態(tài),根據(jù)式(6)將車道的交通流數(shù)據(jù)合成斷面的交通流數(shù)據(jù):
(6)
其中,qi、vi和oi分別表示斷面i的流量、速度和占有率,j表示斷面的車道編號(hào),n表示斷面車道數(shù).
4.2 基于譜聚類的交通狀態(tài)劃分
通過譜聚類算法,將交通流數(shù)據(jù)分為4種交通狀態(tài):順暢、平穩(wěn)、擁擠和擁堵.各交通狀態(tài)下,交通參數(shù)的平均值如表1所示.由表可知,不同交通狀態(tài)的交通參數(shù)值具有較大差異,符合交通流在不同狀態(tài)下的運(yùn)行特征.
表1 各交通狀態(tài)的交通參數(shù)均值
Table 1 Mean values of traffic parameters in different traffic states
交通狀態(tài)每5分鐘流量/輛速度/(km·h-1)占有率/%順暢8473.51.9平穩(wěn)32764.77.7擁擠50653.415.3擁堵53227.133.0
交通流數(shù)據(jù)的分類結(jié)果如圖1所示.從圖1可以看出,通過交通流數(shù)據(jù)的聚類,得到4個(gè)聚類簇,分別對(duì)應(yīng)順暢、平穩(wěn)、擁擠和擁堵4種交通狀態(tài).簇與簇之間的界限明顯,說明聚類效果良好.順暢交通狀態(tài)下,占有率低,車與車之間的干擾很小,車輛幾乎可以自由行駛,速度快,因而該狀態(tài)的交通參數(shù)數(shù)據(jù)點(diǎn)比較分散.平穩(wěn)交通狀態(tài)下,占有率有所升高,車與車之間干擾增加,開始出現(xiàn)跟馳現(xiàn)象,交通流連續(xù)性增強(qiáng),交通運(yùn)行平穩(wěn),交通流量與速度大致成線性關(guān)系,交通流量隨速度的降低而增加.擁擠狀態(tài)下,占有率進(jìn)一步升高,車輛之間的干擾加劇,速度的下降加快,隨之交通流量的增加緩慢,直至不再增加,甚至減小.擁堵狀態(tài)下,車與車之間嚴(yán)重干擾,速度大幅度下降,交通流量減小,占有率急劇升高,交通運(yùn)行極不穩(wěn)定,數(shù)據(jù)的離散度較大.因此,通過譜聚類劃分的交通狀態(tài)符合交通流在不同階段的運(yùn)行特性.
圖2為每一天的交通狀態(tài)類型.
圖2 每天交通狀態(tài)劃分結(jié)果Fig.2 Classification results for traffic state of each day
由圖2可見,每一天的交通狀態(tài)不盡相同,但也具有一定的相似性.每天大約0:00~5:00,交通梯型的變化,從順暢逐漸變?yōu)閾矶?標(biāo)簽為4),出現(xiàn)早高峰;隨后交通狀態(tài)不斷波動(dòng),大約19:00后,交通狀態(tài)開始變?yōu)槠椒€(wěn)(標(biāo)簽為2),在接近0:00時(shí),交通狀態(tài)變?yōu)轫槙?交通狀態(tài)的劃分結(jié)果符合交通流一天的變化規(guī)律,進(jìn)一步說明了基于譜聚類劃分交通狀態(tài)的有效性.
4.3 RS-KNN的訓(xùn)練
使用前4天數(shù)據(jù)構(gòu)建訓(xùn)練集,訓(xùn)練RS-KNN模型.為了避免模型的過度學(xué)習(xí),模型的訓(xùn)練采用五折交叉驗(yàn)證方法.
RS-KNN模型需要確定的參數(shù)包括子空間的個(gè)數(shù)和每個(gè)子空間的特征維數(shù),其中子空間個(gè)數(shù)即為KNN分類器的個(gè)數(shù).不同的子空間個(gè)數(shù)和子空間維數(shù)的RS-KNN模型交通狀態(tài)的分類正確率如圖3所示.由圖可知,隨著子空間維數(shù)的增加,交通狀態(tài)分類正確率升高,因此子空間維數(shù)取4.在理論上,隨著子空間個(gè)數(shù)的增加,即集成的分類器越多,模型的分類正確率越高.然而,集成的分類器越多,計(jì)算效率越低.從圖3的4維子空間曲線來看,當(dāng)集成30個(gè)KNN分類器之后,隨著集成分類器數(shù)目的增加,模型的交通狀態(tài)分類正確率保持不變(均為93.3%).綜上,子空間維數(shù)取4,子空間個(gè)數(shù)取30.
圖3 模型參數(shù)與分類正確率的關(guān)系
Fig.3 Relationships between model parameters and classification accuracy
4.4 模型性能分析
采用第5天數(shù)據(jù)測(cè)試RS-KNN模型的交通狀態(tài)判別效果.為了更好地分析RS-KNN模型的性能,將標(biāo)準(zhǔn)K最近鄰模型、反向傳播神經(jīng)網(wǎng)絡(luò)模型(BPNN)[8]和支持向量機(jī)模型[10]作為對(duì)比模型.其中,KNN模型需要確定鄰近點(diǎn)的個(gè)數(shù),設(shè)置鄰近點(diǎn)個(gè)數(shù)范圍是1-30,經(jīng)過測(cè)試發(fā)現(xiàn),鄰近點(diǎn)個(gè)數(shù)為10時(shí)模型分類效果最優(yōu).BPNN模型需要確定隱層神經(jīng)元個(gè)數(shù),文中根據(jù)文獻(xiàn)[8]所示方法,得出最佳隱層神經(jīng)元數(shù)為8.SVM模型選用RBF核函數(shù),按照文獻(xiàn)[10]所示方法,得到優(yōu)化的RBF核函數(shù)參數(shù)為2.2,懲罰系數(shù)為10.5.
各模型交通狀態(tài)判別結(jié)果的混淆矩陣如圖4所示.混淆矩陣能夠提供模型判別結(jié)果的具體信息.以RS-KNN模型的混淆矩陣(見圖4(a))為例,矩陣主對(duì)角線的方格表示模型正確判別交通狀態(tài),例如最左上角的方格表示有73個(gè)順暢交通狀態(tài)能夠正確識(shí)別,占所有交通狀態(tài)個(gè)數(shù)的比例為25.3%(73/288).最右下角方格表示模型對(duì)所有交通狀態(tài)的總體判別率為96.9%,誤判率為3.1%.非主對(duì)角線方格表示交通狀態(tài)誤判的具體情況,例如第1行、第2列的方格表示模型將平穩(wěn)狀態(tài)(標(biāo)簽為2)誤判為順暢狀態(tài)(標(biāo)簽為1),誤判次數(shù)為2,占判別總數(shù)的0.7%(2/288).混淆矩陣下方灰色方格表示對(duì)每一類交通狀態(tài)的判別率(上面)和誤判率(下面),例如第4行、第1列灰色方格表示順暢狀態(tài)的判別率為98.6%,誤判率為1.4%.右側(cè)灰色方格表示模型判別為某一類交通狀態(tài)時(shí)的結(jié)果中,正確判別為該類交通狀態(tài)的次數(shù)占判別為該類交通狀態(tài)總次數(shù)的比例(上面)以及誤判次數(shù)所占比例(下面).例如第1行、第4列的灰色方格表示在判別為順暢交通狀態(tài)的結(jié)果(共計(jì)73+2個(gè))中,97.3%(73/75)是正確的,2.7%(2/75)是錯(cuò)誤的.
由圖4可知,在擁堵狀態(tài)判別方面,RS-KNN模型與SVM模型的判別率相等(均為97.1%),除此之外,RS-KNN模型對(duì)各交通狀態(tài)的判別率均高于其他模型.在總體判別率方面,RS-KNN模型比KNN模型、BPNN模型和SVM模型分別提高了7.3%、4.9%和4.5%.在交通狀態(tài)的誤判方面,RS-KNN模型誤判的交通狀態(tài)與目標(biāo)交通狀態(tài)只相差一個(gè)類型,而其他模型均出現(xiàn)相差兩個(gè)交通狀態(tài)類型的誤判情況,即出現(xiàn)較為嚴(yán)重的誤判,說明RS-KNN在交通狀態(tài)判別上具有更好的穩(wěn)定性.綜上,RS-KNN模型不僅能夠進(jìn)一步提高交通狀態(tài)判別的精度,而且具有較好的魯棒性.
圖4 模型的混淆矩陣Fig.4 Confusion matrixes of models
文中結(jié)合無監(jiān)督學(xué)習(xí)算法和監(jiān)督學(xué)習(xí)算法的優(yōu)勢(shì),構(gòu)建了一種基于譜聚類和RS-KNN的交通狀態(tài)判別模型(SC-RS-KNN).首先通過譜聚類算法將交通狀態(tài)特征變量數(shù)據(jù)劃分為4類,分別對(duì)應(yīng)4種交通狀態(tài);然后使用已分類的特征變量數(shù)據(jù)構(gòu)造訓(xùn)練集,訓(xùn)練RS-KNN模型并優(yōu)化模型參數(shù);最后通過實(shí)測(cè)數(shù)據(jù),對(duì)模型性能進(jìn)行比較和分析.結(jié)果表明,SC-RS-KNN模型性能良好,不僅交通狀態(tài)的判別率較高,而且誤判的嚴(yán)重程度較低.在進(jìn)一步研究中,將使用不同道路的交通數(shù)據(jù)驗(yàn)證和分析模型性能.此外,采用更加智能的模型優(yōu)化方法(如群體智慧算法和進(jìn)化算法)也是未來研究的方向.
[1] XIA J,CHEN M.A nested clustering technique for freeway operating condition classification [J].Computer-Aided Civil and Infrastructure Engineering,2007,22(6):430- 437.
[2] 楊慶芳,馬明輝,梁士棟,等.基于收費(fèi)數(shù)據(jù)的高速公路交通狀態(tài)判別方法 [J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(12):51- 57. YANG Qing-fang,MA Ming-hui,LIANG Shi-dong,et al.Freeway traffic state identification based on toll data [J].Journal of South China University of Technology(Natural ScienceEdition),2014,42(12):51- 57.
[3] 姜桂艷,郭海鋒,吳超騰.基于感應(yīng)線圈數(shù)據(jù)的城市道路交通狀態(tài)判別方法 [J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2008,38(S1):37- 42. JIANG Gui-yan,GUO Hai-feng,WU Chao-teng.Identification method of urban road traffic conditions based on inductive coil data [J].Journal of Jilin University(Engineering and Technology Edition),2008,38(S1):37- 42.
[4] 張亮亮,賈元華,牛忠海,等.交通狀態(tài)劃分的參數(shù)權(quán)重聚類方法研究 [J].交通運(yùn)輸系統(tǒng)工程與信息,2014,14(6):147- 151. ZHANG Liang-liang,JIA Yuan-hua,NIU Zhong-hai,et al.Traffic state classification based on parameter weighting and clustering method [J].Journal of Transportation Systems Engineering and Information Technology,2014,14(6):147- 151.
[5] AZIMI M,ZHANG Y.Categorizing freeway flow conditions by using clustering methods [J].Transportation Research Record:Journal of the Transportation Research Board,2010,2010(2173):105- 114.
[6] MONTAZERI-GH M,FOTOUHI A.Traffic condition re-cognition using thek-means clustering method [J].Scientia Iranica,2011,18(4):930- 937.
[7] 李曉斌,徐建閩.基于 RBF 神經(jīng)網(wǎng)絡(luò)的高速公路交通狀況判別 [J].計(jì)算機(jī)仿真,2011,28(2):350- 353. LI Xiao-bin,XU Jian-min.Discriminating for traffic situation of highway based on RBF neural network [J].Computer Simulation,2011,28(2):350- 353.
[8] 巫威眺,靳文舟,林培群.基于BP神經(jīng)網(wǎng)絡(luò)的道路交通狀態(tài)判別方法研究 [J].交通信息與安全,2011,29(4):71- 74. WU Wei-tiao,JIN Wen-zhou,LIN Pei-qun.The method of traffic state identification based on BP neural network [J].Journal of Transportation Information and Safety,2011,29(4):71- 74.
[9] NIU S,LIU H.Probabilistic neural networks for the identification of traffic state [C]∥Proceedings of the 14th International IEEE Conference on Intelligent Transportation Systems(ITSC).Washington DC:IEEE,2011:754- 759.
[10] 董春嬌,邵春福,熊志華.基于優(yōu)化SVM的城市快速路網(wǎng)交通流狀態(tài)判別 [J].北京交通大學(xué)學(xué)報(bào),2011,35(6):13- 16. DONG Chun-jiao,SHAO Chun-fu,XIONG Zhi-hua.Identification of traffic states with optimized SVM method on urban expressway network [J].Journal of Beijing Jiaotong University,2011,35(6):13- 16.
[11] 李清泉,高德荃,楊必勝.基于模糊支持向量機(jī)的城市道路交通狀態(tài)分類 [J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2009,39(S2):131- 134. LI Qing-quan,GAO De-quan,YANG Bi-sheng.Urban road traffic status classification based on fuzzy support vector machines [J].Journal of Jilin University(Engineering and Technology Edition),2009,39(S2):131- 134.[12] 于榮,王國(guó)祥,鄭繼媛,等.基于支持向量機(jī)的城市道路交通狀態(tài)模式識(shí)別研究 [J].交通運(yùn)輸系統(tǒng)工程與信息,2013(1):130- 136. YU Rong,WANG Guo-xiang,ZHENG Ji-yuan,et al.Urban road traffic condition pattern recognition based on support vector machine [J].Journal of Transportation Systems Engineering and Information Technology,2013(1):130- 136.
[13] DENG C,WANG F,SHI H,et al.Real-time freeway traffic state estimation based on cluster analysis and multiclass support vector machine [C]∥ Proceedings of International Workshop on Intelligent Systems and Applications(ISA).Wuhan:IEEE,2009:1- 4.
[14] ANTONIOU C,KOUTSOPOULOS H N,YANNIS G.Dynamic data-driven local traffic state estimation and prediction [J].Transportation Research Part C:Emerging Technologies,2013,34:89- 107.
[15] LIU D,WANG J,WANG H.Short-term wind speed forecasting based on spectral clustering and optimised echo state networks [J].Renewable Energy,2015,78:599- 608.
[16] GUO H,LI Y,LI Y,et al.PSO-adaboost-KNN ensemble learning algorithm for multi-class imbalanced data classification [J].Engineering Applications of Artificial Intelligence,2016,49:176- 193.
[17] VON LUXBURG U.A tutorial on spectral clustering [J].Statistics and Computing,2007,17(4):395- 416.
[18] 邴其春,龔勃文,楊兆升,等.基于投影尋蹤動(dòng)態(tài)聚類的快速路交通狀態(tài)判別 [J].西南交通大學(xué)學(xué)報(bào),2015,50(6):1164- 1169. BING Qi-chun,GONG Bo-wen,YANG Zhao-sheng,et al.Traffic state identification for urban expressway based on projection pursuit dynamic cluster model [J].Journal of Southwest Jiaotong University,2015,50(6):1164- 1169.
Traffic State Identification for Urban Expressway Based on Spectral Clustering and RS-KNN
SHANG Qiang1LIN Ci-yun1,2YANG Zhao-sheng1,2BING Qi-chun1,4TIAN Xiu-juan1WANG Shu-xing3
(1.College of Transportation,Jilin University,Changchun 130022, Jilin, China;2.Jilin Province Key Laboratory of Road Traffic, Jilin University, Changchun 130022, Jilin, China;3.Shandong High-Speed Group Co., Ltd., Jinan 250014, Shandong, China;4.College of Automobile and Transportation, Qingdao Technological University, Qingdao 266520, Shandong, China)
In order to improve the accuracy of traffic state identification for urban expressway,a traffic state identification model based on spectral clustering and RS-KNN (Random Subspace Ensemble K-Nearest Neighbors) is developed. In the investigation,first,on the basis of spot traffic parameters data and according to the operation cha-racteristics of traffic flow,the traffic state is divided into four categories with the consideration of the four levels of service for Chinese roads. Then,the classified traffic flow data are used to train the RS-KNN model.Finally,by using the real data of an expressway in Shanghai,China,an experimental verification and a comparative analysis for the proposed model are carried out. Experimental results demonstrate that the proposed model not only improves the accuracy of traffic state identification but also possesses good robustness;and that the identification rate of the proposed model is 7.3%,4.9% and 4.5% higher than that of the standard KNN model,the BP neural network and the SVM model,respectively.
traffic engineering;traffic state identification;spectral clustering;random subspace;K-nearest neighbor
2016- 10- 08
國(guó)家科技支撐計(jì)劃項(xiàng)目(2014BAG03B03);國(guó)家自然科學(xué)基金資助項(xiàng)目(51408257,51308248);山東省省管企業(yè)科技創(chuàng)新項(xiàng)目(20122150251- 1) Foundation items: Supported by the National Key Technology Research and Development Program of the Ministry of Science and Technology of China(2014BAG03B03) and the National Natural Science Foundation of China(51408257,51308248)
商強(qiáng)(1987-),男,博士生,主要從事智能交通系統(tǒng)關(guān)鍵理論與技術(shù)研究.E-mail:shangqiang14@mails.jlu.edu.cn
? 通信作者: 林賜云(1980-),男,博士,副教授,主要從事智能交通系統(tǒng)關(guān)鍵理論與技術(shù)研究.E-mail:linciyun@jlu.edu.cn
1000- 565X(2017)06- 0052- 07
U 491
10.3969/j.issn.1000-565X.2017.06.009