張麗娟,黃 晟,梅 誠,許薛軍
(1.華南理工大學(xué)土木與交通學(xué)院,廣東 廣州 510640;2.廣東省交通運輸規(guī)劃研究中心,廣東 廣州 510101)
隨著行車荷載和使用年限的增加,瀝青路面服務(wù)水平不斷下降,路面逐漸發(fā)生破壞,準(zhǔn)確預(yù)測瀝青路面使用性能衰變規(guī)律,可為掌握瀝青路面技術(shù)狀況、評定路面結(jié)構(gòu)設(shè)計優(yōu)劣、制定養(yǎng)護(hù)決策提供依據(jù)。
瀝青路面使用性能受自然環(huán)境、交通荷載、結(jié)構(gòu)設(shè)計、材料性能、施工質(zhì)量和維修養(yǎng)護(hù)等多因素綜合影響,使得預(yù)測瀝青路面性能十分復(fù)雜。目前國內(nèi)外比較常見的確定型預(yù)測模型包括經(jīng)驗法和力學(xué)經(jīng)驗法等。如美國(NCHRP)1-37A模型[1]、KIM[2]等開發(fā)的基于力學(xué)經(jīng)驗法的在役路面車轍預(yù)測模型;孫立軍[3]等提出基于瀝青路面初始性能指數(shù)、路齡等因素的瀝青路面性能衰變模型;汪海年[4]等提出了考慮當(dāng)?shù)貧夂驐l件、交通荷載與參數(shù)校正的MEPDG半剛性基層瀝青路面車轍預(yù)估模型。這些模型都是用數(shù)據(jù)擬合的回歸模型,預(yù)測值與真實值可以產(chǎn)生很大偏差,且有些模型考慮的性能影響因素不夠全面。
目前我國公路管理部門構(gòu)建了多個公路養(yǎng)護(hù)信息管理平臺,積累了大量的道路路線、區(qū)間、路面結(jié)構(gòu)、交通量、路況基礎(chǔ)數(shù)據(jù)。大數(shù)據(jù)技術(shù)是挖掘這些信息資源的重要工具,大數(shù)據(jù)的相關(guān)算法已在瀝青路面性能預(yù)測中得到應(yīng)用。如劉黔會[5]等利用支持向量機(jī)(SVM)回歸方法,建立瀝青路面使用性能的預(yù)測評價模型;趙靜[6]等提出了基于灰色關(guān)聯(lián)度分析和支持向量機(jī)回歸(GRA-SVR)的瀝青路面使用性能預(yù)測模型。
K最鄰近(K Nearest Neighbor,簡稱KNN)算法是數(shù)據(jù)挖掘領(lǐng)域常用的機(jī)器學(xué)習(xí)算法,在大規(guī)模、大批量的數(shù)據(jù)分級分類方面,KNN算法具有獨特的快速性、便捷性與精準(zhǔn)性。近年來,有學(xué)者采用K最鄰近算法預(yù)測道路路段短時行程時間[7-9],但未見K最鄰近算法應(yīng)用于瀝青路面使用性能預(yù)測上。本文利用廣東省普通國省道典型瀝青路面路況資料,探索K最鄰近算法在瀝青路面使用性能預(yù)測領(lǐng)域的應(yīng)用。
根據(jù)廣東省公路事務(wù)中心提供的資料,本文篩選了廣東省9條國道和124條省道的普通國省道干線路段(總長度達(dá)13 576 km),從中統(tǒng)計出廣東省普通國省道典型路面結(jié)構(gòu)及其組成[10](見表1)。
從表1可見,排名前2位的路面結(jié)構(gòu)為水泥路面結(jié)構(gòu),排名前3~6位的路面結(jié)構(gòu)為瀝青路面結(jié)構(gòu)(A1~A4型)。在普通國省道典型瀝青路面結(jié)構(gòu)中,一般采用厚度為20~35 cm水泥穩(wěn)定級配碎石(CGA)基層和15~20 cm水泥穩(wěn)定碎石(CCS)底基層,有些底基層采用石灰穩(wěn)定集料(LSGA),有些路段為水泥混凝土路面(PCC)上加鋪瀝青面層。表1分別列出了A2~A4型瀝青路面結(jié)構(gòu)常見的2種基層結(jié)構(gòu)組成。
根據(jù)表1的統(tǒng)計結(jié)果,本文選用A1~A4型瀝青路面結(jié)構(gòu)作為廣東省典型國省道典型瀝青路面結(jié)構(gòu)開展研究。
表1 廣東省普通國省道典型路面結(jié)構(gòu)Table1 ThetypicalpavementstructuresincommonnationalandprovincialtrunkhighwaysinGuangdongprovince排序路面結(jié)構(gòu)編碼路面結(jié)構(gòu)組成路面類型所占比例/%1C1水泥混凝土(23-26cm)水泥路面37.172C2水泥混凝土(20-23cm)水泥路面20.563A1瀝青混凝土(0-4cm)+(20-25)cmPCC+(15-20)CGA瀝青路面6.184A2A2-1瀝青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmCCS瀝青路面3.90A2-2瀝青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmLSGA5A3A3-1瀝青混凝土(15-16cm)+(20-25)cmPCC+(25-30)cmCGA瀝青路面3.71A3-2瀝青混凝土(15-16cm)+(30-35)cmCGA+(15-20)cmCCS6A4A4-1瀝青混凝土(8-10m)+(20-25)cmPCC+(15-20)cmCCS瀝青路面2.95A4-2瀝青混凝土(8-10m)+(25-30)cmCGA+(15-20)cmCCS
自然氣候條件、交通量和施工質(zhì)量是影響路面結(jié)構(gòu)使用性能的外部因素。根據(jù)對廣東省不同地區(qū)氣候、地質(zhì)及交通特點比較分析,從路面結(jié)構(gòu)設(shè)計角度來看,將全省劃分為2個自然片區(qū)較為合理,即粵北地區(qū)(①分區(qū)),珠三角、粵東和粵西地區(qū)(②分區(qū))。根據(jù)普通國省道交通量數(shù)據(jù),本文采用年平均日交通量AADT作為交通量分級的指標(biāo),將普通國省道交通量分成了輕交通、中交通、重交通3個等級。即輕交通等級的AADT值小于3 000 pcu/d,中交通等級的AADT為3 000~10 000 pcu/d,重交通等級的AADT大于10 000 pcu/d。
表1所列的典型瀝青路面結(jié)構(gòu)在兩個自然分區(qū)均有分布,且大多數(shù)普通國省道路段的交通量屬于重交通和中交通等級,輕交通量等級情況只出現(xiàn)在部分省道中。A1瀝青路面結(jié)構(gòu)的瀝青面層厚度偏薄,只見于省道的輕交通量等級路面中,多屬于舊路改造路面。
根據(jù)自然氣候條件、交通荷載條件特點,廣東省分為2個自然片區(qū),交通荷載分為輕、中、重3個交通量等級。根據(jù)面層、基層類型的材料及厚度差異,表1所列的典型瀝青路面結(jié)構(gòu)實際上可以細(xì)化為26種典型瀝青路面結(jié)構(gòu)。
根據(jù)《公路技術(shù)狀況評定標(biāo)準(zhǔn)》(JTG 5210-2018),采用路面使用性能指數(shù)PQI作為瀝青路面使用性能狀況評定指標(biāo)。PQI由路面損壞狀況指數(shù)PCI、路面行駛質(zhì)量指數(shù)RQI、路面車轍深度指數(shù)RDI、路面抗滑性能指數(shù)SRI等4個分項指標(biāo)組成。路面使用性能狀況分為優(yōu)、良、中、次、差5個等級,PQI值評價等級分級標(biāo)準(zhǔn)見表2。
表2 PQI值評價等級分級標(biāo)準(zhǔn)Table2 ClassificationcriteriaofPQIevaluationlevel等級優(yōu)良中次差PQI值/%90^10080^9070^8060^700^60
根據(jù)廣東省公路事務(wù)中心提供的資料,本文選取了在2011年-2015年內(nèi)路面沒有進(jìn)行大中修、僅進(jìn)行普通日常養(yǎng)護(hù)情況下具有代表性的典型瀝青路面結(jié)構(gòu)路段,統(tǒng)計了上述26種廣東省國省道典型瀝青路面結(jié)構(gòu)的PCI、RQI、RDI、SRI等分項指標(biāo)5a檢測數(shù)據(jù),計算出PQI值。
圖1~圖5分別為不同自然分區(qū)、交通量等級下典型瀝青路面結(jié)構(gòu)的PQI值變化規(guī)律。
圖1 ①分區(qū)重交通條件下PQI值趨勢
圖2 ②分區(qū)重交通條件下PQI值趨勢
圖3 ①分區(qū)中交通條件下PQI值趨勢
圖4 ②分區(qū)中交通條件下PQI值趨勢
圖5 輕交通條件下PQI值趨勢
從圖1~圖5可以看出,各典型瀝青路面結(jié)構(gòu)代表性的5年評價等級都在“良”級以上,路面結(jié)構(gòu)使用性能隨時間而衰減,交通量越大,衰減程度越大。在交通量相同條件下,廣東省不同地區(qū)的瀝青路面使用性能差異不顯著。
K最鄰近(KNN)算法是數(shù)據(jù)挖掘領(lǐng)域中基于實例學(xué)習(xí)的非參數(shù)回歸預(yù)測法,通過搜索訓(xùn)練集數(shù)據(jù)庫中與預(yù)測值特征向量最相似的K個樣本來進(jìn)行分類和預(yù)測。如果某一個樣本與該訓(xùn)練集空間中K個最相似(即訓(xùn)練集空間中最近鄰)的樣本中的絕大多數(shù)都屬于某一個類別,則該樣本也屬于這個類別[11-12]。KNN算法采用距離度量的方式判斷歷史數(shù)據(jù)與預(yù)測值特征向量的近似程度。
本文以歐幾里得距離(Euclidean)作為距離算法,以最大投票法(Consensus)作為決策類別屬性算法,在K值未定情況下,KNN算法步驟為:
a.通過己經(jīng)采集的數(shù)據(jù)構(gòu)建訓(xùn)練集S。其中,S由i個樣本組成,每個樣本由m個特征向量(輸入變量)及輸出變量y構(gòu)成,其數(shù)學(xué)表達(dá)式為:
(1)
b.先擬定K值(通常為奇數(shù)),再根據(jù)預(yù)測結(jié)果最終確定K值。
c.設(shè)yp為預(yù)測值(輸出變量),xp為預(yù)測值yp的特征向量,計算特征向量xp與訓(xùn)練集S中歷史特征向量xm的歐幾里得距離dm:
(2)
d.將計算得到的預(yù)測值特征向量與訓(xùn)練集歷史特征向量的距離由小到大排列,在訓(xùn)練集中搜尋出K個與xp距離最近的歷史特征向量,得出這K個歷史特征向量所對應(yīng)的輸出值集合y=[y1,y2,y3,…,yK]。
e.采用最大投票原則,投票數(shù)最多的輸出值yh(h∈K)即為待預(yù)測值yp。
KNN算法包括選擇訓(xùn)練集、構(gòu)建特征向量、選擇合適的K值、距離測量、決策判別等過程,如圖6所示。
圖6 KNN算法流程圖
a.建立KNN模型的訓(xùn)練集和測試集。
利用KNN算法預(yù)測路面使用性能時,需要先建立有足夠多樣性和復(fù)雜性樣本的訓(xùn)練集,以保證訓(xùn)練集有一定的深度與廣度。表1所列的A1、A3、A4型瀝青路面結(jié)構(gòu)的組成、厚度各異,所在路段分布在①分區(qū)和②分區(qū),且有輕、中、重3種交通量等級,滿足訓(xùn)練集的深度與廣度要求。因此,以A1、A3、A4型瀝青路面結(jié)構(gòu)作為訓(xùn)練集,將A2型瀝青路面結(jié)構(gòu)作為測試集。
b.建立KNN模型輸入、輸出指標(biāo)體系。
將影響路面使用性能的因素(自然分區(qū)、交通量等級、面層類型及厚度、基層類型及厚度、路齡)作為輸入指標(biāo)(特征向量),將PQI值及其評價等級作為輸出指標(biāo)(輸出變量),本文在Matlab平臺上進(jìn)行KNN算法仿真分析。在Matlab平臺上,自然分區(qū)、交通量等級、性能評價等級等無法以文本形式輸入,需要將文本轉(zhuǎn)化為數(shù)字形式輸入。
本文運用歐幾里得距離算法,在由A1、A3、A4型瀝青路面結(jié)構(gòu)數(shù)據(jù)構(gòu)建的訓(xùn)練集中尋找K個近似樣本,通過最大投票法決策類別屬性算法預(yù)測A2型路面結(jié)構(gòu)的PQI值及其性能等級,并與實測得到的PQI值進(jìn)行比較。
圖7~圖10為K=3時各自然分區(qū)、交通量等級下A2型瀝青路面結(jié)構(gòu)PQI值預(yù)測值和實測值。
圖7 ①分區(qū)重交通條件下PQI值預(yù)測(K=3)
圖8 ②分區(qū)重交通條件下PQI值預(yù)測(K=3)
圖9 ①分區(qū)中交通條件下PQI值預(yù)測(K=3)
圖10 ②分區(qū)中交通條件下PQI值預(yù)測(K=3)
圖11~圖14為K=5時各自然分區(qū)、交通量等級下A2型瀝青路面結(jié)構(gòu)的PQI值預(yù)測值和實測值。
圖11 ①分區(qū)重交通條件下PQI值預(yù)測(K=5)
圖12 ②分區(qū)重交通條件下PQI值預(yù)測(K=5)
圖13 ①分區(qū)中交通條件下PQI值預(yù)測(K=5)
圖14 ②分區(qū)中交通條件下PQI值預(yù)測(K=5)
選擇平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分誤差(MAPE)作為評價預(yù)測精度指標(biāo)。根據(jù)預(yù)測結(jié)果,計算出預(yù)測誤差指標(biāo)值見表3。
表3 KNN算法預(yù)測結(jié)果評價Table3 EvaluationofpredictedresultsbyKNNAlgorithmK值MAERMSEMAPE/%K=30.6920.8320.737K=50.7640.8740.793
從表3可見,兩個K值的PQI預(yù)測結(jié)果平均絕對百分誤差均小于1%,滿足預(yù)測精度要求,體現(xiàn)了KNN算法這種非參數(shù)回歸方法的優(yōu)越性。K=3時PQI值預(yù)測結(jié)果的MAE、RMSE和MAPE值均小于K=5時的值,說明在該路面性能KNN預(yù)測模型中,K取值為3時,預(yù)測誤差小、精度高。
a.基于K最鄰近算法的瀝青路面使用性能預(yù)測方法考慮了瀝青路面使用性能的非線性影響因素,其以自然分區(qū)、交通量等級、面層類型及厚度、基層類型及厚度、路齡作為特征向量,將PQI值及其評價等級作為輸出向量。KNN模型是一種多因素的綜合模型,相對于其他模型考慮的影響因素更多。
b.利用廣東省普通國省道典型瀝青路面結(jié)構(gòu)5 a的路況歷史數(shù)據(jù),構(gòu)建了KNN預(yù)測模型的訓(xùn)練集,PQI預(yù)測結(jié)果平均絕對百分誤差小于1%,模型預(yù)測精度較高,為瀝青路面結(jié)構(gòu)設(shè)計和制定養(yǎng)護(hù)決策提供參考依據(jù)。
c.模型預(yù)測結(jié)果受限于訓(xùn)練集的數(shù)據(jù)特性。如實例中訓(xùn)練集的瀝青路面結(jié)構(gòu)性能評價等級皆為“優(yōu)”、“良”等級時,測試集瀝青路面結(jié)構(gòu)的性能評價等級結(jié)果呈現(xiàn)出只有“優(yōu)”、“良”等級的特點。因此,要求訓(xùn)練集的數(shù)據(jù)應(yīng)具有一定的廣度與深度,才能保證預(yù)測結(jié)果的準(zhǔn)確性。
d.K最鄰近算法是大數(shù)據(jù)挖掘算法,數(shù)據(jù)樣本的規(guī)模越大,其評價和預(yù)測結(jié)果更科學(xué)、準(zhǔn)確。將獲得的數(shù)據(jù)不斷補(bǔ)充到訓(xùn)練集中,基于K最鄰近算法的瀝青路面使用性能預(yù)測方法可實現(xiàn)動態(tài)預(yù)測,推進(jìn)大數(shù)據(jù)技術(shù)在道路工程領(lǐng)域中的應(yīng)用。