杜翠
(中國鐵道科學研究院集團有限公司鐵道建筑研究所,北京 100081)
地質(zhì)雷達(Ground Penetrating Radar,GPR)技術(shù)作為一種快速、無損、高效的探測技術(shù),在鐵路路基檢測領(lǐng)域得到廣泛應用。車載地質(zhì)雷達技術(shù)是鐵路路基檢測的主要手段[1-3]。采用車載GPR 技術(shù)進行路基檢測時,天線懸掛固定安裝在檢測車底部,與軌枕頂面保持相對固定的距離進行快速檢測。由于車載GPR檢測速度可達100 km/h,長距離檢測導致雷達數(shù)據(jù)的里程累積誤差較大,對病害解釋結(jié)果的空間準確度有重要影響。因此,里程校正是鐵路路基GPR 檢測數(shù)據(jù)處理的必要步驟。
里程校正普遍采用的是橋梁標記回歸計算的方法。數(shù)據(jù)處理人員從采集到的GPR 原始圖像中人工判讀橋梁,記錄其原始里程,與鐵路局相關(guān)部門提供的橋梁實際里程進行回歸計算。由于鐵路路基檢測的數(shù)據(jù)量很大(3 條測線,每100 km 約12 GB),而人工判讀橋梁的效率較低,導致里程校正耗費了大量的人力和時間,因此須研發(fā)快速、準確的GPR 檢測數(shù)據(jù)里程校正方法。橋梁的識別效率是制約GPR 檢測數(shù)據(jù)里程校正效率的關(guān)鍵因素。近年來,隨著計算機視覺技術(shù)的發(fā)展,國內(nèi)外學者陸續(xù)開展少量關(guān)于GPR 路基圖像識別的研究。主要以路基病害為識別目標,采用處理后的GPR 圖像,以單道波形為單位,提取若干個一維特征值,采用神經(jīng)網(wǎng)絡、稀疏表示、支持向量機(Support Vector Machine,SVM)等方法進行分類識別[4-7]。但識別的病害類型較少,且一維特征值對路基特征的表征能力有限,識別效果不佳,尚未達到滿足工程實際應用的水平。
本文基于對GPR 圖像特征的分析,提出一種鐵路路基GPR 檢測數(shù)據(jù)智能里程校正方法。首先,將GPR原始圖像進行二維離散,分段提取二維特征值,建立初始特征向量。其次,采用主成分分析(Principal Component Analysis,PCA)方法進行降維,得到降維后的特征向量。再次,采用適合小樣本數(shù)據(jù)的SVM 方法,建立橋梁的識別模型。然后,將識別到的橋梁同設備表進行自動匹配,同真實里程進行回歸計算,建立GPR 檢測數(shù)據(jù)原始里程與實際里程的相關(guān)關(guān)系,進而得出GPR 文件的實際起止里程和道間距。最后,從京九線路基檢測數(shù)據(jù)提取訓練樣本和測試樣本,對本文提出的鐵路路基GPR 檢測數(shù)據(jù)智能里程校正方法的準確性進行了驗證。
在處理后的GPR 圖像中,噪聲及干擾信號得到一定程度的去除,信噪比提高,與橋梁呈現(xiàn)相近特征的目標反而增多,不利于橋梁的自動識別。而在GPR 原始圖像中,能夠判別的目標通常只有路基、橋梁、道岔3種,如圖1所示。GPR原始圖像更適合作為橋梁自動識別的數(shù)據(jù)源類型。
針對路基、橋梁、道岔3種類型,各選取1道A-scan數(shù)據(jù)(采樣點為512)觀察單道波形,為便于觀察,將振幅歸一化到[-10,10]內(nèi)。如圖2 所示,波形能量集中于前100 個采樣點,即淺層區(qū)域,橋梁波形的能量最強,道岔與路基相近。3 種類型的目標在A-scan 維度的差異主要體現(xiàn)在沿深度方向的能量和方差變化。
圖1 GPR原始數(shù)據(jù)主要類型
圖2 單道波形對比
綜合圖1、圖2,路基、道岔、橋梁的圖像特征差異主要為能量強弱、沿深度方向的分布以及紋理表征。因此,本文對GPR 圖像進行二維離散,沿水平方向劃分為若干個識別單元,再將每個識別單元沿深度方向劃分為若干個子單元,每個識別單元的特征值由其所有子單元的特征值組成,其維度為子單元個數(shù)與特征值個數(shù)的乘積。選取能量、方差以及6 個反映圖像紋理的直方圖統(tǒng)計特征作為特征值[8]。
為檢驗前文選取的特征值對路基、道岔、橋梁3種類型的表征性能,采用京九線實測數(shù)據(jù)進行計算驗證。以5 m 為單位劃分識別單元,每種類型各選2 個。將其沿深度方向分為5 個子單元,計算特征值并進行歸一化處理。
特征值計算結(jié)果見圖3,各個特征值表征性能分析見表1。標準方差和三階矩可區(qū)分3種類型,而其他特征值則只能區(qū)分2類或不具有區(qū)分性能。方差與能量的表征是冗余的,熵與一致性的表征是冗余的。此外,特征值在不同深度的表征性能不同??傮w來說,具有有效表征能力的特征值約16個。
圖3 特征值曲線
表1 特征值表征性能分析
在2.1 節(jié)中構(gòu)建了40 維的特征向量,但存在一定的冗余,且并非所有特征值都具有較高的表征性能。此外,特征向量的維數(shù)過高還會增加計算的復雜度。因此,本文采用主成分分析(Principal Component Analysis,PCA)對原始特征向量進行降維。
為了確定最終的特征向量的維度,以4維為步長,分別進行PCA 降維,檢驗降維后的數(shù)據(jù)集對原始數(shù)據(jù)集的表征性能。表征性能通過2個矩陣的均方根誤差來衡量,計算結(jié)果見圖4。隨著維度增高,均方根誤差呈指數(shù)降低趨勢,20 維處為近似的拐點,即降維至20維后,特征向量表征性能接近原始維度,同2.1節(jié)得出的具有有效表征能力的特征值約16 個的結(jié)論基本一致。
圖4 不同降維維度的重構(gòu)均方根誤差
SVM 是在統(tǒng)計學習理論的基礎上發(fā)展起來的新一代學習算法,通過把低維的復雜問題轉(zhuǎn)換到高維空間,尋求一個最優(yōu)分類超平面,從而降低問題的復雜度,尤其適用于訓練樣本較小的數(shù)據(jù)分類問題[9]。
核函數(shù)的選擇是SVM 的關(guān)鍵步驟,采用適當?shù)暮撕瘮?shù)就可以實現(xiàn)從低維空間向高維空間的映射,從而實現(xiàn)某一非線性分類變換后的線性分類,并且沒有增加計算復雜度。常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)RBF與Sigmoid核函數(shù)等。本文經(jīng)試驗對比,選用徑向基核函數(shù)構(gòu)建SVM識別模型。
綜上所述,本文提出的鐵路路基GPR 檢測數(shù)據(jù)智能里程校正方法的流程如圖5 所示,其關(guān)鍵環(huán)節(jié)分述如下:
1)模型訓練。對訓練樣本進行特征提取和PCA降維后,對降維后的特征向量集進行訓練,建立SVM識別模型。
2)橋梁智能識別。對待處理的GPR 檢測數(shù)據(jù)進行特征提取和PCA 降維,再利用識別模型進行自動分類識別,將識別出的各個橋梁的中心里程作為橋梁標記。
圖5 鐵路路基GPR檢測數(shù)據(jù)智能里程校正方法流程
3)里程回歸。利用橋梁標記和設備表,根據(jù)長度、前后橋梁的里程差等信息,將GPR 檢測數(shù)據(jù)中的橋梁與設備表中橋梁的自動匹配,得到每個橋梁的實際中心里程。再將原始中心里程、實際中心里程進行回歸計算。根據(jù)回歸公式,即可計算GPR 文件的實際起止里程與道間距。
從京九線路基檢測數(shù)據(jù)提取訓練樣本和測試樣本,對本文的模型和方法進行驗證。數(shù)據(jù)采集參數(shù):中心頻率為400 MHz 的屏蔽天線,采樣時窗為64 ns,采樣點數(shù)為512,采集道間距為0.114 9 m。
試驗的硬件環(huán)境:Intel(R)Xeon(R)Gold 5115 CPU@2.40 GHz,64 GB內(nèi)存。在Windows10 64 位系統(tǒng)下使用Visual Studio 2017+MySQL+ OpenCVSharp3.4編程實現(xiàn)算法。
樣本集構(gòu)建情況見表2。對各類樣本計算特征值后進行歸一化處理,再通過PCA 方法降維至20 維。SVM 模型訓練采用徑向基核函數(shù)RBF,得到82個支持向量,訓練精度達到了98%。
表2 各類型樣本集構(gòu)建情況
各類型樣本識別結(jié)果見表3。可知,路基、橋梁、道岔3 類樣本的識別正確率分別為100%,94%,81%。識別錯誤均為橋梁和道岔的錯誤分類。
表3 各類型樣本識別結(jié)果
選取30 km 京九線路基檢測數(shù)據(jù),分別采用人工判讀和自動識別的方法得出該區(qū)段的實際里程和道間距,驗證自動識別方法的誤差。為避免道岔的干擾,將橋梁長度設置為不小于30 m。
人工判讀與自動識別結(jié)果見表4??芍?種方法均識別出8 座橋梁,中心里程的誤差均低于0.005%。回歸計算后得出的里程起止范圍的誤差約2 m,道間距誤差低于1 mm,精度高,滿足鐵路路基檢測工程的實際需求。
表4 人工判讀與自動識別結(jié)果
1)針對目前GPR 檢測數(shù)據(jù)里程校正效率低的問題,提出了一種鐵路路基GPR 檢測數(shù)據(jù)智能里程校正方法。
2)本文提出的里程校正方法通過“二維離散+特征提取+PCA+SVM”的方法自動識別橋梁、路基、道岔,對樣本的需求量小,且降維后計算復雜度降低,計算簡便,不需要較高的硬件配置。
3)經(jīng)京九線路基檢測數(shù)據(jù)驗證測試表明,基于SVM 的橋梁識別方法具有較高的精度,與人工判讀結(jié)果的誤差低于0.005%,最終里程校正的誤差約為2 m,滿足鐵路路基檢測工程的實際需求。