于博軒
(中車工業(yè)研究院有限公司,北京 100070)
作為一種大運量、經(jīng)濟型交通工具,鐵路在我國的經(jīng)濟生活中占有重要的地位,為我國經(jīng)濟社會發(fā)展做出了巨大貢獻。2019年我國鐵路營業(yè)里程超過13.9萬 km,其中電氣化里程10.0萬km,電氣化率為71.9%。電氣化鐵路的快速發(fā)展對接觸網(wǎng)檢測提出了更高要求。
電器化鐵路接觸網(wǎng)由接觸懸掛、定位裝置、支持裝置、支柱等部分組成,是電氣化鐵路的重要組成部分。其中,接觸網(wǎng)定位裝置由定位管、定位器、定位線夾及其連接零件組成,用于將接觸網(wǎng)懸掛定位在設計的空間范圍內(nèi),使其滿足受電弓取流的幾何要求。接觸網(wǎng)的露天架設,導致接觸網(wǎng)定位裝置在外部環(huán)境以及自身壽命的影響下出現(xiàn)部件松動、斷裂、小部件缺失等問題,而一旦定位器底座開口銷缺失,將帶來重大安全隱患,因此,如何及時發(fā)現(xiàn)定位器底座開口銷缺失是急需解決的技術難題。
接觸網(wǎng)懸掛狀態(tài)檢測系統(tǒng)是一種包含了圖像處理技術、動態(tài)拍攝技術、激光攝像技術、數(shù)據(jù)庫技術的成像檢測系統(tǒng)。該系統(tǒng)搭載于接觸網(wǎng)作業(yè)車或專用車輛上,隨車輛行駛過程自動識別接觸網(wǎng)支持裝置并通過圖像抓拍技術獲得接觸網(wǎng)懸掛狀態(tài)圖像,所拍攝的圖像能夠有效呈現(xiàn)接觸網(wǎng)支持裝置、附加懸掛、接觸懸掛及吊柱座區(qū)域零部件的技術狀態(tài)。數(shù)據(jù)處理分析模塊采用圖像穩(wěn)定技術對高清相機采集的圖片進行處理,得到高分辨率圖像。該高分辨率的圖像一方面可以分辨出懸掛裝置出現(xiàn)的松動、脫落、斷裂等故障,另一方面可以提供公里標、桿號、站區(qū)等綜合信息用于定位。
本文采用的接觸網(wǎng)懸掛狀態(tài)檢測系統(tǒng)硬件結構由剛性接觸網(wǎng)成像模塊(包括定位點剛性懸掛成像模塊、剛性懸掛高位吊柱座成像模塊、連續(xù)視頻錄像模塊)、柔性接觸網(wǎng)成像模塊(包括定位裝置及支持裝置成像模塊、附加懸掛成像模塊、桿號成像模塊、接觸懸掛成像模塊)、嵌入式觸發(fā)控制模塊、時空同步定位模塊、支吊柱/定位點識別模塊、補償光源模塊、車地傳輸模塊、顯示與操作模塊、數(shù)據(jù)處理分析模塊等組成,如圖 1所示。
圖1 接觸網(wǎng)檢測系統(tǒng)構成
在每張接觸網(wǎng)檢測圖像中,接觸網(wǎng)定位器底座區(qū)域圖像只占到接觸網(wǎng)檢測圖像中2 900萬像素圖像的很小一塊面積,為準確定位并獲得定位器底座區(qū)域圖像數(shù)據(jù),提高定位器底座開口銷缺失檢測效率,本文采用歸一化互相關模板匹配(NCC)算法,該算法既支持線陣連續(xù)圖像數(shù)據(jù),也支持面陣圖像數(shù)據(jù)。
NCC算法是一種基于統(tǒng)計學且取值范圍在[-1,1]之間的算法,常被用來比較2幅圖像的相似程度,也就是圖像的相關性。對圖像來說,每個像素點都可以看作是1個樣本數(shù)據(jù)子集,這樣整幅圖像就構成了1個樣本數(shù)據(jù)合集。如果該合集中的1個子集與另外1個樣本數(shù)據(jù)中的某個子集出現(xiàn)匹配的情況,則它的NCC值為1,表示相似度極高,反之,如果NCC的值為-1,則表示完全不相關?;谠摾碚?,NCC算法可以表示如下:
式(1)中,W為在待匹配像素位置構建的鄰域窗口;I1(x,y)為模板圖像像素值;I2(x,y)為搜索子圖像素值。
NCC算法優(yōu)點是抗白噪聲干擾能力強,且在灰度變化及幾何畸變不大的情況下精度很高,計算結果有固定的范圍[-1,1],方便設置檢測閾值。
采用NCC算法定位出定位器底座區(qū)域后,本文通過遞進式的銷釘區(qū)域識別和開口銷識別實現(xiàn)開口銷缺失的智能判別,首先從定位器底座圖像中識別出銷釘目標,再根據(jù)銷釘區(qū)域圖像識別開口銷是否缺失。為使不同場景下的開口銷缺失識別效果最優(yōu)化,需要事先通過自編碼器(AE)進行定位器開口銷區(qū)域數(shù)據(jù)采集,采集不同場景、不同光照、不同尺寸條件下的定位器底座圖像、開口銷圖像和銷釘圖像。其中,不同場景指白天和野外,不同光照指圖像曝光偏暗、圖像過曝等,不同尺寸涵蓋接觸網(wǎng)檢測常見的1 600萬像素、2 000萬像素、2 900萬像素圖像。本文最終目的是智能識別開口銷是否缺失,對于開口銷銷釘狀態(tài)圖像采集需要盡量滿足多樣性,如果采集的銷釘狀態(tài)圖像多樣性過少,識別正確率會降低。因此,銷釘狀態(tài)圖像需要涵蓋銷釘掰開的不同程度、銷釘?shù)牟煌?、銷釘?shù)牟煌屡f程度等。
自編碼器是一類在半監(jiān)督學習和非監(jiān)督學習中使用的人工神經(jīng)網(wǎng)絡,其功能是通過將輸入信息作為學習目標,對輸入信息進行表征學習。令輸入層向量為x,通過自編碼器后的輸出層向量為x',但輸出層向量x'和自身輸入層向量x之間仍然存在一定的差異。自編碼器也是一種有損壓縮,可通過損失函數(shù)最小來實現(xiàn)x'近似于x的值?;镜淖跃幋a器是一種包含數(shù)據(jù)輸入層、隱藏層、輸出層3層的神經(jīng)網(wǎng)絡模型。自編碼器包含編碼過程和解碼過程,從輸入層到隱藏層為編碼過程,從隱藏層到輸出層為解碼過程。自編碼器就是將原始數(shù)據(jù)進行編碼,降低維度,發(fā)現(xiàn)數(shù)據(jù)之間規(guī)律的過程。3層自編碼神經(jīng)網(wǎng)絡的模型如圖2所示。
圖2 3層自編碼神經(jīng)網(wǎng)絡模型
自編碼器特征提取算法包括2個過程,輸入層—隱藏層h的編碼過程,如式(2)所示:
式(2)中,δe為編碼函數(shù),W1,b1為編碼的權重和偏置。
隱藏層—輸出層的解碼過程,如式(3)所示:
式(3)中,δd為解碼函數(shù),W2、b2為解碼的權重和偏置。
編碼、解碼之間的壓縮損失JE( W,b)是:
式(4)中, W、b為整個自編碼器網(wǎng)絡的權重和偏置,r表示訓練集中的樣本序號,m表示訓練集的樣本總數(shù)。
由于開口銷狀態(tài)各異,且采集圖像背景復雜多變,實踐中發(fā)現(xiàn)采用灰度梯度直方圖特征(HOG)、局部二值模式特征(LBP)等傳統(tǒng)方法提取圖像特征的識別效果不夠理想。因此,采用自編碼器自動提取圖像特征,使用BP神經(jīng)網(wǎng)絡算法進行訓練,使其輸入值等于輸出值,對輸入的定位裝置底座區(qū)域圖像進行降維處理。實際網(wǎng)絡中,網(wǎng)絡輸入層L1為圖像數(shù)據(jù),考慮到開口銷銷釘?shù)某叽缣攸c,輸入層L1采用70×70的神經(jīng)元數(shù)量,隱藏層L2神經(jīng)元數(shù)量設置為 1 000,輸出層神經(jīng)元數(shù)量和輸入層L1一樣也為70×70。
具體做法是,首先收集5~10萬各種場景下不同形態(tài)的開口銷樣本圖像,并縮放圖像尺寸為70×70;然后采用開口銷樣本圖像訓練自編碼器網(wǎng)絡;最后輸入待識別的定位裝置底座區(qū)域圖像至訓練好的自編碼器,提取隱藏層的1 000維數(shù)據(jù)作為開口銷特征,送入支持向量機(SVM)進行開口銷缺失識別。
定位器底座開口銷缺失識別可通過支持向量機SVM實現(xiàn)。對于已經(jīng)得到了的帶標簽的訓練數(shù)據(jù)(即其 中為自編碼器提取的1 000維特征,yi為開口銷是否缺失類別標簽,i= 1~M),現(xiàn)在需要1個超平面將這些特征數(shù)據(jù)分為正常開口銷和開口銷缺失2類,假設該超平面函數(shù)為為M維向量的轉置,b為實數(shù)),當 0 時,x位于超平面上,的點對應yi= +1的數(shù)據(jù)點,的點對應yi= -1的數(shù)據(jù)點,為此設:
根據(jù)支持向量機(SVM)的推導過程,可得到如下模型公式:
式(6)對于線性可分的任務通常有較好的效果,但是用于開口銷缺失分類的特征數(shù)據(jù)較為復雜,該線性模型已經(jīng)不能適應。因此,根據(jù)支持向量機(SVM)理論,將輸入數(shù)據(jù)映射到高維空間,使其在該空間中盡量線性可分,故上述模型的約束條件可寫為:
式(7)中,φ是輸入數(shù)據(jù)映射到高維空間的映射函數(shù)。
該模型直接求解非常困難,目前基本都是通過優(yōu)化其對偶問題來求解,其對偶問題可通過拉格朗日乘子和對偶定理進行推導,這里不做詳細闡述。在其對偶模型中,涉及到的向量內(nèi)積計算為另一輸入數(shù)據(jù)映射至高緯空間的向量,j= 1~M),而映射后的特征空間維數(shù)通常很高,甚至是無窮維,因此直接計算是非常困難的。為解決這個問題,可通過引入核函數(shù),將高維空間內(nèi)積轉化為求原始空間中核函數(shù)值的方式求解,即:
式(8)中, 是引入的核函數(shù)。本文采用的是高斯核函數(shù),其具有如下形式:
式(9)中, 為高斯核函數(shù)的寬度參數(shù)。上述推導的理論目標不允許任何數(shù)據(jù)分錯,要求所有點都在分類間隔外,這通常都會導致嚴重的過擬合問題。為防止過擬合,增強模型泛化能力,可以引入松弛變量,進而模型可寫為:
引入松弛變量后,其物理意義在于訓練時可通過參數(shù)C來控制分類間隔,允許部分點分錯,這樣就可以在訓練時很大程度地抑制過擬合,提升模型的泛化能力,以適應新的分類數(shù)據(jù)。對于新輸入的定位器底座圖像,即可先輸入訓練好的自編碼器網(wǎng)絡提取降維圖像特征,再將降維圖像特征送入支持向量機(SVM)進行分類,識別是否存在開口銷缺失異常。實際應用時,可先采用上述方法識別定位器底座開口銷圖像中的銷釘區(qū)域,再在銷釘區(qū)域判定開口銷是否缺失。
為檢驗本文提出的定位器底座開口銷缺失識別方法的有效性,在現(xiàn)場設置3處平腕臂底座橫向開口銷缺失和8處斜腕臂底座縱向開口銷缺失,采用本文提出的開口銷缺失識別方法進行開口銷缺失在線識別,識別效果如圖2、圖3所示,識別結果如表1所示。
圖2 平腕臂底座橫向開口銷缺失
圖3 斜腕臂底座縱向開口銷缺失
由表1可知,現(xiàn)場設置的10處平腕臂底座橫向開口銷缺失均實現(xiàn)了正確識別,11處斜腕臂底座縱向開口銷缺失中有1處未識別,其原因在于部件邊緣污垢較多造成區(qū)域特征難以與背景圖像區(qū)分。
表1 開口銷缺失識別結果統(tǒng)計
為高效準確地對接觸網(wǎng)定位器底座開口銷缺失進行識別,針對開口銷形態(tài)小、分布廣的特點,采用歸一化互相關模板匹配(NCC)算法進行定位器底座區(qū)域定位,同時采用無監(jiān)督學習的自編碼器(AE)提取圖像的降維特征,再通過支持向量機(SVM)對開口銷進行識別分類,有效解決了開口銷缺失識別問題?,F(xiàn)場試驗結果表明,本文提出的算法能夠對復雜線路環(huán)境圖像中的定位器底座開口銷缺失進行準確識別和有效檢出,檢出率高,具有較高的技術推廣價值。