崔宵洋 林建輝 陳春俊 楊 崗 楊劼力 徐 剛
(1.西南交通大學(xué)機(jī)械工程學(xué)院 成都 610031)
(2.西南交通大學(xué)牽引動(dòng)力國(guó)家重點(diǎn)實(shí)驗(yàn)室 成都 610031)
(3.中車青島四方機(jī)車車輛股份有限公司 青島 266111)
高速列車采用弓網(wǎng)系統(tǒng)作為車輛的受流裝置。隨著我國(guó)列車速度越來(lái)越高,維持弓網(wǎng)間的良好接觸變得越來(lái)越困難,其受流質(zhì)量不能得到良好的保障,當(dāng)嚴(yán)重惡化時(shí)影響列車的安全運(yùn)行。定位器是接觸網(wǎng)的關(guān)鍵零部件之一,確保接觸線在受電弓滑板運(yùn)行軌跡范圍內(nèi),使接觸線與受電弓不脫離。定位器的坡度狀態(tài)經(jīng)常會(huì)受到弓網(wǎng)耦合系統(tǒng)引起的振動(dòng)和激勵(lì)作用帶來(lái)的不利影響,當(dāng)其坡度值過(guò)大會(huì)出現(xiàn)受電弓滑板加速磨損的現(xiàn)象,當(dāng)坡度值過(guò)小會(huì)導(dǎo)致與受電弓滑板碰撞[1~2]。因此,檢測(cè)接觸網(wǎng)定位器對(duì)確保弓網(wǎng)系統(tǒng)的正常工作有著重要的意義。在我國(guó)鐵路起步階段,鐵路接觸網(wǎng)定位器檢修的自動(dòng)化水平較低,主要依靠傳統(tǒng)人工巡檢方式檢測(cè)。人工檢測(cè)的工作量極大,維修成本高并且效率低下。隨著我國(guó)鐵路檢修設(shè)備的快速發(fā)展和對(duì)自動(dòng)化檢測(cè)的需求越來(lái)越高,鐵路檢修行業(yè)開始使用圖像處理和機(jī)器學(xué)習(xí)的技術(shù)來(lái)對(duì)接觸網(wǎng)定位器進(jìn)行自動(dòng)化檢測(cè),基于視覺的定位器檢測(cè)系統(tǒng)如圖1 所示。此檢測(cè)技術(shù)雖然在一定程度上提高了檢測(cè)效率,降低了人工檢修的成本,但是受到傳統(tǒng)機(jī)器學(xué)習(xí)的弊端影響,造成檢測(cè)的精確度和實(shí)時(shí)性都比較低,不能滿足實(shí)際檢測(cè)的需求[3]?,F(xiàn)如今我國(guó)鐵路檢測(cè)已經(jīng)進(jìn)入“大數(shù)據(jù)”時(shí)代,迫切需要全面提高接觸網(wǎng)定位器的檢測(cè)技術(shù),實(shí)現(xiàn)高精確率和高實(shí)時(shí)性的自動(dòng)化檢測(cè)目標(biāo),切實(shí)保障高速列車的安全行駛。
近二十年隨著硬件GPU 計(jì)算水平的大力提高,深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)視覺技術(shù)在學(xué)術(shù)界和工業(yè)界都取得了巨大成功。鐵路行業(yè)相關(guān)研究學(xué)者也廣泛采用基于卷積神經(jīng)網(wǎng)絡(luò)(convolu?tional neural networks,CNN)的計(jì)算機(jī)視覺技術(shù),在接觸網(wǎng)緊固件[4]、受電弓滑板磨耗[5]和軌道表面缺陷[6]等檢測(cè)領(lǐng)域取得了良好的檢測(cè)效果。在目標(biāo)檢測(cè)領(lǐng)域,以Faster R-CNN[7]為代表的基于候選區(qū)域目標(biāo)檢測(cè)算法在ImageNet[8]和MICROSOFT CO?CO[9]圖像數(shù)據(jù)庫(kù)中效果表現(xiàn)良好,在車輛檢測(cè)和行人檢測(cè)等得到了廣泛的實(shí)際應(yīng)用。然而,F(xiàn)aster R-CNN 算法對(duì)于小目標(biāo)的檢測(cè)效果不太好。基于定位器在接觸網(wǎng)采集圖像中所占區(qū)域比較小事實(shí),本文創(chuàng)新性設(shè)計(jì)了用于精確檢測(cè)小目標(biāo)的多尺度卷積特征,該特征融合了不同卷積神經(jīng)網(wǎng)絡(luò)層的低級(jí)和高級(jí)的卷積特征。因此我們把改進(jìn)后的Faster R-CNN 稱為多尺度特征Faster R-CNN(Multi-Lev?el Features Faster R-CNN,MLF-FRCNN)。
圖1 高速鐵路定位器檢測(cè)視覺系統(tǒng)
近年來(lái),我國(guó)鐵路行業(yè)相關(guān)學(xué)者在定位器檢測(cè)領(lǐng)域做了很多研究工作。范虎偉[11]提出首先利用Sobel 邊緣算子獲取圖像的邊緣輪廓線,然后使用鏈碼對(duì)定位器粗定位和Radon 變換精確定位相結(jié)合的檢測(cè)算法。段汝嬌[12]首先對(duì)定位器圖像進(jìn)行細(xì)化預(yù)處理,然后利用改進(jìn)的霍夫變換對(duì)細(xì)化圖像中的相鄰特征像素點(diǎn)聚類和感知編組,最后采用隨機(jī)霍夫變換使感知編組后的圖像中每條線段更接近直線,實(shí)現(xiàn)定位器快速而又準(zhǔn)確的檢測(cè)。王旭東[13]提出基于霍夫變換直線檢測(cè)與AdaBoost 相結(jié)合的定位器檢測(cè)算法。顧會(huì)建[14]提出基于灰度自相似度特征(Gray Self-Similarity)和AdaBoost 算法構(gòu)建定位器檢測(cè)的分類器,然后利用霍夫變換對(duì)定位器進(jìn)行精確檢測(cè)。前面所提出的定位器檢測(cè)算法主要利用人工獲取目標(biāo)特征,然后手工對(duì)目標(biāo)特征進(jìn)行編碼。然而現(xiàn)如今大規(guī)模的圖像檢測(cè)數(shù)據(jù)給這種基于傳統(tǒng)機(jī)器學(xué)習(xí)的檢測(cè)技術(shù)帶來(lái)了嚴(yán)峻挑戰(zhàn)。傳統(tǒng)檢測(cè)算法嚴(yán)重依賴于設(shè)計(jì)精妙的目標(biāo)特征描述子,容易陷入求解局部最優(yōu)解的陷阱,檢測(cè)精確度和速度偏低。深度卷積神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練過(guò)程中整合特征提取,可以有效地解決上述問題。鐘俊平[15]提出基于CNN 的接觸網(wǎng)開口銷不良狀態(tài)檢測(cè),所提的深度學(xué)習(xí)模型采用新型的錨機(jī)制產(chǎn)生目標(biāo)建議區(qū)域,提高了檢測(cè)準(zhǔn)確率。陳俊文提出[16]基于CNN 的接觸網(wǎng)緊固件缺陷檢測(cè),整個(gè)檢測(cè)模型采用了由粗檢到精檢的策略。劉志剛[17]研究了基于不同深度學(xué)習(xí)模型的接觸網(wǎng)支撐組件的定位和故障檢測(cè)算法,重點(diǎn)比較分析了基于Faster R-CNN[7]的檢測(cè)模型效果。
Faster R-CNN 是R-CNN[18]家族中具有最優(yōu)異的檢測(cè)精確度和速度深度卷積網(wǎng)絡(luò)模型。但是Faster R-CNN本身存在著一個(gè)弊端,即其感興趣區(qū)域池化層(region of interest pooling,ROI-pooling)僅僅從單一高級(jí)卷積神經(jīng)網(wǎng)絡(luò)層的特征圖中構(gòu)建特征,比如VGG-16[19]模型只是從第五個(gè)卷積層(Conv5)的特征圖做候選區(qū)域池化運(yùn)算,忽略了從低級(jí)卷積特征圖中提取特征,這些低級(jí)特征對(duì)于檢測(cè)小目標(biāo)是非常重要的。因此我們提出了基于MLF-FRCNN 的定位器檢測(cè)模型,融合全局特征信息和局部特征信息,可以更好地包含檢測(cè)目標(biāo)的細(xì)節(jié)信息,提高定位器的檢測(cè)精度和魯棒性。
Faster R-CNN 起源于R-CNN,中間又經(jīng)歷了SPP-NET[20]和Fast R-CNN[21]的 發(fā) 展 而 最 終 形 成的。R-CNN 系列深度學(xué)習(xí)模型都是基于建議區(qū)域(region proposal)的目標(biāo)檢測(cè)算法,所以如何尋找和處理目標(biāo)的建議區(qū)域?qū)φ麄€(gè)模型檢測(cè)的性能有著至關(guān)重要的作用。搜索目標(biāo)的建議區(qū)域(region proposal)算法從最初的EdgeBoxes[22]或者Selective Search[23]算法發(fā)展到在Faster R-CNN 中使用的區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN),檢測(cè)的精確率和速度至此得到了大幅度的提高。Faster R-CNN 通過(guò)卷積特征共享的方法使RPN 和Fast R-CNN 高效地結(jié)合成一體完成目標(biāo)檢測(cè)的任務(wù)。然而Faster R-CNN 模型在提取目標(biāo)特征的過(guò)程中,其最后的Conv5 卷積層所對(duì)應(yīng)的感受野范圍是相當(dāng)大的。因此當(dāng)檢測(cè)小目標(biāo)的時(shí)候,Conv5 卷積層輸出結(jié)果只會(huì)包含很少的像素,不能很詳細(xì)地描述目標(biāo)的特征信息。更糟糕的是,隨著卷積神經(jīng)網(wǎng)絡(luò)層數(shù)越來(lái)越深,相應(yīng)特征圖上的每個(gè)像素點(diǎn)提取了感興趣區(qū)域(region of interest,ROI)之外越來(lái)越多的卷積信息。這意味著如果ROI很小,特征圖也就包含了更小比例的ROI內(nèi)部的信息。
跨層連接(skip-layer connections)在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)領(lǐng)域中是一個(gè)比較常用的思想,它可以跨過(guò)中間神經(jīng)層而將低級(jí)和高級(jí)神經(jīng)層的輸出直接連接在一起。例如Sermanet[24]提出基于多步特征(multi-stage features)的行人檢測(cè),就是利用了跨層連接的思想。Liu[25]研究了當(dāng)采用跨層連接技術(shù)提取特征時(shí)特征歸一化的必要性。根據(jù)上述Faster R-CNN 的檢測(cè)弊端和相關(guān)學(xué)者的研究方向,我們認(rèn)為如果將局部特征和全局特征組合起來(lái)形成多尺度特征并加以高效利用,那么能夠更精確地檢測(cè)定位器小目標(biāo),同時(shí)具有較高的魯棒性。因此我們?nèi)略O(shè)計(jì)了多尺度特征,不僅有來(lái)自高級(jí)卷積神經(jīng)網(wǎng)絡(luò)層的高級(jí)特征,還有來(lái)自其他低級(jí)卷積層的特征,例如Conv3 和Conv4 等。這樣MLF-FRCNN 模型的特征提取工作更加完善,既能包含目標(biāo)的全局信息,還能包含更多的目標(biāo)細(xì)節(jié)信息,可以保證高效率地檢測(cè)小目標(biāo)。受Liu 研究工作的啟發(fā),我們?cè)谔崛《嗉?jí)卷積特征過(guò)程中加入了二范歸一化的處理。基于Liu 提出的ParseNet[25]模型,我們?cè)O(shè)計(jì)了如圖2 所示的MLF-FRCNN 深度卷積神經(jīng)網(wǎng)絡(luò)模型。MLF-FRCNN 的區(qū)域候選網(wǎng)絡(luò)和Faster R-CNN 的保持不變,但是我們重新設(shè)計(jì)了可以在不同尺度下提取卷積特征的Fast R-CNN 卷積神經(jīng)網(wǎng)絡(luò)去訓(xùn)練目標(biāo)的候選區(qū)域。新型多尺度特征深度卷積神經(jīng)網(wǎng)絡(luò)包含了5 個(gè)共享的卷積層,分別是Conv1,Conv2,Conv3,Conv4 和Conv5。前兩個(gè)卷積層Conv1和Conv2后面都相應(yīng)依次連接著線性整流函數(shù)(rectified linear unit,ReLU)激活層,局部響應(yīng)歸一化(local response normalization,LRN)層,最大池化(MAX-pooling)層。另外三個(gè)卷積層后面連接ReLU 激活層,它們的輸出結(jié)果做為相應(yīng)的ROI 池化層和歸一化層的輸入。隨后對(duì)來(lái)自不同卷積層的特征進(jìn)行拼接、尺度調(diào)節(jié)和降維處理(1×1 con?volution),形 成 多 尺 度 特 征(Multi-Level Fea?tures)。然后將得到的多尺度特征向量輸入到兩個(gè)全連接層(fully connected layer),最后softmax 回歸層完成目標(biāo)分類和調(diào)整目標(biāo)包絡(luò)框的檢測(cè)任務(wù)。
圖2 MLF-FRCNN模型的結(jié)構(gòu)
為了能夠在多尺度下提取小目標(biāo)的特征,我們需要在感興趣區(qū)域池化操作后將不同維度的特征向量連接起來(lái)。實(shí)際上每個(gè)卷積層的特征圖在通道數(shù)量和像素值大小范圍上都是不同的,例如卷積層越深,其特征圖上的像素值會(huì)越小。如果將各個(gè)不同卷積層的特征向量未加處理直接連接,那么淺層特征向量由于像素值較大而在多尺度特征所占權(quán)重過(guò)大,多尺度特征不能很客觀地描述小目標(biāo)而變得不可信,最后導(dǎo)致整個(gè)深度卷積神級(jí)網(wǎng)絡(luò)檢測(cè)性能非常差。因此,我們對(duì)要連接成多尺度特征的每個(gè)特征向量進(jìn)行二范歸一化處理和尺度調(diào)節(jié)[25],這樣能夠平衡大特征和小特征之間對(duì)多尺度特征的貢獻(xiàn)比,同時(shí)會(huì)使神經(jīng)網(wǎng)絡(luò)訓(xùn)練變得更加穩(wěn)定。特征向量的二范歸一化如式(1)和(2)所示:
在神經(jīng)網(wǎng)路訓(xùn)練過(guò)程中,我們通過(guò)反向傳播(back propagation,BP)算法和鏈?zhǔn)椒▌t來(lái)計(jì)算尺度因子μi和特征向量X 的微分,如式(4)、(5)、(6)所示:
式中,l 表示我們要最小化的損失函數(shù)。
我們需要將二范歸一化層集成到Faster R-CNN 模型中,ROI-pooling 層從Conv3,Conv4 和Conv5 卷積層中提取特征,每個(gè)卷積層都獨(dú)立地將特征數(shù)據(jù)傳遞給二范歸一化層。然后將多個(gè)特征向量連接成一個(gè)特征向量并進(jìn)行尺度調(diào)節(jié),使數(shù)值縮放至合適范圍內(nèi)。為了使縮放后的特征向量能夠成功輸入到原Faster R-CNN 的全連接層,需要保證它們二者之間的維度大小一樣,所以增加了1×1 convolution 層,壓縮特征向量的通道數(shù)為1。高級(jí)和低級(jí)卷積層的特征向量經(jīng)過(guò)歸一化處理,特征拼接,尺度調(diào)節(jié)和降維處理后,形成了固定維度的多尺度特征向量,最后該特征向量輸入到深度卷積神經(jīng)網(wǎng)絡(luò)的全連接層進(jìn)行目標(biāo)分類和目標(biāo)包絡(luò)框的調(diào)整。
在Faster R-CNN 模型的區(qū)域建議網(wǎng)絡(luò)RPN中,錨(anchor)的設(shè)計(jì)采用了3 種尺度{128,256,512} 和3 種比例{1 :1,1:2,2:1} ,總共有9 種不同的候選建議窗口在特種圖上滑動(dòng)。然而接觸網(wǎng)定位器在我們線路試驗(yàn)采集的接觸網(wǎng)圖像中面積占比比較小,比例大概在0.009~0.042 的范圍之間,遠(yuǎn)小于ImageNet 和MICROSOFT COCO圖像數(shù)據(jù)集目標(biāo)的面積占比(0.014~0.463),同時(shí)定位器構(gòu)件的寬度值遠(yuǎn)大于其高度值。基于此,我們將anchor 尺度和比例相應(yīng)地改為{64,128,256}和{4 :1,6:1,8:1} 。改進(jìn)的anchor 在特征圖上產(chǎn)生包括中心點(diǎn)坐標(biāo)、高度和寬度一共4 個(gè)變量參數(shù)( x,y,h,w )的區(qū)域建議框。在卷積神經(jīng)網(wǎng)絡(luò)層的特征圖里每一個(gè)位置上,分別產(chǎn)生36 個(gè)( 4×9 )用于輸入到回歸神經(jīng)網(wǎng)絡(luò)層的參數(shù)和18 個(gè)( 2×9 )用于輸入到分類層的參數(shù)。RPN 在卷積特征圖上滑動(dòng)時(shí)一共產(chǎn)生H×W×9(H ,W 分別代表特征圖的高度和寬度)個(gè)anchor。
我們創(chuàng)建了總數(shù)為6000 張的高速鐵路接觸網(wǎng)定位器圖像數(shù)據(jù)集來(lái)評(píng)估MLF-FRCNN 模型的檢測(cè)效果,其中3000 張作為網(wǎng)絡(luò)模型的訓(xùn)練集,1500張作為驗(yàn)證集,1500 張作為測(cè)試集。接觸網(wǎng)圖像分為有隧道和無(wú)隧道兩種拍攝背景,每一種拍攝背景下的接觸網(wǎng)圖像中包括了不同拍攝角度和光照強(qiáng)度情況。多樣化的接觸網(wǎng)圖像數(shù)據(jù)庫(kù)利于深度卷積模型的訓(xùn)練,提高定位器檢測(cè)算法的魯棒性。在模型訓(xùn)練之前,我們首先利用標(biāo)注工具對(duì)接觸網(wǎng)圖像中的定位器做人工標(biāo)注,存儲(chǔ)目標(biāo)的標(biāo)注數(shù)據(jù)。為了提高網(wǎng)絡(luò)模型對(duì)計(jì)算資源的使用效率,接觸網(wǎng)圖像的分辨率由原來(lái)的6 600×4 400 等比例降為600×400。隨后進(jìn)行零均值化處理,這樣可以在反向傳播中加快網(wǎng)絡(luò)中每一層權(quán)重參數(shù)的收斂。在MLF-FRCNN 模型訓(xùn)練階段,選用VGG16深度卷積神經(jīng)網(wǎng)絡(luò)模型,超參數(shù)學(xué)習(xí)率設(shè)置為0.001,選用動(dòng)量設(shè)置為0.9 的隨機(jī)梯度下降優(yōu)化器。硬件平臺(tái)包括2 GB RAM 的NVDIA TITAN X GPU和3.60GHz Intel i7-7700 CPU等。計(jì)算機(jī)選用Ubuntu操作系統(tǒng)選和Caffe[26]深度學(xué)習(xí)框架。
本小節(jié)重點(diǎn)分析多尺度特征對(duì)MLF-FRCNN模型檢測(cè)效果的影響。表1 比較了不同卷積層特征經(jīng)過(guò)歸一化、尺度調(diào)節(jié)和降維操作連接成的多尺度特征對(duì)模型MLF-FRCNN 的平均精度均值(mean average precision,mAP)的影響。從表1 中我們可以看出,當(dāng)多尺度特征包含卷積層Conv3、Con4 和Conv5 特征時(shí)平均精度均值可以達(dá)到最高98%。若再增加卷積層Conv2的卷積特征時(shí)我們發(fā)現(xiàn)模型MLF-FRCNN 的平均精度均值并沒有得到實(shí)質(zhì)性的提高,反而在一定程度上增加了模型的復(fù)雜性,所以我們?cè)O(shè)計(jì)的多尺度特征實(shí)際上來(lái)自卷積層Conv3、Con4和Conv5。圖3展示了DPM[10]、Fast?er R-CNN 和MLF-FRCNN 的對(duì)比檢測(cè)效果。可以看出在隧道環(huán)境下和無(wú)隧道環(huán)境下,MLF-FRCNN定位器檢測(cè)模型的精確率和回召率都高于DPM 模型和Faster RCNN 模型,這表明設(shè)計(jì)的多尺度特征對(duì)于檢測(cè)小目標(biāo)的定位器有很大的幫助。DPM 模型的檢測(cè)效果最差,大約只有70%。其中主要原因是DPM 基于傳統(tǒng)機(jī)器學(xué)習(xí),提取目標(biāo)特征和訓(xùn)練特征進(jìn)行目標(biāo)分類的過(guò)程是獨(dú)立的,并且目標(biāo)特征的描述子高度依賴人工設(shè)計(jì),有時(shí)候并不能良好地描述目標(biāo)。Faster R-CNN 的檢測(cè)效果處于兩外二者之間,大約為92%。Faster R-CNN 與DPM 模型相比最大的不同之處是采用了深度卷積神經(jīng)網(wǎng)絡(luò),能夠做到端到端學(xué)習(xí),可以大幅度提高檢測(cè)效果。MLF-FRCNN 與Faster R-CNN 相比,實(shí)現(xiàn)了可以在多個(gè)不同尺度下提取目標(biāo)特征,該多尺度特征包含了目標(biāo)的局部細(xì)節(jié)信息,所以檢測(cè)效果是最優(yōu)的,高達(dá)98%。橫向?qū)Ρ韧环N模型在兩種不同檢測(cè)環(huán)境下的效果,我們發(fā)現(xiàn)三種模型在無(wú)隧道的環(huán)境下定位器檢測(cè)的精確率和回召率都要高于隧道環(huán)境。該現(xiàn)象發(fā)生的主要因素是在隧道下拍攝的接觸網(wǎng)圖像背景顯得更復(fù)雜,客觀上增加了定位器的檢測(cè)難度。
圖3 上圖和下圖分別為無(wú)隧道和有隧道環(huán)境下三種檢測(cè)模型的比較
表1 從不同卷積層連接多尺度特征的檢測(cè)效果比較
表2 三種定位器檢測(cè)模型的幀率比較
表2 展 示 了DPM、Faster R-CNN 和MLFFRCNN 定位器檢測(cè)模型的幀率(Frames Per Sec?ond,F(xiàn)PS)。與Faster R-CNN 相比,MLF-FRCNN 由于使用了多尺度特征增加了一定的復(fù)雜性而導(dǎo)致檢測(cè)速度慢了大概1%,該模型的檢測(cè)幀率為4.65。MLF-FRCNN 模型的檢測(cè)速度比DPM 模型快了大約10 倍,可以很好地滿足實(shí)際檢測(cè)中高實(shí)時(shí)性的要求。另外,MLF-FRCNN 模型檢測(cè)幀率的標(biāo)準(zhǔn)差低于DPM 和Faster R-CNN 的標(biāo)準(zhǔn)差,這說(shuō)明我們所提出的模型更具有穩(wěn)定性。圖4 展示了基于MLF-FRCNN 的定位器檢測(cè)模型的最終檢測(cè)結(jié)果,矩形框即為檢測(cè)到的定位器。圖4 的前2 個(gè)子圖片顯示的是在無(wú)隧道場(chǎng)景下定位器檢測(cè)結(jié)果,后4 個(gè)子圖片顯示的是在有隧道場(chǎng)景下的檢測(cè)結(jié)果。綜上分析,基于MLF-FRCNN 的定位器檢測(cè)模型具有高精確率和高實(shí)時(shí)性的特點(diǎn),同時(shí)具有較好的魯棒性。
圖4 基于MLF-FRCNN的定位器檢測(cè)結(jié)果
本文提出了一種基于MLF-FRCNN 的高速鐵路接觸網(wǎng)定位器檢測(cè)模型,主要在以下兩個(gè)方面進(jìn)行了創(chuàng)新。首先是該模型很巧妙地融合了來(lái)自不同卷積神經(jīng)網(wǎng)絡(luò)層的特征,將分別來(lái)自高級(jí)和低級(jí)卷積層的特征向量經(jīng)過(guò)二范歸一化后進(jìn)行特征拼接,隨后對(duì)其尺度調(diào)節(jié)和降維處理,最終形成了多尺度特征。該多尺度特征能夠更好地包含目標(biāo)的整體信息和局部細(xì)節(jié)信息,因此更利于檢測(cè)定位器這種小目標(biāo)。另外,我們根據(jù)定位器的結(jié)構(gòu)特點(diǎn),重新制定了RPN 網(wǎng)絡(luò)中anchor 的尺度和比例設(shè)計(jì)規(guī)則,使其能好地符合檢測(cè)定位器這種目標(biāo)場(chǎng)景。試驗(yàn)結(jié)果表明,基于MLF-FRCNN 的定位器檢測(cè)模型比DPM 模型和Faster R-CNN 在檢測(cè)精確度方面提高了很多,同時(shí)具有很高的實(shí)時(shí)性和魯棒性,這對(duì)高速鐵路定位器的后期維修工作具有重要的意義。由于高速鐵路接觸網(wǎng)圖像的拍攝環(huán)境很惡劣,其圖像背景很復(fù)雜,造成定位器的自動(dòng)化檢測(cè)這項(xiàng)工作很有挑戰(zhàn)性。面向未來(lái),我們需要在如何設(shè)計(jì)高效的多尺度特征方面做更加深入的研究,繼續(xù)提高定位器檢測(cè)的精確度。另外如何從整體上對(duì)該深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,提高檢測(cè)的速度也是非常有價(jià)值的。