王維華
(陜西交通職業(yè)技術(shù)學(xué)院 軌道交通學(xué)院,西安 710018)
地鐵在運行中可能出現(xiàn)的障礙物包括掉落的混凝土、軌旁設(shè)備、意外跌落的行人等,在地鐵行駛中,障礙物的出現(xiàn)危險系數(shù)很高,因此,應(yīng)該加強障礙物的檢測。障礙物檢測是地鐵研究中的一個必不可少的研究方向,在地鐵列車運行過程中,通過對接觸式障礙物檢測系統(tǒng)的應(yīng)用,雖然可以及時發(fā)現(xiàn)前方障礙物,但只能在與障礙物碰撞之后才能使地鐵緊急制動,這樣一來,地鐵可能受到較大的沖擊力,無法保證地鐵與乘客的安全[1],因此,需要改進這種障礙物的檢測方法。關(guān)于障礙物的非接觸檢測很多學(xué)者進行了研究,如張磊等人[2]利用自上而下掃描圖像得到像素分布情況,之后提取出障礙物的區(qū)域目標(biāo),但是這種方法存在應(yīng)用局限,只能對那些比地面要高的障礙物進行檢測;劉威等人基于單目視覺相機的支持執(zhí)行對障礙物的檢測任務(wù),發(fā)現(xiàn)這種方法精度并不高,外界因素容易對其形成干擾[3];徐進等人對以傳感器融合技術(shù)為基礎(chǔ)的算法進行研究及分析,在一定程度上實現(xiàn)了對視覺傳感器數(shù)據(jù)檢測準(zhǔn)確性的提升[4]。楊潔等人對全局背景運動補償參數(shù)估計方法加以運用檢測障礙物,提高了檢測的速度[5]。當(dāng)前,非接觸式的障礙物檢測主要應(yīng)用激光雷達、超聲波、紅外測距傳感器、可見光成像系統(tǒng)等,激光雷達雖然具有不受惡劣天氣影響的優(yōu)點,但其分辨率與精度都很低,無法實現(xiàn)對自主檢測小障礙物要求的滿足[6],超聲波通過主動發(fā)射與接收脈沖檢測障礙物,如果存在多傳感器工作的情況,會有相互之間的干擾產(chǎn)生,對最終檢測結(jié)果產(chǎn)生較為明顯的不利影響[7]。在可見光成像中,包含的信息十分豐富,對于圖像細(xì)節(jié)類信息的獲取同樣非常多,這是可見光成像技術(shù)的明顯優(yōu)勢,如果光照條件比較理想,通過對可見光成像技術(shù)的運用,能夠達到將障礙物檢測精度提高的目的。另一方面,紅外光所具有的優(yōu)點更加得突出,在該技術(shù)的支持下,基于對物體自身紅外輻射的探測,經(jīng)由光電轉(zhuǎn)換以及信號處理等多個環(huán)節(jié)的轉(zhuǎn)換處理,物體表面的熱分布情況會以相對應(yīng)的視頻圖像的形式被輸出出來,整體而言,該技術(shù)可以進行全天候的應(yīng)用,周圍的環(huán)境光照等因素不會對其產(chǎn)生較大的影響,亦可滿足遠(yuǎn)距離探測的要求,對于夜晚等光照條件不理想的環(huán)境探測而言,同樣表現(xiàn)出很好的適用性。所以,對可見光與近紅外兩種技術(shù)進行結(jié)合的雙目視覺技術(shù)在短時間內(nèi)便得到了很快的發(fā)展,基于兩種技術(shù)的成像系統(tǒng)之間能夠達到優(yōu)劣勢充分互補的目的,對于圖像采集模塊對環(huán)境適應(yīng)性的提升具有明顯的積極意義[8-10]。由于在場站環(huán)境下,單一傳感器檢測速度慢、準(zhǔn)確性差、范圍小[11],為了彌補單一傳感器檢測中存在的缺陷,本文設(shè)計了基于紅外成像系統(tǒng)和可見光成像系統(tǒng)的地鐵障礙物檢測系統(tǒng)。
地鐵的運行速度一般在80~100 km/h,設(shè)定的地鐵制動距離為400 m,地鐵車輛障礙物檢測系統(tǒng)應(yīng)該具備的功能如下:1)由于地鐵車輛大部分線路在地下運行,光線條件比較昏暗,因此,系統(tǒng)的運行需要保證能夠在光線不太好的環(huán)境下獲得地鐵前方的障礙物信息;2)可以及時檢測地鐵前方的障礙物,并且進行不同級別的預(yù)警;3)建立地鐵運行中的障礙物數(shù)據(jù)庫,實時記錄相關(guān)信息,便于后期的調(diào)查研究。
系統(tǒng)運行的平臺包括以DSP技術(shù)[12]為核心的平臺、基于嵌入式ARM的平臺、以工控機(IPC,industrial personal computer)[13]為基礎(chǔ)的平臺,由于以DSP技術(shù)為核心的平臺系統(tǒng)開發(fā)周期長,基于嵌入式ARM的平臺不能滿足大量圖像的處理要求,因此選擇工控機為地鐵車輛障礙物檢測系統(tǒng)的運行平臺。本文使用的工控機配置具體如下:CPU為Intel Core i5-4590,3.30 GHz;內(nèi)存為8 GB。相機視場角為51.46°,芯片尺寸為6.4 mm×6.4 mm,感光度為ISO100,鏡頭焦距為15 mm,拍攝的圖片大小為1280×720,處理的圖片的分辨率為640×480,兩個攝像機的光軸相互平行。
綜合而言,可見光系統(tǒng)在對豐富圖像信息的獲取之上具有較為明顯的優(yōu)勢,而紅外成像系統(tǒng)則不會受到光照等因素的過多影響,出于對這些優(yōu)點的把握,選擇對紅外與可見光兩種成像系統(tǒng)進行結(jié)合的方式,達到獲取地鐵車輛運行過程中障礙物信息的目的,基于車載方式的支持進行單個紅外成像系統(tǒng)以及單個可見光系統(tǒng)的安裝。作為地鐵車輛運行過程中的圖像識別裝置,障礙物視覺檢測系統(tǒng)的功能體現(xiàn)為對整個地鐵車輛運行環(huán)節(jié)的障礙物進行檢測,圖1為系統(tǒng)的設(shè)計方案。概括而言,障礙物視覺檢測系統(tǒng)主要由圖像采集模塊、信息處理模塊、行為分析模塊、用戶接口模塊、地鐵列車接口模塊以及全局服務(wù)模塊構(gòu)成。
圖1 地鐵障礙物檢測系統(tǒng)設(shè)計方案
圖像采集模塊主要包括紅外成像系統(tǒng)和可見光成像系統(tǒng),通過上位工控機完成兩類成像系統(tǒng)的并行工作方式設(shè)置,保證采集的圖像在檢測結(jié)果上具有互補性。為了更好地對障礙物圖像信息進行采集,通過雙目校正獲得紅外成像系統(tǒng)和可見光成像系統(tǒng)的相對位置關(guān)系,消除兩個系統(tǒng)的圖像畸變,令它們的成像坐標(biāo)原點一致,校正通過MatLab標(biāo)定得到的內(nèi)外參數(shù)導(dǎo)出到XML文件,調(diào)用OpenCV庫函數(shù)[14]校正紅外成像系統(tǒng)和可見光成像系統(tǒng)的相機內(nèi)外參數(shù),以此對采集的障礙物圖像進行校正[15-16]。
信息處理模塊的主要功能在于完成障礙物的檢測,是系統(tǒng)的核心部分。圖像采集之后進行二值化預(yù)處理,之后采用BEEMD 算法[17]進行紅外圖像和可見光圖像的融合,最后采用YOLO[18]障礙物類別檢測。
行為分析模塊主要是根據(jù)障礙物的檢測信息實現(xiàn)地鐵列車的減速控制、加速控制等。
用戶接口模塊主要是連接顯示器,在顯示器中顯示地鐵運行的基本信息、前方的障礙物信息、參照物信息等,同時設(shè)置一個緊急的剎車制動按鈕,方便地鐵的調(diào)試運行。
列車接口模塊主要由牽引與制動控制單元構(gòu)成,亦即車輛牽引動力單元以及列車制動停車控制單元。障礙物檢測系統(tǒng)的上位工控機對全局服務(wù)模塊進行管理,同時,進行障礙物檢測等相關(guān)信息的存儲[19-20]。
從具體的硬件構(gòu)成上來看,地鐵障礙物檢測系統(tǒng)主要有系統(tǒng)主機、紅外成像系統(tǒng)、可見光成像系統(tǒng)幾大模塊,其中,系統(tǒng)主機的功能在于對紅外成像系統(tǒng)、可見光成像系統(tǒng)采集的圖像信息進行接收,并執(zhí)行對信息的分析任務(wù),一旦檢查到障礙物,由繼電器做出相應(yīng)的動作,達到緊急制動地鐵的目的。圖2所示為地鐵障礙物檢測系統(tǒng)的硬件平臺示意圖。根據(jù)該圖可知,系統(tǒng)主機中進行工控機、紅外傳感器控制板、可見光CCD傳感器控制板、數(shù)據(jù)存儲硬盤以及散熱風(fēng)扇幾個重要模塊的安裝。待工控機完成對圖像數(shù)據(jù)的分析工作之后,若是發(fā)現(xiàn)有障礙物出現(xiàn),則在第一時間經(jīng)由主控板將繼電器斷開,以此實現(xiàn)對地鐵的緊急制動。圖3為地鐵障礙物檢測系統(tǒng)中主控板的設(shè)計示意圖。
圖2 硬件平臺
圖3 主控板的設(shè)計圖
地鐵障礙物檢測系統(tǒng)的軟件工作流程見圖4。啟動系統(tǒng)后,初始化紅外系統(tǒng)和可見光系統(tǒng),開始圖像采集;圖像采集模塊在地鐵運行中實時檢測軌道線路中的障礙物信息;利用YOLO障礙物檢測技術(shù)進行軌道、障礙物檢測,一旦發(fā)現(xiàn)障礙物及時進行預(yù)警;收到警報信息后,地鐵司機進行列車的速度控制,檢測的障礙物信息和列車的運行信息、報警信息等可以存儲在上位工控機中。
圖4 軟件實現(xiàn)流程
對于紅外成像系統(tǒng)與可見光成像系統(tǒng)而言,在具體的圖像采集過程中,兩個成像系統(tǒng)都有可能會受到外部環(huán)境因素的影響,這會在一定程度上造成對采集圖像信息的干擾,導(dǎo)致圖像誤判現(xiàn)象的發(fā)生,所以,需要采用相應(yīng)的技術(shù)或手段執(zhí)行對采集圖像的預(yù)處理任務(wù)。此處對最大類間方差法(Otsu)加以采用,針對圖像作相應(yīng)的二值化預(yù)處理,在Otsu的支持下對圖像作背景與目標(biāo)的有效分割。
圖像分割是基于對數(shù)理統(tǒng)計、模糊理論以及區(qū)域相似等相關(guān)具體標(biāo)準(zhǔn)的參照,在物理意義層面之上對圖像作相應(yīng)描述,亦即使其表示為一些連通區(qū)域的集合。分析圖像分割的目的,在于對圖像進行若干區(qū)域的劃分,以此為人們觀察與理解提供便利。被劃分的區(qū)域之間不能夠重疊,相互之間應(yīng)表現(xiàn)出各自的獨立性,在不同的區(qū)域,部分特征會有明顯不同的表現(xiàn),而在另一區(qū)域之內(nèi),則有一致性或相似性體現(xiàn)出來。在一定意義上可以說,圖像分割的準(zhǔn)確性會對后續(xù)圖像處理工作開展的順利程度產(chǎn)生直接影響。OTSU算法在提出以來便得到了研究人員的較多關(guān)注,究其原因,在于該方法有著簡單易懂的原理,計算效率也較高,可以在較多領(lǐng)域應(yīng)用,并達到很好的分割效果。作為一種無須進行實時監(jiān)督,且沒有參數(shù)調(diào)控、可以自動尋優(yōu)的圖像分割方法,OTSU將一維直方圖作為算法基礎(chǔ),通過類間方差最大化的實現(xiàn)來選擇具體的閾值。在OTSU算法的具體應(yīng)用下,對于圖像I(x,y),目標(biāo)和背景的分割閾值記作T,有:
(1)
式(1)中,ω0、ω1分別代表目標(biāo)像素點數(shù)占整幅圖像的比例、像素點數(shù)占整幅圖像的比例;μ0、μ1、μ代表圖像原灰度灰度、圖像平均灰度、圖像的總平均灰度;g代表類間方差;M×N代表背景較暗時的圖像大小;N0、N1分別代表像素的灰度值小于閾值T的像素個數(shù)、像素灰度值大于閾值T的像素個數(shù)。對公式(1)簡化之后,得出公式g=ω0ω1(μ0-μ1)2;進一步地,采用遍歷的方法,得出最佳閾值T為178。圖像的處理效果如圖5所示(其中,圖5(a)為處理之前的原始圖像,圖5(b)為二值化處理之后的圖像)。
圖5 圖像處理效果
紅外與可見光圖像傳感器在成像上有不同的機理,這決定它們拍攝的圖像同樣有較大差異呈現(xiàn)出來。所以,需要借助于相應(yīng)的算法融合兩種特征并不相同的圖像,獲取有著豐富場景信息的圖像。BEEMD算法主要在高斯白噪聲輔助分析能力的支持下,通過對集成均值方式的采用,獲取準(zhǔn)確度比較高的特征分量和殘差分量[21-22]。詳細(xì)而言,BEEMD算法的主要思想為基于高斯白噪聲輔助分析能力的支持,以提出的噪聲模型為依據(jù)獲取幾個含有不同幅值的噪聲圖像,并借助于優(yōu)化的BEMD對圖像進行分解,通過對集成均值方式的采用,得到可以滿足較高準(zhǔn)確度要求的特征分量以及殘差分量。模態(tài)混疊主要由信號間歇而引起,其存在會導(dǎo)致分解之后的內(nèi)蘊分量頻率出現(xiàn)嚴(yán)重混合的問題,并由此而喪失本有的物理意義。針對BEMD算法,進行一定量的高斯白噪聲的添加反而對于圖像的分解具有很好的促進作用。其原因主要如下:在進行包絡(luò)面的構(gòu)造之時,對于圖像數(shù)據(jù)極值點的分布所提要求比較嚴(yán)格,對于一些有著明顯紋理變化的細(xì)節(jié)區(qū)域,其區(qū)域極值點的數(shù)量比較多,紋理變化速度也相對緩慢,而與之相對應(yīng)的,細(xì)節(jié)并不明顯的區(qū)域卻存在缺少必要區(qū)域極值點的問題,這對于BEMD算法包絡(luò)面的構(gòu)造又具有不利影響。通過將一定量的高斯白噪聲引入其中,可以相應(yīng)地增加圖像局部區(qū)域極值點的數(shù)量,對于包絡(luò)面的構(gòu)造具有積極影響,可以很好地發(fā)揮出對算法的驅(qū)動作用。具體地,圖像融合需要經(jīng)歷以下幾個步驟:
1)將滿足一定比例要求的高斯白噪聲引入其中,讓其可以均勻地填充在整個圖像空間之中;
2)將對稱延拓的方法加以采用,以配準(zhǔn)之后等待融合的圖像為對象,執(zhí)行對其的延拓處理任務(wù),基于這一操作得到含有高斯白噪聲的圖像,數(shù)量一共為n個;
3)基于BEMD算法的支持對得到的上述含有高斯白噪聲的n個圖像進行分解處理,進一步得到每層n個內(nèi)蘊模分量IMF;
4)針對各層n個內(nèi)蘊模分量IMF,將它們的平均值求解出來,由此可以得到等待融合的圖像的特征分量EIMF,之后,采用求解均值的方法得到參殘差分量Res;
5)進行初始化處理,設(shè)定分解層數(shù)i=1,對最大的分解層數(shù)進行限定,一共為I層(即i
6)針對等待分解的圖像,將其視作殘差分量Ri-1,n=An,執(zhí)行對每張圖像第第i層內(nèi)蘊模分量IMFi的計算任務(wù);
7)在完成具體的計算之后,可以獲取各層n個圖像的IMF分量和殘差分量R,在此基礎(chǔ)之上,對第i層的IMFi分量求均值,可進一步獲取等待融合的圖像各層的特征分量EIMFi;
8)對IMF篩選的停止條件進行設(shè)置,以具體的Cauchy-type收斂條件為參照依據(jù),當(dāng)SD<ζ時,停職篩選作業(yè)的進行,設(shè)定ζ的數(shù)值為0.2。
圖6 融合前后的圖像
在借助紅外系統(tǒng)和可見光成像系統(tǒng)采集地鐵前方的障礙物目標(biāo)圖像,并對圖像進行預(yù)處理和圖像融合之后,進一步執(zhí)行YOLO障礙物類別檢測[23-25],實現(xiàn)地鐵的障礙物檢測功能。圖7為障礙物檢測信息處理流程圖。
圖7 障礙物檢測信息處理流程圖
YOLO障礙物類別檢測所用的是一種新型的網(wǎng)絡(luò)結(jié)構(gòu),包括53個卷積層的Darknet53,采用金字塔思想,對第1個預(yù)測層前的特征圖進行上采樣處理,在第2個、第3個預(yù)測層前添加卷積層,使圖像的特征更加細(xì)膩。根據(jù)圖8可知,當(dāng)一副包含目標(biāo)信息的原始圖片輸入之后,網(wǎng)絡(luò)會先對其進行多個網(wǎng)格的分解,之后經(jīng)由迭代卷積逐一對各網(wǎng)格內(nèi)是否包含目標(biāo)物體進行檢測,如果檢測到某網(wǎng)格內(nèi)有目標(biāo)物體存在,則將其作為初始網(wǎng)格,針對網(wǎng)格中心位置與邊界范圍作微調(diào)處理,以此將目標(biāo)物體精準(zhǔn)位置確定下來。在進行識別的整個過程中,卷積神經(jīng)網(wǎng)絡(luò)會基于某一特定順序的卷積與池化,執(zhí)行對圖像的編碼任務(wù),以此將固定特征信息提取出來,之后經(jīng)由上采樣將采集到的含有特征的編碼信息還原為初始圖片,最終,經(jīng)全連接層將其輸出。在整個識別過程中,特征圖越小,可識別的目標(biāo)也會越小。YOLOv3網(wǎng)絡(luò)中,如果輸入像素為256×256的圖片,能夠提取的特征最小尺寸像素為8×8,可以滿足在途列車障礙物檢測場景中對遠(yuǎn)距離目標(biāo)的檢測。
圖8 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)
根據(jù)本文研究的監(jiān)測方法,進行一個用于功能檢測的實驗平臺的搭建,平臺寬度相同于地鐵列車兩車輪之間的間距,具體數(shù)值為1 435 mm,車載機箱所處的位置在底層板上,照相機則位于地面上方1.6 m的位置。借助于內(nèi)外參數(shù)矩陣,照相機可將圖像上鐵軌和實際鐵軌之間的關(guān)系確定下來。結(jié)合城規(guī)列車運行過程中表現(xiàn)出來的相應(yīng)特點,本文提出了一種對外參數(shù)進行計算的模型,基于對照相機鏡頭平面和水平面之間夾角的確定,可以參照內(nèi)參數(shù)矩陣將外參數(shù)矩陣求解出來。在完成對實驗平臺的搭建任務(wù)之后,保持照相機固定狀態(tài),對其鏡頭平面和水平面之間的夾角進行測量,為5°。在系統(tǒng)的各個設(shè)備之間,借助于電纜將它們之間的相互連接建立起來,平臺的下端,位于兩端位置處的輪軌能夠沿著鐵軌的方向,以一個相對而言比較慢的速度對試驗平臺進行推進。針對列車處于靜態(tài)狀態(tài)之下系統(tǒng)的功能,此試驗平臺可以進行模擬,雖然無法做到對列車動態(tài)狀態(tài)之下系統(tǒng)功能的模擬,但是可以發(fā)揮出推動試驗平臺的作用,執(zhí)行對鐵軌邊界特定障礙物的掃描任務(wù),并在此基礎(chǔ)之上,通過對數(shù)據(jù)處理時間的具體計算,又可達到估算列車實際運行狀態(tài)的目的,這同樣意味著系統(tǒng)可以在列車運行狀態(tài)之下發(fā)揮出對障礙物的檢測功能。
為了將系統(tǒng)對障礙物的檢測應(yīng)用效果確定下來,在實際的地鐵運行過程中,通過具體操作將障礙物識別程序啟動,紅外成像系統(tǒng)與可見光成像系統(tǒng)均在地鐵上安裝,它們同時進行地鐵運行圖像信息的采集,并由此而生成相應(yīng)的障礙物檢測數(shù)據(jù)庫,在列車的行駛過程中,如果發(fā)現(xiàn)存在障礙物,則將相應(yīng)的警報信息發(fā)出,若是沒有發(fā)現(xiàn)障礙物,列車保持原狀態(tài)正常運行。
將試驗平臺放置于鐵軌上,平臺靜止不動,設(shè)定人站在鐵軌正前方作為障礙物,己知軌道長度為11.8m,根據(jù)障礙物直線檢測的要求,照像機識別出鐵軌為直線。
識別結(jié)果見圖9。根據(jù)圖9可知,識別結(jié)果較為理想,可以實現(xiàn)列車運行中前方列車80~500 m安全限界范圍內(nèi)的障礙物識別,在500 m內(nèi)能夠識別出行人等障礙物,識別的障礙物大小為40 cm×40 cm;300 m內(nèi)可以識別更小的物體,如掉落在軌道上的石塊等。這樣的識別能力已足夠滿足安全要求。
圖9 障礙物識別效果
本文基于紅外成像系統(tǒng)與可見光成像系統(tǒng)設(shè)計了地鐵障礙物檢測系統(tǒng),先對紅外成像系統(tǒng)與可見光成像系統(tǒng)進行校正,之后采集相關(guān)的圖像信息,由于紅外與可見光圖像傳感器的成像機理不同,所拍攝的圖像也存在有較大的差異。利用BEEMD 算法對圖像進行融合之后進行YOLO障礙物類別檢測,最后對系統(tǒng)的應(yīng)用進行分析,結(jié)果表明該系統(tǒng)的障礙物識別能力滿足地鐵列車的安全運行需求。