蔣麗潔, 柴曉冬, 李立明
(上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院, 上海 201620)
接觸網(wǎng)立柱作為鐵路電網(wǎng)的承重裝置有屬于其本身的身份標(biāo)識(shí)-桿號(hào),所以桿號(hào)的識(shí)別是定位接觸網(wǎng)的最關(guān)鍵步驟之一?,F(xiàn)有研究中,陳忠革[1]采用霍夫直線檢測(cè)實(shí)現(xiàn)支柱定位,后續(xù)采用HOG 特征和支持向量機(jī)(SVM)實(shí)現(xiàn)字符識(shí)別。朱挺[2]采用CCD高速攝像和LED光源技術(shù)拍攝線路兩側(cè)立柱支柱號(hào),該方法利用支柱號(hào)牌本身帶有的熒光,在車頂 LED 光照射情況下,相機(jī)成像的只有帶熒光的支柱號(hào)牌。郭瑞等人[3]分析了立柱號(hào)牌的特點(diǎn)。根據(jù)其特點(diǎn),提出了基于OpenCV的數(shù)字識(shí)別方法。利用HOG特征和支持向量機(jī)分類訓(xùn)練算法實(shí)現(xiàn)立柱定位。
為研究接觸網(wǎng)立柱標(biāo)志牌定位的問題,本文提出了利用顯著性檢測(cè)的方式來定位接觸網(wǎng)立柱桿號(hào)區(qū)域。顯著性檢測(cè)是目前備受學(xué)界關(guān)注的主要研究算法,研究目標(biāo)是人類視覺中的明顯物體,是模擬人類視覺注意力機(jī)制的技術(shù)[4]。Liu等人[5]利用每一個(gè)超像素內(nèi)的運(yùn)動(dòng)直方圖和顏色直方圖,提取這些局部特征并級(jí)聯(lián)成為全局特征,建立了基于超像素的顯著性模型。Singh等人[6]提出生成從不同角度的顯著性模型,并利用線性SVM加權(quán)融合這些顯著圖。多元化特征的來源是聚類成塊或時(shí)間超像素的顏色、運(yùn)動(dòng)和邊界等。本文提到的簡(jiǎn)單線性迭代聚類(SLIC)算法是一種高速度、分割性能好、邊緣黏附度高的超像素分割算法,通過采用K-means聚類以類似于文獻(xiàn)[7]的方式生成超像素。雖然非常簡(jiǎn)單,但是SLIC在Berkeley基準(zhǔn)[8]上產(chǎn)生顯示出對(duì)圖像邊界的最好效果。
本次實(shí)驗(yàn)的研究對(duì)象為列車運(yùn)行過程中手機(jī)拍攝的軌道定位標(biāo)志牌。初始的采集圖像如圖1所示,自然光線下列車車窗也會(huì)出現(xiàn)輕微反光的現(xiàn)象,由于相機(jī)一直處于不斷運(yùn)動(dòng)的狀態(tài),手持拍攝會(huì)隨著列車震蕩有輕微的晃動(dòng),所以得到的圖像序列干擾因素比較復(fù)雜。針對(duì)傳統(tǒng)算法對(duì)負(fù)責(zé)圖像處理速度緩慢并不精確的問題,本文提出了融合超像素分割與基于FT改進(jìn)算法的一種圖像處理方法。具體處理流程如圖2所示。
圖1 原始圖像
圖2 接觸網(wǎng)立柱標(biāo)志牌定位流程圖
在視頻采集過程中,無可避免地會(huì)出現(xiàn)圖像模糊,程度較小的圖像模糊在小區(qū)域放大后也會(huì)對(duì)后續(xù)處理產(chǎn)生大的影響。本文利用基于模糊集的圖像增強(qiáng)方法對(duì)標(biāo)志牌區(qū)域預(yù)處理。研究可知,模糊邏輯推理可以通過模糊化、模糊推理和解模糊化來實(shí)現(xiàn)?;谀:膱D像增強(qiáng)方法的流程步驟可做闡釋分述如下。
(1)模糊特征提取。從數(shù)學(xué)角度講,模糊集使元素與隸屬度一一對(duì)應(yīng),通過隸屬函數(shù)能實(shí)現(xiàn)特定元素到合適隸屬度的映射。對(duì)應(yīng)數(shù)學(xué)公式可表示為:
(1)
其中,F(xiàn)e=128;Fd=0.8;gmax為最大灰度值;gxy對(duì)應(yīng)的則是圖像中(x,y)像素點(diǎn)的灰度值。
(2)模糊推理。通過式(2)變換來修正隸屬度:
(2)
模糊增強(qiáng)的關(guān)鍵在于,模糊增強(qiáng)算子使得隸屬度值大于0.5的更大,而隸屬度值小于0.5的則更小。
(3)模糊與反變換。解模糊化是對(duì)模糊推理輸出進(jìn)行解模糊判決,圖像中新灰度級(jí)的產(chǎn)生利用的是模糊域的反變換,從而實(shí)現(xiàn)了數(shù)據(jù)的模糊域與圖像空間域的轉(zhuǎn)變。對(duì)應(yīng)數(shù)學(xué)公式可表示為:
(3)
(4)灰度圖轉(zhuǎn)換為RGB。函數(shù)先將灰度圖像擴(kuò)展到三通道(復(fù)制通道),提供原始圖像作為本次轉(zhuǎn)換的調(diào)色板,再將2張圖像轉(zhuǎn)為YUV空間("Y"表示明亮度(Luminance或Luma),也就是灰階值;而"U"和"V"表示的是色度(Chrominance或Chroma),可用于描述影像色彩及飽和度,及用于指定像素的顏色)。在此基礎(chǔ)上,通過一個(gè)二重循環(huán)來逐像素生成RGB結(jié)果圖。RGB與YUV分量的對(duì)應(yīng)關(guān)系為:
R=Y+1.14V,G=Y-0.39U-0.58V,B=Y+2.03U.
(4)
利用模糊集對(duì)圖像預(yù)處理后的效果如圖3所示。
圖3 基于模糊集的圖像增強(qiáng)
SLIC超像素分割算法是2010年提出的一種基于K-means聚類的圖像分割算法,是在Lab顏色空間與(x,y)組成的五維向量空間中運(yùn)算的。Lab色彩模型中,L表示的亮度(Luminosity)值域由0(黑色)到100(白色);a表示從洋紅色至綠色的范圍。a為負(fù)值指示綠色,正值指示品紅;b表示從黃色至藍(lán)色的范圍。b為負(fù)值指示藍(lán)色,正值指示黃色。此后,就是對(duì)五維特征向量構(gòu)造距離度量標(biāo)準(zhǔn),對(duì)圖像像素進(jìn)行局部聚類的過程[9]。
SLIC算法流程圖見圖2,而將K-means算法應(yīng)用于圖像像素的聚類中主要算法步驟則將詳述如下。
(1)將圖像轉(zhuǎn)換為L(zhǎng)ab顏色空間。
(2)初始化聚類中心:假設(shè)圖片總共有N個(gè)像素點(diǎn),設(shè)定超像素塊個(gè)數(shù)K,將聚類中心均勻地分配到圖像中。如果所有的超像素塊有相同尺寸,那么各塊的大小為(N/K),近似的相鄰聚類中心的距離(步長(zhǎng))為:
(5)
(3)遍歷操作。將每個(gè)像素塊的中心點(diǎn)的坐標(biāo)(x,y)及其Lab的值保存起來,加入到事先定義好的集合中。算法中,使用中心點(diǎn)的8鄰域像素點(diǎn),計(jì)算獲得最小梯度值的像素點(diǎn),并將其作為新的中心點(diǎn),這里計(jì)算梯度的公式可寫為:
Gradient(x,y)=dx(i,j)+dy(i,j),
(6)
研究中,為了節(jié)省時(shí)間,只遍歷每個(gè)超像素塊中心點(diǎn)周邊的2S*2S區(qū)域內(nèi)的像素點(diǎn),具體如圖4所示。
圖4 SLIC的2S*2S搜索區(qū)域
(4)由于SLIC中的聚類是在[Labxy]五維空間中生成超像素的,簡(jiǎn)單定義歐式距離D將導(dǎo)致不同超像素大小的聚類行為不一致。因此,使用如下公式的距離尺度來定義,即:
(7)
(8)
(9)
公式(9)中通過2個(gè)參數(shù)m和S來協(xié)調(diào)2種距離的比例分配。參數(shù)S即是式(8)計(jì)算得出的每個(gè)像素塊的長(zhǎng)度值,而參數(shù)m為L(zhǎng)ab空間的距離可能最大值,建議可在為[1,40]范圍內(nèi)來選取。
(5) 對(duì)分割后的超像素塊進(jìn)行預(yù)處理。由于后續(xù)的分割操作是在灰度圖進(jìn)行的,在載入超像素分割完成的圖像后,將每個(gè)超像素塊的平均灰度值一一分配給對(duì)應(yīng)的超像素塊。例如像素塊分別為500和1 000的處理結(jié)果則如圖5所示。
(a) 分割尺度500 (b) 分割尺度1 000
FT 算法是2009年Achanta 等人[10]提出針對(duì)頻域的一種顯著性檢測(cè)算法,此方法利用顏色特征的中央-周邊算子來得到顯著圖,通過保留來自原始圖像的更多頻率內(nèi)容來保留圖像邊界,從而輸出具有明確定義邊界的全分辨率顯著圖,該算法的優(yōu)勢(shì)在于設(shè)計(jì)簡(jiǎn)單,計(jì)算速度快。
令ωlc為低頻閾值,ωhc為高頻閾值。低頻信息對(duì)應(yīng)的是圖像中的顯著性區(qū)域,高頻信息對(duì)應(yīng)的是噪聲或紋理特征,為了獲得圖像中的目標(biāo)區(qū)域,捕獲顯著對(duì)象,低頻閾值、即ωlc應(yīng)盡可能低,高頻閾值ωhc應(yīng)盡可能高,甚至舍去。算法采用DOG算子為低通濾波器,運(yùn)算時(shí)參見如下公式:
(10)
其中,DOG算子是高斯函數(shù)的差分,σ1,σ2是高斯分布的標(biāo)準(zhǔn)差,分別決定了ωlc,ωhc。不同的高斯差分對(duì)應(yīng)不同的頻率檢測(cè)范圍,當(dāng)所有高斯差分被執(zhí)行時(shí),所有頻率被檢測(cè)以獲得不同尺度空間的邊界。所以使σ1無窮大以檢測(cè)整幅圖像,σ2無窮小以減少高頻噪聲。
設(shè)圖像大小為m*n,在Lab色彩空間中,L,a,b各特征的整體均值分別為:
(11)
同時(shí)對(duì)各特征進(jìn)行高斯平滑,運(yùn)算公式可表示為:
LG(x,y)=L(x,y)*Gq*q,
aG(x,y)=a(x,y)*Gq*q,bG(x,y)=b(x,y)*Gq*q,
(12)
在實(shí)際進(jìn)行計(jì)算時(shí), FT方法使用窗口5*5的高斯平滑來實(shí)現(xiàn)對(duì)最高頻的舍去。
FT方法在Labxy坐標(biāo)空間圖像像素的顯著性公式為:
S(x,y)=‖IG(x,y)-Iμ‖.
(13)
為了使算法運(yùn)行速度加快,保證各特征值數(shù)據(jù)的收斂,對(duì)各特征值的歸一化處理及改變權(quán)重系數(shù)是本文對(duì)FT基本算法的優(yōu)化。由于在Lab顏色空間中,L,a,b變化快慢不同,在原FT算法計(jì)算過后,對(duì)各特征值做歸一化處理,消除因?yàn)楦魈卣鲗?duì)應(yīng)的顯著值不在一個(gè)數(shù)量級(jí)上,從而突出某一特征的不良影響,即:
(14)
其中,i=L,a,b分別計(jì)算出SnL,Sna,Snb。
最終定義新的顯著值算法如式(15)所示:
(15)
其中,ωi對(duì)應(yīng)各特征的權(quán)重系數(shù)。
調(diào)整對(duì)應(yīng)特征的權(quán)重系數(shù)可以更為可靠地突出所需的圖像特征。
本次實(shí)驗(yàn)的研究旨在針對(duì)初始采集圖像能在本文提出的算法處理流程下可定位標(biāo)志牌區(qū)域并對(duì)標(biāo)志牌的數(shù)字定位進(jìn)行提取。
在SLIC圖像分割過程中采用的超像素?cái)?shù)量越大,聚類效果越好,但分割時(shí)間越長(zhǎng),灰度賦值以后立柱區(qū)域不明顯,如圖5所示。所以本文算法中最終確定像素塊為250。如圖6(b)所示,藍(lán)色部分為需要下一步處理的標(biāo)志牌區(qū)域。
對(duì)圖6(b)區(qū)域做特征選擇,由于圖像大小保持不變,標(biāo)志牌區(qū)域包括區(qū)域面積、區(qū)域的長(zhǎng)度寬度在內(nèi)的特征值有基本統(tǒng)一的閾值。經(jīng)過特征選擇得到單一的藍(lán)色區(qū)域后,在原始彩色圖像上做外接矩形的裁剪,得到只含有標(biāo)志牌的圖像如圖6(c)所示。基于此再利用改進(jìn)的FT算法對(duì)增強(qiáng)后的圖像做顯著性檢測(cè),得到一個(gè)噪音少、數(shù)字邊界明顯的結(jié)果圖像見6(d)。最終數(shù)字見圖6(e)。
利用本文方法對(duì)多個(gè)標(biāo)志牌進(jìn)行測(cè)試,顯示結(jié)果如圖7所示。
(a) 超像素分割圖像 (b) 腐蝕后區(qū)域顯示
(c) 標(biāo)志牌原圖 (d) 顯著性檢測(cè) (e) 數(shù)字顯示
(c) Original sign (d) Saliency test (e) Digital display
圖6 立柱標(biāo)志牌定位結(jié)果圖
Fig. 6 Column sign positioning result map
(a) 標(biāo)志牌 (b) 顯著性檢測(cè) (c) 數(shù)字顯示
基于模糊集的圖像增強(qiáng)算法可以使立柱的模糊圖像清晰程度更高;基于SLIC的超像素分割使得包括標(biāo)志牌在內(nèi)的整個(gè)立柱區(qū)域與背景分割開來;綜合前述研究后,再利用改進(jìn)的FT算法對(duì)標(biāo)志牌區(qū)域做數(shù)字提取。該方法能夠有效定位標(biāo)志牌的數(shù)字部分,為后續(xù)數(shù)字識(shí)別打下基礎(chǔ)。