王媛彬,李媛媛,齊景鋒,吳華英,段 譽
(1.西安科技大學(xué) 電氣與控制工程學(xué)院,陜西 西安 710054;2.陜西陜煤榆北煤業(yè)有限公司 榆林信息化運維分公司,陜西 榆林 719000)
隨著各行各業(yè)的智能化發(fā)展,視頻監(jiān)控被普遍應(yīng)用于礦井作業(yè)中,為工作人員的安全作業(yè)提供有利保障,避免造成巨大的經(jīng)濟損失。但是煤礦井下存在較多粉塵干擾且光照環(huán)境復(fù)雜,往往導(dǎo)致采集到的礦井下圖像質(zhì)量較差。主要表現(xiàn)為圖像整體亮度較低、邊緣輪廓模糊、細(xì)節(jié)大量丟失細(xì)節(jié)信息被隱藏,人眼難以辨別;局部光照過亮,圖像對比度差,噪聲較多。為了更好地監(jiān)控礦井下的信息,增加工作人員對礦井信息判別的準(zhǔn)確性,礦井下低質(zhì)圖像增強具有十分重要的意義[1]。
目前,常見的增強方法往往能夠針對低質(zhì)圖像的不同特質(zhì)進行改善,但仍存在部分不足。例如:①對于礦井下亮度和對比度不足的圖像,基于空域變換的增強方法[2-4]能夠通過變換函數(shù)進行映射,重新調(diào)整像素。該類算法計算復(fù)雜度低、實現(xiàn)簡單,但是會放大原有的噪聲,并在圖像局部出現(xiàn)過增強、欠增強現(xiàn)象,模糊圖像特征;②對于局部細(xì)節(jié)模糊的圖像,基于圖像分層處理的方法[5-9],例如雙邊濾波算法、引導(dǎo)濾波算法等,能夠有效增強弱細(xì)節(jié),但是對圖像整體質(zhì)量改善不明顯;③對于局部區(qū)域較暗的圖像,基于Retinex的相關(guān)方法[10-12]通過變換反射分量,有效調(diào)整圖像的灰度分布,但是容易造成邊緣模糊,對細(xì)節(jié)增強不足。并且在假設(shè)光照均勻的情況下,對礦井下圖像增強效果較差;④對于層次感不強的圖像,使用基于小波變換的增強方法[13-18]能夠調(diào)整頻域內(nèi)分解出的高頻信息和低頻信息,通過不同尺度的系數(shù)調(diào)整,達到突出圖像細(xì)節(jié)的目的。但是該類算法普遍忽視低頻信息的增強處理,對圖像亮度改善不足。
針對上述各個方法存在的缺陷,提出一種基于引導(dǎo)濾波的多尺度自適應(yīng)圖像增強方法。利用引導(dǎo)濾波分解圖像為高、低頻2個部分,通過對比度受限的自適應(yīng)直方圖均衡(Contrast Limited Adaptive Histogram Equalization,CLAHE)對低頻部分的對比度進行整體調(diào)整,再利用梯度域內(nèi)的改進直方圖增強整個高頻部分,并結(jié)合多尺度的細(xì)節(jié)增強算法增加高頻分量,擴展動態(tài)范圍。在進行線性重構(gòu)時,引入灰狼算法(Grey Wolf Optimizer,GWO)自適應(yīng)選擇最佳參數(shù),提高算法效率。
引導(dǎo)濾波是一種局部的線性模型,該模型能夠保證圖像邊緣附近的梯度一致,有效克服梯度翻轉(zhuǎn)現(xiàn)象。且濾波時間復(fù)雜度與窗口大小無關(guān),具有較高的運行效率[19]。因此,文中采用引導(dǎo)濾波將原始圖像分解為低頻和高頻2個部分,再分別進行后續(xù)不同處理。在一個以像素k為中心,半徑為r的二維窗口ωk中,引導(dǎo)圖像G和輸出圖像I1兩者間的線性關(guān)系滿足
I1(i)=akGi+bk,?i∈ωk
(1)
式中 (ak,bk)是在窗口ωk內(nèi)的線性系數(shù)。在ωk內(nèi),利用線性擬合函數(shù)使得輸出圖像I1和原始圖像I差距最小,系數(shù)ak,bk最優(yōu)解的求取見式(3)
(2)
(3)
計算輸出圖像時,單個像素i可能被多個不同窗口所包含,取值不唯一。因此,對包含同一像素的函數(shù)值取均值,即可得到輸出圖像。
(4)
I2=I-I1
(5)
低頻圖像I1整體較暗且對比度較低,不便于人眼直接觀察,使用CLAHE能夠有效改善圖像對比度和整體亮度,同時避免噪聲的放大[20]。輸入圖像I1與輸出圖像I1′之間存在映射關(guān)系見式(6)。
(6)
式中 INT[]為取整符號;I1的灰度范圍為[0,L-1],T為對應(yīng)的累積分布函數(shù)。設(shè)子塊的總像素為P,μ為截斷系數(shù),可得受限閾值C。
(7)
P=m×n
(8)
式中m和n分別為子區(qū)域的行數(shù)和列數(shù);L為直方圖的總灰度級數(shù)256。
通過閾值C裁剪子區(qū)域直方圖,將超出閾值的像素點重新分配,從而達到限制放大幅度的目的。再將裁剪后的子直方圖均衡化,求得每一子區(qū)域的映射函數(shù)。最后,利用線性插值重構(gòu)像素灰度值,能夠減少算法時間復(fù)雜度和避免塊狀效應(yīng)的出現(xiàn)。CLAHE算法處理后的直方圖如圖1(b)所示,在局部直方圖均衡化的基礎(chǔ)上,對子區(qū)域的直方圖進行對比度限幅,有效抑制噪聲的放大,在提高I1對比度的同時有效緩解過增強、欠增強。
通過引導(dǎo)濾波得到的高頻圖像I2,對比度較低,細(xì)節(jié)信息大量丟失、邊緣模糊。針對上述特點,首先采用基于梯度域的直方圖均衡化提高整體的對比度,排除多余的背景干擾[21]。由于背景部分在圖像整體中的占比較大,該部分對應(yīng)的直方圖嚴(yán)重限制了圖像整體對比度的拉伸。通過抑制低梯度區(qū)域的像素數(shù)量能夠可靠地增強整個高頻部分,但對局部細(xì)節(jié)的改善不足,仍存在一定局限性。在此基礎(chǔ)上,利用多尺度細(xì)節(jié)增強來提高局部細(xì)節(jié)可見性,算法的具體流程如下。
圖1 低頻部分的灰度直方圖對比Fig.1 Gray histogram comparison of image with low frequency
1)通過公式(9)對高頻圖像I2進行平滑運算
f(x,y)=I2(x,y)*G(x,y)
(9)
式中G為高斯函數(shù);f為平滑后的圖像。
2)利用Canny算子計算像素點的梯度值
(10)
(11)
(12)
式中 dx和dy分別是像素點的水平和豎直梯度;g(i,j)像素點梯度的幅值。
3)將圖像的像素梯度依次排列,劃分為高梯度和低梯度2個區(qū)域。
4)依據(jù)圖像梯度最大值1/2處對應(yīng)的像素點灰度值進行均衡化,得到整體增強的圖像I2′。
5)將I2′與不同尺度的高斯核函數(shù)進行卷積運算,不同平滑圖像S1,S2和S3求取見式(13)。
S1=G1*I2′,S2=G2*I2′,S3=G3*I2′
(13)
式中G1,G2和G3分別是標(biāo)準(zhǔn)差σ1=1.0,σ2=2.0和σ3=4.0的高斯核。
6)通過不同尺度平滑圖像之間相互做差,得到細(xì)節(jié)D1,中間細(xì)節(jié)D2和粗細(xì)節(jié)D3。
D1=I2′-S1,D2=S1-S2,D3=S2-S3
(14)
7)將3個包含不同層次邊緣信息的細(xì)節(jié)層合并,得到高頻分量見式(15)。
D′=[1-η1×sgn(D1)×D1+η2×D2+η3×D3
(15)
式中η1+η2+η3=1,0.2≤η2≤0.5。通過調(diào)節(jié)D1中的正、負(fù)分量來保持細(xì)節(jié)間的平衡。
圖2 高頻部分的灰度直方圖對比Fig.2 Gray histogram comparison of image with high frequency
基于反銳化掩模(Unsharp Masking,UM)算法具有處理簡單,效果明顯的優(yōu)勢[22]。因此,文章選擇基于反銳化掩模的線性融合方式完成圖像重構(gòu),原始的UM處理方法見式(16)。
fout=fin+α·[fin-Lp(fin)]
(16)
式中fout為處理后的圖像;fin為原始圖像;fin-Lp(fin)為將原始圖像與平滑后圖像做差后得到的高頻分量;α為高頻分量的調(diào)節(jié)因子。
在上述基礎(chǔ)上,利用雙變量合理調(diào)整融合參數(shù)ω1,ω2,來控制不同的融合效果能有效克服光暈產(chǎn)生,增強細(xì)節(jié),處理方式如下所示。
Iout=ω1×I1′+ω2×I2″
(17)
GF[I]=I1,I-GF[I]=I2
(18)
I1′=Enhanced(I1),I2″=Denoised[I2′]=Denoised[Enhanced(I1)]
(19)
式中Iout為輸出圖像;I為原始圖像;GF[]為引導(dǎo)濾波過程;系數(shù)ω1用于控制圖像的整體亮度,系數(shù)ω2調(diào)節(jié)圖像的細(xì)節(jié)增強程度。
圖3展示不同融合比例系數(shù)下圖像的灰度直方圖。固定系數(shù)ω2=0.5不變,ω1值越大圖像越亮,但易造成過增強,產(chǎn)生明顯光暈;ω1越小圖像整體較暗,視覺效果差。系數(shù)ω2取值過大,容易導(dǎo)致圖像過度銳化、噪聲被放大;ω2越小圖像趨于平滑,細(xì)節(jié)不足。
圖3 不同融合比例下,圖像的灰度直方圖Fig.3 Image histogram under different fusion coefficients
在實驗過程中,考慮到人工手動設(shè)置參數(shù)效率低下的問題,文中方法采用灰狼尋優(yōu)算法[23]完成系數(shù)ω1,ω2的自適應(yīng)選擇,獲取較佳的融合圖像增強效果?;依欠N群內(nèi)部嚴(yán)格的等級制度,保證不同等級間的信息能夠有效地協(xié)調(diào)和反饋。算法中隨機參數(shù)向量以及個體間信息共享,為優(yōu)化過程中及時更新參數(shù),避免陷入局部最優(yōu)奠定基礎(chǔ)。與其他優(yōu)化算法相比,灰狼算法整體結(jié)構(gòu)簡單、參數(shù)設(shè)置少、編碼易于實現(xiàn),具有較強的收斂性能和空間搜索能力。參數(shù)尋優(yōu)的具體步驟如下。
將灰狼狩獵時搜索得到最優(yōu)的3個解依次命名為α,β,δ,其余則命名為γ?;依轻鳙C的行為模式見式(20),式(21)。
(20)
(21)
(22)
2)根據(jù)變量的上下界來隨機初始化灰狼個體的位置,即線性融合參數(shù)ω1,ω2的初值。利用該參數(shù)對增強后的低頻和高頻圖像進行線性融合見式(17),根據(jù)適應(yīng)度函數(shù)Fitness評價結(jié)果圖像的增強效果,并作為當(dāng)前目標(biāo)獵物的適應(yīng)度值。
(23)
(24)
(25)
5)判斷是否達到最大迭代次數(shù)200,若滿足則終止迭代,輸出此時相應(yīng)的最優(yōu)參數(shù)值ω1,ω2作為線性融合參數(shù)的最佳值;否則跳轉(zhuǎn)至步驟(3)繼續(xù)更新,直至最大迭代次數(shù)為止。
為了更客觀地評價增強后圖像質(zhì)量,綜合考慮信息熵(Entropy)和峰值信噪比(Peak Signal to Noise Ratio,PSNR)2個評價指標(biāo)的加權(quán)和作為適應(yīng)度函數(shù)。
Entropy從信息論的角度反映圖像信息的豐富性。熵值越大,圖像的信息越豐富,質(zhì)量越好,計算見式(26)。
(26)
式中g(shù)和G分別為圖像的像素灰度最小值和最大值;X為增強后圖像;p(Xi)為灰度值Xi的像素在圖像中出現(xiàn)的概率。
PSNR是一種衡量圖像質(zhì)量的指標(biāo),定義為信號最大值與背景噪聲間的差值。該值越大,去噪效果越好,計算見式(28)。
(27)
(28)
式中I(i,j)和K(i,j)分別為原始圖像和對比圖像;MSE為原圖像和處理圖像間的均方誤差;H和W分別是圖像的高和寬。
針對同一幅圖像2個評價指標(biāo)的數(shù)值相差較大的問題,選取對方指標(biāo)數(shù)值所占指標(biāo)數(shù)值之和的占比作為加權(quán)系數(shù)來平衡兩者的影響,達到較好的增強效果。適應(yīng)度函數(shù)Fitness定義見式(29)。
(29)
式中θ1和θ2分別是信息熵和峰值信噪比的值。
基于引導(dǎo)濾波的多尺度自適應(yīng)增強方法具體實現(xiàn)步驟如下。
1)通過引導(dǎo)濾波,利用式(4)和(5)將原始圖像分解為低頻和高頻2部分。
2)利用限制對比度的自適應(yīng)直方圖均衡提高低頻圖像的整體對比度,得到圖像I1′。
3)在梯度域內(nèi)計算像素點見式(12),得到其分布特點。根據(jù)改進的直方圖調(diào)整細(xì)節(jié)層,排除多余的背景干擾,得到整體增強的高頻圖像I2′。
4)采用多尺度的細(xì)節(jié)增強算法添加高頻分量至I2′中見式(14),拓寬整體的動態(tài)范圍。選擇中值濾波抑制圖像中的噪聲,獲得最終高頻圖像I2″。
5)根據(jù)式(17)進行基于UM的線性融合。引入灰狼算法,對亮度調(diào)節(jié)系數(shù)和細(xì)節(jié)增強系數(shù)尋優(yōu)。并構(gòu)造適應(yīng)度函數(shù)即式(29)評價融合后的最終圖像,取得最優(yōu)增強效果。算法整體框架如圖4所示。
圖4 方法整體框架Fig.4 Overall framework of the methods
針對文中方法,有證明過程如下。
由上文中引導(dǎo)濾波原理可得出以下關(guān)系式
I2=I-I1
式中I,I1,I2意義同前。分別對高頻和低頻分量進行針對性的增強處理,再通過線性融合得到最終結(jié)果圖像Iout
Iout=ω1×Enhancced[GF(I)]+ω2×Deennced{Enhancced[I-GF(I)]}
式中Iout為最終結(jié)果圖像;I為原始圖像;GF(I)為引導(dǎo)濾波處理部分;ω1,ω2為線性調(diào)節(jié)因子。構(gòu)造一個適應(yīng)度函數(shù)Fitness來評價結(jié)果圖像。
θ1=Entropy(Iout),θ2=PSNR(Iout)
式中θ1和θ2分別是結(jié)果圖像的信息熵值和峰值信噪比值?;依撬惴ǜ鶕?jù)變量A,C不斷更新個體位置,直至循環(huán)結(jié)束得到Fitness最大值,此刻對應(yīng)的ω1,ω2值,即為尋找得到的參數(shù)最優(yōu)值。
為有效驗證文中圖像增強方法性能,以4幅礦井下低質(zhì)圖像KJ1,KJ2,KJ3和KJ4為例進行增強實驗。采用的編程工具為:Matlab R2016 b。分別從主觀視覺和定性定量的客觀評價指標(biāo)2個方面將文中方法與5種經(jīng)典的增強方法進行性能比較,同時完成參數(shù)的最優(yōu)選擇。對比算法及其參數(shù)設(shè)置如下:引導(dǎo)濾波方法(GF,濾波器參數(shù)設(shè)置:窗口半徑r=16,正則化參數(shù)ε=0.12)、CLAHE(裁剪閾值:clipLimit=0.01)、基于模糊的增強方法(Fuzzy,參數(shù)設(shè)置:指數(shù)型模糊因子Fe=0.8,倒數(shù)型模糊因子Fd=125)、Single-scale Retinex(SSR,參數(shù)設(shè)置:高斯函數(shù)的標(biāo)準(zhǔn)偏差σ=100)、Multi-scale Retinex(MSR,參數(shù)設(shè)置:3個尺度的加權(quán)系數(shù)為ω1=ω2=ω3=1/3,3個高斯函數(shù)的標(biāo)準(zhǔn)偏差分別為σ1=15,σ2=80,σ=200)。
從圖5可以直觀地看出,原圖像整體較暗且對比度較低,導(dǎo)致人眼觀察圖像輪廓模糊,不利于檢測識別。而采用實驗中的算法均能夠改善圖像視覺效果,增強細(xì)節(jié)但是各個方法均不能達到理想的增強效果,實驗結(jié)果如圖6~11所示。
引導(dǎo)濾波處理后的圖像整體亮度提升不明顯,信息豐富的邊緣區(qū)域出現(xiàn)不同程度的模糊。CLAHE會在對比強烈處產(chǎn)生光暈,圖像局部區(qū)域有過增強、欠增強現(xiàn)象。并且由于均衡化后圖像灰度級的減少,圖像中的部分區(qū)域甚至?xí)l(fā)生細(xì)節(jié)消失?;谀:乃惴苡行б种茍D像噪聲,但是缺少細(xì)節(jié)增強措施,圖像整體偏暗,且暗區(qū)域的細(xì)節(jié)難以分辨。SSR算法采用高斯算子估計光照,導(dǎo)致圖像在過渡區(qū)出現(xiàn)光暈現(xiàn)象,圖像清晰度不足。MSR算法在局部出現(xiàn)塊效應(yīng),圖像包含較多噪聲。而文中方法在一定程度上克服上述增強算法中存在的不足,在增強局部細(xì)節(jié)信息的同時有效改善整體亮度,更加符合人眼的視覺特征。
圖5 不同場景下的礦井低質(zhì)圖像Fig.5 Mine low-quality images in different scenarios
圖6 引導(dǎo)濾波算法增強后Fig.6 Enhanced results by Guided Filter
圖7 CLAHE算法增強后Fig.7 Enhanced results by CLAHE
圖8 模糊集算法增強后Fig.8 Enhanced results by Fuzzy enhancement algorithm
圖9 SSR算法增強后Fig.9 Enhanced results by SSR
圖10 MSR算法增強后Fig.10 Enhanced results by MSR
圖11 文中方法增強后Fig.11 Enhanced results by the proposed algorithm
對不同場景KJ1,KJ2,KJ3和KJ4的線性融合系數(shù)ω1,ω2進行尋優(yōu),參數(shù)尋優(yōu)值見表1。
表1 參數(shù)尋優(yōu)值
尋優(yōu)過程中適應(yīng)度函數(shù)值的變化趨勢如圖12所示。實驗設(shè)置最大迭代次數(shù)為200次,4幅圖像的適應(yīng)度函數(shù)分別在迭代次數(shù)為40次、48次、51次和43次時達到收斂。此時,獲得的融合系數(shù)值能產(chǎn)生最好的圖像增強效果。
圖12 灰狼算法尋優(yōu)迭代過程Fig.12 Optimization iteration process of GWO
為更客觀地分析不同算法的增強效果,分別選擇信息熵、峰值信噪比、結(jié)構(gòu)相似度(Structural Similarity,SSIM)和梯度相似度(Gradient Similarity,GSIM)[24]這4種評價指標(biāo)進行定性和定量的評價,結(jié)果見表2~5和如圖13所示。
SSIM充分考慮到人體視覺,從圖像的整體結(jié)構(gòu)失真的角度來評價圖像質(zhì)量。結(jié)構(gòu)相似度越高,即圖像細(xì)節(jié)損失越少,信息保留越完整,計算見式(30)。
(30)
式中x,y為進行比較的2幅圖像;μx,μy分別為x和y的均值;σx,σy分別為x和y的標(biāo)準(zhǔn)差;C1和C2是常量,避免當(dāng)均值接近0時產(chǎn)生波動,通常取C1=(K1L)2,C2=(K2L)2,默認(rèn)K1=0.01,K2=0.03,L=255。
表2 場景KJ1的客觀評價結(jié)果
表3 場景KJ2的客觀評價結(jié)果
表4 場景KJ3的客觀評價結(jié)果
表5 場景KJ4的客觀評價結(jié)果
GSIM根據(jù)圖像的梯度特征來評價邊緣的損失情況,進而更好地評價圖像質(zhì)量。梯度相似度越大,圖像質(zhì)量越好。在實際應(yīng)用中,一般選擇平均GSIM(MGSIM)來評價整幅圖像質(zhì)量。該評價指標(biāo)包括3個部分,即亮度比較函數(shù)、對比度比較函數(shù)和清晰度比較函,計算見式(31)。
圖13 不同算法的客觀評價值Fig.13 Objective evaluation values of different algorithms
(31)
式中M×N為圖像大??;l(x,y),c(x,y),d(x,y)分別為亮度比較函數(shù),對比度比較函數(shù)和清晰度比較函數(shù);α>0,β>0,γ>0,用于調(diào)整3個部分的相對重要性,α=β=γ=1。
由表2~5和圖13中數(shù)據(jù)可知,針對礦井下低質(zhì)圖像的增強,各算法表現(xiàn)均有優(yōu)劣。由于引導(dǎo)濾波固定參數(shù)ε值,導(dǎo)致算法增強效果不穩(wěn)定、細(xì)節(jié)紋理突出不足。該算法僅PSNR值略高于文中方法,其余各項指標(biāo)普遍較低。CLAHE在處理過程中直接對圖像全局處理,增加背景干擾,放大噪聲,所得PSNR值最低?;谀:脑鰪娝惴ㄒ衷肽芰^強,處理后的圖像PSNR值較高。但對圖像的細(xì)節(jié)提升能力不足,圖像質(zhì)量提升不明顯。而SSR算法采用對數(shù)處理操作壓縮了圖像亮區(qū)域的顯示范圍,所以圖像Entropy較低,細(xì)節(jié)模糊甚至丟失。MSR在SSR的基礎(chǔ)上,以犧牲SSIM和PSNR值來提高圖像中的細(xì)節(jié)信息量,提升Entropy的同時不可避免的產(chǎn)生多余噪聲。綜合分析,文中方法在4個客觀指標(biāo)上均有較好的表現(xiàn),各個指客觀指標(biāo)值與主觀視覺效果基本保持一致,在豐富細(xì)節(jié)的同時能夠保持較好的PSNR值。
1)采用引導(dǎo)濾波分解圖像,較好地保留圖像邊緣特征。對高頻和低頻分別采取針對性的處理措施,自適應(yīng)提高低頻圖像對比度。利用高頻圖像的梯度特點,有效排除無關(guān)背景的影響,豐富局部細(xì)節(jié)信息。通過灰狼算法對自適應(yīng)的圖像融合策略參數(shù)進行尋優(yōu),獲得較好的增強效果。
2)將研究提出的方法與5種經(jīng)典的圖像增強算法進行主觀和客觀兩方面的對比,該方法在主觀視覺與客觀評價指標(biāo)上保持一致,能夠有效改善圖像質(zhì)量,提高整體亮度和對比度。對礦井下整體亮度較低,對比度較差和細(xì)節(jié)信息量不足的問題均有所改善。
3)實驗結(jié)果證明,文中方法在豐富圖像細(xì)節(jié)的同時保持較高的PSNR值,更符合人眼視覺。例如,在場景KJ4中,相較于引導(dǎo)濾波、模糊集和SSR算法,信息熵分別提高3.58%,21.78%,3.33%;相較于CLAHE,SSR和MSR算法,PSNR值分別提高8.05%,15.59%,5.72%。