張 震, 趙啟鵬, 朱留存, 劉濟(jì)塵, 羅俊琦, 魏金占, 李 雪
(1. 北部灣大學(xué) 先端科學(xué)技術(shù)研究院, 廣西 欽州 535001; 2. 吉林大學(xué) 軟件學(xué)院, 長(zhǎng)春 130012; 3. 中國(guó)農(nóng)業(yè)科學(xué)院 長(zhǎng)春獸醫(yī)研究所, 長(zhǎng)春 130118)
在圖像采集過程中, 常受光照環(huán)境或物體表面反光等因素影響導(dǎo)致圖像整體光照不均[1-2], 從而改變了圖像的原始面貌, 給后續(xù)處理帶來困難. 目前常用的處理方法包括: 以直方圖均衡化為代表的時(shí)域變換法[3]、 以同態(tài)濾波為代表的頻域變換法[4]以及以Retinex算法為代表的分離入射和反射分量方法[5]. 直方圖均衡化方法通過拉伸圖像灰度級(jí)增強(qiáng)對(duì)比度[3,6-8], 算法簡(jiǎn)單易實(shí)現(xiàn), 但其忽略了圖像的頻域變化及細(xì)節(jié)信息. 同態(tài)濾波方法主要針對(duì)圖像頻域帶寬的特點(diǎn), 在頻域內(nèi)選取合適的傳遞函數(shù)對(duì)圖像高低頻進(jìn)行處理[4,9-11]. 同態(tài)濾波算法廣泛適用于處理光照不均的圖像, 能在增強(qiáng)暗區(qū)圖像細(xì)節(jié)的同時(shí)不損失亮區(qū)的圖像細(xì)節(jié), 但其易出現(xiàn)處理后圖像輪廓不清晰等問題, 且參數(shù)需要通過實(shí)驗(yàn)測(cè)試獲得, 算法相對(duì)復(fù)雜. Retinex增強(qiáng)方法使用高斯平滑函數(shù)估計(jì)原圖像的亮度分量, 用光照補(bǔ)償方法逼近反射圖像[5,12-14]. Retinex算法在彩色圖像增強(qiáng)[5]、 圖像去霧[12-14]等方面效果較好, 但在強(qiáng)光陰影過渡區(qū)易出現(xiàn)光暈現(xiàn)象, 對(duì)高亮度圖像處理效果欠佳. 近年來, 基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的算法廣泛應(yīng)用于圖像的光照補(bǔ)償, 并取得了較好的效果[15-20], 但這類算法通用性較差, 需采集大量樣本進(jìn)行有監(jiān)督學(xué)習(xí).
針對(duì)上述問題, 本文提出一種基于主成分分析的圖像光照校正算法. 首先, 將受相同光線條件影響的多張圖像映射為向量組; 然后, 利用主成分分析的方法找到一組標(biāo)準(zhǔn)正交基; 最后, 在該向量空間中確定并剔除產(chǎn)生光線影響的基, 利用主成分重構(gòu)圖像, 從而消除光照影響, 取得了較好的效果. 算法總體流程如圖1所示.
圖1 算法流程
定理1[21]若A為n階實(shí)對(duì)稱矩陣, 則存在實(shí)特征值λ1,λ2,…,λn和正交的實(shí)特征向量v1,v2,…,vn, 使得Avi=λivi(i=1,2,…,n).
命題1矩陣ATA是實(shí)對(duì)稱的, 且其特征值為正.
證明: (ATA)T=AT(AT)T=ATA?矩陣ATA是實(shí)對(duì)稱的.設(shè)v為ATA的特征值λ對(duì)應(yīng)的特征向量, 則有
‖Av‖2=(Av)TAv=vT(ATA)v=λvTv=λ‖v‖2?λ>0.
注意本文算法實(shí)現(xiàn)中構(gòu)造的協(xié)方差矩陣為實(shí)對(duì)稱矩陣, 因此一定可得到一組正的特征值和正交的特征向量.
命題2矩陣AAT和ATA有相同的特征值λi, 若ATA的特征向量為vi, 則AAT的特征向量為ui=Avi(i=1,2,…,M,M取矩陣A行與列的最小值).
證明: 設(shè)vi為矩陣ATA的特征值λi(λi>0)對(duì)應(yīng)的特征向量, 則有
(ATA)vi=λivi?A(ATA)vi=λiAvi,
即(AAT)(Avi)=λi(Avi), 其中i=1,2,…,M.
注1若A為m×n階矩陣, 則AAT為m×m階矩陣,ATA為n×n階矩陣.
1)AAT最多有m個(gè)特征值和特征向量;
2)ATA最多有n個(gè)特征值和特征向量;
3) 若m>n, 則ATA的n個(gè)特征值恰好對(duì)應(yīng)于AAT的n個(gè)最大特征值.
當(dāng)m較大時(shí), 計(jì)算AAT的特征值和特征向量很難實(shí)現(xiàn), 一般計(jì)算機(jī)的內(nèi)存很難滿足要求.根據(jù)命題2, 可將求AAT的n個(gè)最大特征值和特征向量轉(zhuǎn)化為求ATA的特征值λ1,λ2,…,λn和特征向量v1,v2,…,vn, 則AAT的n個(gè)最大特征值為λ1,λ2,…,λn, 特征向量為Av1,Av2,…,Avn.
算法實(shí)現(xiàn)步驟如下:
1) 將尺寸相同的圖像映射為向量組.
將每張給定圖像Ii((m,n)矩陣)表示為向量Γi(m×n維向量), 其中i=1,2,…,M, 形成向量組Γ.
2) 計(jì)算協(xié)方差矩陣.
① 計(jì)算向量組Γ的均值向量為
(1)
② 計(jì)算差異矩陣為
A=(φ1,φ2,…,φM),
其中φi=Γi-φ, 則A為(m×n,M)矩陣,AT為(M,m×n)矩陣;
③ 構(gòu)造協(xié)方差矩陣為
(2)
其中C為M×M階矩陣.
3) 計(jì)算AAT的M個(gè)最大特征值及其對(duì)應(yīng)的特征向量.
① 計(jì)算ATA的特征值λ1,λ2,…,λM和對(duì)應(yīng)的特征向量v1,v2,…,vM;
②AAT的M個(gè)最大的特征值為λ1,λ2,…,λM, 對(duì)應(yīng)的特征向量為u1=Av1,u2=Av2, …,uM=AvM.
① 計(jì)算φi(i=1,2,…,M)在標(biāo)準(zhǔn)正交基底(u1,u2,…,uM-1)下的投影, 即坐標(biāo)(w1,w2,…,wM-1)為
wi=〈φi,ui〉,i=1,2,…,M-1;
(3)
(4)
本文實(shí)驗(yàn)圖像選自高速公路路面破損的實(shí)際拍攝圖像, 如圖2所示, 尺寸為2 048×3 072. 圖2(A)為3張?jiān)紙D像, 由圖2(A)可見, 圖像嚴(yán)重受條形光線的干擾, 導(dǎo)致光照不均勻. 本文實(shí)驗(yàn)的目標(biāo)是抑制光線干擾, 保留圖像的主要特征, 突出路面破損情況. 實(shí)驗(yàn)選擇24張圖像進(jìn)行主成分分析, 因篇幅所限, 這里僅給出3張圖像進(jìn)行效果對(duì)比. 為驗(yàn)證算法的有效性, 選擇3種經(jīng)典算法: 同態(tài)濾波(圖2(B))、 直方圖均衡化(圖2(C))和Retinex算法(圖2(D))與本文算法(圖2(E))進(jìn)行對(duì)比實(shí)驗(yàn). 實(shí)驗(yàn)結(jié)果表明: 在抑制光線影響效果方面, 本文算法明顯優(yōu)于3種經(jīng)典算法; 在對(duì)比度方面, 本文算法和直方圖均衡化算法性能更好.
圖2 不同算法對(duì)圖像的處理結(jié)果
在實(shí)際應(yīng)用中, 將數(shù)據(jù)存儲(chǔ)在若干個(gè)文件夾下, 每個(gè)文件夾內(nèi)有24張圖像, 獲取時(shí)間非常接近, 相差時(shí)間為毫秒級(jí), 完全滿足受相同光照條件影響的約定. 每次僅對(duì)一個(gè)文件夾下的24張圖像進(jìn)行處理, 處理一組圖像約耗時(shí)20 s. 實(shí)驗(yàn)硬件環(huán)境為電腦主頻3.6 GHz, 內(nèi)存16 GB. 已累計(jì)處理40多萬張圖像, 本文算法性能穩(wěn)定.
為更客觀地衡量處理效果, 下面采用信息熵、 標(biāo)準(zhǔn)差及平均梯度作為指標(biāo)進(jìn)行定量評(píng)價(jià)[22]. 信息熵H表示為
(5)
其中p(m)表示圖像灰度級(jí)m的分布密度,L表示圖像最高灰度級(jí).一般信息熵越大, 圖像所包含的信息越多.標(biāo)準(zhǔn)差σ表示為
(6)
其中M,N分別表示圖像的行數(shù)和列數(shù),F(i,j)表示點(diǎn)(i,j)的像素值,μ表示像素均值.通常采用標(biāo)準(zhǔn)差衡量圖像的對(duì)比度, 標(biāo)準(zhǔn)差越大, 圖像對(duì)比度越高.平均梯度G表示為
(7)
其中M,N分別表示圖像的行數(shù)和列數(shù),F(i,j)表示點(diǎn)(i,j)的像素值. 平均梯度越大, 圖像層次越分明, 圖像中對(duì)象邊緣細(xì)節(jié)越清晰.
原圖像中圖像1~3的信息熵分別為6.58,6.48,6.62, 標(biāo)準(zhǔn)差分別為31.13,33.39,33.93, 平均梯度分別為9.04,6.83,9.60. 不同算法處理圖像結(jié)果性能對(duì)比列于表1. 由表1可見: 4種算法均不同程度地對(duì)原圖像有改善. 本文算法標(biāo)準(zhǔn)差、 平均梯度兩項(xiàng)指標(biāo)最好, 表明處理后的圖像對(duì)比度更高、 層次更分明、 邊緣更清晰. 但本文算法信息熵指標(biāo)較差, 明顯低于其他3種經(jīng)典算法, 甚至低于原始圖像. 這是由于在重構(gòu)圖像過程中保留了圖像的主要成分, 丟棄了圖像的次要成分所致.
表1 不同算法處理圖像結(jié)果性能對(duì)比
綜上所述, 針對(duì)受相同光照條件影響的圖像光線校正問題, 本文提出了一種基于主成分分析的圖像光照校正算法, 取得了較好的實(shí)驗(yàn)結(jié)果, 能很好地消除光照影響, 處理后的圖像對(duì)比度高, 主要特征得到增強(qiáng).