林海龍,文志強(qiáng),周 濟(jì)
(湖南工業(yè)大學(xué) 計(jì)算機(jī)與通信學(xué)院,湖南 株洲 412000)
許多的圖像渲染技術(shù)只有二進(jìn)制輸出,例如:印刷領(lǐng)域、壓縮存儲(chǔ)、紡織及醫(yī)學(xué)、數(shù)字打印設(shè)備等。將一幅0~255連續(xù)的圖像通過(guò)一定的技術(shù)將其轉(zhuǎn)換成 0、1的二值圖像過(guò)程稱為圖像的半色調(diào)。圖像的半色調(diào)是通過(guò)一個(gè)二值設(shè)備裝置產(chǎn)生出一種連續(xù)圖像的錯(cuò)覺(jué)方法,是使用黑白兩點(diǎn)的密度表示圖像像素值。有效的數(shù)字半色調(diào)可以大幅提高以最小的成本渲染圖像質(zhì)量,常用的半色調(diào)圖像技術(shù)主要分為有序抖動(dòng)、誤差分散、點(diǎn)分散。通過(guò)誤差分散法實(shí)現(xiàn)的半色調(diào)圖像質(zhì)量最好但算法復(fù)雜度相對(duì)最高,點(diǎn)分散法次之,有序抖動(dòng)法最差但算法復(fù)雜度也最低。
在紙質(zhì)圖像的數(shù)字化、數(shù)字出版社系統(tǒng)、半色調(diào)圖像的銳化、較色、壓縮等圖像的再處理領(lǐng)域需要將半色調(diào)圖像轉(zhuǎn)換成連續(xù)色調(diào)圖像為圖像的逆半調(diào)過(guò)程。逆半調(diào)技術(shù)在20世紀(jì)90年代有了一定的研究成果,當(dāng)前公開(kāi)報(bào)道過(guò)逆半調(diào)技術(shù)主要有濾波法、最優(yōu)化估計(jì)法、機(jī)器學(xué)習(xí)法、矢量法等。大部分的逆半調(diào)方法均需要知道產(chǎn)生半色調(diào)圖像的方法,例如參考文獻(xiàn)[1]采用多尺度梯度估計(jì)法以及參考文獻(xiàn)[2]采用MAP最大后驗(yàn)概率估計(jì)的逆半調(diào)就需要知道誤差分散的分散核,針對(duì)誤差分散抖動(dòng)掩膜技術(shù)[3]就需要知道相應(yīng)的半色調(diào)圖像抖動(dòng)方法,所以半色調(diào)圖像的分類研究便顯得十分必要?;叶裙采仃嚕℅LCM)常用灰度圖像的特征提取,具有較好的效果。本文在傳統(tǒng)共生矩陣的基礎(chǔ)上對(duì)其進(jìn)行改進(jìn)提出適應(yīng)于二值圖像特征提取的BGLCM。
在公開(kāi)發(fā)表的刊物中對(duì)半色調(diào)圖像分類研究的文獻(xiàn)相對(duì)較少,最早的為Chang Pao-Chi[4]在1997年提出了LMS濾波的半色調(diào)圖像復(fù)原即逆半調(diào)過(guò)程,為了設(shè)計(jì)不同種類濾波模板參數(shù),使用了一維自相關(guān)函數(shù)提取出半色調(diào)圖像特征,且用該數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),而后支持按半調(diào)類型初始化不同尺度的濾波模板,且依據(jù)LMS原理迭代生成相應(yīng)類型的濾波模板系數(shù)。但文中僅僅對(duì)clustered-dot、constrained average、dispersed-dot、error diffusion 4類半色調(diào)圖像進(jìn)行了分類,顯然當(dāng)前的半色調(diào)技術(shù)不止上述的3種,當(dāng)error diffusion的誤差分散核就存在6種,而B(niǎo)ayesian算法在應(yīng)用中就需要知道誤差分散核的種類。
孔月萍[5]等人在Chang Pao-Chi的一維自相關(guān)函數(shù)基礎(chǔ)上提出了半色調(diào)圖像自相關(guān)與紋理特征相結(jié)合的半色調(diào)圖像分類算法,文中將半色調(diào)圖像通過(guò)適當(dāng)?shù)姆直媛蔬M(jìn)行按照式(1)“下采樣”將得到M/2×N/2(M、N為原圖像尺寸)的0~7級(jí)灰度級(jí)圖像。之后提取出共生矩陣(GLCM)、灰度游程矩陣(GLRM)的紋理逆差距特征C和線紋理特征R,之后結(jié)合自相關(guān)函數(shù)提取特征通過(guò)最鄰近分類器進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明相對(duì)于參考文獻(xiàn)[4]分類的種類及準(zhǔn)確率明顯提高,但文中僅將半色調(diào)圖像分成ED和有序抖動(dòng)兩大類。半色調(diào)圖像類別除了ED和有序抖動(dòng)兩大類還有塊置換法、模板替換像素法、meseDotDitherHvs、meseDotDitherWeighting等,且半色調(diào)圖像自相關(guān)與紋理特征相結(jié)合的半色調(diào)圖像分類算法時(shí)間復(fù)雜度高,會(huì)大大的降低特征提取效率。
圖像的紋理是圖像給人傳達(dá)最直接的線索,圖像的特征通常包括顏色、形狀及紋理,紋理即是圖像像素值與其像素值的空間分布,是圖像中普遍存在且又難以描述的特征。紋理特征提取主要是將圖像中像素值、空間分布關(guān)系用一定的數(shù)學(xué)模型計(jì)算出特征值。其提取標(biāo)準(zhǔn)主要有維數(shù)少、可靠性好、識(shí)別能力強(qiáng)、提取過(guò)程的時(shí)間復(fù)雜度低等。
關(guān)于紋理特征提取算法主要追溯于20世紀(jì)70年代,參考文獻(xiàn)[6]將紋理特征的提取分為統(tǒng)計(jì)類、模型類、信號(hào)處理類、結(jié)構(gòu)類4種。本文將灰度共生矩陣GLCM(G rey Level Co-cocurrence Matrix)作一個(gè)簡(jiǎn)要的描述,G LCM首先由Julesz[7]提出之后由Haralick[8]證明其用于特征提取中具有較好的有效性。但由于待提取的半色調(diào)圖像是一個(gè)只含有0、1的二值圖像,傳統(tǒng)的共生矩陣便失去了統(tǒng)計(jì)意義所以提出基于共生矩陣思想上的改進(jìn)算法。
f為一幅連續(xù)的灰度圖像,其灰度值為0~L。G為一矩陣,該矩陣的元素gij是f圖像灰度值i、j在位置相對(duì)算子Q(為d、φ函數(shù))出現(xiàn)次數(shù),其中,0≤i,j≤L。按照該種方法形成的矩陣G稱之為灰度共生矩陣,其求解過(guò)程如圖1所示。
圖1 共生矩陣求解圖
共生矩陣G的大小和原連續(xù)圖像f的灰度值L有關(guān),在實(shí)際的運(yùn)用中為了計(jì)算上的方便常將灰度值L劃分成n等分,將0~L灰度值量化成0~n從而縮小G的大小,減少計(jì)算過(guò)程中的時(shí)間復(fù)雜度。同時(shí)使用式(2)共生矩陣出現(xiàn)的概率來(lái)替代其次數(shù)大小。
在對(duì)原始連續(xù)的圖像提取共生矩陣時(shí),為了能更好地描述原圖像紋理特征,參考文獻(xiàn)[9]計(jì)算出了共生矩陣G的8種描繪子,式中省略參數(shù)d、φ。
(1)最大概率
度量共生矩陣G的最強(qiáng)響應(yīng),其值越大表明該店響應(yīng)最大,值域?yàn)閇0,1]。
(2)相關(guān)性
度量一個(gè)像素與其鄰域像素的相關(guān)性,值域?yàn)閇-1,1],若任意的一個(gè)標(biāo)準(zhǔn)差為0,則像素的相關(guān)性無(wú)意義。
(3)對(duì)比度
紋理對(duì)比度是表示GLCM的一個(gè)像素與其鄰域其他像素灰度對(duì)比的度量,反應(yīng)了圖像紋理的清晰度。
(4)熵
反應(yīng)了GLCM圖像像素的隨機(jī)性以及信息量的多少,由公式可知當(dāng)所有的pij為零時(shí)熵值為 0,當(dāng)pij值相等時(shí)熵值最大。
(5)同質(zhì)性
反應(yīng)了GLCM矩陣對(duì)角線元素空間分布的緊密度,當(dāng)其元素全部位于對(duì)角線時(shí)值最大,其值的范圍為[0,1]。
(6)一致性
GLCM的一致性為G矩陣各個(gè)元素平方之和,其值域?yàn)閇0,1],它反映了灰度分布均勻程度和紋理粒度。
(7)逆差距
灰度共生矩陣GLCM的逆差距反應(yīng)了圖像的均勻性,其值越大則圖像越均勻。
(8)角二階矩
產(chǎn)生半色調(diào)圖像主要分為誤差分散(Error diffusion)、點(diǎn)分散(Dot diffusion)、有序抖動(dòng)法(Ordered dither)、直接二值搜索法(Direct binary search)。通過(guò)參考文獻(xiàn)[9]可知有序抖動(dòng)與點(diǎn)分散法時(shí)間復(fù)雜度低,但半色調(diào)圖像的質(zhì)量較差,誤差分散法時(shí)間復(fù)雜度低,質(zhì)量好,直接二值搜索法時(shí)間復(fù)雜度最高但產(chǎn)生的半色調(diào)圖像質(zhì)量最好。
在實(shí)際應(yīng)用與研究中雖然直接二值搜索法[10]能夠產(chǎn)生最好的半色調(diào)圖像,但由于其時(shí)間復(fù)雜度很高,所以并非常用。誤差分散法使用最多,其次為點(diǎn)分散法,最后為有序抖動(dòng)法。誤差分散法和點(diǎn)分散法主要用于人物、景觀等打印顯示,有序抖動(dòng)法主要用于圖形類圖像。
圖2為常見(jiàn)的半色調(diào)圖像,設(shè)計(jì)算法對(duì)其特征進(jìn)行提取,將提取之后的特征通過(guò)BP神經(jīng)網(wǎng)絡(luò)分類,實(shí)驗(yàn)結(jié)果證明該算法在半色調(diào)圖像分類準(zhǔn)確率且分類種類均優(yōu)于傳統(tǒng)GLCM,適用于二值圖像的特征提取及分類,故將其稱為BGLCM。
圖2 待分類半色調(diào)圖像
由于半色調(diào)圖像是一個(gè)二值圖像,所以將其轉(zhuǎn)換成灰度共生矩陣(GLCM)得到的是一個(gè)2×2的矩陣如圖3所示,元素為在位置相對(duì)算子Q上在原圖同時(shí)出現(xiàn)(0,0)、(0,1)、(1,0)、(1,1)的次數(shù),那么該共生矩陣便失去了統(tǒng)計(jì)意義。本小節(jié)就在基于灰度共生矩陣的思想上將其進(jìn)行改進(jìn)使其適用二值圖像的特征提取。
圖3 半色調(diào)圖像對(duì)應(yīng)的GLCM
半色調(diào)圖像產(chǎn)生的 GLCM 其元素值g(i,j,d,φ)(i,j=0或 1,d、φ由Q確定)如圖 1所示,通過(guò)不斷地改變位置相對(duì)算子Q便會(huì)產(chǎn)生不同的GLCM,每個(gè)相對(duì)算子Q在(0,0),(0,1),(1,0),(1,1)均會(huì)有一個(gè)統(tǒng)計(jì)值與之相對(duì)應(yīng)。 通過(guò)實(shí)驗(yàn)證明僅當(dāng)(0,1)或(1,0)時(shí)的統(tǒng)計(jì)值對(duì)分類是有效的。 文中將d取 1~5,φ 值取 0°,45°,90°,135°,180°,225°,270°,315°的 8 個(gè) 方 向 如 圖 3 所 示 ,那么每幅半色調(diào)圖像就會(huì)產(chǎn)生40個(gè)共生矩陣G,將每個(gè)矩陣對(duì)應(yīng)(0,1)、(1,0)的統(tǒng)計(jì)值相加作為該共生矩陣G的一個(gè)特征值,總共有40個(gè)共生矩陣那么就存在40個(gè)特征值作為一幅圖像的特征向量B。之后將統(tǒng)計(jì)的特征數(shù)據(jù)通過(guò)式(9)最大最小規(guī)格化方法將其歸一化。
本實(shí)驗(yàn)在Windows XP操作系統(tǒng)環(huán)境下進(jìn)行操作,采用VC6.0結(jié)合OpenCv及Matlab進(jìn)行編程。通過(guò)對(duì)12種半調(diào)方法產(chǎn)生的半色調(diào)圖像庫(kù)中每一類隨機(jī)地取出2 000幅圖片通過(guò)上述傳統(tǒng)共生矩陣(GLCM)及改進(jìn)之后共生矩陣(BGLCM)算法的特征進(jìn)行提取及歸一化,之后從2 000個(gè)特征向量中隨機(jī)抽取10個(gè)特征向量形成特征曲線比較如圖4所示,由上至下依次對(duì)應(yīng)著圖2所示的半色調(diào)圖像類型。
圖4顯示了使用傳統(tǒng)共生矩陣(GLCM)和改進(jìn)之后共生矩陣(BGLCM)對(duì)半色調(diào)圖像特征提取形成特征曲線圖,橫軸代表每幅半色調(diào)圖像的特征數(shù)8和40,縱軸為每一個(gè)特征數(shù)對(duì)應(yīng)的特征值,由圖中可見(jiàn)兩種算法產(chǎn)生的半色調(diào)圖像的特征曲線均具有很好的擬合度,但傳統(tǒng)的共生矩陣(GLCM)產(chǎn)生曲線圖在不同種類之間識(shí)別度不高而改進(jìn)之后共生矩陣(BGLCM)不同類型的曲線又有很好的辨識(shí)度適合分類。
從產(chǎn)生的特征向量中選取500個(gè)特征對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,之后隨機(jī)選取1 500個(gè)特征向量經(jīng)過(guò)訓(xùn)練之后的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試得其分類的準(zhǔn)確率如表1、表 2 所示,表為一 個(gè)矩 陣 A(i,j)(1≤i≤12,1≤j≤12),其中i,j分別對(duì)應(yīng)著圖 2中的 12類半色調(diào)圖像,A(i,i)(1≤i≤12)即對(duì)角線上數(shù)目為第i類正確數(shù)目,第13列為各類分類準(zhǔn)確率。表中反應(yīng)出在同一個(gè)實(shí)驗(yàn)環(huán)境由傳統(tǒng)的灰度共生矩陣對(duì)12類半色調(diào)圖像提取的特征通過(guò)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類的準(zhǔn)確率較改進(jìn)之后的BGLCM更差。
圖4 特征圖差異比較
表1 改進(jìn)BGLCM分類準(zhǔn)確率
表2 傳統(tǒng)GLCM分類準(zhǔn)確率
本文先介紹了半色調(diào)技術(shù)的應(yīng)用與常用的一些技術(shù)以及半色調(diào)圖像的再重建需要將二值圖像通過(guò)逆半調(diào)技術(shù)將其轉(zhuǎn)換成連續(xù)色調(diào)的灰度圖像。在逆半調(diào)技術(shù)中大部分需要知道相應(yīng)半色調(diào)圖像產(chǎn)生的方法,所以對(duì)半色調(diào)圖像的分類就顯得十分重要。之后分析現(xiàn)有的半色調(diào)圖像分類相關(guān)報(bào)道的不足之處,同時(shí)基于傳統(tǒng)的共生矩陣(GLCM)思想上對(duì)其進(jìn)行相應(yīng)的改進(jìn)使其適用二值圖像分類的BGLCM,改進(jìn)之后的BGLCM省略了求共生矩陣的特征值而是對(duì)不同的相對(duì)算子 Q含有(0,1)和(1,0)元素進(jìn)行統(tǒng)計(jì),相對(duì)傳統(tǒng)共生矩陣可以減少算法的時(shí)間復(fù)雜度,通過(guò)實(shí)驗(yàn)分析可以看出在同一個(gè)實(shí)驗(yàn)環(huán)境中經(jīng)過(guò)改進(jìn)之后的BGLCM對(duì)二值圖像分類準(zhǔn)確率優(yōu)于傳統(tǒng)的灰度共生矩陣。
[1]KITE T D, DAMERA-VENKATA N, EVANS B L, et al.A fast high-quality inverse halftoning algorithm for error diffused halftones[J].Image Processing,IEEE Transactions on, 2000, 9(9): 1583-1592.
[2]STEVENSON R L.Inverse halftoning via MAP estimation[J].Image Processing, IEEE Transactions on, 1997, 6 (4):574-583.
[3]KARNIZ, FREEDMAN D, SHAKED D.Fastinverse halftoning[C].31st International Congress on Imaging Science(ICIS 2010), Beijing, China.2010.
[4]CHANG P C,YU C S.Neural net classification and LMS reconstruction to halftone images[C].Photonics West′98 Electronic Imaging.International Society forOptics and Photonics,1998:592-602.
[5]孔月萍,杜旭苗.一種半調(diào)圖像類型識(shí)別方法[J].計(jì)算機(jī)應(yīng)究,2009,26(12):4850-4851.
[6]劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國(guó)圖象圖形學(xué)報(bào),2009,14(4):622-635
[7] JULESZ B. Visual pattern discrimination[J].InformationTheory,IRE Transactions on, 1962, 8(2): 84-92.
[8]HARALICKRM,SHANMUGAM K, DINSTEIN I H. Textural features for image classification[J].Systems, Man and Cybernetics,IEEE Transactions on, 1973 (6):610-621.
[9]孔月萍,曾平.圖像逆半調(diào)及其質(zhì)量評(píng)價(jià)技術(shù)研究[D].西安:西安電子科技大學(xué),2008.
[10]ANALOUIM,ALLEBACH JP.Model-based halftoning using direct binary search[C].SPIE/IS&T 1992 Symposium on Electronic Imaging: Science and Technology.International Society for Optics and Photonics, 1992: 96-108.