金真伊 李德
摘 要: 本文提出一種在理想實(shí)驗(yàn)環(huán)境中可以抗打印掃描攻擊的大容量文本水印算法,該算法首先對(duì)文本圖像進(jìn)行字符切分,以字符復(fù)雜度為標(biāo)準(zhǔn)將字符圖像分為嵌入部分、調(diào)整部分和去除部分,對(duì)嵌入部分和調(diào)整部分的每塊字符圖像再次切分。根據(jù)切分出的字符圖像,以打印掃描不變量為基礎(chǔ),建立量化函數(shù),通過(guò)分別翻轉(zhuǎn)單個(gè)字符圖像切分部分的的像素邊界點(diǎn),實(shí)現(xiàn)水印的嵌入。該方法考慮到人類視覺(jué)系統(tǒng)的掩蔽特性,嵌入水印信息后的文本圖像視覺(jué)效果良好,經(jīng)實(shí)驗(yàn),該方法可以抵抗常見(jiàn)的噪聲攻擊以及縮放攻擊,實(shí)現(xiàn)了水印的全盲提取。
關(guān)鍵詞: 文本水印;量化;大容量
數(shù)字水印的基本方法是利用載體冗余數(shù)據(jù)來(lái)嵌入水印信息的,可以避免引起感官系統(tǒng)的察覺(jué),而文本對(duì)于圖像、聲音、及視頻等多媒體數(shù)據(jù)而言,冗余度較小,所以,目前基于頻域的文本水印嵌入方法,嵌入水印后的圖像視覺(jué)效果并不理想,這給文本水印的發(fā)展帶來(lái)了極大的難題[1-2]?;诜D(zhuǎn)字符像素的水印嵌入方法可以保持較好的視覺(jué)效果,這給文本水印的發(fā)展帶來(lái)了新思路,但該方法單個(gè)字符嵌入容量過(guò)低,而整體的嵌入量也依賴于字符圖像的多少,比如證書(shū)類的文本文件字?jǐn)?shù)都相對(duì)較少,因此,提高單個(gè)字符嵌入量顯得尤為重要[3-4]。
本文針對(duì)抗打印掃描水印算法容量較小的問(wèn)題,在保證嵌入水印后整體視覺(jué)效果不變的前提下,提出一種基于字符像素翻轉(zhuǎn)的大容量且抗打印掃描攻擊的文本水印算法。經(jīng)實(shí)驗(yàn)表明,該算法具有很好的不可感知性,并且可以抵抗打印掃描攻擊,具有很好的魯棒性。
1 水印的嵌入和提取方案
1.1 水印嵌入過(guò)程
Step1將文本圖像進(jìn)行二值化處理后,對(duì)圖像進(jìn)行字符切分,根據(jù)切分出來(lái)的字符圖像設(shè)置像素復(fù)雜度的閾值為T(mén),作為去除字符圖像的復(fù)雜度參數(shù)。將文本圖像分為三個(gè)部分,分別為嵌入部分A,調(diào)整部分B和去除部分C。然后計(jì)算出整體字符圖像黑色像素的平均值;
Step2將單個(gè)字符圖像再一次進(jìn)行切分,每個(gè)字符圖像被切分成為四份,分別對(duì)每一份圖像里的字符像素分別進(jìn)行處理;
Step3計(jì)算出嵌入部分A中的每個(gè)字符內(nèi)部的四個(gè)像素塊中,黑色像素的翻轉(zhuǎn)量,并計(jì)算出嵌入部分的所有像素改變量之和;
Step4使整體字符像素?cái)?shù)保持不變,需要根據(jù)嵌入部分字符像素改變量的總和對(duì)調(diào)整部分字符進(jìn)行翻轉(zhuǎn)。
Step5如翻轉(zhuǎn)量大于0時(shí),找響應(yīng)數(shù)目的白色邊界點(diǎn)進(jìn)行翻轉(zhuǎn);如翻轉(zhuǎn)量小于0時(shí),要找相應(yīng)數(shù)目的黑色邊界點(diǎn)進(jìn)行翻轉(zhuǎn),從而實(shí)現(xiàn)水印的嵌入。
1.2 水印提取過(guò)程
Step1將嵌入水印的文本圖像按照與水印嵌入相同的方式進(jìn)行字符切分,將所有字符分為嵌入部分、調(diào)整部分和去除部分;
Step2對(duì)單個(gè)字符像素再一次進(jìn)行切分,將每個(gè)字符圖像切分成四份圖像,對(duì)每一份圖像中的字符像素分別進(jìn)行處理;
Step3分別計(jì)算出A和B中字符圖像中包含的黑色像素,計(jì)算整體字符圖像黑色像素的平均值;
Step4用奇偶量化方法對(duì)單個(gè)字符里的四個(gè)字符塊分別進(jìn)行提取。
2 實(shí)驗(yàn)結(jié)果及分析
為了提高算法的抗變換性,在水印提取時(shí)采用眾數(shù)原則,即對(duì)提取出的對(duì)應(yīng)于同一水印信息的3比特?cái)?shù)據(jù)按照取值0或1的多少來(lái)決定最后的水印信息。
對(duì)比了原始圖像與嵌入水印后的圖像后發(fā)現(xiàn),除了單個(gè)字符圖像的比劃略微變粗或變細(xì),幾乎看不出其他明顯的差別,所以,嵌入水印后的文本圖像具有較好的不可感知性。圖像在受到椒鹽攻擊及高斯攻擊后,仍能夠提取出的水印,且誤碼率在允許的范圍之內(nèi);對(duì)此文本圖像進(jìn)行縮放攻擊,縮放到85%,BER為0.06,在誤碼率允許的范圍內(nèi),即與原始水印信息有很高的相似性。所以,此算法可以抵御一定程度上的縮放攻擊、高斯攻擊以及椒鹽攻擊。
3 結(jié)論
本文中為了使字符得到充分的翻轉(zhuǎn),在算法中引入了字符復(fù)雜度的概念,去除不能充分翻轉(zhuǎn)的字符,提高算法的抗變換性。在保證一定魯棒性的同時(shí)實(shí)現(xiàn)了單個(gè)字符嵌入量的提升。通過(guò)實(shí)驗(yàn)可以看出本算法實(shí)現(xiàn)了全盲檢測(cè)的同時(shí),使嵌入水印后的文本圖像表現(xiàn)出很好的視覺(jué)效果,人眼幾乎很難察覺(jué)到文檔被修改過(guò),并且能夠抵抗椒鹽攻擊、高斯攻擊以及縮放攻擊。本算法是在理想實(shí)驗(yàn)環(huán)境中實(shí)現(xiàn)的,但在實(shí)際應(yīng)用中,還有一些輔助因素要考慮,如對(duì)掃描后的圖像進(jìn)行文檔糾偏,去噪,找到有效的文字塊區(qū)域等,這對(duì)實(shí)際應(yīng)用的成功都是至關(guān)重要的,下一步要解決這些輔助因素,將本方法應(yīng)用到實(shí)際中去。
參考文獻(xiàn):
[1]BARNEY S,QIU X.Statistical image differences,degradation feature and character distance metrics[J].International Journal of Document Analysis and Recognition,2004,6(3):146-153.
[2]潭論正,朱寧波,孫星明.基于文檔圖像的抗打印-掃描數(shù)字水印技術(shù).計(jì)算機(jī)應(yīng)用研究,2007,24(12):112-116.
[3]郭承青,徐國(guó)愛(ài),鈕心忻,李洋.抗打印掃描攻擊的大容量文本水印.應(yīng)用科學(xué)學(xué)報(bào),2011,3,29(2):95-102.
[4]亓文法,李曉龍,楊斌,程道放.用于信息追蹤的文本水印算法[J].通信學(xué)報(bào),2008,29(10):183-190.