高光勇,龔金林
(1.九江學(xué)院網(wǎng)絡(luò)與信息安全研究所,江西 九江 332005;2.九江學(xué)院圖書館,江西 九江 332005)
面向數(shù)字圖書館信息資源的可逆認(rèn)證方案*
高光勇1,龔金林2
(1.九江學(xué)院網(wǎng)絡(luò)與信息安全研究所,江西 九江 332005;2.九江學(xué)院圖書館,江西 九江 332005)
針對(duì)目前數(shù)字圖書館信息資源因被篡改而引起的認(rèn)證問題,提出一種篡改自恢復(fù)可逆認(rèn)證解決方案。當(dāng)對(duì)待檢測(cè)圖像進(jìn)行完整性認(rèn)證時(shí),只需根據(jù)提取的分塊檢測(cè)比特即可判定待檢測(cè)圖像是否遭受篡改以及遭受篡改的位置。如沒有遭受篡改,表明待檢測(cè)圖像通過完整性認(rèn)證,并且能還原待檢測(cè)圖像至原始狀態(tài)。否則,表明待檢測(cè)圖像沒有通過完整性認(rèn)證,然后可利用壓縮感知重構(gòu)技術(shù)對(duì)篡改內(nèi)容進(jìn)行恢復(fù)。
數(shù)字圖書館;可逆認(rèn)證;篡改恢復(fù)
近十年來,隨著因特網(wǎng)技術(shù)和數(shù)字信息技術(shù)的普及,數(shù)字資源共享平臺(tái)(例如數(shù)字圖書館)的建設(shè)也得到快速發(fā)展。數(shù)字圖書館通過對(duì)數(shù)字信息資源的整合與共享,大大提高了信息資源的利用效率。但是在信息傳播變得便捷的同時(shí),對(duì)數(shù)字資源的篡改變得更加容易,進(jìn)而引起的版權(quán)問題也日益突出[1]。如何在促進(jìn)數(shù)字信息資源共建共享的同時(shí),又能真正實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)的保護(hù),已成為科研技術(shù)人員必須解決的緊迫課題。本文將可逆認(rèn)證技術(shù)應(yīng)用于數(shù)字圖書館信息資源的版權(quán)保護(hù)中,針對(duì)數(shù)字圖像提出一種篡改自恢復(fù)可逆認(rèn)證解決方案,能夠有效避免傳統(tǒng)水印技術(shù)的不可逆性以及不能還原被篡改內(nèi)容等缺點(diǎn),為數(shù)字信息資源的產(chǎn)權(quán)保護(hù)提供有力的技術(shù)支撐。
目前,用于數(shù)字資源產(chǎn)權(quán)保護(hù)的數(shù)字水印技術(shù)主要分為三類:魯棒嵌入水印、零水印以及可逆水印。魯棒嵌入水印是一種傳統(tǒng)數(shù)字水印技術(shù),主要是利用信號(hào)處理技術(shù)在數(shù)字作品的空域或頻域中嵌入認(rèn)證信息,檢測(cè)時(shí)通過提取的認(rèn)證信息來判別數(shù)字信息的版權(quán)歸屬。魯棒水印技術(shù)主要考慮在外來攻擊(如在數(shù)字作品上疊加噪音、對(duì)數(shù)字作品進(jìn)行縮放、旋轉(zhuǎn)及裁剪等)下是否仍能正確提取水印信息。過去十年有大量應(yīng)用于數(shù)字資源版權(quán)保護(hù)的魯棒數(shù)字水印方案被提出。鄧成等[2]提出了一種基于仿射協(xié)變區(qū)域的抗幾何攻擊數(shù)字水印算法。蘭宇琳[3]提出一種基于奇異值分解及獨(dú)立成分分析的數(shù)字音頻水印算法。Shao等[4]利用正交傅里葉-梅林矩和混沌映射實(shí)現(xiàn)了一種魯棒水印方案。這些方案對(duì)常規(guī)信號(hào)處理、幾何攻擊以及組合攻擊均具有較好的魯棒性。
由于傳統(tǒng)的魯棒嵌入水印在水印的魯棒性和不可感知性上的矛盾始終存在,為了解決這一問題,溫泉等[5]提出了零水印技術(shù),即采用數(shù)字媒體的重要特征去構(gòu)造水印信息,在此過程中數(shù)字媒體自身并沒有被修改。郝世博等[6]以數(shù)字圖像為例,利用分塊壓縮感知技術(shù)對(duì)原始圖像進(jìn)行觀測(cè),將觀測(cè)值與Arnold變換后的版權(quán)信息結(jié)合,構(gòu)造零水印信息。該方法在一定程度上有助于圖書館、博物館、檔案館數(shù)字信息資源的版權(quán)保護(hù)。Gao等[7]基于貝塞爾-傅里葉矩的不變性提出一種零水印方案,相對(duì)其他零水印技術(shù),該方案能更好地抵抗信號(hào)處理及幾何攻擊。
盡管零水印不損害數(shù)字資源的原始性,但是在版權(quán)認(rèn)證時(shí),零水印存在需借助第三方并且具有較高的誤警率等不足,這使得零水印技術(shù)的推廣使用受到限制。近來,一種名為可逆水印的版權(quán)保護(hù)技術(shù)引起人們的重視??赡嫠∏度胨⌒畔⒌綌?shù)字媒體,認(rèn)證時(shí)通過提取嵌入的水印信息來判別版權(quán)歸屬,同時(shí)數(shù)字媒體在水印信息提取后能可逆還原至原始狀態(tài)。Tian[8]首次利用鄰居像素間差分的擴(kuò)展嵌入水印信息,認(rèn)證完成后進(jìn)行嵌入過程逆向處理即可恢復(fù)原始數(shù)字信息。Dragoi等[9]提出一種基于像素塊局部預(yù)測(cè)的可逆水印認(rèn)證方案。姜明芳[10]提出一種面向電子圖書的可逆可見水印方案。該方案在保護(hù)電子圖書版權(quán)的同時(shí),可提供用戶預(yù)訂與預(yù)覽功能,僅授權(quán)用戶可去除可見水印而獲得高清電子圖書。
雖然目前提出的基于可逆水印的版權(quán)保護(hù)方案具有較好的認(rèn)證效果,但是大多數(shù)算法沒有涉及數(shù)字資源的被篡改內(nèi)容的定位及其恢復(fù)。
篡改自恢復(fù)可逆認(rèn)證方案的主要思想是首先對(duì)數(shù)字圖像進(jìn)行可逆增強(qiáng),因?yàn)榍度胨?huì)降低數(shù)字圖像的可視性,而可逆增強(qiáng)可以提高數(shù)字圖像的視覺質(zhì)量,并且在需要的時(shí)候可以恢復(fù)被增強(qiáng)圖像至原始狀態(tài)。然后可逆地嵌入各圖像分塊的特征信息到相應(yīng)的各分塊像素中。當(dāng)進(jìn)行完整性認(rèn)證時(shí),認(rèn)證者利用從各分塊提取的信息來判斷各圖像分塊的完整性,如果各圖像塊均完整,則該數(shù)字圖像通過認(rèn)證;否則認(rèn)為非完整的分塊受到篡改,并利用已有的信息,結(jié)合壓縮感知重構(gòu)技術(shù)實(shí)現(xiàn)對(duì)篡改分塊的恢復(fù)。下面首先介紹認(rèn)證方案用到的可逆圖像增強(qiáng)及壓縮感知技術(shù),然后詳細(xì)給出篡改自恢復(fù)可逆認(rèn)證的具體設(shè)計(jì)方案,最后給出應(yīng)用實(shí)例。
2.1可逆圖像增強(qiáng)
通??赡嫠∷惴ㄔ谇度胨r(shí)主要考慮嵌入容量及嵌入圖像的峰值信噪比(PSNR),希望在盡可能嵌入更多水印信息的同時(shí),保留較高的PSNR值。但嵌入容量與PSNR是一對(duì)矛盾體,很難實(shí)現(xiàn)最佳的折中。為了解決這個(gè)問題,有關(guān)文獻(xiàn)[11]提出先通過對(duì)圖像增強(qiáng)來改善圖像的視覺質(zhì)量,在實(shí)現(xiàn)增強(qiáng)的同時(shí)嵌入部分水印,然后在增強(qiáng)后的圖像里再嵌入更多水印信息。因?yàn)閳D像質(zhì)量在一開始已被增強(qiáng),因而盡管有更多水印嵌入,圖像的可視性仍有保證。同時(shí)采用的增強(qiáng)技術(shù)是可逆的,當(dāng)需要的時(shí)候可以將嵌入圖像還原為原始圖像。
2.2壓縮感知
壓縮感知(CS)的概念于2006年由Donoho[12]正式提出后,便很快受到相關(guān)研究領(lǐng)域的國(guó)內(nèi)外學(xué)者的高度重視,并于2007年被MIT評(píng)選為十大科技進(jìn)展之一。壓縮感知理論突破了經(jīng)典香農(nóng)定理的瓶頸,其核心思想是通過遠(yuǎn)少于奈奎斯特頻率的釆樣數(shù)據(jù),同時(shí)實(shí)現(xiàn)信號(hào)的采樣和壓縮。
壓縮感知理論主要由信號(hào)的稀疏表示、信號(hào)的線性測(cè)量和信號(hào)的重建算法組成。信號(hào)的稀疏表示是指如果信號(hào)投影到正交變換基后獲得的絕大部分變換系數(shù)的絕對(duì)值接近零值,那么稱生成的變換向量是稀疏或者近似稀疏的,同時(shí)該稀疏向量可以看作是原始信號(hào)的一種簡(jiǎn)潔表達(dá)。只有能被稀疏表示的信號(hào)才能應(yīng)用壓縮感知技術(shù),換句話說,信號(hào)的稀疏表示是壓縮感知的先驗(yàn)條件。信號(hào)的線性測(cè)量是通過稀疏表示的原始信號(hào)與事先選擇的穩(wěn)定性好的感知矩陣的乘積來獲得原始信號(hào)的線性投影測(cè)量值,這里測(cè)量值的數(shù)據(jù)量遠(yuǎn)小于原始信號(hào)的數(shù)據(jù)量。最后,通過測(cè)量值及感知矩陣,并利用信號(hào)重建算法可重新構(gòu)造出原始信號(hào)。
2.3具體設(shè)計(jì)方案
2.3.1水印嵌入過程
圖1可逆水印嵌入過程框圖
圖1直觀地顯示了水印嵌入過程,具體步驟如下:
第1步:對(duì)數(shù)字圖像進(jìn)行可逆增強(qiáng)。通過對(duì)圖像的直方圖峰值進(jìn)行平移以實(shí)現(xiàn)直方圖均衡化,從而達(dá)到增強(qiáng)圖像視覺質(zhì)量的目的。在直方圖平移的過程中以可逆的方式嵌入一些秘密信息,例如數(shù)字作品擁有者的版權(quán)信息等。
第2步:對(duì)增強(qiáng)后的圖像進(jìn)行分塊處理,分塊大小為16×16。然后對(duì)各分塊進(jìn)行隨機(jī)置亂,置亂后的分塊被劃分為若干個(gè)分組,每個(gè)分組含16個(gè)分塊。
第3步:對(duì)每個(gè)圖像塊分別進(jìn)行余弦變換(DCT),因?yàn)槊總€(gè)分塊含256像素,所以變換后的DCT系數(shù)為256個(gè),這樣每個(gè)分組就含有4096個(gè)DCT系數(shù)。每個(gè)分組的DCT系數(shù)可看作為1×4096矩陣,然后乘以一個(gè)滿足正態(tài)分布的4096×368參考矩陣后得到1×368矩陣。矩陣中的368個(gè)數(shù)值稱為參考值。
第4步:隨機(jī)置亂所有分組的參考值,并將其劃分為N/256個(gè)集合,每個(gè)集合含23個(gè)參考值。這里N表示數(shù)字圖像的像素?cái)?shù)量。
第5步:通過某量化函數(shù)將所有參考值量化為大小位于[-32,31]的整數(shù)形式,每個(gè)整數(shù)值用6比特表示,這樣每集合就含有138比特參考值。
第6步:用64比特表示每分塊的位置信息,即32比特被用來表示分塊的第一個(gè)像素的橫坐標(biāo),另32比特表示分塊的第一個(gè)像素的縱坐標(biāo)。然后每分塊的64位位置比特、256×8位像素比特及對(duì)應(yīng)的138位參考比特被輸入一個(gè)哈希函數(shù),通過計(jì)算輸出得到31位哈希比特。
第7步:利用隨機(jī)函數(shù)生成31位標(biāo)簽比特。然后31位哈希比特與31位標(biāo)簽比特進(jìn)行異或運(yùn)算后獲得31位檢測(cè)比特。
第8步:利用基于預(yù)測(cè)誤差擴(kuò)展的可逆嵌入算法[13],將138位參考比特與31位檢測(cè)比特共169位比特嵌入到相應(yīng)的圖像分塊。基于預(yù)測(cè)誤差的可逆嵌入算法通過相鄰的三個(gè)像素來預(yù)測(cè)當(dāng)前像素值,然后計(jì)算預(yù)測(cè)像素值和實(shí)際像素值的誤差,并在誤差擴(kuò)展后進(jìn)行比特信息的嵌入。如果第1輪不能完成所有169比特的嵌入,則可通過第2輪、第3輪等多輪執(zhí)行來完成所有比特的嵌入。最后獲得最終嵌入圖像。
2.3.2水印提取及篡改檢測(cè)過程
水印提取及篡改檢測(cè)過程如圖2所示:
第1步:對(duì)接收?qǐng)D像進(jìn)行分塊,分塊大小為16×16。利用基于預(yù)測(cè)誤差擴(kuò)展的可逆提取算法[14],提取各圖像分塊里嵌入的138位參考比特及31位檢測(cè)比特。
第2步:類似于水印嵌入過程,獲得各分塊位置比特。然后將各分塊的64位位置比特、256×8位像素比特及提取的138位參考比特輸入哈希函數(shù),通過計(jì)算輸出得到31位哈希比特。最后,各分塊的31位哈希比特與提取的對(duì)應(yīng)的31位檢測(cè)比特進(jìn)行異或運(yùn)算后獲得31位標(biāo)簽比特。
第3步:比較各分塊的標(biāo)簽比特,如超過40%的分塊具有相同的31位標(biāo)簽比特,那么認(rèn)為該31位標(biāo)簽比特是嵌入過程所使用的標(biāo)簽比特,并把這31位標(biāo)簽比特記為B。將所有分塊的標(biāo)簽比特與B計(jì)較,把結(jié)果不一致的分塊標(biāo)記為保留塊,結(jié)果不一致的分塊標(biāo)記為篡改塊。如所有分塊都與B一致,則表明沒有篡改發(fā)生,該接收?qǐng)D像通過完整性認(rèn)證。如存在篡改塊,則完整性認(rèn)證失敗,可對(duì)篡改塊內(nèi)容進(jìn)行恢復(fù)以進(jìn)一步證明該遭受篡改圖像是來自原始圖像。
第4步:如接收?qǐng)D像通過完整性認(rèn)證,則執(zhí)行可逆增強(qiáng)算法的逆過程,提取嵌入的秘密信息并還原數(shù)字圖像至原始狀態(tài),即獲得與原始數(shù)字圖像一致的圖像。
第5步:如接收?qǐng)D像沒有通過完整性認(rèn)證,則采用與嵌入過程相同的方法對(duì)各分塊進(jìn)行隨機(jī)置亂,置亂后的分塊被劃分為若干個(gè)分組,每個(gè)分組含16個(gè)分塊。
第6步:針對(duì)每個(gè)分組,設(shè)被篡改分塊的數(shù)目為z,首先把從(16-z)個(gè)保留塊里提取的參考比特?fù)Q算為十進(jìn)制參考值,然后利用量化函數(shù)對(duì)參考值進(jìn)行反量化。
第7步:利用反量化后的參考值、從保留塊里計(jì)算得到的余弦變換系數(shù)以及嵌入過程用過的參考矩陣,通過公式計(jì)算獲得z個(gè)篡改塊的參考值的近似值S[14]。由于余弦變換系數(shù)大部分接近零,即具有稀疏性,因而可利用壓縮感知重構(gòu)技術(shù)對(duì)其重新構(gòu)造。這里使用S和參考矩陣,通過正交匹配追蹤算法[15](一種壓縮感知重構(gòu)技術(shù))重構(gòu)出z個(gè)篡改塊的余弦變換系數(shù)。因?yàn)閴嚎s感知技術(shù)的有損性,重構(gòu)出的余弦變換系數(shù)相比原始系數(shù)有小部分信息丟失。然后對(duì)這些余弦變換系數(shù)進(jìn)行逆變換后生成恢復(fù)后的圖像塊。最后結(jié)合圖像所有分組的保留分塊,得到還原后的近似圖像。近似圖像相比原始圖像雖然有部分信息損失,但總體上仍能體現(xiàn)圖像原貌,這有助于進(jìn)一步證明該接收?qǐng)D像是在原始圖像上進(jìn)行篡改后的結(jié)果。
圖2可逆水印提取及篡改檢測(cè)過程框圖
2.4應(yīng)用實(shí)例
采用通用測(cè)試數(shù)字圖像Lena作為實(shí)例,應(yīng)用本文提出可逆認(rèn)證方案進(jìn)行實(shí)驗(yàn),測(cè)試結(jié)果如圖3所示。圖3(a)為原始Lena圖像;圖3(b)為應(yīng)用本文方案的嵌入水印圖像;圖3(c)是對(duì)圖3(b)進(jìn)行完整性認(rèn)證后可逆還原后的圖像,計(jì)算衡量?jī)煞鶊D像質(zhì)量相似度的客觀指標(biāo)PSNR(峰值信噪比),可得PSNR為無窮大,表明圖3(c)和圖3(a)完全一致,并且通過完整性認(rèn)證的圖像可以被還原至原始狀態(tài)。圖3(d)是對(duì)圖3(b)進(jìn)行篡改后的圖像;對(duì)圖3(d)進(jìn)行的完整性認(rèn)證失敗后,自恢復(fù)篡改內(nèi)容后的圖像如圖3(e)所示,可以看出,恢復(fù)后的圖像雖然在篡改位置的內(nèi)容和原始圖像相比仍有些細(xì)微差別,但總體保持了原始圖像的特征,從而間接證明了圖3(c)是源自圖3(b)。
圖3測(cè)試結(jié)果.(a)原始Lena圖像,(b)嵌入水印圖像,(c)認(rèn)證通過,還原后的圖像,(d)遭受篡改后的圖像,(e)篡改恢復(fù)后的圖像
根據(jù)數(shù)字圖書館數(shù)字資源版權(quán)保護(hù)的研究現(xiàn)狀,本文提出一種篡改自恢復(fù)可逆認(rèn)證方案。通過應(yīng)用可逆增強(qiáng)、壓縮感知以及基于預(yù)測(cè)誤差擴(kuò)展的可逆水印技術(shù),實(shí)現(xiàn)了對(duì)數(shù)字作品的完整性認(rèn)證,并能將通過認(rèn)證的數(shù)字作品還原至原始狀態(tài)。通過標(biāo)簽比特能定位被篡改內(nèi)容的位置,并利用從保留分塊提取的參考值去恢復(fù)篡改分塊的內(nèi)容。恢復(fù)過程不需要借助外部數(shù)據(jù),僅通過數(shù)字作品自身即可實(shí)現(xiàn)。最后通過實(shí)際用例證明了提出方案的有效性。
[1]楊子伍.數(shù)字圖書館建設(shè)中知識(shí)產(chǎn)權(quán)保護(hù)的關(guān)鍵技術(shù)[J].河南圖書館學(xué)刊,2006(2):115-117.
[2]鄧成,李潔,高新波.基于仿射協(xié)變區(qū)域的抗幾何攻擊圖像水印算法[J].自動(dòng)化學(xué)報(bào),2010(2):221-228.
[3]蘭宇琳.數(shù)字圖書館音頻信息資源版權(quán)保護(hù)研究[J],數(shù)字圖書館論壇,2015(1):42-46.
[4]SHAO Z,SHANG Y.Robust watermarking using orthogonal Fourier-Mellin moments and chaotic map for double images[J]. Signal Processing,2016(3):522-531.
[5]溫泉,孫錟鋒,王樹勛.零水印的概念與應(yīng)用[J].電子學(xué)報(bào),2003(2):214-216.
[6]郝世博,朱學(xué)芳.面向圖博檔的分塊壓縮感知圖像零水?。跩].現(xiàn)代圖書情報(bào)技術(shù),2014(4):87-93.
[7]GAO G Y,JIANG G P.Bessel-Fourier moment-based robust image zero-watermarking[J].Multimedia Tools and Applications,2015(3):841-858.
[8]TIAN J.Reversible data embedding using a difference expansion[J].IEEE Transactions on Circuits and Systems for Video Technology,2003(8):890-896.
[9]DRAGOI I,COLTUC D.On local prediction based reversible watermarking[J].IEEE Transactions Image Processing,2015(4): 1244-1246.
[10]姜明芳.適用于電子圖書版權(quán)保護(hù)的可逆可見水印方案[J].現(xiàn)代情報(bào),2014(2):58-61.
[11]WU H,DUGELAY J,SHI Y Q.Reversible image data hiding with contrast enhancement[J].IEEE Signal Processing Letters,2015(1):81-85.
[12]DONOHO D L.Compressed Sensing[J].IEEE Transactions on Information Theory,2006(4):1289-1306.
[13]THODI D M,RODRIQUEZ J J.Expansion embedding techniques for reversible watermarking[J].IEEE Transactions on Image Processing,2007(3):721-730.
[14]ZHANG X,QIAN Z,REN Y,etc.Watermarking with flexible self-recovery quality based on compressive sensing and compositive reconstruction[J].IEEE Transactions on Information Forensics and Security,2011(4):1223-1232.
[15]TROPP J A,GILBERT A C.Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Transactions on Information Theory,2007(12):4655-4666.
(編發(fā):王域鋮)
Reversible Authentication Scheme for Information Resources of Digital Library
GAO Guang-yong1,GONG Jin-lin2
(1.Institute of Network and Information Security,Jiujiang University,Jiujiang 332005,China;2.Library of Jiujiang University,Jiujiang 332005,China)
Aiming at the authentication issue raised from the tampered information resources of digital library,this paper proposes a solving scheme for the reversible authentication with self-recovery of tampered content.When the detected image is authenticated,we can determine if the tamper happens and the tampered image location only by the extracted detection bits.If the tamper does not happen,then it manifests that the content of detected image passes the integrity authentication and the image can be restored to its original state.Otherwise,the integrity authentication for the content of detected image fails,and then the tampered content is recovered by compressive sensing reconstruction.
digital library;reversible authentication;tamper recovery
G250.76
G250.76
A
2095-5197(2016)03-0044-05
高光勇(1973-),男,副教授,博士,研究方向:數(shù)字媒體信息安全;龔金林(1973-),男,副研究館員,碩士,研究方向:數(shù)字圖書館信息處理。
2016-02-22