◆陳天宇 張 蓉 王 珩
?
基于深度學(xué)習(xí)的圖像篡改被動(dòng)檢測(cè)技術(shù)的研究與實(shí)現(xiàn)
◆陳天宇 張 蓉 王 珩
(華東理工大學(xué)信息學(xué)院 上海 200237)
圖像篡改的被動(dòng)檢測(cè)技術(shù)通過(guò)提取圖像的特征從而判斷圖像是否遭受到了篡改。本文通過(guò)提取圖像DCT系數(shù)的馬爾科夫轉(zhuǎn)移概率特征矩陣,經(jīng)閾值處理、多步長(zhǎng)差分后作為深度學(xué)習(xí)的輸入,進(jìn)行圖像篡改檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)拼接篡改圖像的檢測(cè)準(zhǔn)確率高達(dá)92.54%,具有一定的實(shí)用性。
深度學(xué)習(xí);馬爾科夫模型;圖像篡改;被動(dòng)取證
隨著互聯(lián)網(wǎng)時(shí)代數(shù)字圖像的廣泛使用,圖像篡改變得更為容易。圖像的使用者可以隨意使用photoshop等軟件輕易地更改圖像內(nèi)容,而篡改后的圖像可能會(huì)被別有用心的人使用而實(shí)現(xiàn)其惡意的用途或目的。通常這樣的篡改圖像難以被肉眼辨認(rèn)出,因而針對(duì)數(shù)字圖像的篡改認(rèn)證取證技術(shù)就顯得尤為重要。
圖像篡改檢測(cè)技術(shù)分為主動(dòng)檢測(cè)技術(shù)和被動(dòng)檢測(cè)技術(shù)。主動(dòng)檢測(cè)技術(shù)即預(yù)先在圖像中嵌入某種數(shù)字水印、數(shù)字簽名等信息,接收方再通過(guò)提取該類(lèi)信息是否與發(fā)送方一致,來(lái)判斷圖像是否遭到了篡改。而被動(dòng)檢測(cè)技術(shù)則是通過(guò)提取圖像中的各類(lèi)特征,來(lái)判斷圖像是否遭到了篡改。如通過(guò)Hilbert-Huang 變換[1]、韋伯局部特征[2]等方法提取圖片特征,其認(rèn)證準(zhǔn)確率分別達(dá)到了73.55%、86.36%。而隨著計(jì)算機(jī)性能的提高,可以將上述方法與深度學(xué)習(xí)相結(jié)合,進(jìn)一步提高圖像篡改認(rèn)證的準(zhǔn)確率。文獻(xiàn)[3]使用深度置信網(wǎng)絡(luò),提取DCT域馬爾科夫概率轉(zhuǎn)移矩陣后進(jìn)行差分處理使檢測(cè)的認(rèn)證準(zhǔn)確率達(dá)到了91.26%。
在文獻(xiàn)[3]的基礎(chǔ)上,為進(jìn)一步提高檢測(cè)準(zhǔn)確率,增加了閾值選取、多步長(zhǎng)差分的特征提取方法。研究改進(jìn)后的基于馬爾科夫模型的圖像拼接篡改檢測(cè)算法的篡改認(rèn)證準(zhǔn)確率,算法步驟:
對(duì)輸入的圖像進(jìn)行沒(méi)有重疊的8*8的分塊,圖像邊緣不足8*8的部分用0補(bǔ)足,并對(duì)每一小塊進(jìn)行離散余弦變換。將結(jié)果四舍五入至整數(shù)。對(duì)于任意8*8塊的離散余弦變換的公式為:
式中,
對(duì)圖像在水平,豎直,主、副對(duì)角線上分別進(jìn)行差分處理,以減小塊與塊之間的相關(guān)性。則四個(gè)方向上步長(zhǎng)為的差分的結(jié)果如下:
同時(shí),為了降低計(jì)算的復(fù)雜性,對(duì)差分的結(jié)果進(jìn)行閾值處理,處理方法如下:
(3)馬爾科夫轉(zhuǎn)移概率矩陣提取
其中:
(4)深度卷積網(wǎng)絡(luò)
將(3)中得到的馬爾科夫轉(zhuǎn)移概率特征矩陣作為深度學(xué)習(xí)的輸入。采用卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的網(wǎng)絡(luò),網(wǎng)絡(luò)參數(shù)如表1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)框圖
表1 網(wǎng)絡(luò)訓(xùn)練的訓(xùn)練參數(shù)
實(shí)驗(yàn)采用了哥倫比亞大學(xué)的拼接檢測(cè)數(shù)據(jù)庫(kù)[4],其中包含了均勻平滑、均勻紋理、平滑-平滑、紋理-紋理、平滑-紋理五類(lèi)圖像共1846張。圖像均為128*128像素的灰度圖像,如圖2和圖3所示。隨機(jī)選取圖像中的1661張作為訓(xùn)練圖像,185張作為測(cè)試圖像。
圖2 數(shù)據(jù)庫(kù)中未篡改的圖像
圖3 數(shù)據(jù)庫(kù)中經(jīng)篡改的圖像
分別取閾值T=2至T=7,采用步驟(1)至步驟(3)中的方法分別提取其馬爾科夫轉(zhuǎn)移概率矩陣組。使用步驟(4)中的方法配置網(wǎng)絡(luò)并訓(xùn)練。圖像篡改認(rèn)證的準(zhǔn)確率如下表2所示。由表2可見(jiàn),隨著閾值的增加,認(rèn)證正確率會(huì)隨之提高,但當(dāng)T大于5以后,正確率不再明顯提高,因此,選取T=5為閾值比較合適。
表2 閾值與檢測(cè)認(rèn)證正確率
分別取差分步長(zhǎng)為1、2和3的馬爾科夫轉(zhuǎn)移概率矩陣組,單獨(dú)或共同作為深度學(xué)習(xí)的輸入,閾值T=5。按照步驟(4)中的方法配置網(wǎng)絡(luò)并訓(xùn)練,比較其認(rèn)證正確率,如表3所示。
表3 差分步長(zhǎng)的選取與檢測(cè)認(rèn)證正確率的關(guān)系
由表3可知,當(dāng)采用單獨(dú)差分步長(zhǎng)的馬爾科夫轉(zhuǎn)移概率矩陣組作為卷積神經(jīng)網(wǎng)絡(luò)的輸入時(shí),差分步長(zhǎng)為1的馬爾科夫轉(zhuǎn)移概率矩陣組的效果最好。同時(shí),聯(lián)合轉(zhuǎn)移概率矩陣組的效果均好于單獨(dú)的轉(zhuǎn)移概率矩陣組,步長(zhǎng)為1、2和3的差分聯(lián)合轉(zhuǎn)移概率矩陣組取得了最好的認(rèn)證準(zhǔn)確率,達(dá)到了92.54%。
本文在DCT域提取馬爾科夫轉(zhuǎn)移概率特征的基礎(chǔ)上,增加了閾值T的選取及多種步長(zhǎng)轉(zhuǎn)移概率的圖像特征提取,并將其與深度學(xué)習(xí)相結(jié)合。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)于圖像的篡改的認(rèn)證準(zhǔn)確率達(dá)到了92.54%,具有較好的實(shí)用性。在下一步的工作中,還將研究其他圖像篡改的取證方法。
[1]Fu D,Shi Y.Q, Su W.Detection of Image Splicing Based on Hilbert-Huang Transform and Moments of Characteristic Functions with Wavelet Decompositi -on[C].5th International Workshop on Digital Watermarking. Korea, 2006: 177-187.
[2]劉曉霞,李峰,熊兵.基于韋伯局部特征的圖像拼接檢測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(12):140-143.
[3]尹立國(guó).基于深度學(xué)習(xí)的圖像拼接篡改取證研究[D].云南大學(xué),2015.
[4]http://www.ee.Columbia.edu/In/dvmm/downloads/AuthSplicedDataSetlAuthSplicedDataSet.htm.[200403].