段明月 李爽 張源策 李麗紅
摘要:隱寫術(shù)與隱寫分析是信息安全領(lǐng)域中一個重要的課題。隨著圖像隱寫的不斷發(fā)展,為了防止技術(shù)被惡意者利用,提出了圖像隱寫分析技術(shù)。本文簡單介紹圖像隱寫類別,并根據(jù)適用范圍不同將隱寫分析分為專用隱寫分析和通用隱寫分析,總結(jié)和歸納各算法的優(yōu)缺點,探討深度學(xué)習(xí)在圖像隱寫分析上的研究所面臨的問題及發(fā)展趨勢。
關(guān)鍵詞: 圖像隱寫; 圖像隱寫分析; 深度學(xué)習(xí)
中圖分類號:TP18? ? ? ? ?文獻標(biāo)識碼:A
文章編號:1009-3044(2022)09-0003-03
1引言
隨著網(wǎng)絡(luò)的不斷發(fā)展,通信加密技術(shù)得到了很好的發(fā)展,然而簡單的通信加密并不能滿足敏感信息傳遞需求,隨后研究者開始研究信息隱藏技術(shù),簡稱“隱寫術(shù)”,通過把秘密信息嵌入多媒體載體盡可能不改變載體的視覺和統(tǒng)計特性, 以達(dá)到掩蓋“正在進行秘密通訊”的目的[1]?;ヂ?lián)網(wǎng)中廣泛的多媒體數(shù)據(jù)可以作為載體,如視頻、音頻、圖像、文本等,其中圖像因其內(nèi)容廣泛、容易獲取,且人們對圖像的非重點區(qū)域不夠敏感等原因,逐漸成為最常見的秘密信息載體形式。近年來,針對圖像的隱寫算法已有較為成熟的算法,并得到了廣泛應(yīng)用。
然而,“隱寫術(shù)”是一把雙刃劍。為了避免不法分子利用“隱寫術(shù)”傳播不良信息,研究者提出了隱寫分析技術(shù)。隱寫分析的目標(biāo)是根據(jù)載體的統(tǒng)計特性判斷其中是否隱藏有秘密信息, 進而估計嵌入的信息長度、識別隱寫工具、估計隱寫密鑰, 最終提取秘密信息[2],當(dāng)前的研究重點是檢測載體中是否含有秘密信息。
本文首先對圖像隱寫算法進行簡單介紹,然后分別介紹專用隱寫分析與通用隱寫分析,最后總結(jié)當(dāng)前隱寫分析算法的劣勢,并討論未來發(fā)展趨勢。
2圖像隱寫
根據(jù)是否改變載體原始數(shù)據(jù)將圖像隱寫算法分為嵌入型隱寫算法和無載體隱寫算法。嵌入型隱寫算法通過修改載體像素嵌入秘密信息,具有高隱寫量、易于實現(xiàn)等特點,近幾年取得了不錯的成果。根據(jù)不同的嵌入策略可將嵌入型隱寫算法分為非自適應(yīng)隱寫算法與自適應(yīng)隱寫算法。其中,非自適應(yīng)隱寫算法主要是通過修改像素值或頻域系數(shù)實現(xiàn)秘密信息嵌入,是對載體元素?zé)o差別的選擇與修改,包括LSB(Least Significant Bit)算法[4]、[±1]嵌入算法、Outguess、F5[5]等。
針對自適應(yīng)隱寫算法導(dǎo)致圖像質(zhì)量大幅下降、統(tǒng)計特征改變過大等問題,研究者提出自適應(yīng)隱寫算法,選擇合適的載體圖像,通過訓(xùn)練找到最適合隱寫的位置,得到最小損失函數(shù),常見的自適應(yīng)隱寫術(shù)主要有HILL(High-pass, Low-pass, and Low-pass)、S-UNIWARD、WOW (Wavelet Obtained Weights)、HUGO等。
但是,嵌入型隱寫算法通過直接修改載體圖像隱藏信息的方式,總會影響圖像的視覺效果和統(tǒng)計特征,容易被隱寫分析捕捉到,研究者又提出了無載體隱寫算法。該算法本身不存在修改載體問題,而是通過載體的某些特征屬性隱藏秘密信息,其抗隱寫分析能力更高。無載體圖像隱寫并不是完全不需要載體,而是通過建立圖像的屬性特征與隱秘信息的映射關(guān)系來實現(xiàn)隱寫目的,為隱寫提供了新思路。但該方法的隱寫信息量較小,研究難度大,目前的研究成果不多。
3? 圖像隱寫分析
圖像隱寫分析技術(shù)主要是對圖像進行檢測,判定其是否含有秘密信息。隨著隱寫術(shù)的快速發(fā)展,隱寫方法層出不窮,與之相對的隱寫分析也取得了很多成果。圖像隱寫分析主要的步驟分為三步:(1)圖像預(yù)處理,將獲取到的圖像進行處理,得到可處理的信息;(2)提取特征,在預(yù)處理后的圖像中提取盡可能多且關(guān)鍵的特征;(3)判定輸入圖像是否含密。通過使用大量的圖像數(shù)據(jù)訓(xùn)練卷積網(wǎng)絡(luò),得到較好的判定效果。圖像隱寫分析方法主要分為兩大類,分別為專用隱寫分析算法和通用隱寫分析算法。
3.1專用隱寫分析算法
專用隱寫分析算法主要針對某種非自適應(yīng)隱寫算法進行分析。主要是利用該隱寫算法的漏洞,檢測正確率很高,但泛化能力比較差,不適合大規(guī)模使用。
LSB替換會使圖像DCT系數(shù)值的相鄰對值趨于一致,相鄰對值的接近程度與是否含密成正比,根據(jù)這種特性提出了[x2]算法[6],將每組對值的均值與實際分布進行對比,得出含密的概率。根據(jù)空域LSB隱寫嵌入秘密信息會降低圖像系數(shù)空間相關(guān)性的特點提出了RS分析方法[7],通過統(tǒng)計替換前后規(guī)則類、異常類和不可使用類的個數(shù)變化得出嵌入的秘密信息量。
針對F5算法,提出了一種基于平方誤差最小準(zhǔn)則的隱寫分析算法[8],將剪裁后的圖像與載密圖像的DCT系數(shù)直方圖進行比較分析,判斷是否含密并計算含密容量。還可以根據(jù)0/1系數(shù)組合差異對F5算法進行有效檢測,通過提取相鄰塊間0/1系數(shù)組合差異特征,用SVM進行分類。
3.2通用隱寫分析算法
通用隱寫分析方法主要是針對自適應(yīng)隱寫算法和無載體隱寫算法所設(shè)計的,能有效識別多種隱寫算法,這種方法相比專用隱寫分析算法識別率稍差,但其泛化能力較強,能有效抵御一些新出現(xiàn)的隱寫算法,因此成為當(dāng)下研究的熱點。通用隱寫分析方法主要是使用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò),有效獲取圖像中的特征,通過學(xué)習(xí)大量的數(shù)據(jù)優(yōu)化權(quán)重和偏移量,使用不同的網(wǎng)絡(luò)層和激活函數(shù)調(diào)整網(wǎng)絡(luò)、加速收斂,因此不需要過多的先驗知識就可以完成隱寫分析。根據(jù)訓(xùn)練策略的不同,通用隱寫分析方法又可以分為兩類,分別為半學(xué)習(xí)隱寫分析方法和全學(xué)習(xí)隱寫分析方法。
3.2.1半學(xué)習(xí)隱寫分析方法
半學(xué)習(xí)隱寫分析模型是指圖像預(yù)處理時使用給定的高通濾波器,獲取圖像的殘差信息,輔助卷積神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí)。
2016年,Xu等人[10]提出了Xu-Net網(wǎng)絡(luò),預(yù)處理時使用中心對稱的KV核,有效保留當(dāng)前像素點與其周圍像素點之間的關(guān)系,獲取像素之間的共生矩陣,該網(wǎng)絡(luò)的檢測正確率大幅提高。
2018年,高培賢等人[12]在Xu-Net的基礎(chǔ)上提出SCNN模型,該模型含有七個卷積層和一個全連接層,用兩個3×3的卷積核代替Xu-Net的5×5的卷積核,激活函數(shù)全部用ReLU函數(shù),用移動步長為2的卷積層替代池化層,在減少參數(shù)的同時提升了準(zhǔn)確率,并且加速模型收斂,防止梯度爆炸和梯度消失等問題。同年,又提出S-DCCN模型[13],在每個卷積層后連接一個密集連接模塊,可使最后一層得到原始圖像的特征,防止部分特征丟失,相比Xu-Net,檢測準(zhǔn)確率提升了14%,但這也導(dǎo)致模型訓(xùn)練時間更長,參數(shù)更多,不過還是在可接受范圍內(nèi)。2018年,汪然等人[14]提出了分類與分割相結(jié)合的JPEG圖像隱寫分析模型,該模型降低了類內(nèi)離散度、提升了類間離散度,與“富模型”特征提取相比,檢測性能更加優(yōu)異。
2021年,黃思遠(yuǎn)等人[16]提出了一種基于顯著性檢測的圖像隱寫分析方法,對圖像的復(fù)雜區(qū)域做重點監(jiān)測,用BASNet將圖像的顯著性區(qū)域提取出來,進行特征提取與學(xué)習(xí),該方法的優(yōu)點是空域與JPEG域通用,將圖像分割融合了隱寫分析領(lǐng)域,但在低嵌入率情況下檢測效果不好。
3.2.2全學(xué)習(xí)隱寫分析方法
全學(xué)習(xí)隱寫分析方法與半學(xué)習(xí)模型最大的差別是預(yù)處理結(jié)構(gòu)也要經(jīng)過網(wǎng)絡(luò)訓(xùn)練,而不是使用固定的濾波器。
2017年,Ye等人[11]提出了Ye-Net網(wǎng)絡(luò),添加了多種濾波核,使用一種新的截斷(truncated linear unit,簡稱TLU)激活函數(shù)。Ye-Net首次將通道感知引入隱寫分析中,并且這種技術(shù)在紋理復(fù)雜處與細(xì)節(jié)處檢測效果更好,并且能夠提升檢測的準(zhǔn)確率。2019年,Zhu等人[15]提出了Zhu-Net網(wǎng)絡(luò),在預(yù)處理時將25個5×5的濾波核替換為3×3的濾波核,減小計算量,模型更容易收斂和訓(xùn)練。
4? 結(jié)論與展望
4.1結(jié)論
本文對近幾年圖像隱寫分析做了簡單的介紹,通過將深度學(xué)習(xí)引入圖像領(lǐng)域,已經(jīng)對隱寫檢測正確率有了較好的提升,并且泛化效果和魯棒性都有了很大的提升。但是,基于深度學(xué)習(xí)的隱寫分析模型還有很多地方需要改進。
(1)擬合速度慢。模型參數(shù)多、層數(shù)多、訓(xùn)練時間長、模型收斂慢。
(2)對預(yù)處理層過分依賴。選擇不同的濾波器會得到相差很大的結(jié)果。
(3)低嵌入率檢測效果差。當(dāng)隱寫的數(shù)據(jù)量很小時,不能有效檢測到嵌入,檢測的正確率較低。
4.2展望
筆者期待的圖像隱寫分析網(wǎng)絡(luò)是可以檢測出秘密信息是否存在,并且提取秘密信息,而當(dāng)下還處于檢測是否存在階段,之后的研究可能集中在以下幾個方向:
(1)加速模型訓(xùn)練。目前的網(wǎng)絡(luò)訓(xùn)練時長并不理想,訓(xùn)練時間過長不利于投入使用,尤其是全學(xué)習(xí)隱寫分析模型。
(2)實現(xiàn)小樣本集訓(xùn)練。目前的神經(jīng)網(wǎng)絡(luò)主要依靠大量樣本的學(xué)習(xí)才能訓(xùn)練出一個較好的結(jié)果,而大樣本集難以獲取和訓(xùn)練時間長都是問題,如果可以實現(xiàn)小樣本訓(xùn)練,對時間和空間節(jié)省都是一項巨大的進步。
(3)進一步提高隱寫分析模型的通用性。使一個模型可以對多種格式的圖像進行分析。
(4)開展針對無載體圖像隱寫的研究。目前無法有效檢測這種隱寫算法,未來有很大的發(fā)展空間。
參考文獻:
[1] Cheddad A,Condell J, Curran K, et al. Digital image steganography: survey and analysis of current methods[J].Signal Processing,2010,90(3):727-752.
[2] Nissar A,Mir A H. Classification of steganalysis techniques: a study[J].Digital Signal Processing,2010,20(6):1758-1770.
[3] Hinton G, Osindero S, WellingM, et al.Unsupervised discovery of nonlinear structure using contrastive backpropagation[J].Cognitive Science,2006,30(4):725-731.
[4] Chan C K, Cheng L M. Hiding data in images by simple LSB substitution[J].Pattern Recognition,2004,37(3):469-474.
[5]A Westfeld. F5-A Steganographic Algorithm High Capacity Despite Better Steganalysis[C]// 4th International Workshop on Information Hiding (IH 2001),2001.
[6] Westfeld A, Pfitzmann A.Attacks on steganographicsystems[C]//InformationHiding,2000.
[7] Fridrich J,Goljan M,Du R.Detecting LSB steganography in color,and gray-scale images[J].IEEE MultiMedia,2001,8(4):22-28.
[8] Fridrich J,Goljan M,Hogea D.Steganalysis of JPEG images:breaking the F5 algorithm[C]//InformationHiding,2003.
[9] 韓曉東,平西建,張濤.基于0,1系數(shù)組合差異的F5隱寫分析算法[J].信息工程大學(xué)學(xué)報,2009,10(2):184-187.
[10] Xu G S,Wu H Z,Shi Y Q. Structural design of convolutional neural networks for steganalysis[J]. IEEE Signal Processing Letters,2016,23(5):708-712.
[11] YeJ,Ni J Q,Yi Y. Deep learning hierarchical representations for image steganalysis[J].IEEE Transactions on Information Forensics and Security,2017,12(11):2545-2557.
[12] 高培賢,魏立線,劉佳,等.針對圖像隱寫分析的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計[J].中國科技論文,2018,13(14):1664-1668.
[13] 高培賢,魏立線,劉佳,等.基于密集連接網(wǎng)絡(luò)的圖像隱寫分析[J].計算機工程與應(yīng)用,2018,54(15):74-77,146.
[14] 汪然,薛小燕,平西建,等.分類與分割相結(jié)合的JPEG圖像隱寫分析[J].中國圖象圖形學(xué)報,2018,23(10):1472-1482.
[15] Zhang R,Zhu F,Liu J Y, et al. Depth-wise separable convolutions and multi-level pooling for an efficient spatial CNN-based steganalysis[J].IEEE Transactions on Information Forensics and Security,2020,15:1138-1150.
[16] 黃思遠(yuǎn),張敏情,柯彥,等.基于顯著性檢測的圖像隱寫分析方法[J].計算機應(yīng)用,2021,41(2):441-448.
【通聯(lián)編輯:唐一東】