楊 飛,匡柯瀾,易軍凱
(北京信息科技大學 自動化學院,北京 100192)
隱寫術[1-3]研究的內(nèi)容是如何將數(shù)據(jù)隱藏于多媒體數(shù)據(jù)(如圖片、視頻、音頻)中,并防止被第三方檢測、破壞和提取.作為信息隱藏技術的重要分支,隱寫術自上世紀九十年代被提出以來,一直是信息安全領域的研究熱點[4,5].與加密技術相比,隱寫術將重要數(shù)據(jù)隱藏在載體中,并通過載體在公共信道傳輸,從而實現(xiàn)數(shù)據(jù)的隱蔽傳輸,在保護重要數(shù)據(jù)的同時掩蓋通訊信道,具有非常強的數(shù)據(jù)保護能力和欺騙性.因此,隱寫術多被軍方、間諜等有數(shù)據(jù)隱藏和隱蔽通信需求的機構(gòu)或個人使用.另一方面,隱寫術也會帶來新的安全問題,譬如不法分子可能以其實現(xiàn)秘密通信、數(shù)據(jù)竊取等.在這種情況下,研究如何檢測、提取或中斷潛在隱蔽通信的隱寫分析成為了信息安全領域研究的一個重要課題.
目前,隱寫分析主要分為專用隱寫分析和通用隱寫分析[6].專用隱寫分析方法通過利用隱寫算法存在的漏洞對某一種算法進行針對性的檢測;通用隱寫分析則根據(jù)載體的某些特征信息進行隱寫分析檢測.對于空間域LSB Replacement隱寫術會造成載體圖像直方圖統(tǒng)計不對稱的漏洞,Andreas Westfeld等提出的卡方攻擊(Chi-squre attach)方法[7]、Fridrich等人提出的RS方法、WS方法[8]等對其都有一定的檢測效果.Dumitresc[9]等人在RS算法基礎上增加了奇偶類,使得改進后的隱寫分析方法能夠估算載體中數(shù)據(jù)的攜帶量.Harmsen等人根據(jù)LSB Matching隱寫算法會引起載體圖像直方圖特征函數(shù)(histogram chararcteristic function,HFC)的質(zhì)心發(fā)生變化的特點提出的HCF COM[10]隱寫分析方法,該方法具有相對較高檢出率和低漏檢率的特點.Sullivan[11]等認為圖像的像素間存在相關性,將相鄰像素的變化看作馬爾科夫(Markov)隨機過程,基于該特征的相關算法都有較好的隱寫分析表現(xiàn).Fridrich[12]等提出SRM(Spatial Rich Model),將不同的濾波核得到不同的殘差圖像,然后通過殘差圖像計算共生矩陣,共生矩陣的組合得到高維特征,利用該類特征結(jié)合分類器實現(xiàn)隱寫分析,該模型檢測效果優(yōu)于其他特征信息模型.另一方面,基于深度學習的隱寫分析方法近年來也逐漸成為研究的熱點,Qian[13]等將CNN應用于隱寫分析,使用高通濾波和Gaussian非線性核函數(shù),在準確率上僅比SPRM低4%左右.
從以上分析可以看出,專用隱寫分析對某一種隱寫方法具有很強的檢測能力,但是新的隱寫方法層出不窮,專用隱寫分析方法具有很大局限性.通用隱寫分析方法雖然對多種隱寫素具有檢測能力,但存在對不同的隱寫算法檢測效果差距較大、漏檢率偏高等問題,尤其是在嵌入率較低時檢出效果不夠理想.
本文提出一種基于快速傅里葉變換的主動攻擊隱寫分析方法,采用二維快速傅里葉變換,根據(jù)人類視覺系統(tǒng)對不同頻率數(shù)據(jù)的敏感性不同以及隱寫術對不同頻率的數(shù)據(jù)影響不同的特點,對變換后得到的頻域數(shù)據(jù)進行分頻濾波攻擊.實驗表明該主動攻擊方法能有效的破壞隱寫數(shù)據(jù),中斷基于圖像隱寫術的隱蔽通訊.
雖然隱寫方法在大量研究人員的努力研究下層出不窮,仍然可以按照隱寫數(shù)據(jù)的嵌入方法將其分為兩類:1)基于空間域的隱寫方法;2)基于擴頻域的隱寫方法.它們都可以看作在原始圖像信號中加入隱寫數(shù)據(jù)信號,如圖1所示.
圖1 隱寫原理圖Fig.1 Schematic diagram of steganography
設原始圖像為C,隱寫數(shù)據(jù)為M,則載密圖像D可以看作M和C以隱寫算法S方法合成,即:
D=M+C
(1)
按照上述原理,對圖像的主動攻擊可以表述為:
G(u,v)=F(u,v)*H(u,v)
(2)
其中F(u,v)表示載密圖像快速傅里葉變換后的頻域信號,H(u,v)表示主動攻擊變換和濾波函數(shù),G(u,v)表示主動攻擊后的FFT頻域數(shù)據(jù).
離散傅里葉變換(Discrete Fourier Transform,DFT)是將信號從時空域向頻率域進行變換的一種數(shù)學算法.對有N個采樣點的一維信號F(x)的變換和逆變換公式為:
(3)
(4)
FFT是DFT的快速計算方法,采用FFT可以將DFT的時間復雜度從O(N2)降到O(Nlog2N).二維快速傅里葉變換是一維快速傅里葉變換的擴展,通常的處理方法是先逐行對數(shù)據(jù)做一維快速傅里葉變換,然后再對變換后的數(shù)據(jù)逐列進行快速傅里葉變換.對于一張N×M的圖像,可將其看作一個二維函數(shù)f(x,y),則行和列的快速傅里葉變換公式為:
(5)
(6)
所以,二維傅里葉變換表示為:
(7)
其中u∈[0,N-1],v∈[0,M-1].
隱寫術的基本原理是通過將秘密數(shù)據(jù)嵌入到載體中人類視覺系統(tǒng)感知不敏感的部分,例如經(jīng)典的LSB隱寫方法就是通過修改圖像像素的最低有效位(Least Significant Bit,LSB)來實現(xiàn)信息的隱藏,人眼幾乎無法察覺圖像的細微變化.但這些細微的變化可以在一些分析方法的幫助下體現(xiàn)出來.
表1 不同算法在嵌入率為0.2bpp時的峰值噪聲比Table 1 Peak-to-noise ratio of different algorithms at an embedded rate of 0.2bpp
基于空間域的隱寫術通過算法直接修改圖像的像素值實現(xiàn)數(shù)據(jù)的隱藏;基于變換域的隱寫術根據(jù)圖像的壓縮原理,將數(shù)據(jù)隱藏到圖像壓縮的DCT變換矩陣或其他數(shù)據(jù)中.無論是空間域還是變換域的隱寫術,由于其嵌入數(shù)據(jù)與原始圖像的不相關性,必然使得圖像得質(zhì)量有一定的下降.“Lena”圖在不同的隱寫算法下嵌入0.2bpp(bit per pixels,bpp)的隱寫數(shù)據(jù)時,圖像的峰值噪聲比(Peak Signal to Noise Ratio,PSNR)不相同且都不高,如表1所示,表明隱寫數(shù)據(jù)的嵌入在一定程度上降低了原始圖像的質(zhì)量.在圖像的頻譜方面,由于隱寫數(shù)據(jù)的嵌入,圖像的頻譜和能量都將發(fā)生變化,這種變化主要表現(xiàn)在圖像的高頻部分.“Lena”圖像在F5隱寫術隱寫前后圖像如圖2所示,肉眼很難發(fā)現(xiàn)其不同之處.經(jīng)過傅里葉變換之后的頻譜圖如圖3所示,其中高頻成分在肉眼仔細觀察下可以發(fā)現(xiàn)頻率的變化.
圖2 “Lena”圖隱寫前后對比圖Fig.2 Comparison of "Lena" graph before
由頻譜圖不難發(fā)現(xiàn),經(jīng)過隱寫操作之后圖像的高頻成分有較為明顯的增加,高頻成分的能量也有一定的加強.另一方面,不同的隱寫術在相同的隱寫數(shù)據(jù)下,由于隱寫方式的不同所產(chǎn)生的頻率特征將不相同;相同的隱寫算法在隱寫數(shù)據(jù)不同的條件下,其產(chǎn)生的頻率特征也不相同.因此,如果從識別隱寫數(shù)據(jù)的特征方面進行主動攻擊將會面臨很大的難度.但是若以圖像的特征為出發(fā)點,設計合適的濾波器或變換方法,在保證圖像特征數(shù)據(jù)不變的條件下,濾除或擾亂隱寫數(shù)據(jù)是一種實用且有效的主動攻擊方法.
圖3 “Lena”圖隱寫前后頻譜對比圖Fig.3 Spectrum comparison chart of “Lena” before
圖像傅里葉變換后得到的頻譜圖,在經(jīng)過移位變換后,直流信號位于圖像的中心,高頻信號位于靠近頻譜圖的中心的區(qū)域,低頻信號則分散在圖像的邊緣.低頻信號與圖像的平滑區(qū)域相對應,高頻信號與物體邊緣或圖像突變區(qū)域相對應.由于隱寫數(shù)據(jù)與圖像的不相關性,隱寫數(shù)據(jù)等同于在圖像數(shù)據(jù)中添加了噪聲.此外,為抵抗隱寫分析,減小隱寫對圖像特征信息的影響,近年來隱寫術逐漸向自適應隱寫方向發(fā)展,隱寫時減少低頻區(qū)域的隱寫數(shù)據(jù)嵌入量或主動避開圖像的低頻區(qū)域,在物體邊緣或像素變化梯度較大的高頻信號中嵌入數(shù)據(jù).
圖4 主動攻擊分析框架Fig.4 Active attack method framework
在對圖像濾波處理時,針對隱寫操作對整個圖像的影響的特點,為盡可能的保留圖像的細節(jié),對整個圖像進行分頻處理,對低頻和高頻數(shù)據(jù)采用不同的濾波處理方法.隱寫分析過程分為:快速傅里葉變換、高低頻數(shù)據(jù)分離、低頻濾波及逆傅里葉變換、逆傅里葉變換及空域濾波、高低頻數(shù)據(jù)按像素值疊加,如圖4所示.其中對傅里葉變換之后的高低頻數(shù)據(jù)的區(qū)分是以頻率fr作為閾值,該頻率閾值可以根據(jù)傅里葉變換之后的頻譜圖進行調(diào)整.
在隱寫模型中,通常假設隱寫的秘密信息m符合高斯分布(即m~N(0,δm)),且獨立于載體圖像s.按照式(1),對載密圖像主動攻擊的問題可轉(zhuǎn)化為對s的估計問題.快速傅里葉變換后,加入圖像的高斯噪聲在頻率域表現(xiàn)仍然為高斯噪聲,則對低頻數(shù)據(jù)的主動攻擊即為對原圖像的MAP(Maximum a Posteriori)估計.
由文獻[14]可知,這種對原始圖像的MAP估計即為Wiener濾波,所以對于低頻數(shù)據(jù)的處理采用Wiener濾波器,其傳遞函數(shù)為:
(8)
圖像像素向領域像素的轉(zhuǎn)移符合馬爾科夫模型,設尺寸為M×N灰度圖I={I(i,j)},0≤I(i,j)≤255,1≤i≤M,1≤j≤N,則像素I(i,j)向8個方向轉(zhuǎn)移的差分矩陣D(i,j)表示為:
D(i,j)={M(u,v)|u,v∈[1,3]} ={I(i,j)-I(i+r,j+s)}
(9)
其中:r,s∈{-1,0,1}r,s不同時為零;8個方向的集合表示為{←,→,↑,↓,,,,}.像素轉(zhuǎn)移的概率可以表示為:
(10)
其中:S*表示差分矩陣D(i,j)各個元素的最小公倍數(shù);Ψ表示差分矩陣D(i,j)中所有兩個不同元素乘積之和.由于圖像像素間的相關性,可以采用差分矩陣和像素轉(zhuǎn)移概率來預測目標像素,即:
(11)
其中:M(u,v)為I(i,j)差分矩陣的元素;P(u,v)為差分矩陣元素對應的轉(zhuǎn)移概率.
圖5 主動攻擊前后“Lena”對比圖Fig.5 Comparison of "Lena" graph before and after attack before
圖5給出了頻域主動攻擊之前和攻擊之后的對比圖,從圖中可以看出該攻擊方法在破壞潛在隱寫數(shù)據(jù)的同時,對載體圖像的影響很小,具體的實驗數(shù)據(jù)將在下節(jié)詳細說明.
實驗條件設置為:AMD Phenom P960 CPU;4G內(nèi)存;64位window 10操作系統(tǒng);OpenCV 2.4;Visual Studio版本為2015.
實驗采用尺寸分別為6464、128128、256256、512512的圖像處理領域經(jīng)典“Lena”圖像.實驗測試用隱寫算法分別選擇具有不同數(shù)據(jù)嵌入量和魯棒性的LSB、DCT、F5、UED[15]、文獻[16]算法、文獻[17]算法、文獻[18]算法.
采用峰值噪聲比(PSNR)、隱寫數(shù)據(jù)破壞率(P)作為主動攻擊隱寫分析方法的評價標準.PSNR主要用于評價圖像及其噪聲水平的客觀標準,其值越大說明圖像噪聲越低.隱寫數(shù)據(jù)破壞率(P)主要用于評價主動攻擊的效果.PSNR和隱寫數(shù)據(jù)破壞率的計算公式如公式(12)-公式(14)所示.
(12)
(13)
(14)
其中,MSE為單色圖像的均方差;d0代表對隱寫圖像進行頻域攻擊之后從載體圖像中正確提取的隱寫數(shù)據(jù)量,dh代表初始隱寫時隱寫數(shù)據(jù)的嵌入量;I和K分別代表原始圖像和處理后的圖像.
首先,為了對主動攻擊方法的有效性做出評定,實驗測試了嵌入率分別為0.05bpp、0.1bpp、0.2bpp、0.3bpp、0.4bpp時,該攻擊算法對7種隱寫術的數(shù)據(jù)破壞率,實驗結(jié)果如表2所示.
表2 不同嵌入率下主動攻擊隱寫數(shù)據(jù)破壞率Table 2 Destruction rate of Steganographic data between different embedding rates
由表2可知該主動攻擊隱寫分析方法對選取的幾種經(jīng)典隱寫術有非常好的測試效果,在測試的幾種嵌入率下能完全破壞隱寫數(shù)據(jù),有效中斷隱蔽通訊.同時,對于選取的目前隱寫術發(fā)展方向上幾種典型的魯棒性較好的隱寫術,該主動攻擊隱寫分析方法也能有效的破壞不同嵌入率下的隱寫數(shù)據(jù).
表3 算法對圖像質(zhì)量的影響Table 3 Influence of the algorithm on image quality
其次,本文選取了幾組不同尺寸的大小的“Lena”圖像,測試隱寫分析前后圖像以及隱寫分析后與原始未嵌入數(shù)據(jù)圖像的的峰值噪聲比,隱寫術選擇F5隱寫算法,數(shù)據(jù)嵌入率為飽和狀態(tài),實驗結(jié)果如表3所示.根據(jù)表3中的數(shù)據(jù)不難發(fā)現(xiàn),該隱寫分析算法對圖像的質(zhì)量影響比較小,處理后的圖像與原始圖像的畫質(zhì)更為接近,能有效降低圖像中噪音水平.
另外將本文的攻擊方法與現(xiàn)有較為先進的盲檢測和提取攻擊方法做了比較[2,19,20],發(fā)現(xiàn)提取攻擊主要針對特定的隱寫算法較為有效,而盲檢測方法存在誤檢率普遍較高的問題.文獻[3]給出的算法其最低的誤檢率為0.1733;文獻[19]專門針對LSB 隱寫算法進行了提取攻擊,對其他隱寫算法不具有普遍適用性;文獻[20]提出的盲檢測算法總的平均最低誤檢率為0.2662,其中某些檢測的誤檢率超過4成.而本文提出的方法直接針對潛在的隱寫圖像進行主動攻擊,其破壞率能夠達到96.9%以上,對一些傳統(tǒng)隱寫算法的破壞率能夠達到100%,同時該方法受嵌入率的影響非常小.因此如果不考慮精確檢測,同時不影響原始圖像清晰度的前提下,本文提供的方法在消除潛在的圖像隱蔽通信方面具有較大優(yōu)勢.
表4 處理不同尺寸圖片耗時表Table 4 Handle time-consuming table for handling sizes of different images
而且本文提出的方法在時間性能方面具有較大優(yōu)勢,傳統(tǒng)的隱寫分析方法往往需要對分類器進行訓練,因此需要比較長的檢測時間[2].本文提出的方法處理不同尺寸圖片時間的實驗結(jié)果如表4所示.
本文對主動攻擊隱寫分析方法進行了研究,結(jié)合隱寫術對圖像頻域影響的特點,提出一種分頻濾波的主動攻擊隱寫分析方法.本文提出的隱寫分析方法對圖像低頻數(shù)據(jù)采用改進的具有最小均方誤差的Wiener濾波器,為充分保留圖像細節(jié)信息,對于高頻數(shù)據(jù)根據(jù)像素遷移符合馬爾科夫模型的特點設計了一種線性濾波器.實驗表明該主動攻擊方法能有效破壞隱寫數(shù)據(jù),即使是對魯棒性較好的隱寫算法也非常有效.但是該隱寫分析方法在精確檢測方面還有一定的不足,這將是后期改進的一個方向.