郝瀾宇 孟 馨 栗榮賓 朱和貴
(東北大學(xué)理學(xué)院數(shù)學(xué)系 沈陽 110004)
隨著圖像處理和編輯軟件的應(yīng)用越來越廣泛,數(shù)字圖像認證方法逐漸興起,與此同時,自然圖片與計算機生成圖片的鑒別已成為圖像識別領(lǐng)域的重要課題。目前的圖像認證方法包括主動圖像認證和被動圖像認證。但大部分圖像沒有進行主動取證操作,因此引起了人們對數(shù)字圖像被動盲取證技術(shù)的關(guān)注[1~2]。S.Lyu 和 H.Farid提出了基于正交鏡像濾波器模型的設(shè)備類型取證算法,其中線性分類器對照片圖像和計算機生成圖像來源鑒別的準確率可以達到54.6%和99.2%,而SVM分類器可以達到66.8%和98.8%。Y.Wang和P.Moulin則從小波變化后的系數(shù)直方圖中提取特征,來對照片圖像和計算機生成圖像進行鑒別[1~2]。美國Columbia大學(xué)的T.T.Ng和S.F.Chang等分析了數(shù)字照片圖像和計算機生成圖像在獲取中的主要區(qū)別,他們認為數(shù)字照片和計算機生成圖像在景物模型、光線模型、獲取方式三個方式存在較大差異。據(jù)此,T.T.Ng等從微分幾何學(xué)的角度,提取不規(guī)則幾何形狀和局部碎片特征,來對數(shù)碼照片圖像和計算機生成圖像進行描述和分類[3]。同濟大學(xué)的崔霞、童雪峰等認為照片圖像的直方圖連續(xù)性強于計算機生成圖像,這會使得直方圖的頻域出現(xiàn)更多的高頻分量,并基于此提出了一種基于直方圖頻域矩的照片圖像和計算機圖像鑒別方法,實驗表明其平均鑒別率可高達94%。鄭二功等人則提出了基于相鄰像素一致性的鑒別方法,最高可以達到96%的鑒別正確率[4~5]。
基于數(shù)字圖像真實性鑒別的現(xiàn)狀,本文提出了一種基于ELBP編碼和Adaboost分類器的鑒別算法。自從Freund和RobertE.Schapire在1995年提出一種名為Adaboost的機器學(xué)習方法以來[6],研究人員提出了許多基于Adaboost的人臉檢驗算法。而ELBP編碼算法則是LBP編碼的一種延伸,常被應(yīng)用于人臉鑒別。本文采用一種新穎的做法,將ELBP編碼和Adaboost分類器[7]應(yīng)用于自然圖像和計算機生成圖像的分類鑒別中,理論和實驗表明,該分類方法可將兩類圖片進行明顯區(qū)分,具有較高的準確性。
LBP是一種用來描述圖像局部紋理特征的算子,具有旋轉(zhuǎn)不變性和灰度不變性等顯著優(yōu)點。首先由T.Ojala,M.Pietik?inen和D.Harwood 在1994年提出,用于紋理特征提取,主要應(yīng)用于人臉識別和目標檢測中。
ELBP是建立在LBP基礎(chǔ)上的一種更具體的算子。根據(jù)統(tǒng)計調(diào)查,發(fā)現(xiàn)有超過80%的情形是圖像灰度值變化大小在7以內(nèi),這就可以引入3層2進制的數(shù)據(jù)來表現(xiàn)這種灰度值的變化。3個二進制的量{i2i3i4}可以表示|DD|≤7,剩下的所有其它的都歸結(jié)為7的情形。i1是按照原先LBP的編碼方式進行賦值,即:
這樣二進制數(shù)就被分成了4層,第一層就是原先的LBP編碼形式,剩下三層為ELBP所得的編碼數(shù)據(jù),每一層都由8位二進制數(shù)據(jù)組成[8]。為詳細說明ELBP編碼,以下述像素矩陣為例,其編碼過程如圖1所示。
圖1 像素矩陣編碼過程
本文的圖像真實性鑒別算法主要分為以下三個步驟進行:
1)采用ELBP編碼對圖像進行預(yù)處理;
2)ELBP特征構(gòu)成類型;
3)利用特征矩陣訓(xùn)練并測試Adaboost分類器。
整個算法流程示意圖如圖2所示。
圖2 算法過程及實現(xiàn)流程圖
原始圖像經(jīng)過ELBP編碼處理之后,會生成四幅不同的圖像。第一幅為原始LBP處理過的灰度圖像,剩下三幅為ELBP編碼后生成的灰度圖像,同時,可以得到4層二進制的紋理特征數(shù)據(jù)。圖3和圖4就是一些經(jīng)過LBP和ELBP處理后得到的二值化自然和計算機生成圖片。
圖3 處理后的自然圖片
圖4 處理后的計算機生成圖片
依據(jù)LBP的降維分類法可以將ELBP生成的3層數(shù)據(jù)分別進行分類。每層的8個二進制數(shù)據(jù)分別對應(yīng)8個采樣點,即ELBP特征值有28種,共256個值,正好對應(yīng)灰度圖像的0-255,因此每幅ELBP圖像都是一幅灰度圖像。依據(jù)LBP的統(tǒng)一模式[9],可以根據(jù)跳變次數(shù)將256個ELBP特征值分為59類,跳變次數(shù)劃分如表1。
表1 跳變次數(shù)劃分表
以上共9種跳變情況,將這256個值進行分配。經(jīng)過調(diào)查研究發(fā)現(xiàn),跳變次數(shù)小于等于2次所占的比例較大,故這58種按照其十進制的對應(yīng)值從小到大分別編碼為1-58,即它們在ELBP特征圖像中的灰度值為1-58。同時,將跳變次數(shù)大于2次的情況全部歸為第59類。這樣256維變成59維,這使得特征向量的維數(shù)更少,并且可以減少高頻噪聲帶來的影響。
3層ELBP數(shù)據(jù)中每一層都可以按照上述的方法分為不同的59類,根據(jù)其分類情況可以繪制出3張直方圖。直方圖的橫軸對應(yīng)上述的59種分類,縱軸對應(yīng)每一種分類情況所出現(xiàn)的次數(shù),最后根據(jù)圖像特征來鑒別自然圖片和計算機合成圖片。圖5和圖6為兩類圖像的直方圖處理結(jié)果。
圖5 自然圖片的直方圖處理
圖6 計算機生成圖片的直方圖處理
由于圖片性質(zhì)會隨圖片的改變而變化,而圖片本身也會被放大或旋轉(zhuǎn)。因此,找到某些不隨上述因素變化的特征是至關(guān)重要的。確定如下8種常用的特征:
1)均值
均值即是 y1,y2,…,yn的平均數(shù):
它描述了數(shù)據(jù)取值的平均位置。在通常情況下,均值有許多優(yōu)良的統(tǒng)計性質(zhì)。然而,當數(shù)據(jù)中存在異常值時,它則缺乏抗擾性,即易受異常值的影響而使其值有較大變化,其較差的穩(wěn)健性由余下的特征來彌補。圖7為10張自然圖像和10張計算機生成圖像的均值比較。
圖7 兩類圖像的均值比較圖像
通過圖7,發(fā)現(xiàn)自然圖像的均值基本穩(wěn)定在同一水平線,而計算機生成圖像的均值則是無規(guī)律變化,可以用來區(qū)分兩類圖像。
2)方差
樣本方差是
它表示觀測值相對于它們的中心位置xˉ的偏差的平方平均,所以用來描述觀測取值的分散程度,這里平均時用n-1作分母是出于統(tǒng)計上無偏性得的考慮。圖8為10張自然圖像和10張計算機生成圖像的方差比較。
圖8 兩類圖像的方差比較圖像
通過圖8,發(fā)現(xiàn)盡管計算機的方差數(shù)值波動較大,但自然圖像的方差數(shù)值略高于計算機生成圖片的該特征值,可以用于區(qū)分。
3)極大值
極大值就是直方圖中縱坐標的最大值,即ymax。經(jīng)過多張自然圖片和計算機生成圖片的預(yù)處理圖像比對可以發(fā)現(xiàn),兩種不同類型圖片的極大值存在很大差異,故此特征可以有效地區(qū)分其類型。圖9為10張自然圖像和10張計算機生成圖像的極大值比較。
圖9 兩類圖像的極大值比較圖像
通過圖9,發(fā)現(xiàn)自然圖像的極大值普遍高于計算機生成圖像的極大值,可以有效區(qū)分兩類圖像。
4)極大值橫坐標
直方圖的橫坐標是59種不同的分類,自然圖片和計算機生成圖片的ELBP編碼圖像在59種分類中存在明顯差異,故將其橫坐標提取出來作為特征的一種,效果十分明顯。圖10為10張自然圖像和10張計算機生成圖像的極大值橫坐標比較。
圖10 兩類圖像的極大值橫坐標比較圖像
通過圖10,發(fā)現(xiàn)自然圖像的極大值橫坐標較高于計算機生成圖像,兩類圖像的該特征存在差異,故可以用來區(qū)分。
5)極差
極差是直方圖中縱坐標的最大值與最小值的差值,其提取原理同3)和4)相同,即從多張自然圖片和計算機生成圖片的預(yù)處理圖像中比對得出。圖11為10張自然圖像和10張計算機生成圖像的極差比較。
通過圖11,發(fā)現(xiàn)自然圖像的極差值明顯大于計算機生成圖像,該提取特征真實有效。
6)中位數(shù)
中位數(shù)的計算公式是
圖11 兩類圖像的極差比較圖像
中位數(shù)是描述數(shù)據(jù)的中心位置的數(shù)字特征,比中位數(shù)大或小的數(shù)據(jù)個數(shù)大體上為整批數(shù)據(jù)個數(shù)的一半。對于對稱分布的數(shù)據(jù),均值與中位數(shù)比較接近,對于偏態(tài)分布的數(shù)據(jù),均值與中位數(shù)差異會較大。中位數(shù)的一個顯著特點是受異常值的影響較小,具有較好的穩(wěn)健性或稱耐抗性,它是數(shù)據(jù)分析中相當重要的一個統(tǒng)計量,可以有效彌補1)特征的缺陷。圖12為10張自然圖像和10張計算機生成圖像的中位數(shù)比較。
圖12 兩類圖像的中位數(shù)比較圖像
通過圖12,發(fā)現(xiàn)自然圖像的中位數(shù)明顯高于計算機生成圖像,故中位數(shù)這個特征可以有效區(qū)分兩類圖像。
7)三均值
三均值M^的計算公式是
通過圖13,發(fā)現(xiàn)自然圖像的三均值特征值普遍高于計算機生成圖像的該特征值,可以有效區(qū)分兩類圖像。
8)ELBP2和ELBP3極差的差值
經(jīng)過大量實驗的驗證,可以發(fā)現(xiàn)在計算機生成圖像中該差值很小,而在自然圖像中該差值沒有規(guī)律,故將其作為一個特征訓(xùn)練Adaboost分類器,可以得到較好的效果。圖14為10張自然圖像和10張計算機生成圖像的極差差值比較,通過圖14可以看出,盡管兩類圖像的極差差值存在波動,但是總體來看自然圖像的該特征值較大。
圖13 兩類圖像的三均值比較圖像
圖14 兩類圖像的極差差值比較圖像
針對前7種特征,每幅圖像都可以提取出3個特征值,共21個特征值,針對第8種特征,每幅圖像只能提取出1個特征值,故每幅原始圖像共提取8種特征,即22個特征值。
設(shè)L1為自然圖片類別的標記,L2為計算機生成圖片類別的標記,若檢驗圖片屬于L1,記為1,同時若檢驗圖片屬于L2,記為0。令訓(xùn)練樣本占總體樣本的比例為α,樣本Si的權(quán)重為Di(t)(t為訓(xùn)練的輪數(shù)),初始化樣本Si的權(quán)重為Di(0 ),當 Si屬于L類樣本時,;屬于 L類樣本時,12。設(shè)定訓(xùn)練總輪數(shù)為T。
在第一輪訓(xùn)練中,Adaboost分類器根據(jù)參數(shù)α隨機在第一類樣本中抽取αm個樣本,在第二類樣本中抽取αn個樣本,作為訓(xùn)練樣本。利用特征μi,生成弱分類器 fi:
其 中 ani為 樣 本 Sn的 μi特 征 的 數(shù) 值 ,pi(pi∈(-1,+1))是分類符號,κi為特征分類器 fi的分類閾值。
構(gòu)造出22個弱分類器,記第i個弱分類器錯誤率為εi,找出分類錯誤率最小的弱分類器,記為F1(其錯誤率為 ε')。若 ε'>0.5,則實驗結(jié)束;否則,F(xiàn)1為第一輪得到的弱分類器。計算弱分類器F1的權(quán)重系數(shù)τ1:
更改樣本權(quán)重,若分類正確,即F1(Sn)=Ln,則D(1)=D(0)。反之,D(1)=,然后選擇分iii類錯誤的樣本和補充的隨機樣本作為下次訓(xùn)練樣本。經(jīng)T輪訓(xùn)練后,可得到T個弱分類器F1,F(xiàn)2,…,F(xiàn)T和每個分類器的權(quán)重,…,τT,將T個弱分類器聯(lián)合起來,得到最終的強分類器[10]:
為測試本文提出的圖像真實性鑒別方法的有效性,需進行仿真實驗。實驗硬件環(huán)境為第五代Intel Core處理器,4G內(nèi)存,操作系統(tǒng)為Windows 7,采用的編程語言為Matlab,使用的編程軟件為Mat?lab 2016a,依據(jù)的圖像庫為哥倫比亞大學(xué)攝影圖像與真實感計算機圖像數(shù)據(jù)庫[11],表2為該數(shù)據(jù)庫的簡要介紹。
表2 數(shù)據(jù)庫構(gòu)成類型介紹
參考自然圖像與計算機生成圖像的分類鑒別相關(guān)研究,本文采用上述數(shù)據(jù)庫中的全部真實感計算機圖像,全部私人攝影圖像和部分回收計算機圖像,其中包括自然圖像1200張和計算機生成圖像1200張。評價分類器有效性最重要的指標是分類準確率,實驗由于圖片庫中圖片數(shù)量有限,采用交叉驗證的方法。在一組實驗過程中,將自然圖像和計算機圖像分別分成三組,每組400張圖像,任取其中一組作為測試集,其余的五組作為訓(xùn)練集,依次進行六次實驗。其中,1~3編號為自然圖像分組,4~6組編號為計算機圖像分組,實驗所得結(jié)果如下。
經(jīng)過整理,可以得到如下的交叉實驗與比較結(jié)果表格。
表3 交叉實驗結(jié)果
表4 交叉實驗與比較結(jié)果
由上述仿真實驗可知,自然圖像的分類準確率為77%,計算機生成圖像的分類準確率為100%,其平均準確率為88.5%。其中,自然圖像和計算機生成圖像的準確率均高于S.Lyu和H.Farid等所研究的圖像鑒別結(jié)果,但兩類圖像的平均準確率低于崔霞和鄭成功等的研究成果,故本文提出的算法仍有改進上升空間。
本文提出了一種基于ELBP編碼形式和Ada?boost分類器的自然圖片和計算機生成圖片的識別檢測方法。對一定數(shù)量的自然圖片和計算機生成圖片進行ELBP等預(yù)處理之后,對其直方圖進行特征值提取,然后對Adaboost分類器進行訓(xùn)練,最后得到準確率較高的分類識別系統(tǒng)。實驗分析和誤差驗證表明,該方法是一種較合適的分類識別方法。
[1]Fei Peng,Juan Liu,Min Long.Identification of Natural Images and Computer Genarated Graphics Based on Hy?brid Features[J].International Journal of Digital Crime and Forensics,2012,4(1):1-12.
[2]曹剛.數(shù)字圖像操作取證技術(shù)研究[D].北京:北京交通大學(xué),2013:12-17.
CAO Gang.Research on Digital Image Manipulation Fo?rensics[D].Beijing:Beijing Jiaotong University,2013:12-17.
[3]王波.利用成像引入特征的數(shù)字圖像被動盲取證研究[D].大連:大連理工大學(xué),2010:14-32.
WANG Bo.Study on Passive and Blind Digital Images Fo?rensics Using Characteristics Introduced by Image Forma?tion[D].Dalian:Dalian University of Technology,2010:14-32.
[4]任先明.基于像素數(shù)據(jù)相關(guān)性分析的數(shù)碼照片真?zhèn)舞b別方法研究[D].上海:上海交通大學(xué),2013:11-13.
REN Xianming.The Research on the Method to Discern the Authenticity of Digital Photos Based on the Analysis on Uniformity of Pixed Data[D].Shanghai:Shanghai Jiao Tong University,2013:11-13.
[5]Fei Peng,Die-lan Zhou.Discriminating natural images and computer generated graphics based on the fact of CFA interpolation on the correlation of PRNU[J].Digital Inves?tigation,2014(11):111-119.
[6]Freund Y,Schapire R E.A decision-theoretic generaliza?tion of on-line learning and an application to boosting[C]//European Conference on Computational Learning Theory.Springer-Verlag,1995:119-139.
[7]左登宇.基于Adaboost算法的人臉檢測研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2009:18-19.
ZUO Dengyu.A Study of Face Detection Based on Ada?boost Algorithm[D].Hefei:University of Science and Technology of China,2009:18-19.
[8]D.Huang et al.,3-D face recognition using ELBP-based facial description and local feature hybrid matching,IEEE Transactions on Information Forensics and Security,vol.7,no.5,pp.1551-1565,Oct.2012.
[9] Ojala T,Pietikainen M,Maenpaa T.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pat?tern Analysis and Machine Intelligence,2002,24(7):971-987.
[10]張公伯,谷昱良,朱和貴.基于Adaboost的動物二分類識別方法[J].計算機與數(shù)字工程,2017,45(4):720-726,767.
ZHANG Gongbo,GU Guliang,ZHU Hegui.Method of Animals'Dichotomous Recognition Based on Adaboost[J].Computer and Digital Engineering,2017,45(4):720-726,767.
[11]Chang S,Ng T,Hsu J,Pepeljugoski M.Columbia DVMM research lab Columbia photographic images and photore?alistic computer graphics dataset.[DB/OL].http://www.ee.columbia.edu/ln/dvmm/downloads/PIM_PRCG_datas?et/,2005-02-05/2017-07-21.
[12]Lyu S,F(xiàn)arid H.How Realistic is Photorealistic[J].IEEE Transactions on Signal Processing,2005,53(2):845-850.