楊湘粵 伍希志 黃雪優(yōu)
摘 ?要:針對特種設(shè)備監(jiān)督檢查過程中焊縫射線圖像復(fù)制、偽造等問題,對圖像進(jìn)行重復(fù)性檢測研究,防止企業(yè)對圖像進(jìn)行人為作假。文章采用了SVM算法對焊縫射線圖像的圖像復(fù)制、圖像編號(hào)篡改和圖像重復(fù)拍攝三種重復(fù)類別進(jìn)行檢測研究,研究結(jié)果表明,該算法對復(fù)制和編號(hào)篡改類型的圖像檢測準(zhǔn)確率為100%,對產(chǎn)品重復(fù)拍攝類型的圖像檢測準(zhǔn)確率為93.3%,通過與差異哈希算法檢測結(jié)果進(jìn)行對比后發(fā)現(xiàn),SVM算法有著更準(zhǔn)確地識(shí)別效果。
關(guān)鍵詞:射線圖像;重復(fù)性檢測;SVM算法;差異哈希算法
中圖分類號(hào):TP391.41 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)21-0155-05
Research on Repeatability Detection of Weld Radiographic Image
Based on SVM Algorithm
YANG Xiangyue1,WU Xizhi1,2,HUANG Xueyou3
(1.School of Materials Science and Engineering,Central South University of Forestry and Technology,Changsha ?410004,China;2.Guangzhou Tech-Long Packaging Machinery Co.,Ltd.,Guangzhou ?510530,China;
3.Hunan Special Equipment Inspection and Testing Institute,Changsha ?410117,China)
Abstract:In view of the duplication and forgery of weld radiographic images in the process of special equipment supervision and inspection,the repeatability detection of images is carried out to prevent enterprises from artificially falsifying images. The article uses the SVM algorithm to detect and research the three repetitive categories of image duplication of weld radiographic images,image number tampering,and image repeated shooting. The research results show that the algorithm has 100% accuracy in detecting duplication and number tampering types of images. The accuracy rate of image detection for the repeated shooting type of the product is 93.3%. By comparing with the detection result of the different hash algorithm,it is verified that the SVM algorithm has a more accurate recognition effect.
Keywords:radiographic image;repeatability detection;SVM algorithm;different hash algorithm
0 ?引 ?言
隨著科學(xué)技術(shù)的飛速發(fā)展,射線成像技術(shù)得到了廣泛應(yīng)用。由于射線圖像易產(chǎn)生、成像快、成本低的特點(diǎn),該成像技術(shù)在工業(yè)、醫(yī)療等領(lǐng)域得到了廣泛應(yīng)用[1,2]。在特種設(shè)備監(jiān)督檢查過程中,某些企業(yè)或個(gè)人,為了減低焊縫檢測成本,通過人為篡改射線圖像,將一幅圖像修改為多個(gè)產(chǎn)品的圖像,逃避監(jiān)檢機(jī)構(gòu)的檢查,這給產(chǎn)品安全使用帶來了嚴(yán)重的隱患。文章以焊縫射線圖像為研究對象,通過對設(shè)備的射線圖像進(jìn)行重復(fù)性檢測,排除有偽造、篡改的圖像,從而提高設(shè)備的性能與質(zhì)量。在湖南省特種設(shè)備檢驗(yàn)檢測研究院的技術(shù)支持下,作者對射線成像技術(shù)進(jìn)行了學(xué)習(xí)與研究,并在中南林業(yè)科技大學(xué)材料科學(xué)與工程學(xué)院與廣州達(dá)意隆包裝機(jī)械股份有限公司博士后科研工作站的指導(dǎo)下,使用射線成像設(shè)備對實(shí)驗(yàn)圖像進(jìn)行了采集。
目前針對圖像重復(fù)檢測已經(jīng)有許多方法。唐堅(jiān)剛[3-5]等描述了一種基于Hash值的檢測方法,通過將圖像特征投影得到降維后的特征向量,生成這些向量的Hash值來查找不同版本的重復(fù)圖像,該方法實(shí)現(xiàn)了圖像快速查重,但當(dāng)數(shù)據(jù)較大時(shí)該算法的魯棒性差;杜振龍等[6,7]提出了基于Wasserstein重心坐標(biāo)作為描述子的圖像盲檢測算法,通過生成圖像歐式重心坐標(biāo)初步篩選重復(fù)區(qū)域,利用PatchMatch算法進(jìn)一步確定重復(fù)區(qū)域特征從而實(shí)現(xiàn)對復(fù)制、篡改、尺度變化等重復(fù)圖像的檢測,該方法有良好的魯棒性,但對于特征相似度較高的圖像識(shí)別率較低;甘玲等[8-10]描述了一種基于點(diǎn)匹配模型的復(fù)制圖像識(shí)別方法,通過提取圖像的特征點(diǎn)來定位出重復(fù)區(qū)域的特征信息,從而完成對重復(fù)圖像的檢測,該方法對于復(fù)制-粘貼篡改的重復(fù)圖像有著良好的檢測效果,但當(dāng)圖像重復(fù)類型較多時(shí)該方法往往很難達(dá)到檢測要求。
本文采用SVM算法作為框架,結(jié)合HOG(Histogram of Oriented Gradient)算子檢索出焊縫射線圖像的特征區(qū)域,然后對圖像進(jìn)行重復(fù)性檢測并輸出重復(fù)類型結(jié)果。
1 ?本文算法
1.1 ?算法流程
本文提出的焊縫圖像重復(fù)檢測算法主要包括以下部分:讀取圖像信息并對樣本進(jìn)行去噪、增強(qiáng)、灰度化,在SVM空間中將圖像信息轉(zhuǎn)變?yōu)橹С窒蛄俊⒂闷矫鎸ο蛄窟M(jìn)行劃分,計(jì)算向量點(diǎn)到平面間的距離,使得分類間隔最大,HOG特征提取,設(shè)定分類標(biāo)準(zhǔn)使得滿足要求的點(diǎn)分布在超平面兩側(cè)。算法流程圖如圖1所示。
本文SVM算法檢測重復(fù)圖像的主要步驟為:
(1)導(dǎo)入數(shù)據(jù),對圖像進(jìn)行預(yù)處理,其過程為:灰度化處理、去噪、圖像增強(qiáng)。
(2)圖像數(shù)據(jù)轉(zhuǎn)為支持向量,超平面劃分向量點(diǎn),最大化分類間隔。
(3)HOG提取,設(shè)置分類參數(shù)并選取多分類模型。
(4)SVM分類訓(xùn)練,檢驗(yàn)結(jié)果。
1.2 ?圖像預(yù)處理
1.2.1 ?灰度化
灰度化是圖像處理的必經(jīng)步驟,能夠?yàn)楹罄m(xù)的圖像識(shí)別做鋪墊。常用的灰度化處理方法有:最大值法、平均值法、加權(quán)平均法,本文采用加權(quán)平均法,選用合適權(quán)值對圖像進(jìn)行灰度化處理,加權(quán)公式為:
Gray=0.299×R+0.578×G+0.114×B
其中,R、G、B為圖像在該顏色通道的像素值。
1.2.2 ?去噪
圖像的采集、傳輸過程中可能會(huì)伴隨噪聲的出現(xiàn),噪聲的類型也有許多種,如椒鹽噪聲、高斯噪聲等,針對不同類型的噪聲,采取不同算法進(jìn)行處理。
焊縫圖片噪聲的產(chǎn)生來自圖像的采集和傳輸過程。射線采集設(shè)備在工作時(shí)可能受到各種因素的影響,如在使用射線拍攝工件時(shí),光照強(qiáng)度和溫度可能是產(chǎn)生噪聲的主要原因,針對不同的噪聲采用不同算法處理。
高斯噪聲是圖像采集中最常見的噪聲,也稱為正態(tài)噪聲。它的概率密度函數(shù)為:
其中,隨機(jī)變量z為灰度值,u為該噪聲的期望,σ2即為噪聲的方差。
椒鹽噪聲也是灰度圖像中常見的噪聲,又稱為雙極脈沖噪聲,其概率密度函數(shù)為:
圖像中出現(xiàn)的噪聲只有兩種灰度值,分別是a和b,這兩種灰度值出現(xiàn)的概率分別是Pa和Pb。
在MATLAB中通過調(diào)用函數(shù)可以得到噪聲圖像與直方圖,通過對噪聲模型以及直方圖的分析,可以明確去除噪聲的方法,圖2為含有噪聲的焊縫圖像,圖3為噪聲的模型與直方圖。
濾波器可以對噪聲進(jìn)行去除,通過對噪聲模型及直方圖的分析,選取合適的濾波方法。常用的濾波復(fù)原器包括算術(shù)均值濾波器和幾何均值濾波器,在坐標(biāo)點(diǎn)(x,y),大小為m×n的矩形窗口表示為Sxy,算術(shù)平均值是窗口Sxy中被干擾圖像g(x,y)的平均值,即:
幾何均值濾波器在去除噪聲時(shí)的表達(dá)式為:
對含有噪聲的圖像采用上述兩種濾波方式,效果如圖4所示。
1.2.3 ?圖像增強(qiáng)
圖像增強(qiáng)的主要目的是提高圖像的質(zhì)量和辨識(shí)度,使得圖像的邊緣特征、輪廓信息更為清晰,便于后續(xù)的特征提取操作。
1.3 ?超平面劃分
預(yù)處理操作之后,將圖像數(shù)據(jù)在SVM空間中轉(zhuǎn)化為支持向量,SVM支持向量機(jī)的基本型為:
s.t.yi(WTxi+b)-1≥0,i=1,2,…,n
其中,yi(WTxi+b)為超平面方程,y為數(shù)據(jù)點(diǎn)的標(biāo)簽,其值一般取1或-1。如果數(shù)據(jù)點(diǎn)在平面的正方向,即(y=+1類),那么向量點(diǎn)到超平面yi(WTxi+b)距離為一個(gè)正數(shù),而當(dāng)數(shù)據(jù)點(diǎn)在平面負(fù)方向時(shí)(y=-1類),距離依然為一個(gè)正數(shù),這樣就能夠保證距離一直大于0。所以向量機(jī)的基本型可以等價(jià)于:
s.t.yi(WTxi+b)-1≥0,i=1,2,…,n
對于多維數(shù)據(jù)樣本集,SVM算法會(huì)隨機(jī)產(chǎn)生一個(gè)平面并對其訓(xùn)練,直到樣本中滿足不同條件的點(diǎn)剛好位于平面的兩側(cè)。
1.4 ?HOG提取
HOG是在計(jì)算機(jī)視覺里用來進(jìn)行目標(biāo)檢測的特征描述子,通過計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征,在一幅圖像中,局部目標(biāo)的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述,所以該方法能夠很好地提取到焊縫圖像的特征信息。圖5為HOG算子對不同重復(fù)類型圖像的特征提取結(jié)果。第一幅圖為原圖像,其余依次為HOG算子對圖像復(fù)制、圖像編號(hào)篡改、產(chǎn)品重復(fù)拍攝的重復(fù)圖像特征提取。
1.5 ?SVM分類訓(xùn)練
SVM是定義在特征空間上的間隔最大線性分類器,它將數(shù)據(jù)點(diǎn)作為向量映射到高維空間中,并在空間中建立一個(gè)最大間隔超平面將這些向量點(diǎn)劃分開,向量點(diǎn)距離超平面的距離越大則分類誤差越小。焊縫圖像的重復(fù)類型主要有:圖像復(fù)制、圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝。本文通過SVM算法將焊縫圖像轉(zhuǎn)化為向量點(diǎn),并在SVM系統(tǒng)里對不同類型的點(diǎn)進(jìn)行歸類,從而檢測出重復(fù)圖像。
2 ?算例結(jié)果與分析
下面主要從兩方面進(jìn)行闡述:一是射線圖像的SVM重復(fù)性檢測研究;二是與差異哈希算法(dHash)重復(fù)性檢測進(jìn)行對比。
算例是在一臺(tái)配置i7-9750H CPU與16 GB RAM的PC機(jī)上在MATLAB 2018環(huán)境中實(shí)現(xiàn)。射線圖像拍攝來自德國進(jìn)口設(shè)備,由企業(yè)提供支持,射線采集設(shè)備如圖6所示。
在算例中,圖像標(biāo)準(zhǔn)庫為120張不含重復(fù)類型的圖片。本算例旨在檢測出與標(biāo)準(zhǔn)庫中圖像復(fù)制、圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝這三種重復(fù)類別的圖片,同時(shí),為了排除無關(guān)變量的影響,增加一組無重復(fù)的圖片作為對照組,保證檢測結(jié)果的準(zhǔn)確性。
2.1 ?SVM重復(fù)性檢測
SVM算法檢測主要分為兩個(gè)步驟:訓(xùn)練模型和圖像重復(fù)性檢測。訓(xùn)練模型過程為:采集訓(xùn)練集圖像。訓(xùn)練集包含圖像復(fù)制、圖像編號(hào)篡改、產(chǎn)品重復(fù)拍攝三種重復(fù)類型的圖片各20張,以及無重復(fù)圖片20張,總計(jì)80張圖片;對訓(xùn)練集圖像進(jìn)行預(yù)處理,并將圖像尺寸縮放為256×256像素;用HOG算子對所有訓(xùn)練圖片進(jìn)行特征提取;對特征圖像進(jìn)行訓(xùn)練;在SVM算法中選用fitcecoc訓(xùn)練模型對圖像進(jìn)行分類訓(xùn)練。訓(xùn)練結(jié)束后,使用測試集圖像進(jìn)行實(shí)驗(yàn)檢測。測試集總計(jì)60張圖片,其中圖像復(fù)制、圖像編號(hào)篡改變換、產(chǎn)品重復(fù)拍攝、無重復(fù)四種類型各15張。將測試集圖像輸入到檢測模型中進(jìn)行分類預(yù)測,并顯示分類結(jié)果。
SVM算法重復(fù)性檢測結(jié)果如表1所示,從表可以看出,SVM算法對于圖像復(fù)制、圖像編號(hào)篡改的重復(fù)性檢測準(zhǔn)確率均為100%,對于產(chǎn)品重復(fù)拍攝類的重復(fù)性檢測準(zhǔn)確率達(dá)到93.33%,同時(shí)對于無重復(fù)的圖片識(shí)別率在100%。因此,SVM算法對圖像重復(fù)性檢測效果良好。
2.2 ?與差異哈希算法對比
差異哈希算法是根據(jù)圖片相鄰像素間的亮度梯度生成圖像的哈希值,然后對圖像間的哈希值進(jìn)行異或運(yùn)算得到漢明距離,通過判別漢明距離大小來進(jìn)行圖像間的重復(fù)性檢測。用該算法對圖像復(fù)制、圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝三種重復(fù)類型進(jìn)行檢測。
不同重復(fù)類型的圖片,漢明距離也不同。針對不同重復(fù)類型的圖片,計(jì)算多組圖像的漢明距離,確定該重復(fù)類型的漢明距離值。每種重復(fù)類型選取6組圖像,漢明距離統(tǒng)計(jì)結(jié)果如表2所示。從表可以看出,圖像復(fù)制類的漢明距離均為0,編號(hào)篡改類的漢明距離在1~5之間分布,重復(fù)拍攝類的漢明距離在20~25之間分布,而無重復(fù)的圖像漢明距離在35~45之間分布。
根據(jù)分布規(guī)律,對圖像復(fù)制、圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝、無重復(fù)這四類圖像的漢明距離做出如下規(guī)定:約定復(fù)制圖像重復(fù)性檢測的漢明距離為0,編號(hào)篡改圖像重復(fù)性檢測的漢明距離為1~5,產(chǎn)品重復(fù)拍攝圖像重復(fù)性檢測的漢明距離為10~25,無重復(fù)類型圖像的漢明距離大于25。
根據(jù)上述漢明距離的規(guī)定,使用差異哈希算法對本算例的焊縫圖像進(jìn)行重復(fù)性檢測。差異哈希算法的檢測過程為:采集檢測圖像,三種重復(fù)類別的圖片各采集15張,無重復(fù)的圖像采集15張,總計(jì)60張圖片;將檢測圖像與標(biāo)準(zhǔn)庫中的圖像兩兩進(jìn)行差異哈希運(yùn)算,生成每組圖像的漢明距離;根據(jù)圖像漢明距離值進(jìn)行重復(fù)圖像檢測和分類。
差異哈希算法檢測結(jié)果如表3所示,從表中可以發(fā)現(xiàn),差異哈希算法對復(fù)制類型的圖片檢測準(zhǔn)確率為100%,對編號(hào)篡改類型的圖像檢測準(zhǔn)確率為86.67%。對重復(fù)拍攝類型的圖片識(shí)別效果一般,準(zhǔn)確率為60%,對于無重復(fù)的圖片能夠100%檢測。相比SVM算法,差異哈希算法對于編號(hào)篡改、重復(fù)拍攝類型的檢測魯棒性較低。
將SVM算法與差異哈希算法檢測結(jié)果進(jìn)行對比,如圖7所示。從圖中可以發(fā)現(xiàn),SVM對于各種重復(fù)類型的識(shí)別均有良好效果,平均識(shí)別率達(dá)到98.33%。差異哈希算法對圖像復(fù)制、編號(hào)篡改類型的檢測效果與SVM算法接近,而對于產(chǎn)品重復(fù)拍攝的圖像檢測效果較差;且差異哈希算法需要分組進(jìn)行圖像檢測,檢測時(shí)間也略高于SVM算法,所以SVM算法更適用于重復(fù)圖像類型的檢測。
3 ?結(jié) ?論
論文采用SVM算法和差異哈希算法對焊縫射線圖像重復(fù)性檢測進(jìn)行了研究,主要研究結(jié)論如下:SVM算法對圖像復(fù)制、圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝的重復(fù)性檢測均有良好效果,平均識(shí)別率達(dá)到98.33%。差異哈希算法對圖像復(fù)制類型的重復(fù)性檢查準(zhǔn)確率為100%,對圖像編號(hào)篡改和產(chǎn)品重復(fù)拍攝類型的重復(fù)圖像檢測準(zhǔn)確率均小于90%,且差異哈希算法的檢測時(shí)間也略高于SVM算法,因此,SVM算法更適用于重復(fù)圖像類型的檢測。
參考文獻(xiàn):
[1] 楊斌,李艷艷,李洪英.基于雙目視覺的待涂裝焊縫的識(shí)別 [J].現(xiàn)代信息科技,2020,4(17):149-151+154.
[2] 牛志忠,楊坤.一種基于多尺度Retinex的夜間圖像增強(qiáng)算法 [J].現(xiàn)代信息科技,2020,4(17):66-68+71.
[3] 唐堅(jiān)剛,孫龍杰,楊生遠(yuǎn).SIFT結(jié)合改進(jìn)的Harris的圖像匹配方法 [J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(7):126-131.
[4] 唐堅(jiān)剛,劉叢,張麗紅.基于形狀邊緣點(diǎn)夾角直方圖的圖像檢索研究 [J].上海理工大學(xué)學(xué)報(bào),2010,32(6):564-568.
[5] 唐堅(jiān)剛,王澤興.基于Hash值的重復(fù)圖像檢測算法 [J].計(jì)算機(jī)工程,2009,35(1):183-185.
[6] 杜振龍,葉超,李曉麗,等.基于Wasserstein直方圖歐氏度量的圖像重復(fù)區(qū)域盲檢測算法 [J].光學(xué)與光電技術(shù),2018,16(6):25-32.
[7] 杜振龍,楊凡,李曉麗,等.基于復(fù)合特征的復(fù)制粘貼偽造圖像盲檢測 [J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(11):4264-4267.
[8] 甘玲,王凱.基于HSV和HE的復(fù)制粘貼篡改檢測算法 [J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,31(3):400-406.
[9] 甘玲,張鵬飛.一種基于點(diǎn)匹配的圖像重復(fù)區(qū)域檢測方法 [J].微電子學(xué)與計(jì)算機(jī),2015,32(8):62-66.
[10] HAJIALILU S F,AZGHANI M,KAZEMI N. Image copy-move forgery detection using sparse recovery and keypoint matching [J].IET Image Processing,2020,14(12):2799-2807.
作者簡介:楊湘粵(1995—),男,苗族,湖南湘西人,碩士研究生,研究方向:圖像處理;通訊作者:伍希志(1985—),男,漢族,湖南婁底人,講師,博士,研究方向:機(jī)器視覺,工程機(jī)械,復(fù)合材料結(jié)構(gòu)。