• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于PHash 的過程性課程考核系統(tǒng)中圖像的客觀相似性對比算法

      2019-09-07 07:13:26丁一無錫城市職業(yè)技術(shù)學(xué)院
      數(shù)碼世界 2019年9期
      關(guān)鍵詞:哈希指紋灰度

      丁一 無錫城市職業(yè)技術(shù)學(xué)院

      一、引言

      隨著改革開放的深入和社會的發(fā)展,高等教育得到的迅速的擴(kuò)張,以往的教學(xué)體系往往已經(jīng)不能適應(yīng)社會進(jìn)步和發(fā)展,基于過程的考核方式通過對具體操作流程進(jìn)行量化考核,通過實踐應(yīng)用中總結(jié)的項目具體化,將考核的量化等級具體到課程的各個實踐環(huán)節(jié)中,從而改變了以往一張卷決定成績的方式。從而探索出以分布式的實踐考核方式,從而達(dá)到激發(fā)學(xué)生積極性的目的,與傳統(tǒng)的考核方式相比具有很強(qiáng)的實踐意義。但在具體實踐教學(xué)中往往會出現(xiàn)教師人工工作量過大的情況,在計算機(jī)、互聯(lián)網(wǎng)、特別是人工智能技術(shù)發(fā)展的今天,手工批改方式已經(jīng)有被新的技術(shù)取代的趨勢,建立過程性考核系統(tǒng)就勢在必行。這些系統(tǒng)雖然可以達(dá)到完成度考核的目的,但缺乏對于真實性的篡改檢測特別是圖像的篡改檢測。本文提出了將PHash 算法應(yīng)用于基于過程性課程考核系統(tǒng)中,并通過人工智能的圖像算法對于圖片客觀相似性對比進(jìn)行量化,從而可以大大減輕教師負(fù)擔(dān)。

      PHash 算法最早其實來自數(shù)字的水印,這個算法從傳統(tǒng)的哈希算法以及圖像對比等領(lǐng)域的概念中總結(jié)了一些理論,并且通過基于圖像感知信息的簡短摘要進(jìn)行匹配,通過這個匹配來獲得圖像的相似度。按照目前的說法,這個算法大致分為量化壓縮以及特征提取兩個階段。首先,特征提取階段是將特征從圖像中提取出來,在不改變圖像的感知內(nèi)容的基礎(chǔ)上,提取出來的特征量要過濾符合在圖片上做的惡意篡改。這就要求算法可以在圖像經(jīng)過惡意篡改之后,仍然可以提取出來這樣的特征。而量化壓縮是為了算法的有效性,將提取出來的特征以二進(jìn)制的向量的形式進(jìn)行壓縮成哈希值。

      張慧等在基于人類視覺系統(tǒng)的圖像感知哈希算法中,將PHash算法和其他算法進(jìn)行比較,結(jié)果中PHash 算法明顯在在魯棒性和區(qū)分性效果更好而且更符合人類的主觀感受。

      馬偉鵬等在基于SIFT 和感知哈希的圖像復(fù)制粘貼篡改檢測方法中,提出提出基于圖像特征子的圖像復(fù)制粘貼篡改檢測方法,利用PHash 降維,從而實現(xiàn)篡改檢測的算法,但該算法僅從復(fù)制粘貼角度考慮,未考慮圖像的篡改中冗余性。宋博在快速特征提取與感知哈希結(jié)合的圖像配準(zhǔn)算法一文中利用感知哈希算法對匹配的特征進(jìn)行清洗,并在增加約束條件的基礎(chǔ)上提高了精準(zhǔn)度。

      本文提出了一個基于PHash 的過程性課程考核系統(tǒng)中圖像的客觀相似性對比算法,該算法實現(xiàn)了學(xué)生電子版作業(yè)、實驗實訓(xùn)報告的完成程度和真實性考核中的圖像相似度對比以及篡改檢測,圖像轉(zhuǎn)化成浮點型的灰度值,在獲取到灰度值的DCT 集合基礎(chǔ)上得到均值并計算哈希值,通過遍歷DCT 整個集合對比進(jìn)行對比獲得8*8這樣的矩陣以獲取圖片的指紋信息,通過對比兩張圖片的指紋并且得到漢明距離,從而確定圖片的相似程度。通過對基于目標(biāo)原圖和其他更改縱橫比、增加水印以及其他差異較大的結(jié)果圖的對比,實現(xiàn)了對圖片之間相似度的量化,從而達(dá)到用人工智能的方法量化識別圖片相似度的目的。

      二、相似性圖像檢測算法

      圖像的相似度檢測算法中,數(shù)學(xué)上最關(guān)鍵的梯度,梯度也就是物體的邊緣,算法最本質(zhì)的也就是這里,計算梯度需要利用灰度圖像,也就是需要圖像的強(qiáng)度這個變量。而顏色等信息,容易受到光照等條件的影響,所以通過計算灰度有利于提高計算速度,重要的是有利于過濾噪音并提供關(guān)鍵信息。

      常用的圖像相似性檢測算法中,比較有名的就是SIFT。SIFT 即尺度不變特征變換算法,這個算法本質(zhì)上是在相異的尺度空間上查找特征關(guān)鍵點,而且需要得到特征點的向量,SIFT 查找一些特殊的而且是并不會因為光照和其他變化以及噪音等因素變化的特征點,如角上以及邊緣上的出現(xiàn)的特征點還有就是比較陰暗的區(qū)域的明亮點以及相反情況的點等等。SIFT 對圖片的局部特征對比很占優(yōu)勢,它相對于其他算法來說在大小變化、角度變化以及灰度等變化都不受影響,對于視點、甚至噪點等變化也會取得不錯的結(jié)果。這個算法不足的地方也有,有時獲取到的特征點相對來說稍有不足以及對邊緣平整的參照物無法準(zhǔn)確提取到特征點,并且對象的平行變動等容易受到光照、雜物、噪聲、目標(biāo)遮擋等影響。

      HOG 算法將圖片中的一部分區(qū)間的梯度進(jìn)行計算統(tǒng)計,特征值由梯度方向直方圖進(jìn)行表達(dá)。HOG 結(jié)合SVM 已經(jīng)在人臉檢測中得到了很廣泛的應(yīng)用。該算法對于畫像處理中幾何特征以及光學(xué)特征方面保持了不變性并且由于它的操作是在圖像的局部矩陣單元上完成,所以它不變性對幾何特征和光學(xué)的特征形變都能保持很好。在三維空間角度的識別上,圖片的光照上微小的變化也不會有太大的影響,HOG 算法適用于視頻或者圖片的人臉檢測。HOG 的特點是準(zhǔn)確率可能不如前者高,但人臉識別這個領(lǐng)域的效果可能會更好。

      ORB 算法的檢測速度快,適用于實時性的特征方面的檢測。該算法最大的特點是快速角度的特征檢測,基于這一方法的特征具有任何維度的幾何形變上的穩(wěn)定性,同時在噪點的處理方面也有比較好的優(yōu)勢。計算速度非??旒丛撍惴ǖ淖畲髢?yōu)點,快速檢測它的特征點的應(yīng)用很好的保證了這一點。它的核心思想就是找出和其他點不一樣的“不平凡”的點,也就是說我們可以用哪個一個點跟它周邊的點比,如果該點與周圍大部分的點在特征上都具有很大的不同即可以認(rèn)為該點就是要候選的所謂特征點。在不同的旋轉(zhuǎn)角度下的圖片相似性對比的應(yīng)用也十分的廣泛。

      任何一個出色的算法都有它的應(yīng)用范圍,在目前過程性課程考核系統(tǒng)中,大多數(shù)學(xué)生的報告或者作業(yè)截圖都是以計算機(jī)界面為主,界面有很大的相似性,特別是計算機(jī)及相關(guān)專業(yè)中,圖片和具體特征點的相似度更高。比如編程代碼中相同的變量,或者網(wǎng)絡(luò)專業(yè)中相同的命令。所以基于這一點考慮的話,至少單純用SIFT 或者ORB 算法都不適用于目前的系統(tǒng),當(dāng)然HOG 等算法也不合適。

      三、PHash 算法與圖片相似度對比

      PHash 算法通過一個有可比較的哈希函數(shù),圖像獲取特征主要來自獨特的指紋,通過比較這些指紋獲得圖片的相似度,其中,獨特的指紋的獲取方式與上文中特征點的獲取方式類似,特征點都是選取一些特殊的而且是并不會因為物理光線灰度以及其他幾何變化以及噪點等因素改變的點。與散列函數(shù)即用于加密的哈希所不同的是加密散列函數(shù)的值隨機(jī)的結(jié)果產(chǎn)生的隨機(jī)的散列。這種數(shù)據(jù)采用相同的值就會產(chǎn)生相同的結(jié)果,不同的數(shù)據(jù)產(chǎn)生不同的結(jié)果。SHA1 算法中,hash 值不同,數(shù)據(jù)也會不同。另外,hash 值相同,數(shù)據(jù)也會相似,因為可能存在著hash 沖突的可能,所以在相同hash 值也產(chǎn)生不同的數(shù)據(jù)。相對來說,感知哈希是可以比較的,這個與上面的加密算法不同,是兩個數(shù)據(jù)集之間的相似的比較。PHash 函數(shù)就是建立一個圖片與指紋字符串之間的映射,通過對不同的圖片產(chǎn)生的指紋所匹配得到的結(jié)果來衡量說明圖片相似度,即相似度所得到的數(shù)值結(jié)果高或者結(jié)果一致這說明圖片高度相似或者同質(zhì)即為同一副圖。

      本文采用的PHash 算法的基本步驟是:

      1.壓縮圖片的尺寸。一般來說會將圖片壓縮成8*8 大小的矩陣,這里面總共是64 個像素點。這個步驟的重點在于圖片細(xì)節(jié)的去除,將圖片的基本結(jié)構(gòu)保留的即保留物理光照明暗灰度信息,通過去除不同尺寸和比例的圖片所帶來的影響,來盡量減少這種對圖片對比產(chǎn)生的圖片差異。

      2.簡化圖片色彩信息。將壓縮后的圖像矩陣轉(zhuǎn)化為64 級的灰度值,也就是將傳統(tǒng)的256 級灰度進(jìn)一步縮小。即通俗的講,所有的像素點一共之后64 中黑白顏色。

      3.計算平均值。為了進(jìn)一步弱化灰度所帶來的噪音上的差異,經(jīng)過離散余弦變換并縮小縮小之后計算8*8 大小的矩陣中,也就是全部64 個像素的灰度平均值。

      4.比較像素的灰度值。將上一步所得到的平均值與圖片中每個像素的灰度值匹配對比,比較得到結(jié)果相對的平均值小的數(shù)字記為0,大于或者等于的結(jié)果中數(shù)字記為1,。通過這一步的比較結(jié)果會得到64 個0 或者1。

      5.計算圖像的哈希值。將上一步所得到結(jié)果進(jìn)行整理,將這個比較結(jié)果組合成64 位的二進(jìn)制整數(shù),為了表示方便或者可以轉(zhuǎn)化成一個16 位的十六進(jìn)制數(shù),這就是圖像的指紋。

      6.通過漢明距離進(jìn)行指紋對比。這個組合的順序?qū)τ?4 位二進(jìn)制數(shù)并非是必要條件,必要條件是相對圖片中的所有產(chǎn)生的組合順序都需要保持一致性。得到幾幅圖像的指紋之后,就可以通過指紋進(jìn)行不同圖像的對比。對比方法就是看64 位中有多少位是不一樣的。這與漢明距離的計算方法是一致的。需要說明的情況是漢明距離的概念是信息論中的,在我們這個算法就是長度相等的幾個二進(jìn)制串之間的漢明距離就是相對對應(yīng)不同二進(jìn)制數(shù)的個數(shù)。也就是說,我們可以做一個規(guī)定,只要其中結(jié)果不一樣的個數(shù)不超過某個值X,就說明兩幅圖像相似度滿足規(guī)定的預(yù)期?;蛘咴O(shè)定一個閾值比如Y只要數(shù)值超過Y 的閾值就可以斷定圖片客觀相似度不符合預(yù)期。

      四、算法的優(yōu)化及過程性課程考核系統(tǒng)中圖片相似度的應(yīng)用

      PHash 算法計算中常用DCT 即離散余弦變換來獲取低頻成分結(jié)果為32*32 大小的矩陣,而計算矩陣離散余弦變換之后灰度平均值的計算最為復(fù)雜,需要用到四層的循環(huán)來計算,所以本文將矩陣優(yōu)化為8*8 大小,并且在計算上采用矩陣的乘法替代原有的四層循環(huán),進(jìn)一步將效率提高。

      本文選取了實踐應(yīng)用中常見的拓?fù)鋱D來展示實驗結(jié)果,圖1(a)為對象圖的原圖、圖1(b)為將原圖更改了縱橫比之后得到的結(jié)果、圖1(c)為縮小原圖之后的圖、圖1(d)為在原圖中加入了其他文字改變原圖之后的結(jié)果。

      圖1 :圖片相似度的應(yīng)用案例圖(一)

      實驗結(jié)果中,原圖經(jīng)過與更改縱橫比之后相似度對比算法計算的結(jié)果為0.97265625,而原圖與將本文縮小之后采用相似度對比算法得到的結(jié)果0.97265625,在加入文字之后得到的結(jié)果為0.984375。需要說明的是結(jié)果中越接近1 說明相似程度越高,結(jié)果為1 的話可以判定為同一副圖片,結(jié)果為0 的話則認(rèn)為兩幅圖片并無相似之處。通常在應(yīng)用中我們把大于0.95 的同樣判斷為同一副或者是接近同一副圖。將大于0.85 的而小于0.95 的圖發(fā)送人工審核。而小于0.85的圖則可認(rèn)為是不同的圖。

      圖2 中采用了兩幅都是文字的圖,圖中文字類似,但由于代碼細(xì)節(jié)中還是有基本的差異,經(jīng)人工判斷可認(rèn)為是不同的圖。計算的結(jié)果也驗證了判斷結(jié)果為0.78125。

      圖2 :圖片相似度的應(yīng)用案例圖(二)

      五 總結(jié)

      本文針對過程性考核系統(tǒng)中的圖片對比效率問題采用了PHash算法,通過在實踐中獲得的圖片作為數(shù)據(jù)集并且在對數(shù)據(jù)集圖片加工的基礎(chǔ)上,給出了最優(yōu)的選擇。感知哈希算法的防篡改檢測能力和隨機(jī)可能性判斷中仍具有一定的矛盾,這方面也需要在今后的研究中進(jìn)行優(yōu)化。另外,在將來的應(yīng)用中可以將該算法引入到視頻信號的處理和識別上。

      猜你喜歡
      哈希指紋灰度
      采用改進(jìn)導(dǎo)重法的拓?fù)浣Y(jié)構(gòu)灰度單元過濾技術(shù)
      基于灰度拉伸的圖像水位識別方法研究
      像偵探一樣提取指紋
      為什么每個人的指紋都不一樣
      基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
      基于灰度線性建模的亞像素圖像抖動量計算
      基于自適應(yīng)稀疏變換的指紋圖像壓縮
      基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
      可疑的指紋
      基于維度分解的哈希多維快速流分類算法
      休宁县| 丹东市| 重庆市| 松阳县| 桂阳县| 喀喇沁旗| 区。| 临高县| 刚察县| 广平县| 乐山市| 岐山县| 广平县| 承德县| 泰宁县| 平利县| 随州市| 阿拉善左旗| 孝义市| 汝州市| 大荔县| 乌拉特前旗| 宁乡县| 大城县| 稻城县| 包头市| 彭州市| 搜索| 新干县| 广饶县| 五河县| 武汉市| 宜宾市| 万州区| 北川| 武胜县| 中卫市| 灵璧县| 伊宁县| 南陵县| 阿城市|