• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分塊離散余弦變換感知哈希算法與ResNet模型的供電安全圖像管理

    2022-01-10 09:11:16曹增新朱龍輝
    西安工程大學(xué)學(xué)報 2021年6期
    關(guān)鍵詞:漢明哈希閾值

    曹增新,蔣 程,朱龍輝

    (1.國網(wǎng)北京房山供電公司,北京 102401;2.西安理工大學(xué) 電氣工程學(xué)院,陜西 西安 710054)

    0 引 言

    電能是人類日常生活中必不可少的一部分[1-2],隨著電力系統(tǒng)的不斷更新完善,越來越多的設(shè)備加入其中,供電安全管控圖像的處理也被提上日程[3-4]。圖像分析常常被用來作為輔助管理的手段,在電力安全管控系統(tǒng)中也是如此,人們將各種設(shè)備以圖像的形式記錄下來,對其進行去重、分類等處理以便于進行后續(xù)的管理過程[5-6]。對于供電安全管控圖像地處理,使用人工智能的方法進行圖像整理,不僅可以大大降低人工操作的出錯率,還可以節(jié)省人力資源。

    在圖像去重方面,許多學(xué)者進行了不斷的探索,傳統(tǒng)的圖像去重方法多數(shù)屬于文件級別,即將圖像視為一個二進制文件,然后再利用傳統(tǒng)哈希算法來實現(xiàn)去重,如塊級數(shù)據(jù)去重算法[7-8],該方法圖像會因壓縮變換導(dǎo)致文件大小發(fā)生改變,此時文件級別的去重方法將無法正確對圖像進行分辨,對感知相似的圖像無法判別。為了追求更高的去重效率,文獻[9]采取了圖像均值PHA簡稱AVG-PHA,通過將圖像轉(zhuǎn)換為灰度圖并壓縮大小在像素域得到圖像的哈希值,再借助漢明距離計算來判斷2幅圖像之間的哈希序列距離。這種方法較為簡單,主要基于圖像原本的各個像素信息,可以減少計算費用開銷,但圖像均值PHA無法對經(jīng)過 JPEG壓縮,對比度發(fā)生變化后的圖像信息進行準確的判定。文獻[10]首先提出了基于DCT的PHA,簡稱DCT-PHA,利用提取頻域中特定系數(shù)產(chǎn)生的圖像哈希作為信號去重判斷,此后有學(xué)者對其方法進行了優(yōu)化,并提出改進版高準確度感知哈希算法[11],該算法對相似圖更加敏感,準確度更高。上面所列舉的方法雖然能夠?qū)崿F(xiàn)圖像分析分類,但是在穩(wěn)健性、錯判率及去重率等方面性能仍然不高。

    在圖像分類方面,深度學(xué)習(xí)模型常被用于圖像的分類[12-14]。自動編碼器就是一種由編碼器和解碼器組成的特殊的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。其中,編碼器將數(shù)據(jù)輸入到隱藏層,通過隱藏層進行表達,而解碼器可以通過隱藏層恢復(fù)輸入的原始數(shù)據(jù)。這種獨特的結(jié)構(gòu)使得它在數(shù)據(jù)降維以及特征提取等方面都取得了不錯的成就。CNN主要包括卷積層和池化層,可以很好保持圖像的空間信息[15-17],但是網(wǎng)絡(luò)的性能在前期會隨著網(wǎng)絡(luò)層數(shù)的增多繼續(xù)提高,但當遇到一個閾值時,網(wǎng)絡(luò)的性能會隨著層數(shù)的增多逐漸降低,這是因為CNN模型出現(xiàn)了梯度消失的現(xiàn)象[18]。

    針對上述圖像處理方面存在的問題,本文將深度學(xué)習(xí)算法應(yīng)用于圖像處理技術(shù)中,通過深度學(xué)習(xí)算法實現(xiàn)供電安全管控圖像的去重與分類,完成電力安全管控系統(tǒng)下智能管理子系統(tǒng)的設(shè)計。對于供電安全管控圖像去重模塊,采用本文提出的BDCT-PHA進行去重管理,該算法穩(wěn)健性好,去重準確率高,且誤判率小。對于供電安全管控圖像分類模塊,本文提出基于ResNet模型的CNN圖像分類方法,該方法可以防止出現(xiàn)梯度消失現(xiàn)象,同時減少了計算量,提高了準確率。

    1 BDCT-PHA的圖像去重

    哈希函數(shù)[19]可處理不同長度的原始數(shù)據(jù),將其變?yōu)榻y(tǒng)一長度的消息摘要,通常用于數(shù)據(jù)加密以及數(shù)據(jù)壓縮,但由于其存在脆弱性與數(shù)據(jù)壓縮性的特點,逐漸被PHA[20]所取代。PHA是圖像數(shù)據(jù)集到感知摘要集之間的一種單向映射,滿足區(qū)分性、感知魯棒性和單向性的特點。與傳統(tǒng)哈希算法相比,PHA所生成的哈希序列值較短,因此它的數(shù)據(jù)所占用的容量不會很高;PHA很難通過輸出的哈希值去追溯到輸入,因此輸入信息可以得到很好地保護;PHA序列的生成過程不容易被模仿,無法通過對輸入圖像進行修改來得到與另一幅不同圖像相似的哈希序列值。PHA的生成過程通常被分為感知特征的提取和量化編碼2個部分,其中感知特征的提取是整個步驟的靈魂。

    1.1 BDCT-PHA的優(yōu)勢

    從算法的穩(wěn)健性、去重率、錯判率3個方面,對BDCT-PHA和AVG-PHA、DCT-PHA進行比較,來說明BDCT-PHA的優(yōu)勢。

    1) 算法的穩(wěn)健性。漢明距離是判定PHA序列相似度的標準,漢明距離越大也就意味著2個序列越遠相距。因此在將閾值設(shè)定為同一個值的情況下,2幅相似圖像之間的漢明距離越大,識別的準確率越低,穩(wěn)健性越弱。對失真圖像的已有研究表明,BDCT-PHA較另外2種算法相比,在多數(shù)情況下,漢明距離的平均值較小,穩(wěn)健性更好。

    2) 算法的去重率。據(jù)已有研究顯示,漢明距離的閾值取為1或5時,PHA對相似圖像的正確識別率較高。在閾值為1時,BDCT-PHA去重的正確率能達到99%,高于DCT-PHA與AVG-PHA;在閾值為5時,BDCT-PHA去重的正確率將達到95%以上,而AVG-PHA與DCT-PHA去重的正確率則在90%以下。

    3) 算法的錯判率。PHA會嚴格區(qū)分不同源的圖像,不同源的圖像被識別為相似圖像的情況被記為錯判。已有研究表明,在有限大量數(shù)據(jù)的情況下,BDCT-PHA的錯判率幾乎為0,相較于其他2種算法有明顯的優(yōu)越性。

    1.2 圖像去重

    BDCT-PHA會首先對圖像進行預(yù)處理,對其做分塊DCT變換并提取特征向量,得到感知哈希序列值,再使用漢明距離來描述2幅圖像之間的距離,并設(shè)定閾值來對圖像相似與否進行判別,具體操作如下:

    步驟1:圖像的預(yù)處理。首先,使用RGB轉(zhuǎn)灰度公式Hgray(i,j)=0.299R(i,j)+0.587G(i,j)+0.114B(i,j)對彩色的圖像在(i,j)處進行灰度化處理,以降低圖像亮度對于分析的影響。最后,圖像的大小將會影響生成的感知哈希序列長度,因此需要提前對圖像的大小進行統(tǒng)一。本文采用雙線性插值的方式對圖像進行處理,分辨率統(tǒng)一設(shè)定為64×64。

    步驟2:提取圖像的特征向量。首先,對經(jīng)過預(yù)處理的圖像進行處理,將每個圖像分為64個8×8的塊,然后對其進行分塊DCT變換,得到每個分塊的DCT矩陣;其次,分別取每個塊的DC分量,按照AC1和AC5分量將相同位置的分量連接起來,連接方式為從上到下,從左到右,連接完成后組成3個一維向量Am,長度為64;再次,對得到的3組向量分別用式(1)進行二值化處理,即

    (1)

    最后,將3個Fm向量依次連接,生成一維特征向量F,其長度為192,且表示了圖像經(jīng)過處理后的感知哈希序列值。

    (2)

    本文研究并判斷2個字符串之間的相似性是通過它們的漢明距離。判斷標準為:漢明距離越小,2個字符串差異性越小。對類似的字符串進行識別時,設(shè)置一個閾值T與所得漢明距離進行比較,當D(x,y)≤T時,兩者被識別為相似的字符串,否則識別為不同的的字符串。對應(yīng)感知哈希序列則是當D(x,y)≤T時,2個感知哈希序列代表的圖像相似;當D(x,y)>T時,2個感知哈希序列所代表的圖像不同。

    2 ResNet模型

    在達到CNN性能閾值前,不斷增加CNN模型的深度會使模型的性能更好,但是當達到閾值后,不斷增加CNN模型的深度,會出現(xiàn)梯度消失現(xiàn)象,而基于殘差網(wǎng)絡(luò)結(jié)構(gòu)的ResNet模型可以防止梯度消失現(xiàn)象[21-22]。ResNet模型把殘差網(wǎng)絡(luò)引入到深度CNN之中,實現(xiàn)了“短路”機制,可以較好地解決“網(wǎng)絡(luò)加深而準確率下降”的問題。

    ResNet模型采用VGG的結(jié)構(gòu)并在其基礎(chǔ)上進行了修改,在增加ResNet模型非線性激活函數(shù)數(shù)量的同時減少了ResNet模型參數(shù),這使得ResNet模型的計算量變得更小,即不是采用大卷積核的方法,而是用多個非常小的卷積核。ResNet可以使用2種殘差單元,分別對應(yīng)深層網(wǎng)絡(luò)和淺層網(wǎng)絡(luò),兩者均可在輸入與輸出維度一致時,直接將輸入加到輸出上。

    2.1 超參數(shù)設(shè)置

    在訓(xùn)練ResNet模型時,批量訓(xùn)練的大小、學(xué)習(xí)速率的大小、分類數(shù)目與權(quán)值衰減率的選擇等都需要進行超參數(shù)的設(shè)置[23]。

    1)批量訓(xùn)練大小的選擇決定了ResNet模型下降的方向。當數(shù)據(jù)量較小的時候,為了對噪聲數(shù)據(jù)產(chǎn)生魯棒性,即減少噪聲數(shù)據(jù)的干擾,批量訓(xùn)練值就應(yīng)該較大。當數(shù)據(jù)量足夠龐大時,為了減少計算量,應(yīng)該適當減小批量訓(xùn)練的大小。ResNet模型在收斂精度和訓(xùn)練時間上存在一個最優(yōu)取值,因為批量訓(xùn)練值按照經(jīng)驗存在一個全局最優(yōu)值。

    2)學(xué)習(xí)速率的大小與權(quán)值更新的幅度緊密相關(guān),所以應(yīng)該把學(xué)習(xí)率設(shè)置在一個適宜的范圍。如果學(xué)習(xí)率設(shè)置過大,ResNet模型會在誤差較小的一端來回擺動,形成一種已達到最優(yōu)的錯覺,因為其權(quán)值已經(jīng)超過最優(yōu)值,無法收斂到最優(yōu)值。若學(xué)習(xí)率設(shè)置的過小,優(yōu)化ResNet模型就需要大量時間,需要反復(fù)迭代,一步步靠近最優(yōu)值,最不理想的情況下可能會導(dǎo)致ResNet模型無法收斂。

    2.2 數(shù)據(jù)輸入

    樣本數(shù)據(jù)的輸入主要包括選擇特征集、選取樣本以及生成TFRecords樣本數(shù)據(jù)集3個部分。

    1) 選擇特征集,選擇的主要是待分類的圖像。為使特征集的維度更大,模型收到的信息更全面,可以通過提取不同維度的特征來構(gòu)成特征集。但是過高的圖像數(shù)據(jù)特征維度,又會對ResNet模型產(chǎn)生不良的影響,特征維度也存在一個最優(yōu)值。

    2) 選取樣本,選取樣本點并提取樣本點的M維特征,每個樣本的特征是一個大小為M×N的矩陣。樣本的數(shù)據(jù)量在現(xiàn)實運用中是遠遠滿足不了ResNet模型的需求的,因此需要使用隨機擦除與變換對比度的方式對原圖像數(shù)據(jù)進行增強。

    3)生成TFRecords樣本數(shù)據(jù)集。按照比例將數(shù)據(jù)集拆分為訓(xùn)練集和測試集,并將其全部轉(zhuǎn)換成二進制文件,再根據(jù)文件夾名稱添加樣本標簽,轉(zhuǎn)換得到的TFRecords文件作為ResNet模型數(shù)據(jù)輸入。

    2.3 ResNet模型卷積層

    投影快捷方式用于在殘差網(wǎng)絡(luò)特征維度改變之前添加不同特征尺寸的特性。原始殘差網(wǎng)絡(luò)使用步幅為2的1×1卷積來改變通道的變化,如圖1(a)所示。但1×1卷積會丟失大量的信息,所以如圖1(b)所示,本文使用步幅為2的3×3最大池化層跟隨步幅為1的1×1卷積層來代替原始的投影快捷方式。

    (a) 原始投影快捷方式 (b) 改進投影快捷方式

    改進的投影快捷方式的好處是在投影時將考慮來自特征映射的所有信息,并在下一步選擇具有最高激活度的元素,以減少信息丟失。在通道流程方面,改進的投影快捷方式可以被視為軟下采樣和硬下采樣的組合,這補充了2種方法的優(yōu)勢。硬采樣有助于進行分類,而軟采樣有助于不丟失所有空間背景。同時這種改進不會增加模型的復(fù)雜度和模型參數(shù)量。

    當前,大量研究結(jié)果表明方差為1的正態(tài)分布的白化操作可以使模型的收斂速度變得更快,即通過把輸入數(shù)據(jù)拉伸為值為0的均值,將輸入數(shù)據(jù)規(guī)范化和歸一化。ResNet模型的每個輸出層的輸出結(jié)果都是下一場輸入層的輸入數(shù)據(jù),因此,ResNet模型的白化操作,即為了克服模型訓(xùn)練時由于參數(shù)變化對模型梯度下降所產(chǎn)生的不良影響,需要對數(shù)據(jù)輸出層增加規(guī)范化層,對每個節(jié)點的輸入數(shù)據(jù)做歸一化拉伸。批量歸一化的主要目的是加快模型的收斂速度,避免梯度消失現(xiàn)象的出現(xiàn),其計算公式可表示為

    (3)

    因為圖像數(shù)據(jù)的特征具有稀疏性,即存在明顯的線性可分性,所以為了模型能自動引入稀疏性且通過線性分段緩解梯度消失現(xiàn)象,在本模型中使用稀疏性激活函數(shù)ReLU。

    2.4 ResNet模型訓(xùn)練

    在對ResNet模型進行訓(xùn)練時,設(shè)計的目標函數(shù)可表示為

    (4)

    設(shè)計的損失函數(shù)為樣本的真實類型與預(yù)測結(jié)果的交叉熵,可表示為

    (5)

    對于每批次樣本,損失函數(shù)可表示為

    (6)

    對ResNet模型訓(xùn)練時,卷積層會進行特征提取工作,并把相應(yīng)的參數(shù)值記錄下來。在統(tǒng)計樣本的分類值之前,會先將模型最底層提取的稀疏特征輸入到Logist層。

    3 仿真實驗

    本文的仿真實驗的流程為載入數(shù)據(jù)集→完成數(shù)據(jù)集去重→將去重后的數(shù)據(jù)集輸入待訓(xùn)練模型→完成模型訓(xùn)練→輸出結(jié)果。其中,原始圖像數(shù)據(jù)集為從現(xiàn)場收集到的關(guān)于開關(guān)柜、控制屏柜、刀閘等10類供電安全相關(guān)設(shè)備的圖片集共300張。將數(shù)據(jù)集進行去重后,仍有254張圖片。從中選取120張圖片作為訓(xùn)練集,50張圖片作為測試集。

    3.1 圖像去重驗證

    當漢明距離的閾值選取為1與5時,去重率較高,但在圖像失真的情況下,閾值為5時的穩(wěn)健性較好,故本文將漢明距離的閾值設(shè)定為5。

    1) 選取要參與去重實驗的文件。本文選擇供電安全管控圖像的文件夾來進行示范實驗,32張圖像的編碼依次從00001到00032。

    2) 存在1組相似圖像的去重實驗。對編號為00001到00022的22張供電安全管控圖像進行去重操作,結(jié)果如圖2(a)所示,可以顯示出較為相似的一組圖像的全部編號,對應(yīng)編號圖像如圖3(a)所示。

    3) 不存在相似圖像的去重實驗。對編號為00003到00021的19張供電安全管控圖像進行去重操作,結(jié)果如圖2(b)所示,不存在相似圖像提示。

    4) 存在2組相似圖像的去重實驗。對編號為00001與00032的32張供電安全管控圖像進行去重操作,結(jié)果如圖2(c)所示,顯示出了2組相似圖像的全部編號,并清晰地表明了與其相似的對象,對應(yīng)編號圖像如圖3(b)所示。

    (a) 存在1組相似圖像的去重結(jié)果

    (a) 第1組相似圖像的相似圖像

    3.2 圖像分類重驗證

    本文對供電安全管控圖像進行如下處理,以實現(xiàn)圖像的分類功能檢驗。

    1) 打標簽。使用labelImg工具為每張圖像上的電力設(shè)備打上對應(yīng)的標簽,例如switchgear、monitor等。

    2) 數(shù)據(jù)增強。通過水平翻轉(zhuǎn)、旋轉(zhuǎn)等方式將訓(xùn)練集數(shù)據(jù)增強至1 200張。

    3) 轉(zhuǎn)換格式。將數(shù)據(jù)集轉(zhuǎn)化為VOC數(shù)據(jù)集的格式以便對其進行后續(xù)的訓(xùn)練。

    4) 對數(shù)據(jù)集進行訓(xùn)練。本文通過損失函數(shù)來對圖像分類的正確性進行表示。使用之前準備好的數(shù)據(jù)集進行訓(xùn)練,對過程中的各部分損失實現(xiàn)可視化,如圖4所示。

    圖 4 損失函數(shù)計算結(jié)果

    從圖4可以看出,損失在不斷變小,最終收斂于一個較為穩(wěn)定的范圍內(nèi),即收斂于4.785%~4.894%,由此可以得出本次訓(xùn)練結(jié)果良好。

    5) 進行對比實驗。通過與densenet169[24]、vgg16[25]、mobilenetv2[26]以及原始Resnet進行準確率對比實驗,實驗結(jié)果如表1所示。

    表 1 實驗結(jié)果

    從表1可以看出,在識別分類不同電氣設(shè)備時,數(shù)據(jù)集去重操作在本實驗中可有效降低模型的損失率和提升模型的準確率。

    4 結(jié) 語

    本文在PHA的基礎(chǔ)上提出了一種BDCT-PHA,并采用改進的Resnet模型,最后實現(xiàn)電力安全管控圖像的去重和分類。仿真實驗表明:所提方法在有效地完成圖片去重的同時可以列出被去重圖片的編號,避免了重復(fù)或者過相似圖片對系統(tǒng)管理影響;利用損失函數(shù)和分類準確率來對結(jié)果進行可視化描述,損失值不斷降低并最終趨于一個相對穩(wěn)定的區(qū)間,證明模型可有效被訓(xùn)練;分類準確率的對比結(jié)果證明所提方法具有良好的分類效果。

    猜你喜歡
    漢明哈希閾值
    小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應(yīng)用
    基于自適應(yīng)閾值和連通域的隧道裂縫提取
    比值遙感蝕變信息提取及閾值確定(插圖)
    河北遙感(2017年2期)2017-08-07 14:49:00
    室內(nèi)表面平均氡析出率閾值探討
    媳婦管錢
    基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
    中年研究
    基于維度分解的哈希多維快速流分類算法
    計算機工程(2015年8期)2015-07-03 12:20:04
    漢明距離矩陣的研究
    基于同態(tài)哈希函數(shù)的云數(shù)據(jù)完整性驗證算法
    計算機工程(2014年6期)2014-02-28 01:25:40
    开封市| 霸州市| 镇安县| 乾安县| 岑巩县| 湘阴县| 阿坝县| 永修县| 汾西县| 若尔盖县| 泗水县| 颍上县| 漠河县| 壤塘县| 岳西县| 长治市| 建平县| 东乡族自治县| 政和县| 通许县| 崇信县| 西畴县| 武山县| 龙陵县| 基隆市| 绥中县| 高阳县| 博客| 巴马| 河北区| 包头市| 津南区| 富川| 枞阳县| 明星| 康保县| 龙口市| 舒兰市| 当雄县| 潮州市| 容城县|