• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      改進(jìn)的基于密度峰值背景純化的高光譜異常檢測(cè)

      2021-09-24 13:13:40湯書路趙春暉
      關(guān)鍵詞:學(xué)習(xí)機(jī)背景光譜

      湯書路,趙春暉,崔 穎

      (哈爾濱工程大學(xué) 信息與通信工程學(xué)院,哈爾濱 150001)

      0 引 言

      高光譜圖像包含二維空間信息和一維光譜信息,具有“圖譜合一”的特點(diǎn)[1]。高光譜圖像具有光譜分辨率高的特點(diǎn),包含非常豐富的地物光譜信息[2],為地物分類、檢測(cè)、識(shí)別提供了很大的可能[3]。目前,在軍事、農(nóng)林業(yè)、土地資源管理和海洋遙感等領(lǐng)域已得到廣泛的使用[4-6]。

      對(duì)高光譜圖像中的目標(biāo)進(jìn)行檢測(cè)可以分為:有先驗(yàn)信息的目標(biāo)檢測(cè)和沒有先驗(yàn)信息的異常目標(biāo)檢測(cè)?!爱惓!敝改繕?biāo)與背景的光譜信息存在很大的差異性[7],這種異常目標(biāo)在高光譜圖像中存在的比例較小。通常在異常檢測(cè)的算法中需要找到異常目標(biāo)與背景的差異,達(dá)到檢測(cè)出異常目標(biāo)的目的。

      在高光譜圖像異常檢測(cè)的算法中,Reed I S[8]提出的 RX 算法最為經(jīng)典。由于異常目標(biāo)和背景在高維特征空間的分布差異性,一種基于核方法的異常檢測(cè)算法應(yīng)運(yùn)而生了,如核 RX(KRX)[9]。Banerjee A等[10]提出了一種新的基于支持向量域描述的非線性檢測(cè)算法 (Support Vector Domain Description,SVDD)。近年,基于表示理論的異常算法逐漸被提出,這些算法摒棄了經(jīng)典算法中對(duì)目標(biāo)、背景和噪聲做出的假設(shè),如基于協(xié)同表示的異常目標(biāo)檢測(cè)算法(Collaborative-Representation-based Detecter,CRD)[11]。此外還有基于稀疏表示的異常目標(biāo)檢測(cè)算法[12],該算法根據(jù)像元的稀疏表示其系數(shù)向量的非零系數(shù)位置來判別該像元是背景還是異常目標(biāo)。上述方法均用到了地物的光譜信息,由于高光譜圖像蘊(yùn)含著豐富的空間信息,利用空間信息有利于提升算法的精度和效果。如Du B等[13]提出的局部和異常檢測(cè)(Local Summation Anomaly Detection, LSAD)把測(cè)試點(diǎn)近鄰域局部窗的多層局部分布與空間和光譜譜特性相結(jié)合,提高了異常目標(biāo)檢測(cè)的性能。為了進(jìn)一步提高檢測(cè)精度,Su H等[14]使用主成分分析方法(Principal Component Analysis,PCA)在局部區(qū)域提取背景的主要像素信息作為CRD的樣本,同時(shí)去除背景中的異常像素信息。

      通常用矩形窗口來提取背景像元,在選定的背景像元中仍有少量的相關(guān)像元及噪聲,對(duì)背景估計(jì)產(chǎn)生影響,降低異常檢測(cè)算法的檢測(cè)精度[15]。為了解決這個(gè)問題,提出了一種改進(jìn)的基于密度峰值背景純化的高光譜圖像異常目標(biāo)檢測(cè)算法。由于高光譜圖像的維度較高,會(huì)造成信息冗余[16]。提出用極限學(xué)習(xí)機(jī)對(duì)原始高光譜圖像進(jìn)行降維,得到一個(gè)低維的特征空間;用基于密度峰值背景純化的算法去除噪聲和異常目標(biāo)的干擾,得到純背景集;用 CRD 算法進(jìn)行異常目標(biāo)檢測(cè),避免了對(duì)背景進(jìn)行假設(shè)估計(jì)。

      1 基于極限學(xué)習(xí)機(jī)和背景純化的高光譜圖像異常目標(biāo)檢測(cè)

      對(duì)高光譜圖像進(jìn)行目標(biāo)檢測(cè)時(shí),直接對(duì)原始的高光譜數(shù)據(jù)進(jìn)行處理,只用到了高光譜數(shù)據(jù)的光譜信息。高光譜圖像光譜維度高,容易造成信息冗余的問題,會(huì)對(duì)最終的異常檢測(cè)結(jié)果產(chǎn)生影響。利用極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)將原始的高光譜數(shù)據(jù)映射到低維的非線性特征空間,避免了“同物異譜,同譜異物”對(duì)檢測(cè)結(jié)果的影響。進(jìn)行異常目標(biāo)檢測(cè)時(shí),會(huì)受到噪聲和異常目標(biāo)的干擾,影響最終的檢測(cè)效果。因此,本文提出利用基于密度峰值背景純化(Density Peak Background Purification,DPBP)的方法獲取純背景集并對(duì)其進(jìn)行異常檢測(cè)(DPBP_AD)算法框圖見圖1。

      1.1 基于極限學(xué)習(xí)機(jī)的特征空間的獲取

      新加坡南洋理工大學(xué)的黃廣斌教授提出的極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種新型單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feed forward neural Networks,SLFNs)學(xué)習(xí)算法[17]。SLFNs逼近擬合理論指出,對(duì)于輸入網(wǎng)絡(luò)中的N個(gè)樣本,確定了激活函數(shù)和隱藏層的節(jié)點(diǎn)數(shù),對(duì)隱藏層權(quán)重和偏置隨機(jī)賦值,可無限地接近N個(gè)樣本。ELM是隨機(jī)確定隱藏層權(quán)重和偏置,找到最優(yōu)的隱藏層和輸出層間的參數(shù),使輸出的誤差盡可能最小,與神經(jīng)網(wǎng)絡(luò)的算法相比,ELM網(wǎng)絡(luò)不需要調(diào)節(jié)隱藏層參數(shù)。ELM的網(wǎng)絡(luò)結(jié)構(gòu)見圖2。p,l和m分別為輸入層、隱藏層和輸出層的節(jié)點(diǎn)個(gè)數(shù);a和b分別為輸入層與隱藏層間的連接權(quán)重和偏置,通過隨機(jī)初始化賦值;β為隱藏層與輸出層間的連接權(quán)值。

      圖2 ELM的網(wǎng)絡(luò)結(jié)構(gòu)

      (1)

      則ELM的輸出表示為

      (2)

      其中:g(·)為激勵(lì)函數(shù),是任意有界的分段連續(xù)函數(shù)。

      β*=H+T

      (3)

      其中:H+為矩陣H的Moore-Penrose 廣義逆??梢宰C明,求得的最小二乘解β*的范數(shù)最小且具有唯一性。

      輸入待測(cè)試的高光譜影像XHSI,根據(jù)式(2),利用訓(xùn)練樣本所求得的最優(yōu)輸出矩陣β*,計(jì)算XHSI在嵌入空間的特征映射:

      YHSI(XHSI)=HHSIβ*

      (4)

      其中,HHSI與訓(xùn)練樣本的H計(jì)算方法相同,通過隨機(jī)初始化賦值。

      由于 ELM 網(wǎng)絡(luò)是一個(gè)有監(jiān)督的網(wǎng)絡(luò),而異常檢測(cè)中沒有異常點(diǎn)的先驗(yàn)信息,因此需要一個(gè)帶標(biāo)簽參考數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò)。參考數(shù)據(jù)需滿足以下2個(gè)要求:①參考數(shù)據(jù)必須是與待測(cè)圖像同源(同源指由同樣的傳感器接收到的高光譜圖像)的帶有標(biāo)簽的數(shù)據(jù)集;②數(shù)據(jù)的維度相同。ELM網(wǎng)絡(luò)訓(xùn)練好后,輸入待測(cè)圖像,得到測(cè)試數(shù)據(jù)的特征空間。

      1.2 基于密度峰值的純背景集的獲取

      1.2.1 基于密度峰值快速搜索的聚類算法

      傳統(tǒng)的聚類方法,如 Kmeans 聚類算法,優(yōu)點(diǎn)是計(jì)算效率高且收斂速度快,適用于實(shí)時(shí)的聚類背景[18]。缺點(diǎn)是結(jié)果差異性較大,算法的魯棒性較差[19]。其他的聚類算法,如啟發(fā)式聚類算法和全局智能優(yōu)化聚類方法等,這些算法的復(fù)雜度較高[20],不適用于較高次數(shù)重復(fù)聚類的高光譜異常探測(cè)。因此 Rodrigurez A等[21]提出了一種基于密度峰值快速搜索的聚類算法(Clustering by Fast Search and Find of Density Peaks,CFSDP),簡(jiǎn)稱密度聚類算法(Density Cluster,DC)。該算法計(jì)算速度快,能夠?qū)θ我庑螤畹姆植歼M(jìn)行聚類,適合對(duì)于維度較高,成分復(fù)雜的高光譜圖像。

      該算法假設(shè):①聚類中心由局部密度較低的鄰域像元包圍;②聚類中心與局部密度較大的像元間的距離較大。通過計(jì)算最小鄰域距離來確定聚類中心,根據(jù)密度將剩余的點(diǎn)歸到相應(yīng)的類別中。假設(shè)待聚類的高光譜數(shù)據(jù)為X=(x1,x2,…,xi,…,xn),n為數(shù)據(jù)的像元總數(shù)。局部密度可表示為

      (5)

      當(dāng)δ值高時(shí),ρ值相對(duì)高的點(diǎn)為聚類中心,ρ值低的點(diǎn)是異常點(diǎn)。確定了聚類中心后,剩余的像元將被歸為最近鄰密度最高的簇。與其他優(yōu)化目標(biāo)函數(shù)的迭代算法不同,該算法的集群分配可以一步完成。

      1.2.2 純背景集的獲取

      1)計(jì)算中心像元與內(nèi)外窗間所有像元的歐氏距離,構(gòu)造距離向量,即

      (6)

      2)在雙窗內(nèi)計(jì)算局部密度,即

      (7)

      (8)

      其中:p為自由參數(shù),表示選取像元的比例。

      1.3 基于協(xié)同表示的異常目標(biāo)檢測(cè)

      不同于經(jīng)典的算法對(duì)異常目標(biāo)、背景和噪聲的假設(shè),CRD 算法是任意背景像元可以近似地由其鄰域像元線性表示,而異常像元?jiǎng)t不能。因此待測(cè)像元的估計(jì)值為

      (9)

      (10)

      式中:λ為拉格朗日乘子;Γy為 Tikhonov 正則化矩陣,即

      (11)

      異常檢測(cè)算子為

      (12)

      獲取純背景集后,改進(jìn)的檢測(cè)算子為

      (13)

      如果δ大于閾值,則γ為異常目標(biāo);反之γ為背景像元。

      2 實(shí)驗(yàn)結(jié)果和分析

      2.1 高光譜實(shí)驗(yàn)數(shù)據(jù)

      實(shí)驗(yàn)中所用的數(shù)據(jù)集均來自機(jī)場(chǎng)—海灘—城市(airport-beach-urban)數(shù)據(jù)集,分別在3個(gè)場(chǎng)景中選取一個(gè)數(shù)據(jù)集來驗(yàn)證算法的有效性。其中 Dataset1 和 Dataset3 均是由機(jī)載可見、紅外成像光譜儀(AVIRIS)傳感器采集的數(shù)據(jù)集,Dataset2 是由德國(guó)的機(jī)載反射光學(xué)光譜成像儀(ROSIS-03)傳感器采集的數(shù)據(jù)集[22]。由于極限學(xué)習(xí)機(jī)是有監(jiān)督的網(wǎng)絡(luò),需要帶有標(biāo)簽的同源且光譜維度相同的數(shù)據(jù)集先對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。因此,截取測(cè)試圖像的1/10作為訓(xùn)練集。各個(gè)數(shù)據(jù)集的信息、偽彩圖和真值圖見表1和圖3。

      表1 各個(gè)數(shù)據(jù)集的基本信息

      圖3 3個(gè)數(shù)據(jù)集的偽彩圖和真值圖

      實(shí)驗(yàn)中以 ROC(Receiver Operating Characteristic)曲線、ROC 曲線下面積 AUC(Area Under Curve)的值和檢測(cè)時(shí)間作為評(píng)價(jià)指標(biāo)[23],實(shí)驗(yàn)使用的硬件環(huán)境是 Intel(R) Core(TM) i5-5200U 處理器,內(nèi)存 8 GB,軟件環(huán)境為 Windows 8.1。

      2.2 實(shí)驗(yàn)結(jié)果及分析

      2.2.1 檢測(cè)結(jié)果

      將提出的方法與5個(gè)經(jīng)典算法(分別為 RX、KRX、CRD、KCRD、BACON 算法)進(jìn)行比較。以 ROC 曲線、AUC 值和檢測(cè)時(shí)間作為不同算法的檢測(cè)性能評(píng)價(jià)指標(biāo),給出了各個(gè)算法對(duì)不同數(shù)據(jù)集的檢測(cè)結(jié)果,見表2。

      由表2可見,提出的方法對(duì)2個(gè)傳感器獲取的3個(gè)不同的數(shù)據(jù)集均能在一定程度上提高檢測(cè)精度。對(duì) AVIRIS 傳感器和 ROSIS-03 傳感器分別獲取的 Dataset1、Dataset2 和 Dataset3 數(shù)據(jù)集,提出的算法在一定程度上縮短了檢測(cè)時(shí)間,與對(duì)比算法中檢測(cè)精度最高的算法相比,檢測(cè)時(shí)間分別縮短了 74.4 s、27.77 s和33.19 s。其中,對(duì) Dataset1 和 Dataset2 來說提出的算法的檢測(cè)時(shí)間最短,而對(duì) Dataset3 數(shù)據(jù)集,提出的算法較 KCRD 算法用時(shí)較長(zhǎng),這可能是由于異常目標(biāo)較大,導(dǎo)致 DPBP_AD 選取的內(nèi)外窗口尺寸較大,影響了檢測(cè)時(shí)間??傊?,提出的方法對(duì)2個(gè)傳感器獲得的數(shù)據(jù)集都能提高檢測(cè)精度。在只要求檢測(cè)精度高時(shí),可選用提出的算法。不同算法對(duì)3個(gè)數(shù)據(jù)集檢測(cè)結(jié)果的 ROC 曲線見圖4。由圖4可見,提出的算法在一定程度上提高了檢測(cè)精度。

      表2 各個(gè)算法對(duì)不同數(shù)據(jù)集的檢測(cè)效果

      圖4 3個(gè)數(shù)據(jù)集檢測(cè)的ROC曲線

      不同算法對(duì)各個(gè)數(shù)據(jù)集的檢測(cè)效果圖見圖5~圖7,由圖5~圖7可見,提出的算法其檢測(cè)效果優(yōu)于其他幾種算法。DPBP_AD算法能有效地檢測(cè)出大多數(shù)異常目標(biāo),并能保持異常形狀。相反,RX、KRX 方法獲得的檢測(cè)圖中很難見到異常目標(biāo)。RX 算法存在許多錯(cuò)誤警報(bào)(圖5(c));與圖5(g) 相比可見局部密度信息能進(jìn)一步純化背景光譜信息。

      圖5 Dataset1的彩色合成圖和比較方法的檢測(cè)圖(第二列為通過人工標(biāo)記獲得的參考檢測(cè)圖)

      圖6 Dataset2的彩色合成圖和比較方法的檢測(cè)圖(第二列為通過人工標(biāo)記獲得的參考檢測(cè)圖)

      2.2.2 DPBP_AD算法的參數(shù)選擇

      根據(jù) AUC 值分析了不同參數(shù)的設(shè)置對(duì)算法性能的影響,在提出的方法中分別有4個(gè)參數(shù):特征空間維數(shù)m;純背景集選取的比例p;內(nèi)外窗口尺寸ωin和ωout。

      特征空間維數(shù)的選取,影響背景和異常目標(biāo)的可分性,也對(duì)異常檢測(cè)的結(jié)果產(chǎn)生影響。選取最優(yōu)特征空間維數(shù)能很大程度上去除冗余信息的同時(shí)最大限度地保留原始信息。3個(gè)數(shù)據(jù)集的最優(yōu)特征空間維數(shù)檢測(cè)結(jié)果由 AUC 值給出,見表3 。由表3可見,當(dāng)最優(yōu)特征空間維數(shù)分別為 10、6 和 13 時(shí),檢測(cè)精度最高,分別為 0.988 7、0.989 0 和 0.964 0。

      表3 各個(gè)數(shù)據(jù)集的最優(yōu)特征空間維數(shù)

      參數(shù)p的選擇是為了保證選取的背景集的純凈性。3個(gè)數(shù)據(jù)集的特征空間維數(shù)均為上述分析結(jié)果下最優(yōu)特征空間維數(shù),改變參數(shù)p的值(從 0.1 到 1)分別對(duì)3組數(shù)據(jù)進(jìn)行異常檢測(cè),探測(cè)結(jié)果同樣由 AUC 值給出見表4。由表4可見,各個(gè)數(shù)據(jù)集中背景集選取的比例對(duì)檢測(cè)結(jié)果的影響。數(shù)據(jù)集 Dataset1、Dataset2 和 Dataset3 的純背景集選取的最佳比例均為 0.8,此時(shí)檢測(cè)性能最好,分別是 0.988 7、0.989 0 和 0.964 0。參數(shù)p的值越接近于 1 的原因在于異常目標(biāo)的分布比較集中。

      表4 各個(gè)數(shù)據(jù)集中純背景集選取的比例對(duì)檢測(cè)性能的影響

      內(nèi)窗口的大小是由中心像元的均勻區(qū)域的大小決定的,外窗口的大小由用于表示中心像元的信息量決定的。即窗口的大小是根據(jù)不同場(chǎng)景中的異常目標(biāo)的大小而改變的。設(shè)置內(nèi)窗口的大小,以滿足中心像元周圍的均勻區(qū)域可以適當(dāng)去除的條件。當(dāng)外窗口足夠大時(shí),說明背景像元能更加精確地表示中心像元。因此,當(dāng)外窗口較大時(shí),算法將獲得較高的 AUC 值。各個(gè)數(shù)據(jù)集內(nèi)外窗口尺寸的選取見表5。由表5可見,數(shù)據(jù)集 Dataset1 和 Dataset2 的最佳窗口尺寸均為ωin=3,ωout=5。而數(shù)據(jù)集 Dataset3 的最佳窗口尺寸為ωin=13,ωout=15。

      表5 內(nèi)外窗尺寸對(duì)不同數(shù)據(jù)集檢測(cè)結(jié)果

      3 結(jié) 論

      高光譜圖像異常目標(biāo)檢測(cè)的效果會(huì)受到噪聲和異常目標(biāo)的干擾、由光譜維度較高導(dǎo)致的信息冗余以及“同物異譜,同譜異物”的影響。提出了一種改進(jìn)的基于密度峰值背景純化的高光譜圖像異常目標(biāo)檢測(cè)算法。利用基于極限學(xué)習(xí)機(jī)的特征空間提取,獲得了低維的非線性特征空間,不僅避免了“同物異譜,同譜異物”的影響,更避免了由于光譜維度較高所帶來的信息冗余的影響,提高了檢測(cè)精度。并且極限學(xué)習(xí)機(jī)結(jié)構(gòu)簡(jiǎn)單,擁有快速的學(xué)習(xí)能力,縮短了檢測(cè)時(shí)間。密度峰值背景純化的方法避免了噪聲和異常目標(biāo)對(duì)檢測(cè)結(jié)果的影響,同時(shí)也有效地挖掘了像元間的空間信息,提高了檢測(cè)精度。DPBP_AD算法不需要對(duì)背景進(jìn)行假設(shè)估計(jì),對(duì)不同的高光譜圖像都具有較好的檢測(cè)結(jié)果,同時(shí)也更適用于真實(shí)的高光譜數(shù)據(jù)。實(shí)驗(yàn)表明,所提的 DPBP_AD算法相比于其他算法,提高了檢測(cè)精度。同時(shí)與 RX、CRD 和 BACON 算法相比,所用的檢測(cè)時(shí)間較短。

      猜你喜歡
      學(xué)習(xí)機(jī)背景光譜
      基于三維Saab變換的高光譜圖像壓縮方法
      “新四化”背景下汽車NVH的發(fā)展趨勢(shì)
      《論持久戰(zhàn)》的寫作背景
      極限學(xué)習(xí)機(jī)綜述
      基于極限學(xué)習(xí)機(jī)參數(shù)遷移的域適應(yīng)算法
      分層極限學(xué)習(xí)機(jī)在滾動(dòng)軸承故障診斷中的應(yīng)用
      晚清外語翻譯人才培養(yǎng)的背景
      星載近紅外高光譜CO2遙感進(jìn)展
      苦味酸與牛血清蛋白相互作用的光譜研究
      一種基于AdaBoost的極限學(xué)習(xí)機(jī)分類方法
      青河县| 广宗县| 揭阳市| 华容县| 华蓥市| 临颍县| 赤壁市| 茶陵县| 红安县| 宣汉县| 桂林市| 城口县| 南雄市| 丹棱县| 揭东县| 长岭县| 浑源县| 唐海县| 疏勒县| 渝北区| 株洲市| 收藏| 麻栗坡县| 钟祥市| 和龙市| 防城港市| 东乌珠穆沁旗| 涿州市| 雷山县| 罗源县| 安吉县| 喀什市| 柘城县| 新晃| 诏安县| 罗平县| 长岛县| 宁夏| 班玛县| 东平县| 贞丰县|