楊華東,郝永平
(沈陽理工大學(xué) 1.信息科學(xué)與工程學(xué)院;2.機(jī)械工程學(xué)院,沈陽 110159)
高光譜遙感成像技術(shù)同時(shí)獲取觀測(cè)目標(biāo)區(qū)域的二維幾何空間信息與一維光譜信息,具有光譜分辨率高,成像波段多且連續(xù)的特點(diǎn),使人們能夠從遙感圖像中獲取的信息有了質(zhì)的轉(zhuǎn)變[1]。然而,由于高光譜傳感器空間分辨率偏低及地物復(fù)雜多樣等因素,圖像中多數(shù)像元的光譜信號(hào)都是多種地物光譜信號(hào)的綜合,即混合像元現(xiàn)象?;旌舷裨F(xiàn)象給地物準(zhǔn)確識(shí)別和精細(xì)分類帶來極大困難,嚴(yán)重阻礙了高光譜遙感技術(shù)定量化應(yīng)用。
高光譜解混技術(shù)將高光譜圖像中的混合像元光譜分解為一組組分光譜,稱為端元,與相應(yīng)組分所占的比例,稱為豐度,是解決混合像元的有效方法[2]。提取混合像元中基本組成成分特征光譜的過程稱為端元提取,而計(jì)算各個(gè)端元在混合像元中所占比例的過程稱為豐度反演。端元提取是混合像元分解的必要前提,端元提取的好壞是混合像元分解效果的關(guān)鍵。
當(dāng)前研究中,基于光譜數(shù)據(jù)在其特征空間中呈凸面單體的幾何特性,從特征空間搜索單體頂點(diǎn)是端元提取最成功、最廣泛的方法。典型方法包括:像元純度指數(shù)(PPI)[3]、自動(dòng)目標(biāo)生成(ATGP)[4]、頂點(diǎn)成分分析(VCA)[5]、NFINDR[6]、單體增長算法(SGA)[7]、正交基方法(OBA)[8]、最小體積約束非負(fù)矩陣分解(MVC-NMF)[9]、最小體積單體分析(MVSA)[10]等。還有一些學(xué)者針對(duì)圖像中的空間信息進(jìn)行研究,發(fā)展了融合空間信息的端元提取方法,如自動(dòng)形態(tài)學(xué)端元提取(AMEE)[11]、空間預(yù)處理(SPP)[12]端元提取算法等。這些方法分別在不同技術(shù)發(fā)展階段獲得了較好的端元提取效果,但這些方法都有一個(gè)共同的缺陷:端元提取未考慮端元變異性,只為每類地物提取出一個(gè)端元,端元光譜代表性差,很難準(zhǔn)確刻畫一個(gè)地物類別,使得混合像元分解精度難以提高。
針對(duì)端元變異問題,本文提出一種結(jié)合局部空間光譜信息的多端元提取方法(MEELSI),通過將原始高光譜圖像劃分為若干不重疊的圖像塊,然后進(jìn)行分塊端元提取,并利用局部空間信息精選優(yōu)化端元光譜,最后對(duì)端元集聚類分組實(shí)現(xiàn)地物光譜多樣化表達(dá)。與傳統(tǒng)僅基于光譜信息的單端元提取方法相比,MEELSI在端元提取過程中充分利用了圖像的光譜信息和局部空間約束,提取的端元能更好地刻畫地物類別,有效提高混合像元分解精度。另一方面,MEELSI可以為影像中的每個(gè)地物類別提取多個(gè)端元光譜,有效解決遙感影像中的光譜變異問題。
(1)
基于線性混合模型,L維像元向量r可以看作是高光譜數(shù)據(jù)特征空間中的一個(gè)點(diǎn),在滿足非負(fù)和全加性約束條件的情況下,全部光譜數(shù)據(jù)在該空間擴(kuò)展成一個(gè)凸面單形體(也稱單體),而端元恰好位于這個(gè)單形體的頂點(diǎn)處,因此,端元提取問題就轉(zhuǎn)化為尋求凸面單形體的問題。
本文提出的結(jié)合局部空譜信息的MEELSI算法包含四個(gè)關(guān)鍵步驟:(1)圖像子空間劃分;(2)基于ATGP的端元自動(dòng)提?。?3)空間信息約束下的端元優(yōu)化選擇;(4)基于光譜相似性的端元聚類。
遙感圖像中,受地勢(shì)、光照、環(huán)境等因素影響,通常會(huì)發(fā)生光譜變異現(xiàn)象,即同一地物類型在不同的區(qū)域所呈現(xiàn)的特征光譜曲線不盡相同,即“同物異譜”現(xiàn)象,圖像空間跨度較大時(shí)更是如此。因此,在不同的圖像空間區(qū)域分別提取端元光譜,為每類地物獲取多個(gè)端元光譜更能刻畫地物類型屬性,同時(shí)也可以有效解決端元光譜變異問題,提高端元提取精度。
MEELSI算法第一步,將原始高光譜圖像劃分為不重疊的圖像子區(qū)域(圖像塊)。本文采用最簡單的方法對(duì)圖像進(jìn)行分割,即以固定的行列數(shù)目對(duì)圖像進(jìn)行劃分,并限制分割后的圖像塊大小為20×20。
在利用ATGP進(jìn)行高光譜圖像端元提取之前,需要確定端元個(gè)數(shù)。Chang等提出了虛擬維數(shù)(virtual dimensionality,VD)[13]概念來解決這個(gè)問題,并給出了相應(yīng)的確定VD噪聲白化的HFC(noise-hitened Harsanyi-Farrand-Chang,NWHFC)算法。本文中高光譜圖像的端元個(gè)數(shù)q采用NWHFC算法確定,然后利用ATGP算法分別在每個(gè)圖像子區(qū)域提取候選端元。
ATGP自動(dòng)提取端元過程簡述如下。設(shè)由NWHFC方法確定的端元個(gè)數(shù)為q,像元向量為r。選擇圖像中具有最大長度的像元向量作為初始端元向量t0,選擇公式如式(2)所示。
(2)
(3)
式中UT和U-1分別是U的轉(zhuǎn)置矩陣和逆矩陣。
ATGP算法易受噪聲和異常像元的影響。文獻(xiàn)[11-12]中指出,圖像中純像元一般位于空間同質(zhì)區(qū),而混合像元通常位于地物類型過渡區(qū)或異質(zhì)區(qū)。因此,在候選端元鄰域內(nèi)(以候選像元為中心大小為d×d的窗口內(nèi),d=3,5,7)搜尋與候選端元光譜近似的像元光譜,以其均值光譜作為新的端元光譜,可以在一定程度上抵消噪聲影響。另一方面,異常像元與其鄰域像元的光譜差異性較大,所以通過比較候選端元與其鄰域像元的光譜相似性,可以有效剔除異常像元。
本文采用光譜角距離(Spectral Angle Distance,SAD)衡量光譜相似性,像元x和y的SAD定義如下。
(4)
SAD的值越小表明兩個(gè)像元的光譜相似性越高。通過合理設(shè)定SAD閾值區(qū)間,可以甄別異常像元和同質(zhì)區(qū)像元。
異常像元光譜與其鄰域像元光譜差異顯著,光譜角的值較大,因此,判定異常像元的SAD閾值一般較大,本文實(shí)驗(yàn)中設(shè)為10(度)。而同質(zhì)區(qū)內(nèi)包含相同地物類型的純像元光譜差異較小,這類光譜差異主要由噪聲引起。因此,SAD閾值一般設(shè)為2~5(度)。實(shí)驗(yàn)中SAD閾值的大小與圖像空間分辨率、噪聲水平以及地物分布等因素都有關(guān)系,應(yīng)根據(jù)實(shí)際情況作相應(yīng)調(diào)整,如噪聲水平低或空間分辨率高時(shí),閾值應(yīng)適當(dāng)減?。环粗嗳?。
在對(duì)所有圖像子區(qū)域進(jìn)行空間信息約束下的端元優(yōu)化后,利用聚類技術(shù)對(duì)所有端元進(jìn)行聚類分組,本文采用K-means聚類算法[14]對(duì)端元集分類。算法中聚類個(gè)數(shù)q由NWHFC方法確定,q個(gè)初始聚類中心通過在端元集上執(zhí)行ATGP算法獲得。在迭代更新聚類中心時(shí),采用SAD作為距離度量。
MEELSI方法流程如圖1所示。首先對(duì)高光譜圖像進(jìn)行圖像空間區(qū)域劃分,然后在所有圖像塊上利用ATGP算法提取候選端元,得到整幅圖像的候選端元集;為提高端元提取精度,利用光譜相似性測(cè)度和局部空間信息分析對(duì)所有候選端元進(jìn)行優(yōu)化,剔除候選端元集中的異常像元和純度較低的候選端元;最后利用K-means聚類算法對(duì)優(yōu)化后的端元集進(jìn)行分組,獲得地物的多端元光譜集。
圖1 MEELSI算法流程
為驗(yàn)證結(jié)合局部空譜信息的高光譜圖像多端元提取算法的正確性和有效性,這一部分將選擇ATGP和NFINDR算法與本文提出的MEELSI算法在仿真高光譜影像和真實(shí)高光譜影像數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)采用的計(jì)算機(jī)硬件環(huán)境為Inter(R) Core(TM) i7-4700MQ CPU 2.4GHz,內(nèi)存8GB,軟件環(huán)境為Microsoft Windows 8.1專業(yè)版,Matlab R2016b。
為評(píng)價(jià)端元提取和豐度估計(jì)精度,分別采用SAD和均方根誤差(Root Mean Square Error,RMSE)兩個(gè)指標(biāo)定量比較。SAD計(jì)算公式見式(4),RMSE計(jì)算公式如式(5)所示。
(5)
從美國地質(zhì)調(diào)查局(USGS)光譜庫中選取3類地物6種端元光譜,分別為明礬石(Alunite-1和Alunite-2,簡記為A1和A2)、水銨長石(Budding-tonite-1和Buddingtonite-2,簡記為B1和B2)和高嶺石(Kaolinite-1和Kaolinite-2,簡記為K1和K2)。利用上述6種光譜合成一幅具有200個(gè)波段120×90的高光譜圖像,示意圖見圖2,生成方式如下。
圖2 合成圖像示意圖
將圖像分為12個(gè)大小為30×30的圖像塊,每個(gè)圖像塊內(nèi)的像元由兩種端元光譜混合而成,混合比例為1:1,從左至右,自上而下端元光譜組成情況依次為(A1,B1)、(A1,B2)、(A2,B1)、(A2,B2)、(A1,K1)、(A1,K2)、(A2,K1)、(A2,K2)、(B1,K1)、(B1,K2)、(B2,K1)、(B2,K2)。為了模擬純像元,分別用大小為10×10的純像元塊替換上述12個(gè)圖像塊的中心區(qū)域(圖中陰影區(qū)域),純像元塊的組成依次為K1、K2、K1、K2、B1、B2、B1、B2、A1、A2、A1、A2。
為模擬真實(shí)的高光譜影像,對(duì)影像先進(jìn)行模板大小為9×9的均值濾波處理,然后附加信噪比(SNR)為30dB的高斯白噪聲。
表1是MEELSI算法與ATGP、NFINDR算法獲得的端元光譜與真實(shí)端元光譜的SAD(以弧度值表示)對(duì)比結(jié)果。
表1 提取的端元光譜與真實(shí)端元光譜的SAD
由于ATGP和NFINDR都是單端元提取方法,因此只能為每類地物提取一條光譜,表1中“*”號(hào)表示該方法未提取到這種端元光譜??傮w來看,MEELSI算法可以為每類地物提取多個(gè)端元代表,而且MEELSI算法的SAD值最小,精度最高。
為進(jìn)一步驗(yàn)證端元提取結(jié)果對(duì)光譜解混精度的影響,本文分別利用ATGP、NFINDR和MEELSI算法提取的端元進(jìn)行豐度估計(jì)。對(duì)于單端元提取算法ATGP和NFINDR,采用經(jīng)典的全約束最小二乘估計(jì)法(Fully Constrained Least Squares,FCLS)[15]估計(jì)豐度。對(duì)于本文提出的多端元提取算法MEELSI,則利用經(jīng)典的多端元光譜混合分析(Multiple Endmember Spectral Mixture Analysis,MESMA)[16]估計(jì)豐度。表2是豐度估計(jì)的RMSE對(duì)比結(jié)果。
表2 真實(shí)豐度與估計(jì)豐度的RMSE
從表2中數(shù)據(jù)可以看出,對(duì)仿真高光譜圖像進(jìn)行多端元提取和多端元混合像元分解,其光譜解混精度要高于傳統(tǒng)單端元光譜解混。
真實(shí)高光譜影像是由AVIRIS成像儀于1997年獲取的位于美國內(nèi)華達(dá)州南部Cuprite礦區(qū)的高光譜數(shù)據(jù)。圖像包含224個(gè)波段,空間分辨率為20m,光譜分辨率為10nm,光譜范圍為0.4~2.5μm。實(shí)驗(yàn)中選取該影像的200×200子區(qū)域作為真實(shí)實(shí)驗(yàn)數(shù)據(jù),如圖3所示。刪除水吸收和低信噪比波段后,剩余188個(gè)波段的數(shù)據(jù)供實(shí)驗(yàn)使用。
圖3 真實(shí)高光譜影像
利用NWHFC方法估計(jì)的端元數(shù)目為14,參考Clark等[17]在該地區(qū)的實(shí)地調(diào)查和礦物填圖結(jié)果,本文在實(shí)驗(yàn)時(shí),選取該地區(qū)內(nèi)分布較多且發(fā)生光譜變異較多的5種典型地物類型進(jìn)行研究。ATGP、NFINDR和MEELSI算法提取的端元光譜與USGS光譜庫中相應(yīng)礦物光譜的SAD結(jié)果見表3所示。
表3 Cuprite數(shù)據(jù)實(shí)驗(yàn)結(jié)果
從表3中可以看出,MEELSI提取的端元光譜和光譜庫中的礦物光譜總體上最為相似。
提出了結(jié)合局部空間和光譜信息的高光譜圖像多端元提取方法,提取的端元能更好地刻畫地物類別,可以有效解決遙感影像中的光譜變異問題,提高了端元提取和光譜解混精度。在仿真數(shù)據(jù)集上,發(fā)生光譜變異的端元提取成功率達(dá)到100%,真實(shí)高光譜圖像數(shù)據(jù)集上的端元提取結(jié)果也更接近光譜庫中的參考光譜。未來將進(jìn)一步改進(jìn)本文的方法,使其適用于數(shù)據(jù)混合度較高的高光譜圖像,同時(shí)設(shè)計(jì)更有效的空間信息分析策略,進(jìn)一步提高算法精度。