劉庚才,趙紅舉 ,黃 湮,邱文豪,陳 湘
(湖北科技學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,湖北 咸寧 437100)
高光譜遙感(hyperspectral remote sensing)興起于20世紀(jì)80年代,是在成像光譜學(xué)(imaging spectroscopy)的基礎(chǔ)上發(fā)展起來的一種全新遙感技術(shù)[1]。借助高精度的機載或星載成像光譜儀,在記錄地物的二維平面位置信息的同時可采集地物反射或發(fā)射的電磁波存儲在第三維?,F(xiàn)今的成像光譜儀,能在波長間隔達到10nm、波段數(shù)超過100個的分辨率下,從可見光至近紅外區(qū)域,對像元產(chǎn)生一條完整而幾乎連續(xù)的電磁波譜特征曲線。不同的地物表現(xiàn)出不同的光譜特征,其波譜反射曲線特征存在差異性,對高光譜數(shù)據(jù)特征的解譯,為基于高光譜圖像(hyperspectral image, HSI)的分類、分割和目標(biāo)檢測等應(yīng)用提供了可能。
高光譜數(shù)據(jù)光譜通道的高維特性,提高了其應(yīng)用廣泛性的同時也給數(shù)據(jù)的后期處理提出了挑戰(zhàn)。如在分類問題中,數(shù)據(jù)的高維特性所導(dǎo)致的“維數(shù)災(zāi)難”問題(Hughes現(xiàn)象)。為有效挖掘光譜通道中蘊含的有判別作用的特征,科研人員開發(fā)出眾多的分類模型,比如非參數(shù)分類器和參數(shù)分類器。k近鄰分類是可應(yīng)用于高光譜圖像分類的一種經(jīng)典的分類方法[2],屬于一種非參數(shù)的分類器。而諸如最大似然估計模型、高斯混合模型[3]得到的分類器則屬于參數(shù)型分類器。
近十來年,發(fā)端于人臉識別領(lǐng)域的稀疏表示(sparse representation, SR)理論[4]引發(fā)了研究人員的大量關(guān)注。從信號表示的角度看,就是信號可以表示成字典原子(訓(xùn)練集中的樣本)的線性組合,稀疏表示意味著信號可以被字典中同一類別的少數(shù)原子的線性組合表示。這樣,字典中不參與表示的字典原子在線性表示時的系數(shù)為零,此時得到的大多數(shù)分量為零的表示向量稱為稀疏的。后來,Zhang等提出了協(xié)同表示(collaborative representation, CR)分類[5]。這是一種基于最小二乘框架設(shè)計的分類器,但將稀疏表示中的L0正則化替換成L2正則化,該分類器將測試樣本直接表示為全類別樣本的線性組合。實驗表明,協(xié)同表示分類器不僅取得了與稀疏表示同樣的分類精度,而且由于存在解析解,可使表示向量的求解更快。
稀疏表示或協(xié)同表示的策略也被研究人員應(yīng)用于高光譜圖像分類問題[6-7],更多經(jīng)改進的模型也陸續(xù)被提出。如Li等提出的最近正則子空間分類器(NRS)[8],通過對正則化項的進一步優(yōu)化,文章的方法改進了表示分類器的性能。結(jié)合像元的空間關(guān)聯(lián)性,聯(lián)合稀疏表示(JSR)[9]或聯(lián)合協(xié)同表示(JCR)[10]分類模型則明顯提升了僅采用光譜的表示分類器的性能。事實上,高光譜圖像的像元對應(yīng)的地物在地面分布上存在某種連續(xù)性,所以目標(biāo)像元與其周邊一定范圍的像元存在一定的同質(zhì)性,因而它們的光譜有著一定概率的相似性。所以,不管是將一定鄰域范圍內(nèi)的光譜特征綜合到單個目標(biāo)像元上,再對該像元作表示,還是將目標(biāo)像元及其鄰域整體作表示來判定目標(biāo)像元的類別,都可以使待測像元的光譜特征得到加強,提高類別的區(qū)分度。
鑒于在樣本量不是很大的時候,k最近鄰可以以非常簡單、快捷的方式搜索到與目標(biāo)樣本相近的同類樣本,這一算法可用于表示分類模型過完備訓(xùn)練字典的篩選。光譜信息與空間信息的結(jié)合,實實在在地提高了協(xié)同表示模型在面向高光譜圖像分類時的性能。本文將復(fù)合的光譜相似性度量用于測試樣本的個性化字典的構(gòu)建,再結(jié)合非一致性正則化的協(xié)同表示模型,針對光譜信息與空間信息融合后的高光譜圖給出了一種分類算法。文章第一節(jié)給出了一些背景和預(yù)備知識,第二節(jié)給出了分類算法及其過程,第三節(jié)則在通行的數(shù)據(jù)集上開展了算法實驗并分析了實驗的結(jié)果。最后,第四節(jié)對全文進行了總結(jié)。
1.光譜相似性度量與k最近鄰算法
在對光譜數(shù)據(jù)進行解譯時,通常要對光譜的相似性進行度量。以對兩個光譜的相似性度量為例,依托某個特定的光譜相似性度量函數(shù)ρ(·,·):Rd×Rd→R,判定待測光譜y(類別未知)與參考光譜x(類別已知)之間的相似程度,并根據(jù)ρ(y,x)的大小執(zhí)行相應(yīng)的操作,如字典原子的選擇、測試樣本類別的標(biāo)記等。高光譜數(shù)據(jù)分析的幾個主要研究領(lǐng)域,如異常目標(biāo)檢測、地物分類、混合像元分解等,均以光譜相似性度量為基礎(chǔ)[11]。目前主流的對兩個光譜相似性度量的方法可歸納為如下四種:基于距離的光譜相似性度量、基于投影的光譜相似性度量、基于信息散度的光譜相似性度量、基于統(tǒng)計特征的光譜相似性度量。
光譜的幅值決定向量在空間的長度,歐氏距離與其幅值的大小直接相關(guān),反映了幾何空間中兩個點的真實距離,它對光譜的形狀差異不敏感,距離度量小的兩個光譜可能形狀差異比較大?;谕队暗墓庾V相似性度量則可在一定程度上反映出光譜的形狀差異。在光譜向量空間中,光譜的形狀表現(xiàn)為光譜在空間中的方向,兩個光譜的形狀特征差異表現(xiàn)為它們夾角的大小。Kruse等[12]提出計算兩個光譜向量的夾角大小來評價光譜的相似度,夾角越小兩個光譜相似度越高,反之越低。設(shè)xi,xj是兩個d維的光譜向量,則光譜夾角的計算公式為:
dθ(xi,xj)稱為光譜向量xi,xj的光譜角度量(spectral angle metric,SAM)。顯然,光譜角度量具有倍乘不變性,即dθ(αxi,βxj)=dθ(xi,xj),0<α,β≤1。這說明在歐氏空間中,光譜幅值的變化不影響夾角的大小,所以光譜角度量對光譜的形狀差異要比對光譜幅值的變化敏感。這使得光譜角度量能克服因復(fù)雜地形、光照強度和陰影變化等因素對光譜幅值的改變,彌補了光譜幅值利用的不足。光譜角度量方法被廣泛應(yīng)用于光譜角填圖(spectral angle mapping,SAM)研究,在地物分類和巖性識別都有很好的應(yīng)用。研究人員還在光譜角度量的基礎(chǔ)之上提出了光譜梯度角度量,以及核空間的光譜角填圖[11]。
k最近鄰算法是早期分類算法中非常簡便的一種監(jiān)督學(xué)習(xí)方法。kNN分類實際上并沒有創(chuàng)建一個抽象模型,無需花費時間做模型的構(gòu)建,屬于一種懶惰算法,其在訓(xùn)練時間上的耗費基本為零。但它在測試樣本分類時的計算量大,內(nèi)存開銷大。kNN算法的優(yōu)點是明顯的,它易于理解,易于實現(xiàn),無需估計參數(shù),特別適合于多分類問題。對于類域的交叉或重疊較多的待分樣本集來說,kNN方法較很多方法更為適合。
kNN方法的參數(shù)k一般采用交叉檢驗來確定,取值一般低于訓(xùn)練樣本數(shù)的平方根,并且取k=1常常會得到比其他值好的結(jié)果。不過,在樣本充足的情況下,選擇較大的k值能提高抗噪性能。kNN通常用歐氏距離作為度量,前文提到的SAM也可作為選擇最近鄰的度量。改變度量方式可能使選中的待測樣本的最近鄰顯著不同,會導(dǎo)致分類結(jié)果產(chǎn)生較大改變。對于類域的交叉或重疊較多的樣本集來說,比如高光譜數(shù)據(jù)集,kNN方法是不錯的選擇,它可以幫助對訓(xùn)練集做初篩,找到與待測光譜更相似的光譜充當(dāng)表示原子。
2.表示分類模型
研究高光譜圖像分類時,通常假定同一類的光譜分布在同一維度的子空間中。假如測試樣本y∈Rd來自第i 類,稀疏表示分類(SRC)則認為y可以在第i類訓(xùn)練樣本的張成空間近似作線性表示,即
y≈αi,1xi,1+αi,2xi,2+…+αi,nixi,ni=[xi,1xi,2…xini][αi,1,αi,2,…,αi,ni]T=Xiαi,其中αi是選用第i類樣本表示時的系數(shù)向量。實際上,y的類別標(biāo)簽是未知的,這樣y需要在全部訓(xùn)練樣本X的張成上表成線性組合y=Xα,α=[α1;α2;…;αc],是對應(yīng)全部訓(xùn)練樣本的n維列系數(shù)向量。理想情形下,一個屬于第i類的測試樣本的表示系數(shù),除了第i類系數(shù)之外的都應(yīng)該等于零,此時y在X上的表示是稀疏的。
不同于在整個訓(xùn)練集上的協(xié)同表示,Li等提出了逐一在子空間中進行協(xié)同表示的最近正則子空間分類(NRS)方法,該分類器每次僅在一類訓(xùn)練樣本上尋求y的線性表示,并采用關(guān)聯(lián)距離度量的非一致正則化項。NRS既能實現(xiàn)CRC的計算優(yōu)勢,也能體現(xiàn)同類樣本對測試樣本的差異化懲罰,改善了上述SRC和CRC對表示系數(shù)的懲罰一致性不足。
NRS求解表示系數(shù)的算法模型如下,
3.“光譜-空間”聯(lián)合策略
地物分布通常具有一定的連續(xù)性,也就是說,目標(biāo)地物與其周邊一定范圍內(nèi)的地物具有較高概率的同質(zhì)性。對高光譜圖像而言,平面上的某一像元與其幾何距離相近的周邊像元的光譜會比較相似,它們屬于同一類別的可能性大。故而,在高光譜圖像分類中采用“光譜-空間”相結(jié)合的分類方法可以比僅利用光譜特征的分類方法取得更好的分類結(jié)果,因為前者不僅利用光譜特征,也結(jié)合了來自空域的信息。光譜特征與空間信息融合分類一經(jīng)提出,其對分類器性能的提升立刻引發(fā)了大量關(guān)注,成為近幾年的研究熱點。
在表示分類模型中融入空間信息同樣顯著提高了模型的分類性能。如在文[10]提出的稀疏表示模型中,以待測像元為中心,將其正方形鄰域中的全部像元光譜取平均作為待測像元新的光譜,之后對中心像元進行稀疏表示。另如文[9],將待測像元及其正方形鄰域內(nèi)的全部像元當(dāng)成一個像素塊,再對這個像塊進行稀疏表示。這兩種方法都滲透了“光譜-空間”聯(lián)合分類的思想,但在融入空間信息的策略上有所區(qū)別。前者將鄰域的光譜特征信息集中到中心像元上,使得中心像元的光譜特征得到加強,增強了其光譜特征的辨識度,后續(xù)過程處理的是單像元。后者將局部鄰域的光譜連續(xù)性作為考察的重點,后續(xù)過程處理的是像素塊這一整體。這兩種策略都只利用了鄰域像素的光譜特征,并未利用鄰域像素的標(biāo)簽信息。
另外,鄰域的大小,即所選窗口的半徑直接影響所提供空域信息的像元數(shù)目的多少和質(zhì)量的高低。鄰域選擇過大可能導(dǎo)致過多的異質(zhì)像元參與,提供的光譜信息過于混雜,對后續(xù)的分類產(chǎn)生不利后果。鄰域選擇過小會使得空間信息利用不充分,不能充分發(fā)揮“光譜-空間”聯(lián)合策略的優(yōu)勢。鄰域范圍的選擇有固定方式和自適應(yīng)方式,前者對所有測試樣本都選擇同一鄰域尺寸來獲取空間信息,后者對不同測試樣本會自適應(yīng)地選擇鄰域尺寸獲得空間信息[13]。
考慮到在高光譜圖像分類問題中,提供的訓(xùn)練集常具有一定的冗余度,將訓(xùn)練樣本篩選后進行分類可以改善相關(guān)模型的分類性能。本節(jié)把基于距離和基于投影的光譜相似性復(fù)合度量作為kNN算法中最近鄰選擇的度量,生成低冗余度的字典,結(jié)合常用的“光譜-空間”聯(lián)合策略,在表示分類模型的框架下,綜合了CRC和NRS的優(yōu)勢,提出了一種改進后的表示分類器,稱為“基于復(fù)合度量的聯(lián)合表示分類器(CJR)”。
1.復(fù)合度量
為彌補光譜距離度量和光譜角度量在衡量光譜相似度上的不足,采用一種“復(fù)合度量”來衡量像元之間的相似性。這種方法綜合考慮兩個比較像元的光譜距離和光譜夾角,是一種既對光譜的幅值敏感,也對光譜的形狀敏感的度量方式。該復(fù)合度量dC(x,y)表示為,dC(x,y)=(1-cos(dθ(x,y))×dE(x,y),dθ(xi,y)即前文給出的光譜角相似度量,dE(x,y)即常見的歐氏距離度量。容易驗證,復(fù)合度量dC(x,y)滿足“距離度量”的基本性質(zhì)中的“非負性、同一性、對稱性”,但不滿足“直遞性”,即不能保證不等式dC(x,y)≤dC(x,z)+dC(z,y)一定成立。
通常,我們一般基于某種形式的距離來定義“相似度度量”,且參照距離越大相似性越小的原則進行評價。然而,用于相似度度量的距離未必一定滿足距離度量的所有基本性質(zhì),尤其是直遞性[14]。在一些實際分類任務(wù)中所建立的相似度度量不滿足直遞性有其合理的考慮,直遞性不成立并不一定會產(chǎn)生決定性的影響。
此處針對高光譜圖像分類設(shè)計的復(fù)合度量,乘式中的前項發(fā)揮了光譜角度量相似性的長處,降低了復(fù)雜地形中地物的錯誤分類,后項則發(fā)揮了在處理平坦區(qū)域中的地物光譜的優(yōu)勢,因為此時地形的影響降低,光譜亮度值成為地物區(qū)分的重要參考特征。將特定的相似度進行復(fù)合,可以增強像元的細節(jié)信息,提高彼此的區(qū)分度。
2.分類器算法流程
分類器算法可按以下五步實現(xiàn)。
選用高光譜圖像處理中常用的帕維亞大學(xué)(Pavia University)數(shù)據(jù)集[ http://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes#Pavia_University_scene]進行分類實驗。本節(jié)給出了基于歐氏距離度量的kNN(Ed-kNN)方法,基于光譜角度量的kNN(An-kNN)方法,基于復(fù)合度量的kNN(Cm-kNN)方法等三種kNN分類器和聯(lián)合協(xié)同表示(JCR)分類器、復(fù)合度量的聯(lián)合表示(CJR)分類器等兩種表示型分類器的分類結(jié)果及分析。實驗借助安裝在個人電腦的科學(xué)計算軟件MATLAB 8.3進行。
1.數(shù)據(jù)集與評價指標(biāo)
帕維亞大學(xué)數(shù)據(jù)集:數(shù)據(jù)由德國的機載ROSIS成像光譜儀于2003年采自意大利帕維亞市的Pavia University。 圖像地面分辨率為1.3m,經(jīng)裁切后保留610×340個像元,像元原有115個波段(波長范圍0.43-0.86),分類前去除了12個水吸收和噪聲波段,共有9個地面物類,每類的樣本數(shù)見表1。
表1 帕維亞大學(xué)數(shù)據(jù)集類別和樣本數(shù)
對分類器性能的衡量,選取了總體準(zhǔn)確率(OA)、類準(zhǔn)確率(CA)、平均準(zhǔn)確率(AA)、卡帕系數(shù)和分類時間(秒)等五個指標(biāo)進行比較。
2.實驗結(jié)果分析
實驗按每類隨機選取60個樣本組成540個樣本的訓(xùn)練集,各類剩余樣本用于測試。實驗隨機進行了5次,然后計算5次的平均值得到數(shù)據(jù),見表2。表2后五列各給出了一個分類器的分類數(shù)據(jù)統(tǒng)計,另外,還通過圖1—圖3給出了相關(guān)參數(shù)的變化對分類器的總體準(zhǔn)確率影響的對比。其中三個最近鄰型分類器的參數(shù)k、表示分類器的正方形鄰域參數(shù)w和正則化參數(shù)λ均由人工多次試驗,對比結(jié)果后選定。
表2 帕維亞大學(xué)數(shù)據(jù)集五個分類器的結(jié)果(%)對比
表2明顯可見,兩個表示型分類器在指標(biāo)OA、AA和Kappa要明顯優(yōu)于三個最近鄰分類器。在單類的準(zhǔn)確率上,除了在第9類上表示型分類器遜色于三個最近鄰分類器,第5類兩個類型分類器效果相差無幾外,其它七個類都是表示型分類器JCR和CJR占據(jù)較大優(yōu)勢,尤其是第6、8兩個類別。在時間消耗方面,表示算法因為需要計算大量訓(xùn)練樣本的表示系數(shù),所以分類時間達到了最近鄰分類器的近10倍,這是提高準(zhǔn)確率不得不增加的計算成本。對比CJR和JCR的OA/AA/Kappa值和Time值,發(fā)現(xiàn)CJR用相當(dāng)于JCR 42.8%的時間成本就已達到JCR同樣的OA/AA/Kappa值,這說明在表示分類的機理下,訓(xùn)練字典的確存在冗余性,這為表示字典的篩選和改進提供了可研究的空間。
Ed-kNN、An-kNN和Cm-kNN三個分類器都需用到最近鄰參數(shù)k,圖1比較了這三個基于不同相似性度量的最近鄰分類器的OA值依參數(shù)k的走勢。首先,圖1顯示,在帕維亞大學(xué)數(shù)據(jù)集上,參數(shù)k=2時,三個最近鄰分類器都取得最大OA值,之后隨k值增大而減小,這驗證了前文所述多分類問題中一般取較小的k值kNN效果會比較好。另外,1 圖1 Ed-kNN/An-kNN/Cm-kNN的k值對OA值的影響對比 最近鄰參數(shù)k對基于復(fù)合度量從原始訓(xùn)練集中選擇字典原子的CJR分類器的效果產(chǎn)生影響,圖2給出了Cm-kNN與CJR的OA值依最近鄰參數(shù)k的變化趨勢。首先,CJR分類器不同于Cm-kNN的是,k值的增大提升了表示分類器的OA值,而不是像Cm-kNN那樣是減小的。顯然,最近鄰參數(shù)k的增大,意味著表示字典的原子數(shù)目更多,字典的表示能力相應(yīng)會增強,故如圖中曲線可見,k值的增大讓CJR分類器的OA值一直在遞增。但Cm-kNN中較大的k值會使kNN型的分類器的最近鄰數(shù)目增多,會改變最近鄰中各類別的比例,導(dǎo)致錯誤的類別投票結(jié)果。從圖中CJR分類的OA值的增長曲線看出,k值增長對它的OA提升作用邊際效果遞減,后期非常緩慢,基本呈停滯狀態(tài)。這與k值對Cm-kNN的OA值的影響是截然不同的。因為k增大使字典原子達到一定量后,大量有效的字典原子已基本被最近鄰原則搜索到,再次增加原子數(shù)起到的作用不明顯。假如k增大到原訓(xùn)練樣本數(shù)540,其效果就等同于JCR分類,這時最近鄰對字典原子的選擇作用已經(jīng)喪失,還徒增了對原子的排序計算消耗。所以對CJR來說,對其參數(shù)k的選擇要綜合考慮OA提升所付出的計算代價,無限制增大k值肯定是不可取的,表2的CJR分類結(jié)果是在k=60時獲得的。 圖2 Cm-kNN和CJR的k值對OA值的影響對比 圖3 JCR和CJR的鄰域參數(shù)值w對OA值的影響對比 在高光譜圖像的協(xié)同表示分類器中,訓(xùn)練集常有一定的冗余度,直接將全部訓(xùn)練樣本用作字典,會產(chǎn)生一些不必要的時間消耗。故將訓(xùn)練樣本篩選后重建表示字典,可改善分類器的分類性能。采用“光譜-空間”聯(lián)合的策略對初始像元進行加工得到的像元空間信息更豐富,考慮到光譜的物理特性和幾何特征,將兩者融合得到的復(fù)合相似性度量具有互補性,采用該度量作為k近鄰算法的距離選擇標(biāo)準(zhǔn),能構(gòu)建更簡潔的訓(xùn)練字典。在非一致性正則化協(xié)同表示的模型框架下,本文的基于復(fù)合度量的聯(lián)合表示分類器,其精度對比一般的協(xié)同表示分類器不分伯仲,但時間耗費上更為節(jié)省。所以,該分類器提升了常規(guī)的歐氏距離度量或光譜角度量表示分類器的綜合性能。四、總結(jié)