黃 鴻,唐玉梟,段宇樂
(重慶大學(xué) 光電技術(shù)與系統(tǒng)教育部重點實驗室,重慶 400044)
高光譜遙感影像包含從可見光到紅外光譜區(qū)域數(shù)十?dāng)?shù)百個狹窄且連續(xù)的光譜波段,其每個像素點包含幾十到幾百維的光譜反射數(shù)據(jù),已廣泛應(yīng)用于資源勘探、精細(xì)農(nóng)業(yè)、災(zāi)害評估以及目標(biāo)識別等領(lǐng)域[1-2]。高光譜影像盡管給地物精確分類帶來了機(jī)遇,但是存在維數(shù)高、波段相關(guān)性強(qiáng)、標(biāo)記樣本較少等問題[3-5]。因此如何降低數(shù)據(jù)冗余,實現(xiàn)鑒別特征提取是高光譜遙感影像研究的前沿與熱點[6]。
維數(shù)約簡方法可以降低數(shù)據(jù)維數(shù),得到高維數(shù)據(jù)有意義的低維表征,有利于解決“維數(shù)災(zāi)難”問題[7]。常用的維數(shù)約簡算法主要有主成分分析(Principle Component Analysis, PCA)[8]、線性判別分析(Linear Discriminant Analysis, LDA)[9]、局部線性嵌入(Local Linear Embedding, LLE)[10]、拉普拉斯特征映射(Laplacian Eigenmaps, LE)[11]、等距映射(Isometric Mapping, ISOMAP)[12]、鄰域保持嵌入(Neighborhood Preserving Embedding, NPE)[13]以及局部保持投影(Locality Preserving Projections, LPP)[14]等。上述方法可統(tǒng)一到圖嵌入框架(Graph Embedding, GE)下,學(xué)者們基于該框架提出了邊界Fisher分析(Marginal Fisher Analysis, MFA)[15]、局部線性判別分析(Losal Fisher Discriminant Analysis, LFDA)[16]、局部幾何結(jié)構(gòu)Fisher分析(Local Geometric Structure Fisher Analysis, LGSFA)[17]等監(jiān)督學(xué)習(xí)方法,通過有效利用樣本數(shù)據(jù)的類別信息提高低維嵌入特征的可分性,提升分類性能。但在實際應(yīng)用中,標(biāo)記樣本往往非常有限,或者需消耗大量的人力財力去進(jìn)行標(biāo)記,同時存在大量的無標(biāo)記樣本可供利用。學(xué)者們提出采用半監(jiān)督學(xué)習(xí)方法提出通過利用標(biāo)記樣本和無標(biāo)記樣本來實現(xiàn)半監(jiān)督特征提取,如半監(jiān)督鑒別分析(Semi-supervised Discriminant Analysis, SDA)[18]、半監(jiān)督局部判別分析(Semi-supervised Local Discriminant Analysis, SELD)[19]和半監(jiān)督稀疏流形嵌入(Semi-supervised Sparse Manifold Embedding, S3ME)[20]等,可進(jìn)一步提升分類性能。
上述圖嵌入方法僅考慮了點與點之間結(jié)構(gòu)關(guān)系,而觀測數(shù)據(jù)在高維空間往往具有復(fù)雜的多元結(jié)構(gòu)[21],因此學(xué)者們提出構(gòu)建超圖模型以表達(dá)數(shù)據(jù)間復(fù)雜結(jié)構(gòu)關(guān)系。Huang等[22]結(jié)合超圖結(jié)構(gòu)與判別局部保留投影的思想提出判別超-拉普拉斯投影(Discriminant Hyper-laplacian Dproiection, DHLP)方法,使投影后的同類數(shù)據(jù)聚集、不同類數(shù)據(jù)遠(yuǎn)離。Sun等[23]提出空-譜超圖嵌入(SS Hypergraph, SSHG)方法,采用擴(kuò)展形態(tài)特征和光譜特征并聯(lián)合超圖嵌入模型的方法學(xué)習(xí)高光譜圖像數(shù)據(jù)的幾何結(jié)構(gòu),同時引入超邊權(quán)重的正則化約束來保持有效的超邊界。Wang等[24]通過空間鄰域內(nèi)的相關(guān)像素來構(gòu)造約束字典并激活相關(guān)點、抑制不相關(guān)點,提出一種空-譜局部約束彈性網(wǎng)超圖學(xué)習(xí)模型并應(yīng)用于高光譜圖像地物聚類。在超圖方法中,超邊由多頂點連接構(gòu)成,使超邊更易連接成圖,有效表征數(shù)據(jù)間的多元結(jié)構(gòu)關(guān)系。超邊權(quán)重為其所包含頂點之間兩兩相似度的和,兩點之間的相似關(guān)系同時也受超邊內(nèi)其他頂點的影響,這種“平均”效應(yīng)削弱了兩點之間的直接聯(lián)系。因此,如何有效聯(lián)合簡單圖和超圖模型,以有效表征高維數(shù)據(jù)本質(zhì)結(jié)構(gòu),成為高光譜數(shù)據(jù)維數(shù)約簡過程中的關(guān)鍵所在。
針對上述問題,本文提出一種半監(jiān)督多圖嵌入(Semi-Supervised Multi-Graph Embedding, SSMGE)的維數(shù)約簡方法,以兩類圖的協(xié)同結(jié)構(gòu)表征數(shù)據(jù)在高維空間中的結(jié)構(gòu),實現(xiàn)高光譜數(shù)據(jù)鑒別特征提取。該方法通過樣本數(shù)據(jù)的歐式近鄰點以尋找數(shù)據(jù)在高維空間的位置關(guān)系,利用有標(biāo)記樣本和無標(biāo)記樣本分別構(gòu)建監(jiān)督、非監(jiān)督超圖以表征其多元關(guān)系,并使用有標(biāo)記樣本構(gòu)建普通圖,然后通過多圖協(xié)同方式來表征數(shù)據(jù)間的復(fù)雜幾何結(jié)構(gòu)。在低維嵌入空間中,加強(qiáng)類內(nèi)圖和本征圖的結(jié)構(gòu),抑制類間圖和懲罰圖的關(guān)系,實現(xiàn)鑒別特征提取,進(jìn)而有效改善地物的分類性能。在PaviaU和Urban高光譜數(shù)據(jù)集上的實驗結(jié)果證明了本文方法的有效性。
本文中,高光譜數(shù)據(jù)集表示為X=[Xl,Xu]∈RB×n,B為波段數(shù),n為樣本總數(shù),其中標(biāo)記樣本集為Xl=[(xl,1,l1),(xl,2,l2),...,(xl,nl,lnl)]∈RB×nl,li∈{1,2,...,m},m為樣本類別數(shù),無標(biāo)記樣本集為Xu=[xu,1,xu,2,...,xu,nu]∈RB×nu,nl為有標(biāo)記樣本數(shù),nu為無標(biāo)記樣本數(shù),n=nl+nu。低維嵌入特征表示為Y=[yl,1,yl,2,...,yl,nl,yu,1,yu,2,...,yu,nu]∈Rd×n,其中d為低維特征的嵌入維數(shù),Y=PTX,P∈RB×d為投影矩陣。
為更好地理解PCA,LDA,LLE,LE,ISOMAP,NPE,LPP等維數(shù)約簡算法,YAN等[25]提出圖嵌入模型并將上述算法統(tǒng)一到該框架下。在圖嵌入模型中,需構(gòu)建本征圖G={V,W}以表征數(shù)據(jù)的統(tǒng)計及幾何特性,其中V=[v1,v2,...,vn]∈RB×n為頂點集,W=[wij]∈Rn×n為權(quán)重矩陣,wij為頂點vi和vj之間的權(quán)值。
圖嵌入模型的主要目的是使圖中的頂點在低維嵌入過程中保持頂點間的相似關(guān)系,實際應(yīng)用中可能會加入懲罰圖使不相似數(shù)據(jù)盡量遠(yuǎn)離。因此,其目標(biāo)函數(shù)可表示如下:
(1)
超圖與普通圖的區(qū)別主要在于邊與超邊內(nèi)頂點的數(shù)量不同,普通圖的邊僅表示兩點之間的關(guān)系,而超圖的邊包含多個頂點,多點連接的不同超邊共享更多的頂點,使超邊更易連接成圖,兩類圖從不同角度來表征高維數(shù)據(jù)中的結(jié)構(gòu)關(guān)系。超圖模型可表示為GH={VH,EH,WH},其中EH為超邊集,VH為超邊集,超邊ei∈EH,其權(quán)值w(eH)∈WH。關(guān)聯(lián)矩陣H=[h(vi,ej)]i,j∈R|VH|×|EH|表示頂點vi與超邊ej的關(guān)系,頂點的度d(vi)表示連接頂點的超邊權(quán)重之和,超邊的度d(ei)表示為每條超邊上頂點的個數(shù),其定義如下:
(2)
(3)
(4)
超圖與普通圖的邊主要區(qū)別在于頂點連接成邊的方式不同,如圖1(a)所示,該圖共包含3條超邊和15條普通邊,普通圖的每個邊僅僅連接兩個頂點,而超圖的邊由多個頂點構(gòu)成,例如超邊e1,e2分別由頂點子集{v1,v2,v5},{v2,v3,v4}構(gòu)成。由于超邊間的頂點子集有重疊部分,因此可以連接超邊構(gòu)成超圖,相比普通圖,超圖更能更高
圖1 普通圖與超圖結(jié)構(gòu)對比Fig.1 Example of simple graph and hypergraph
效的揭示頂點間復(fù)雜的多元幾何關(guān)系。圖1(b),{e4,...,e18}為普通圖的邊,超邊集{e1,e2,e3}構(gòu)成超圖關(guān)聯(lián)矩陣H,H表示為每條超邊所包含的頂點,1表示某超邊包含對應(yīng)的頂點,0表示不包含相應(yīng)的頂點。
為有效利用高光譜數(shù)據(jù)中少量的標(biāo)記樣本和數(shù)量較多的無標(biāo)記樣本,并解決單一構(gòu)圖方法表征結(jié)構(gòu)不足等問題,提出一種半監(jiān)督多圖嵌入(Semi-supervised Multi-graph Embedding, SSMGE)算法,實現(xiàn)鑒別特征提取。該算法首先利用標(biāo)記樣本計算得到其近鄰點,構(gòu)建有監(jiān)督類內(nèi)超圖、類間超圖和類內(nèi)普通圖、類間普通圖,并利用無標(biāo)記樣本的近鄰點和遠(yuǎn)離點分別構(gòu)造無監(jiān)督本征超圖和懲罰超圖,以實現(xiàn)多圖協(xié)同表征高光譜數(shù)據(jù)的本征結(jié)構(gòu)。在低維嵌入空間中,使類內(nèi)圖和本征圖中的數(shù)據(jù)盡量聚集,類間圖和懲罰圖內(nèi)中的數(shù)據(jù)盡可能遠(yuǎn)離,以提取低維鑒別特征,進(jìn)而提升分類器分類性能。該算法流程如圖2所示。
圖2 SSMGE算法流程圖Fig.2 Flowchart of proposed SSMGE method
2.3.1 有監(jiān)督普通圖與超圖構(gòu)建
在高光譜遙感數(shù)據(jù)中,同類地物對各個波段光譜的反射能力具有相似性,因此可利用光譜數(shù)據(jù)的歐氏距離來度量其近鄰關(guān)系。普通圖和超圖主要結(jié)構(gòu)差異在于圖的連接方式不同,普通圖僅僅是兩點構(gòu)成邊,超圖多點構(gòu)成超邊。
根據(jù)樣本的類別信息與樣本間的歐式距離來構(gòu)建普通圖和超圖,包括類內(nèi)普通圖、類間普通圖Gw={Vw,Ww},Gb={Vb,Wb}和類內(nèi)超圖GHw={Vw,EHw,WHw}、類間超圖GHb={Vb,EHb,WHb},其中Vw,Vb為類內(nèi)、類間圖頂點集,VHw,VHb為類內(nèi)、類間超圖頂點集,EHw,EHb為類內(nèi)、類間超邊集,Ww,Wb為類內(nèi)、類間圖Gw,Gb的權(quán)重矩陣,WHw,WHb為超邊集EHw,EHb對應(yīng)的權(quán)重矩陣。
類內(nèi)超邊權(quán)值定義為:
類內(nèi)超圖的關(guān)聯(lián)矩陣Hw定義如下:
(6)
基于超邊權(quán)值WHw和關(guān)聯(lián)矩陣Hw可計算頂點vi∈Vw的度:
(7)
(8)
與此同時,類間超圖的超邊權(quán)值可表示為:
(9)
其相應(yīng)的類間超圖的關(guān)聯(lián)矩陣Hb表示為:
(10)
(11)
(12)
為提取出數(shù)據(jù)在低維空間的投影特征,使類內(nèi)圖盡量靠近,類間圖盡量遠(yuǎn)離,由式(5)~式(12)可計算出超圖的目標(biāo)函數(shù):
(13)
(14)
(15)
(16)
(17)
(18)
在低維嵌入空間中,為提取低維鑒別特征,應(yīng)使類內(nèi)圖和類內(nèi)超圖更加緊密,類間圖和類間超圖更加遠(yuǎn)離?;诖?,可聯(lián)合式(15)和式(18)構(gòu)建以下目標(biāo)函數(shù):
(19)
式中:α為平衡類內(nèi)超圖和普通圖權(quán)衡系數(shù),β為平衡類類間超圖和普通圖的權(quán)衡系數(shù)。
2.3.2 無監(jiān)督超圖構(gòu)建
由于在實際應(yīng)用中,標(biāo)記樣本往往非常有限,僅通過標(biāo)記樣本不足以有效表征高維數(shù)據(jù)的復(fù)雜結(jié)構(gòu),因此可通過無標(biāo)記樣本構(gòu)建非監(jiān)督超圖來進(jìn)一步表征其多元結(jié)構(gòu)關(guān)系。為此,選取每個樣本的近鄰點構(gòu)建無監(jiān)督本征圖,使其盡量靠近,選取遠(yuǎn)離點構(gòu)建無監(jiān)督懲罰圖,使其盡量遠(yuǎn)離。無監(jiān)督超圖的超邊權(quán)重、關(guān)聯(lián)矩陣、頂點的度和超邊的度定義如下:
(20)
(22)
(23)
(24)
(25)
(26)
(27)
由此,可得到無監(jiān)督超圖的目標(biāo)函數(shù):
(28)
進(jìn)一步優(yōu)化上述目標(biāo)函數(shù)為:
(29)
結(jié)合式(19)與式(29),本文提出的半監(jiān)督多圖融合嵌入(SSMGE)算法的目標(biāo)函數(shù)可表示為:
(30)
根據(jù)拉格朗日乘子法,式(30)中的最優(yōu)化問題可被轉(zhuǎn)換為求解如下廣義特征值問題:
(31)
算法:半監(jiān)督多圖融合嵌入(SSMGE)輸入:高光譜數(shù)據(jù)集X=[Xl,Xu]∈RB×n,無標(biāo)簽樣本Xu=[xu,1,xu,2,...,xu,nu]∈RB×nu,帶標(biāo)簽樣本Xl=[(xl,1,l1),(xl,2,l2),...,(xl,nl,lnl)]∈RB×nl,有監(jiān)督圖和超圖類內(nèi)、類間近鄰點數(shù)intraK,interK,無監(jiān)督超圖近鄰點和遠(yuǎn)離點數(shù)uK,低維嵌入維度d,平衡參數(shù)α,β。輸出:低維嵌入特征Y=PTX∈Rd×n,PT∈RB×n為投影矩陣 1.將高光譜數(shù)據(jù)集X進(jìn)行歸一化處理,并隨機(jī)選取一定數(shù)量標(biāo)記樣本和無標(biāo)記樣本進(jìn)行訓(xùn)練;2.計算并選取帶標(biāo)簽樣本的intraK個類內(nèi)近鄰點、interK個類間近鄰點,構(gòu)建監(jiān)督普通圖和超圖;3.計算監(jiān)督普通圖的拉普拉斯矩陣Lw=Dw-Ww,Lb=Db-Wb;4.計算監(jiān)督超圖的拉普拉斯矩陣LwH=Dwv-HwWHwDwe-1HwT,LbH=Dbv-HbWHbDbe-1HbT;5.計算并選取無標(biāo)簽樣本近鄰點和遠(yuǎn)離點各uK個,構(gòu)建無監(jiān)督超圖;6.計算無監(jiān)督超圖的拉普拉斯矩陣LwHu=Dwvu-HwuWHwuDweu-1HwuT,LbHu=Dbvu-HbuWHbuDbeu-1HbuT;7.由式(30)構(gòu)建多圖融合優(yōu)化目標(biāo)函數(shù);8.求解式(31)廣義特征值問題,得到特征投影向量P,低維嵌入特征Y=PTX∈Rd×n。
為驗證SSMGE算法的有效性,本文在PaviaU和Urban高光譜數(shù)據(jù)集上進(jìn)行地物分類實驗,并與相關(guān)算法進(jìn)行對比。
University of Pavia (PaviaU)數(shù)據(jù)集于2002年由ROSIS傳感器拍攝意大利北部Pavia大學(xué)的高光譜圖像。該圖像大小為610×340 pixel,空間分辨率為1.3 m,共有115個光譜波段,去除其中12個受噪聲影響的波段,剩余103個波段用于實驗。該圖像包含瀝青、草地、碎石、樹和裸土等9類地物及其相應(yīng)的標(biāo)簽信息,其假彩色圖像和真實地物圖像如圖3所示。
圖3 PaviaU高光譜圖像Fig.3 University of Pavia hyperspectral image
Urban數(shù)據(jù)集于1995年由HYDICE傳感器拍攝美國德克薩斯州胡德堡附近地區(qū)的高光譜圖像,該圖像大小為307×307 pixel,空間分辨率為4 m,共有210個波段,去除其中1~4,76,87,101~111,136~153,198~210共48個受噪聲影響的波段,剩余162個波段用于實驗。該圖像包含建筑、陰影、瀝青路、混凝土路、草地和樹6類地物,其假彩色圖像和真實地物圖像如圖4所示。
圖4 Urban高光譜圖像Fig.4 Urban hyperspectral image
實驗中,在數(shù)據(jù)集中隨機(jī)選取一定數(shù)量標(biāo)記樣本和無標(biāo)記樣本作為訓(xùn)練集,其余作為測試集,其中無/半監(jiān)督算法采用整個訓(xùn)練集進(jìn)行學(xué)習(xí),而監(jiān)督算法只利用其中的標(biāo)記樣本。首先采用各種維數(shù)簡約算法計算得到投影矩陣,然后得到測試樣本的低維嵌入特征,最后采用最近鄰分類器(1-NN)進(jìn)行分類,每組實驗均進(jìn)行10次重復(fù)實驗,并用總體分類精度(Overall Accuracy, OA)、平均分類精度(Average Accuracy, AA)和Kappa系數(shù)(κ)作為評價指標(biāo)。實驗中選取了RAW,PAC,LDA,MFA,LGSFA,DHLP和S3ME與本文提出的SSMGE方法進(jìn)行對比,其中RAW為直接對原始數(shù)據(jù)進(jìn)行分類。各算法參數(shù)均通過交叉驗證調(diào)到最佳,MFA的類內(nèi)、類間近鄰數(shù)分別選取為3,60,LGSFA中參數(shù)k和β設(shè)為9和20,S3ME的加權(quán)參數(shù)β和系數(shù)平衡參數(shù)λ設(shè)為5和20。LDA低維嵌入維數(shù)為c-1,c為類別數(shù),其余算法嵌入維數(shù)為30。
為探究本算法中類內(nèi)、類間近鄰點數(shù)目intraK和interK對總體分類精度的影響,從數(shù)據(jù)集中每類選取80個標(biāo)記樣本、400個無標(biāo)記樣本進(jìn)行訓(xùn)練,其余作為測試樣本。在實驗中,在PaviaU數(shù)據(jù)集中intraK和interK參數(shù)區(qū)間設(shè)置為{5,10,...,50},在Urban中設(shè)為{3,5,...,25},且α=β=0.5,uK=60。圖5為SSMGE算法在不同類內(nèi)、類間近鄰點數(shù)下的分類結(jié)果。
由圖5可知,分類精度隨類內(nèi)近鄰點數(shù)的增加先有所提升后下降,這是由于隨著類內(nèi)近鄰點增加可更有效的表征高光譜數(shù)據(jù)結(jié)構(gòu),有利于鑒別特征提取,但是近鄰點過多,會導(dǎo)致相似度低的數(shù)據(jù)點引入構(gòu)建類內(nèi)圖,導(dǎo)致不能有效表征同類數(shù)據(jù)間本征結(jié)構(gòu);而類間點增加有利于表征不同類數(shù)據(jù)之間區(qū)別,但是過多類間點會導(dǎo)致計算復(fù)雜度增加。根據(jù)圖5中的實驗結(jié)果,將PaviaU,Urban數(shù)據(jù)集上(intraK,interK)分別設(shè)置為(25, 20)和(11, 7)。
為探究平衡參數(shù)α和β對結(jié)果的影響,繼續(xù)下一步實驗,其它參數(shù)不變,在兩數(shù)據(jù)集中將α和β均設(shè)置為{0,0.01,0.1,0.2,...,0.9,1}。圖6為不同α,β參數(shù)值下的分類結(jié)果。
由圖6可知,本文提出的多圖協(xié)同表征方法的分類性能均優(yōu)于普通圖/超圖此類單一圖嵌入方法,這表明簡單圖和超圖具有互補性,有益于高光譜數(shù)據(jù)復(fù)雜結(jié)構(gòu)表征。同時,本文方法在取得較好分類性能時,α往往要大于β,這說明超圖模型在提取鑒別特征時更為重要。依據(jù)圖6 中實驗結(jié)果,本文在PaviaU,Urban數(shù)據(jù)集上將平衡參數(shù)(α,β)分別設(shè)定為(0.7, 0.7)和(0.3, 0.4)。
圖5 SSMGE在不同intraK和interK參數(shù)下的OAFig.5 OAs of SSMGE with different values of parameters intraK and interK on PaviaU and Urban data sets
圖6 SSMGE在不同α和β參數(shù)下的OAFig.6 OAs of SSMGE with different values of parametersαandβon PaviaU and Urban data sets
為探究無標(biāo)記樣本的近鄰點和遠(yuǎn)離點數(shù)對實驗的影響,隨機(jī)選取無標(biāo)記訓(xùn)練樣本400個。為簡化實驗過程,在此將無標(biāo)記樣本的近鄰點與遠(yuǎn)離點均設(shè)置為uK,其在兩個高光譜數(shù)據(jù)集上調(diào)試范圍為{20,40,...,200,250,300},具體分類結(jié)果如圖7所示。同時,為分析無標(biāo)記樣本數(shù)量對分類性能的影響,設(shè)置無標(biāo)記樣本數(shù)為{50,100,200,400,...,4 000}進(jìn)行測試,其分類結(jié)果如圖8所示。
由圖7可知,OA和kappa隨無標(biāo)記樣本近鄰點數(shù)和遠(yuǎn)離點數(shù)的增加先有所提升后開始下降,這是由于利用適量的無標(biāo)記樣本的近鄰點和遠(yuǎn)離點可更有效表征數(shù)據(jù)間的本征結(jié)構(gòu)。由圖8可知,無標(biāo)記樣本的增加可它提供更多信息,有利于特征提取,分類精度也隨之增加,但是過多無標(biāo)記樣本不僅會存在冗余信息,且會增加計算復(fù)雜度。因此,選擇合適的其近鄰點、遠(yuǎn)離點數(shù)和無標(biāo)記樣本數(shù)可以在分類精度和計算復(fù)雜度之間取得平衡?;趫D7和8的實驗結(jié)果,在PaviaU和Urban數(shù)據(jù)集上uK分別設(shè)置為120和140,無標(biāo)簽樣本數(shù)分別設(shè)置為600和800。
圖7 SSMGE在不同uK參數(shù)下的OAFig.7 OAs of SSMGE with different values of parameters unK on PaviaU and Urban data sets
圖8 SSMGE在不同無標(biāo)記樣本數(shù)下的OAFig.8 OAs of SSMGE with different numbers of unlabeled samples on PaviaU and Urban data sets
在實驗中,從PaviaU數(shù)據(jù)集中每類隨機(jī)選取5,10,20,40,60,80個有標(biāo)記樣本和600個無標(biāo)記樣本作為訓(xùn)練集,剩余樣本作為測試集。采用1-NN分類器進(jìn)行分類,每次實驗重復(fù)10次。表1表示不同維數(shù)約簡方法算法的分類結(jié)果。
由表1可知,各算法的分類精度隨訓(xùn)練樣本數(shù)的增加而增加,是由于訓(xùn)練樣本數(shù)增加,其中的信息就越豐富,越利于特征提取,可改善分類效果。在標(biāo)記樣本較少的情況下,LDA,LGSFA,DHLP監(jiān)督方法由于過擬合導(dǎo)致分類精度較低,但隨著標(biāo)記樣本的增多逐漸表現(xiàn)出其優(yōu)勢,而半監(jiān)督算法S3ME利用無標(biāo)記樣本解決標(biāo)記樣本不足的問題,利用半監(jiān)督圖有效表征數(shù)據(jù)的內(nèi)部結(jié)構(gòu),獲得較好的分類效果。本文提出的SSMGE算法基于多圖協(xié)同表征的思想,通過充分利用有標(biāo)記和無標(biāo)記樣本構(gòu)建簡單圖和超圖,實現(xiàn)高光譜數(shù)據(jù)中復(fù)雜結(jié)構(gòu)表征。該方法不僅解決DHLP算法在標(biāo)記樣本較少時情況下超圖模型構(gòu)建不準(zhǔn)確問題,同時比S3ME方法中單一圖模型更有效表示數(shù)據(jù)中多元結(jié)構(gòu)關(guān)系,其低維嵌入特征可分性更好,可獲得更優(yōu)的分類精度。
表1 不同算法在PaviaU數(shù)據(jù)集上的分類結(jié)果(總體分類準(zhǔn)確度±標(biāo)準(zhǔn)差(%) (kappa系數(shù)))
Tab.1 Classification results with different numbers of training samples on the PaviaU data set(OA ± std (%) (KC))
算法1020406080RAW64.30±5.26(0.558)67.27±1.90(0.592)71.21±1.78(0.637)73.60±1.57(0.664)75.55±0.74(0.688)PCA64.30±5.56(0.558)67.27±2.00(0.592)71.22±1.89(0.637)73.56±1.66(0.664)75.54±0.81(0.688)LDA29.51±5.12(0.171)59.48±2.03(0.493)71.19±1.61(0.634)74.63±1.62(0.675)78.37±0.78(0.721)MFA67.66±3.64(0.598)71.76±2.03(0.645)75.25±2.84(0.686)76.58±2.92(0.702)78.08±1.83(0.719)LGSFA52.17±5.29(0.419)64.58±3.58(0.556)70.71±3.11(0.630)75.45±1.63(0.686)78.72±1.44(0.725)DHLP63.52±2.99(0.544)64.02±2.69(0.551)69.53±2.12(0.616)74.32±1.74(0.673)78.34±0.98(0.721)S3ME67.28±3.29(0.592)73.46±3.22(0.664)78.49±2.33(0.725)82.58±1.33(0.775)83.74±1.06(0.789)SSMGE68.46±2.89(0.607)75.08±2.32(0.684)80.64±1.74(0.752)83.61±1.04(0.788)85.42±0.95(0.810)
為探索各算法在各類地物上的分類性能,從PaviaU數(shù)據(jù)集中每類隨機(jī)選取80個的標(biāo)記樣本、600個的無標(biāo)記樣本作為訓(xùn)練集,剩余樣本作為測試集。表2為各類算法采用1-NN分類器測試各類樣本的結(jié)果,包含總體分類精度、平均分類精度、kappa系數(shù)和降維時間(DR Time),圖9為各算法在整個數(shù)據(jù)集上的分類結(jié)果圖。
由表2可知,SSMGE在大多數(shù)地物類別中都具有較好的分類效果,具有最好的OA,AA和kappa系數(shù)。相比于S3ME算法,本文方法在訓(xùn)練時間上具有明顯的優(yōu)勢,這是由于S3ME采用稀疏表示的方法表征數(shù)據(jù)之間聯(lián)系,計算復(fù)雜較高。在圖9中,本文方法在“Meadows”,“Bitumen”,“Bricks” 等地物中分類效果較好,錯分點少,這是由于多圖結(jié)構(gòu)更能協(xié)同表征出數(shù)據(jù)的本征屬性,去除冗余信息,提取出更有利于區(qū)分不同地物的鑒別特征,有利于分類。
表2 各類算法對PaviaU數(shù)據(jù)集每類地物的分類結(jié)果
圖9 各類算法在PaviaU數(shù)據(jù)集上降維后的分類結(jié)果圖Fig.9 Classification maps of different DR methods with 1-NN for the PaviaU data set
從Urban數(shù)據(jù)集中每類地物隨機(jī)選取10,20,40,60,80個有標(biāo)記樣本和800個無標(biāo)記樣本作為訓(xùn)練集,剩余樣本作為測試集進(jìn)行實驗,表3為各維數(shù)簡約算法在不同標(biāo)記樣本下采用1-NN分類器進(jìn)行分類的實驗結(jié)果。
表3 不同算法在Urban數(shù)據(jù)集上的分類結(jié)果(總體分類準(zhǔn)確度±標(biāo)準(zhǔn)差(%)(kappa系數(shù)))
Tab.3 Classification results with different numbers of training samples on the Urban data set(OA ± std (%) (KC))
算法1020406080RAW69.92±3.68(0.547)71.84±2.93(0.571)73.36±2.20(0.592)75.20±1.61(0.616)75.69±0.98(0.623)PCA69.92±3.86(0.547)71.84±3.09(0.571)73.37±2.31(0.592)75.18±1.68(0.615)75.69±1.04(0.623)LDA67.03±4.14(0.513)57.77±3.32(0.397)66.67±3.34(0.507)76.29±2.07(0.633)78.18±1.31(0.660)MFA73.16±2.65(0.592)74.48±2.65(0.609)75.79±1.37(0.628)76.54±2.16(0.637)77.09±1.39(0.645)LGSFA65.40±5.21(0.500)74.95±1.74(0.612)76.48±1.87(0.637)78.36±2.31(0.662)78.65±1.00(0.666)DHLP73.14±2.87(0.592)74.91±1.20(0.616)75.16±2.39(0.619)77.51±3.14(0.650)77.45±1.09(0.650)S3ME73.49±3.20(0.594)76.73±2.12(0.639)76.36±2.39(0.636)78.36±2.81(0.664)79.04±1.29(0.673)SSMGE74.14±2.90(0.606)77.16±1.92(0.645)78.09±1.37(0.659)79.38±2.30(0.678)80.07±0.81(0.687)
由表3可知,MFA,LGSFA,DHLP等圖嵌入算法要明顯優(yōu)于PCA,LDA等傳統(tǒng)算法,說明圖嵌入能更有效表征數(shù)據(jù)的幾何結(jié)構(gòu);半監(jiān)督圖嵌入算法S3ME,SSMGE優(yōu)于其他監(jiān)督算法,這是由于半監(jiān)督方法可充分利用標(biāo)記樣本和無標(biāo)記樣本間的信息,提升了地物分類性能;本文SSMGE方法在各種訓(xùn)練條件下分類結(jié)果均優(yōu)于其他方法,這是由于其通過融合普通圖和超圖中的有用信息,從而可更充分表征高光譜數(shù)據(jù)的復(fù)雜結(jié)構(gòu)關(guān)系,并增強(qiáng)同類數(shù)據(jù)的聚集性和不同類數(shù)據(jù)的遠(yuǎn)離性,改善特征提取效果,提升地物分類精度。
為進(jìn)一步研究各算法對各類地物的特征提取性能,從Urban數(shù)據(jù)集每類中隨機(jī)選取80個有標(biāo)記樣本和800個無標(biāo)記樣本作為訓(xùn)練樣本,其余作為測試樣本。表4為不同算法在每類地物上維數(shù)約簡后采用1-NN分類器分類的結(jié)果,包含OA,AA,Kappa和降維時間,圖10為各種算法在整個Urban數(shù)據(jù)集上分類結(jié)果圖。由表4可知,相對其他算法,SSMGE在該數(shù)據(jù)集大部分類別地物上都均能獲取更好的分類效果,且在圖10中“Grass”,“Concrete”等地物具有較為光滑的分類結(jié)果,錯分點少,表明多圖協(xié)同嵌入方法比單圖嵌入方法更能表征數(shù)據(jù)的內(nèi)部結(jié)構(gòu),提取出更有利于提高分類效果的低維嵌入特征。
表4 各類算法對Urban數(shù)據(jù)集每類地物的分類結(jié)果
圖10 各類算法在Urban數(shù)據(jù)集上降維后的分類結(jié)果圖Fig.10 Classification maps of different DR methods with 1-NN for the Urban data set
針對普通圖或超圖嵌入高光譜數(shù)據(jù)過程中表達(dá)形式單一,并為解決較少標(biāo)記樣本下特征提取問題,本文提出一種結(jié)合圖和超圖聯(lián)合表征的半監(jiān)督多圖嵌入(SSMGE)維數(shù)簡約方法,以提取低維鑒別特征。該方法通過標(biāo)記樣本的近鄰點構(gòu)建類內(nèi)圖、類間圖和類內(nèi)超圖、類間超圖,以多圖協(xié)同表征的形式挖掘高光譜影像中的數(shù)據(jù)關(guān)系,同時通過無標(biāo)記樣本的近鄰點與遠(yuǎn)離點構(gòu)建無監(jiān)督本征超圖和無監(jiān)督懲罰超圖,增加更多有利于分類的鑒別信息,同時加強(qiáng)超圖結(jié)構(gòu)在整個數(shù)據(jù)集中的結(jié)構(gòu)關(guān)系。在低維嵌入空間中,加強(qiáng)數(shù)據(jù)的類內(nèi)結(jié)構(gòu)和本征結(jié)構(gòu),遠(yuǎn)離數(shù)據(jù)的類間結(jié)構(gòu)和懲罰結(jié)構(gòu),以實現(xiàn)特征提取。在PaviaU和Urban高光譜數(shù)據(jù)集上的實驗表明,相比于其他對比方法,SSMGE的總體分類精度分別可達(dá)到85.92%和79.74%,說明本文提出的SSMGE方法相比于單圖嵌入方法能明顯提升地物分類性能,有利于實際應(yīng)用。由于本文方法僅利用高光譜數(shù)據(jù)的光譜信息,下一步工作將利用空間信息構(gòu)建空-譜超圖,進(jìn)一步提升分類性能。