何 芳, 王標標, 張峰干, 郭 帥, 賈維敏
(1.火箭軍工程大學(xué) 核工程學(xué)院,陜西 西安 710025; 2.96862部隊,河南 洛陽 471003)
加權(quán)空-譜自適應(yīng)近鄰聚類的高光譜圖像分類
何 芳1, 王標標2, 張峰干1, 郭 帥1, 賈維敏1
(1.火箭軍工程大學(xué) 核工程學(xué)院,陜西 西安 710025; 2.96862部隊,河南 洛陽 471003)
高光譜圖像聚類算法可以對海量的高光譜圖像數(shù)據(jù)進行信息提取,完成地物類別的初步分類。自適應(yīng)近鄰聚類(clustering with adaptive neighbors,CAN)作為一種新型的聚類算法,利用樣本間的局部連通性實現(xiàn)聚類,聚類效果較好,但是該算法的性能受樣本間相關(guān)性的影響較大。基于此,文章提出了一種新的融合高光譜圖像的空間信息和光譜信息的分類方法,即加權(quán)空-譜自適應(yīng)近鄰聚類(weighted spatial and spectral clustering with adaptive neighbors,WSS-CAN)法,該方法通過引入樣本點的近鄰窗口尺度和光譜因子2個參數(shù)對高光譜圖像進行重構(gòu),增強了樣本間的相關(guān)性,對重構(gòu)后的圖像進行CAN聚類,有效提高了分類精度。在Indian Pines和Salinas-A數(shù)據(jù)庫上的實驗結(jié)果表明,由WSS-CAN得到的總體精度分別為56.33%、77.90%,分別比其他聚類算法提升了11.52%~18.47%、10.1%~14.79%,聚類效果較好。
聚類算法;自適應(yīng)近鄰聚類;空間信息;光譜信息;加權(quán)空-譜自適應(yīng)近鄰聚類;高光譜圖像分類
高光譜圖像將傳統(tǒng)的空間維與光譜維信息融合為一體,具有“圖譜合一”的特點,廣泛地應(yīng)用于軍事偵察、環(huán)境監(jiān)測、地質(zhì)勘查、精細農(nóng)業(yè)、大氣遙感、水文學(xué)等領(lǐng)域[1-2]。高光譜圖像[3]是由成像光譜儀獲取的遙感圖像,將傳統(tǒng)的空間維與光譜維信息融合為一體。高光譜遙感技術(shù)從可見光到熱紅外波段的范圍內(nèi)采集大量的、狹窄的光譜影像數(shù)據(jù)[4],其較高的光譜維數(shù)和光譜分辨率為地物精細分類帶來了良好的機遇[5],然而,海量的高光譜圖像數(shù)據(jù)也給尋找有用的地物信息帶來了巨大的阻礙[6]。聚類算法是圖像分割中的經(jīng)典算法之一[7],采用合適的聚類分析方法可以從海量的高光譜圖像數(shù)據(jù)中找到有價值的信息,從而完成地物類別的初步分類。
高光譜圖像具有同類地物的光譜特征相同或相近、不同類地物的光譜特征差異較大的特點,高光譜圖像聚類算法根據(jù)這一特點可以實現(xiàn)對高光譜圖像的像元進行準確地分類[8]。
K-means作為經(jīng)典的聚類算法,通過不斷移動各類中心使每一類樣本的類內(nèi)距離最小,具有高效、簡單的特點,但該算法的聚類性能與初始聚類中心的選取有關(guān)。譜聚類算法基于相似圖構(gòu)建Laplacian 矩陣,通過Laplacian 矩陣將樣本點映射到較低維空間后再進行K-means聚類,引入圖論的方法能取得較好的聚類效果,但是譜聚類算法的性能易受相似圖構(gòu)建的影響[9]。文獻[10]提出自適應(yīng)近鄰聚類(clustering with adaptive neighbors,CAN)方法,將2點之間的距離越小成為同一類的概率越大作為先驗知識?;跇颖鹃g的局部連通性自適應(yīng)地為樣本分配最佳近鄰,得到相似矩陣。對Laplacian矩陣增加秩約束條件使樣本的連通分量剛好等于樣本類別數(shù),并且每一個連通分量對應(yīng)一類樣本,聚類效果更好,穩(wěn)定性更高。但是,CAN算法的性能在很大程度上依賴于構(gòu)造自適應(yīng)近鄰圖的樣本的數(shù)量和相關(guān)性,樣本的數(shù)量越多,樣本間的相關(guān)性越大,聚類效果越好?;诖?本文提出一種新的聚類方法,即加權(quán)空-譜自適應(yīng)近鄰聚類(weighted spatial and spectral clustering with adaptive neighbors,
WSS-CAN)法,該方法首先利用高光譜圖像的物理特性,通過引入近鄰窗口和光譜因子2個參數(shù)對高光譜圖像進行重構(gòu),使同類像元之間的相似性和異類像元之間的差異性增強,增大了樣本間的相關(guān)性;然后根據(jù)樣本間的局部連通性為重構(gòu)后的數(shù)據(jù)自適應(yīng)地分配最佳近鄰,有利于提高高光譜圖像的分類精度。
加權(quán)空-譜算法可以對高光譜圖像進行平滑處理,減小奇異點的干擾。其原理為:在高光譜圖像中樣本點xi的像素坐標為(pi,qi),則像元xi的近鄰空間為:
N(xi)={x(p,q)},
p∈[pi-a,pi+a],q∈[qi-a,qi+a]
(1)
其中,a=(w-1)/2,w表示xi的近鄰窗口的寬度即尺度,通常取為奇數(shù)。近鄰空間N(xi)中的像素點為xi,xi1,xi2,…,xis,則xi近鄰點的個數(shù)為s=w2-1。
采用如下規(guī)則對像素點xi進行重構(gòu),得到的重構(gòu)像素點為:
其中,近鄰空間N(vi)中任一像元vik到中心像元xi的權(quán)重為νk=exp{-γ0‖xi-xik‖2},參數(shù)γ0為光譜因子,通過對近鄰空間中與中心像元差異較大的點賦予較小的權(quán)重而降低奇異點的干擾,實現(xiàn)對高光譜圖像的平滑處理[11]。
近鄰窗口尺度w可以調(diào)節(jié)近鄰空間的大小,光譜因子γ0可以調(diào)整像元間的相互影響程度。因此,參數(shù)w和γ0的選取直接影響高光譜圖像處理的結(jié)果,本文通過實驗分析的方法進行選取。不同情況下像元xij的近鄰空間如圖1所示。
圖1 不同情況下像元xij的近鄰空間
采用圖1方法預(yù)處理位于圖像邊緣或角落的像元。圖1中,高光譜圖像中的每一個像元用一個正方形格子表示,淺灰色格子為中心像元,深灰色格子為填補方式。對于位于四周的像素點,直接取最上、最下一行和最左、最右一列的像素補充,4個角的像素分別取與其近鄰的3個像素的平均值進行填補。
現(xiàn)有的聚類方法多數(shù)是基于輸入數(shù)據(jù)的相似矩陣來實現(xiàn)聚類的,聚類性能在很大程度上依賴于相似矩陣的學(xué)習(xí)。
在聚類過程中,利用樣本間的局部連通性往往能得到較好的聚類效果[10]。CAN算法以概率論上的近鄰為基礎(chǔ),能有效利用樣本間的局部連通性,自適應(yīng)地為樣本分配最佳近鄰。該方法對Laplacian矩陣增加秩約束條件,使樣本的連通分量剛好等于樣本類別數(shù),并且每一個連通分量對應(yīng)一類樣本。
其中,l為所有元素為1的列向量,而(3)式存在平凡解,即與xi最近的點與它成為近鄰的概率為1,而其他點都不是xi的近鄰。
其中,γ為正則化參數(shù),利用(4)式為每一個樣本點xi分配近鄰,即
由于相似矩陣S是半正定矩陣,則對應(yīng)的Laplacian矩陣LS特征值為0的重數(shù)k等于圖論中相似矩陣S的連通分量的個數(shù)[9]。因此當(dāng)rank(LS)=n-k時,可以使近鄰分配成為一個自適應(yīng)的過程,得到的連通分量剛好為k個,且每一個連通分量對應(yīng)一類樣本,而不需要進行K-means聚類或者其他的離散化聚類算法。因此,最終的目標函數(shù)為:
rank(LS)=n-c
(6)
輸入:高光譜圖像數(shù)據(jù)X={x1,…,xn}T,X∈Rn×d,類別數(shù)k,參數(shù)γ以及λ,尺度參數(shù)w,光譜因子γ0。
輸出:高光譜圖像分類精度評價指標。
(1) 根據(jù)(1)式選取數(shù)據(jù)集X的近鄰空間,得到所有樣本的近鄰空間。
(1) 實驗數(shù)據(jù)選擇。本文選擇具有代表性的Indian Pines[12]和Salinas-A[13]圖像數(shù)據(jù)庫用于驗證本文所提算法的有效性。
Indian Pines圖像數(shù)據(jù)庫是1992年6月由 AVIRIS 傳感器在美國印第安納州的一塊印度松樹測試地獲取的,如圖2所示。
該圖像由145×145個像元組成,去除水的吸收及噪聲剩下200個波段用作實驗。每個波段圖像上含有16類不同類型作物的像元,共 10 249個樣本點。圖2a為選取Indian Pines的第50、27、17波段合成的RGB圖像,圖2b為其地面真實數(shù)據(jù)及相應(yīng)的圖例。
Salinas-A圖像數(shù)據(jù)庫是Salinas圖像的一部分,Salinas圖像數(shù)據(jù)是在加利福利亞薩利納斯山谷由AVIRIS傳感器獲得的[14],如圖3所示。該圖像包括83×86個像素點,224個波段,去除20個被污染的波段,剩余204個波段用于實驗分析,每個波段包含5 348個樣本點,6類地物。
圖3a為選取Salinas-A的第16、130、200波段合成的RGB圖像,圖3b為地面真實數(shù)據(jù)及相應(yīng)的圖例。
圖3 Salinas-A圖像示意圖
(2) 基于Indian Pines的高光譜圖像分類。WSS-CAN的2個主要參數(shù)為近鄰窗口尺度w和光譜因子γ0。本文通過實驗分析不同的w和γ0對實驗結(jié)果的影響,從中選取最佳的參數(shù)。不同的近鄰窗口尺度w和光譜因子γ0對分類精度的影響如圖4所示。
圖4 在Indian Pines數(shù)據(jù)庫上不同參數(shù)對分類精度的影響
當(dāng)分析w對分類精度的影響時,γ0設(shè)置為1.0;同樣地,分析γ0時,w設(shè)置為3。由圖4可知,在Indian Pines數(shù)據(jù)庫上的最佳參數(shù)設(shè)置為w=3,γ0=1.0。
為比較各個算法的性能,將4種聚類算法應(yīng)用于高光譜圖像分類中并計算分類精度評價指標。在IndianPines數(shù)據(jù)庫上由不同算法得到的各類地物的分類精度,平均精度AA,總體精度OA和kappa系數(shù)見表1所列。由表1可知,WSS-CAN算法的分類性能明顯優(yōu)于其他算法,由WSS-CAN算法得到的OA達到了56.63%,kappa系數(shù)達到了0.469 2,分別比K均值算法提高了18.47%,達到了0.144 7。這是由于WSS-CAN算法有效融合高光譜圖像的空間信息和光譜信息對高光譜圖像的像素進行重構(gòu),使重構(gòu)后的像素點類內(nèi)相似性和類間差異性變大,增強了圖像的可分性;采用實驗分析的方法選取了最佳的近鄰窗口尺度和光譜因子,有效地提高了分類精度;根據(jù)樣本的局部連通性,自適應(yīng)地為樣本分配最佳近鄰,聚類效果更好,穩(wěn)定性更高。
高光譜圖像存在“同物異譜”和“同譜異物”的特點,給地物的分類識別帶來了一系列的問題,而本文提出的算法是一種無監(jiān)督的分類方法,并不能有效解決上述問題,因此對于有些地物的識別精度甚至可能是0。從圖2中可以看出苜蓿草、燕麥、石鋼塔的樣本個數(shù)都小于100,而所有樣本的個數(shù)是10 249,但是CAN算法和WSS-CAN算法的聚類性能與構(gòu)造自適應(yīng)近鄰圖的樣本的個數(shù)有關(guān),因此對于小樣本取得的聚類結(jié)果并不理想,表1中對C10、C12、C15等的分類效果并不是很好。
表1 Indian Pines數(shù)據(jù)庫上各類地物在不同算法下的分類精度 %
采用與IndianPines相同的參數(shù)檢驗方法,得到在Salinas-A數(shù)據(jù)庫上的最佳參數(shù)取值為:w=5,γ0=1.0。各算法的分類結(jié)果見表2所列。由表2可知,由本文方法得到的OA達到了77.90%,kappa系數(shù)達到了0.721 6,分別較K均值算法提高了11%,kappa系數(shù)達到了0.112 7,再次證明了本文算法的實用性和有效性。
表2 Salinas-A數(shù)據(jù)庫上各類地物在不同算法下的分類精度 %
從表1、表2可以看出,本文用到的幾種算法對各類地物的分類精度的波動較大,這是由于高光譜圖像中每一個像元點對應(yīng)一條連續(xù)的光譜曲線,反映了其對應(yīng)地物的光譜屬性,不同地物的光譜屬性不同,而在分類過程中是用光譜值進行分類的,因此對不同地物的分類精度不同,波動較大。
本文提出了一種新的融合高光譜圖像空間信息和光譜信息的聚類算法,即WSS-CAN算法。WSS-CAN算法不僅有效利用了高光譜圖像的空間信息和光譜信息,而且根據(jù)樣本間的局部連通性實現(xiàn)聚類,取得了較好的聚類效果。在IndianPines和Salinas-A數(shù)據(jù)庫上的實驗結(jié)果表明:本文方法顯著提高了分類精度,在IndianPines數(shù)據(jù)庫上,由本文方法得到的OA達到了56.33%,比其他算法提升了11.52%~18.47%,kappa系數(shù)提升了11.25%~15.57%。在Salinas-A數(shù)據(jù)庫上,由本文方法得到的OA達到了77.90%,比其他算法提升了10.1%~14.79%,kappa系數(shù)提升了10.51%~19.14%。
[1] 楊可明,劉飛,孫陽陽,等.諧波分析光譜角制圖高光譜影像分類[J].中國圖象圖形學(xué)報,2015,20(6):836-844.
[2] 陳有明,楊娟,疏淺,等.長江流域地貌、水患防治及土地潛力遙感研究 [J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2014,37(6):736-744.
[3] 楊藝,韓崇昭,韓德強.利用特征子空間評價與多分類器的高光譜圖像聚類[J].西安交通大學(xué)學(xué)報,2010,44(8):21-24.
[4] JIA X,KUO B C,CRAWFORD M M.Feature mining for hyperspectral image classification [J].Proceedings of IEEE,2013,101(3): 676-697.
[5] 欒靜,殷明,于立萍,等.基于Curvelet和改進區(qū)域方差的遙感圖像融合[J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2015,38(9):1220-1225.
[6] 何同弟.高光譜圖像的分類技術(shù)研究[D].重慶:重慶大學(xué),2014.
[7] 張海濤,李雅男.閾值標記的分水嶺彩色圖像分割[J].中國圖象圖形學(xué)報,2015,20(12):1602-1611.
[8] 李翔.高光譜影像的聚類分析及應(yīng)用[D].北京:北京交通大學(xué),2015.
[9] 劉雅蓉,汪西莉.LUV 色彩空間中多層次化結(jié)構(gòu) Nystrm 方法的自適應(yīng)譜聚類算法[J].中國圖象圖形學(xué)報,2012,17(4):530-536.
[10] NIE F,WANG X,HUANG H.Clustering and projected clustering with adaptive neighbors[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data mining.[S.l.]:ACM,2014: 977-986.
[11] 黃鴻,鄭新磊.加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類[J].光學(xué)精密工程,2016,24(4):873-881.
[12] HUANG H,LUO F L,LIU J M,et al.Dimensionality reduction of hyperspectral images based on sparse discriminant manifold embedding[J].ISPRS Journal of Photogrammetry and Remote Sensing,2015(106):42-54.
[13] ZHOU Y C,PENG J T,CHEN C L P.Dimension reduction using spatial and spectral regularized local discriminant embedding for hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(2):1082-1095.
[14] 查方興.基于稀疏表示和空間約束的高光譜遙感圖像分類方法研究[D].西安:西安電子科技大學(xué),2014.
Hyperspectralimageclassificationusingweightedspatialandspectralclusteringwithadaptiveneighbors
HE Fang1, WANG Biaobiao2, ZHANG Fenggan1, GUO Shuai1, JIA Weimin1
(1.College of Nuclear Engineering, Rocket Force Engineering University, Xi’an 710025, China; 2.Troops No.96862, Luoyang 471003, China)
The algorithm of hyperspectral images(HSI) clustering can extract the valuable information, which can be used to classify the ground truth, from vast HSI data. Clustering with adaptive neighbors(CAN), a new clustering algorithm, performs well by using the local connectivity effectively, but the result is susceptible to the correlation of samples. In this paper, a new spatial-spectral classification method, weighted spatial and spectral clustering with adaptive neighbors(WSS-CAN) is proposed. This algorithm combines both spatial window and spectral factor to reconstruct the HSI, which strengthens the correlation of pixels. CAN is used to cluster the reconstructed data, thus increasing the classification accuracy. The benchmark tests on Indian Pines and Salinas-A demonstrate that the performance of WSS-CAN is better than that of other algorithms. The best value of overall accuracy(OA) obtained by WSS-CAN on the HSI datasets is 56.33% and 77.90% respectively, exceeding that by other algorithms 11.52%-18.47% and 10.1%-14.79%.
clustering algorithm; clustering with adaptive neighbors(CAN); spatial information; spectral information; weighted spatial and spectral clustering with adaptive neighbors(WSS-CAN); hyperspectral image classification
2016-08-01;
2016-10-08
國家自然科學(xué)基金資助項目(61401471);中國博士后科學(xué)基金資助項目(2014M562636)
何 芳(1991-),女,湖北武漢人,火箭軍工程大學(xué)博士生;
賈維敏(1971-),女,河北故城人,博士,火箭軍工程大學(xué)教授,博士生導(dǎo)師,通訊作者,E-mail:jwm602@126.com.
10.3969/j.issn.1003-5060.2017.12.005
TP751
A
1003-5060(2017)12-1604-06
(責(zé)任編輯張 镅)