何浩, 沈永林, 劉修國(guó), 馬麗
(1.中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院,武漢 430074; 2.中國(guó)地質(zhì)大學(xué)(武漢)機(jī)械與電子信息學(xué)院,武漢 430074; 3.新疆大學(xué)建筑工程學(xué)院,烏魯木齊 830047)
?
空間-光譜約束的圖半監(jiān)督高光譜影像分類算法
何浩1,3, 沈永林1, 劉修國(guó)1, 馬麗2
(1.中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院,武漢430074; 2.中國(guó)地質(zhì)大學(xué)(武漢)機(jī)械與電子信息學(xué)院,武漢430074; 3.新疆大學(xué)建筑工程學(xué)院,烏魯木齊830047)
摘要:高光譜影像數(shù)據(jù)的類標(biāo)簽樣本獲取困難,而在少量標(biāo)簽點(diǎn)情況下的分類精度通常不理想。為此,提出了一種改進(jìn)的空間-光譜約束的圖半監(jiān)督分類算法(spatial-spectral constrained graph-based semi-supervised classification,SS-GSSC)。首先,以歐氏距離結(jié)合RBF(radial basis function)核函數(shù)確定空間相似性權(quán)值; 采用光譜相關(guān)角(spectral correlation angle,SCA)計(jì)算光譜相似性權(quán)值; 然后,將2種權(quán)值以乘積的形式進(jìn)行組合,對(duì)相似性測(cè)度進(jìn)行約束; 最后,利用標(biāo)簽傳遞算法對(duì)測(cè)試數(shù)據(jù)進(jìn)行標(biāo)簽預(yù)測(cè),獲得分類結(jié)果。通過分別對(duì)Indian Pines影像和DC Sub影像進(jìn)行分類實(shí)驗(yàn)的結(jié)果表明,該算法較之以往的分類算法,能更好地消除同類地物圖斑中夾雜異類地物散點(diǎn)的現(xiàn)象,在少量標(biāo)簽點(diǎn)(每類25個(gè))情況下,取得了較高的分類精度。
關(guān)鍵詞:半監(jiān)督分類; 圖; 空間-光譜; 高光譜遙感
0引言
高光譜遙感影像分類一直是高光譜遙感領(lǐng)域較為熱門的研究方向,從傳統(tǒng)的監(jiān)督分類、非監(jiān)督分類,到近年來(lái)興起的半監(jiān)督分類,國(guó)內(nèi)外研究人員已發(fā)展了多種分類算法。然而,多數(shù)算法僅利用光譜相似性測(cè)度進(jìn)行分類,對(duì)地物的空間信息利用不足。針對(duì)此問題,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的相關(guān)研究,提出了多種空間-光譜分類算法[1]。在引入空間信息輔助分類時(shí),通常利用影像的紋理、形狀等特征作為輔助信息。趙銀娣等[2]提出了一種適用于多光譜紋理影像分類的廣義馬爾可夫隨機(jī)場(chǎng)模型,該算法提高了紋理影像的分類精度; 黃昕等[3]提出了一種像元形狀指數(shù)及基于形狀與光譜特征融合的高空間分辨率遙感影像分類算法,該算法計(jì)算簡(jiǎn)便且能有效表達(dá)高分辨率影像的地物特征; Xia等[4]利用4種特征提取方法,結(jié)合旋轉(zhuǎn)森林進(jìn)行特征提取,再采用空間上下文信息、先驗(yàn)馬爾可夫場(chǎng)等方法進(jìn)行高光譜影像分類,顯著提高了分類精度; Wang等[5]提出了一種新的基于空間-光譜標(biāo)簽傳遞分類算法用于高光譜圖像的半監(jiān)督分類; Ji等[6]采用構(gòu)建超圖結(jié)構(gòu)形式將像元光譜特征與空間約束相結(jié)合,進(jìn)行高光譜圖像分類; Ghamisi等[7]提出了一種基于隱馬爾可夫隨機(jī)場(chǎng)分割和支持向量機(jī)(support vector machine,SVM)相結(jié)合的分類算法; Li等[8]提出了一種非局部聯(lián)合協(xié)同表示分類算法與局部自適應(yīng)字典相結(jié)合的高光譜圖像分類算法。這些算法在標(biāo)簽數(shù)量較多的情況下具有很高的分類精度,但同時(shí)也都具有計(jì)算較復(fù)雜的問題; 當(dāng)標(biāo)簽數(shù)量少、無(wú)標(biāo)記樣本數(shù)量龐大時(shí),分類精度通常不理想。分類結(jié)果也常伴隨著同類地物圖斑中夾雜其他類別地物散點(diǎn)的現(xiàn)象。
本文在圖半監(jiān)督分類方法的基礎(chǔ)上,顧及空間信息約束,提出一種改進(jìn)的空間-光譜約束的圖半監(jiān)督分類算法(spatial-spectral constrained graph-based semi-supervised classification,SS-GSSC)。該算法基于2點(diǎn)假設(shè)[6]: ①具有相似光譜特征值的像元點(diǎn)可能具有相同的類別標(biāo)簽; ②空間鄰近的像元點(diǎn)可能具有相同的類別標(biāo)簽。算法采用乘積的方式組合空間信息與光譜信息的權(quán)值,從而擴(kuò)大像元點(diǎn)之間的相似性差異。能夠在少量標(biāo)簽情況下,取得較高的分類精度。同時(shí),也在一定程度上解決了同類地物圖斑中夾雜其他類別地物散點(diǎn)的問題。
1空間-光譜約束的圖半監(jiān)督分類算法
傳統(tǒng)的分類方法大體可分為監(jiān)督分類和非監(jiān)督分類。監(jiān)督分類常利用有類別標(biāo)簽的訓(xùn)練樣本數(shù)據(jù)訓(xùn)練獲得一個(gè)分類器,對(duì)無(wú)標(biāo)簽的測(cè)試數(shù)據(jù)進(jìn)行標(biāo)簽預(yù)測(cè); 而非監(jiān)督分類則是直接對(duì)沒有類別標(biāo)簽的數(shù)據(jù),利用數(shù)據(jù)的聚類特性進(jìn)行分類; 近年來(lái)在模式識(shí)別領(lǐng)域興起的半監(jiān)督分類算法,同時(shí)利用了少量標(biāo)簽數(shù)據(jù)的類別信息和無(wú)標(biāo)簽數(shù)據(jù)中的隱含信息,對(duì)小樣本分類具有一定的優(yōu)勢(shì)?;趫D的半監(jiān)督分類(graph-based semi-supervised classification,GSSC)[9]最大的特點(diǎn)就是用圖來(lái)表示數(shù)據(jù)之間的關(guān)系。
綜合考慮高光譜影像中目標(biāo)像元與鄰近相似像元在空間和光譜上的關(guān)系,將2種相似性測(cè)度組合定權(quán),改進(jìn)圖半監(jiān)督分類算法。該算法包括: 相似性測(cè)度選擇、組合和標(biāo)簽傳遞計(jì)算。
1.1空間相似性測(cè)度
(1)
1.2光譜相似性測(cè)度
(2)
(3)
式中:n表示波段數(shù);k為波段;r,t分別代表第i和第j個(gè)像元點(diǎn)的光譜值。
1.3相似性測(cè)度的組合方法
空間相似性權(quán)值和光譜相似性權(quán)值從不同的角度描述了像元點(diǎn)之間標(biāo)簽相似程度。實(shí)驗(yàn)了多種權(quán)值組合方法,發(fā)現(xiàn)采用權(quán)值相乘的方法組合定權(quán),分類效果最好。這從理論上也很容易得到解釋,如果2個(gè)像元點(diǎn)之間的2種相似性權(quán)值都很小或都很大,以乘積的形式組合可使這種相似性差異進(jìn)一步擴(kuò)大; 當(dāng)2種相似性權(quán)值出現(xiàn)一大一小時(shí),取乘積可使其相似性權(quán)值保持適中,從而有效地避免了光譜相似而空間距離較遠(yuǎn)的異類地物被誤分為同一類地物的情況。則組合定權(quán)公式為
(4)
式中:Wij為像元i與像元j之間的組合邊權(quán)值;W為對(duì)稱矩陣; 為了避免像元自相似性,令Wii=0。
1.4標(biāo)簽傳遞算法
用圖表示數(shù)據(jù)之間的關(guān)系,圖的結(jié)點(diǎn)表示數(shù)據(jù)點(diǎn)(包括標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)),點(diǎn)與點(diǎn)之間的邊權(quán)值采用上述相似性測(cè)度組合方法計(jì)算獲得。則預(yù)測(cè)標(biāo)簽值可表示為
(5)
式中: 參數(shù)α取值范圍為(0,1); I為單位矩陣;
S=D-1/2WD-1/2,
(6)
其中D為對(duì)角矩陣,元素Dii為W的第i行之和;
Y*=(Yl,Yu)T={y1,y2,…,yl,yl+1,…,yl+u}T,
(7)
(8)
獲得,式中C為類別數(shù)。
空間-光譜約束的圖半監(jiān)督分類步驟如下:
1)輸入帶標(biāo)簽的訓(xùn)練數(shù)據(jù)Yl和無(wú)標(biāo)簽的待分類數(shù)據(jù)Yu; 設(shè)置RBF核函數(shù)的帶寬超參數(shù)σ和標(biāo)簽傳遞調(diào)節(jié)參數(shù)α; 設(shè)置訓(xùn)練數(shù)據(jù)標(biāo)簽個(gè)數(shù)。
3)設(shè)置標(biāo)簽矩陣。步驟為由Yl和Yu(無(wú)標(biāo)簽數(shù)據(jù)的標(biāo)簽值均為0)的標(biāo)簽構(gòu)成N×C的標(biāo)簽矩陣Y,其中N為像元總數(shù)。
4)標(biāo)簽傳遞算法。首先,構(gòu)建由訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)組成的全部數(shù)據(jù)的全連接圖,邊權(quán)值矩陣采用上述已計(jì)算出的W; 然后,利用公式(6)計(jì)算對(duì)稱矩陣S; 最后,利用公式(5)計(jì)算預(yù)測(cè)標(biāo)簽矩陣F*,取極大值對(duì)應(yīng)類別作為該像元的類別。
5)輸出預(yù)測(cè)標(biāo)簽矩陣及分類結(jié)果圖。
2實(shí)驗(yàn)結(jié)果及分析
2.1實(shí)驗(yàn)數(shù)據(jù)
為了方便比較算法的分類效果,選取了2種不同傳感器的高光譜遙感影像。
1)Indian Pines數(shù)據(jù)集是AVIRIS傳感器采集的數(shù)據(jù),采集于1992年美國(guó)印第安納州的一個(gè)農(nóng)場(chǎng),空間分辨率為20 m,去除水汽吸收波段,剩余200個(gè)波段。農(nóng)田區(qū)域具有比較規(guī)整的幾何形狀,作物類別主要包括玉米和大豆,由于耕種情況和土壤濕度的不同,可以細(xì)分為多種類別。根據(jù)Landgrebe的報(bào)告[10],選擇所有的16個(gè)類別進(jìn)行實(shí)驗(yàn)。
2)Washington DC數(shù)據(jù)集為機(jī)載傳感器HYDICE采集,影像由210個(gè)波段組成,波長(zhǎng)范圍400~2 400 nm,去除水汽吸收波段,剩余191個(gè)波段。實(shí)驗(yàn)選擇了Washington DC的一個(gè)子場(chǎng)景,命名為DC Sub。該影像為行號(hào)655—762和列號(hào)67—177組成的108像元×111像元的影像,包含草地、樹、屋頂、道路和陰影等6類地物。
實(shí)驗(yàn)中分別采用以光譜特征值作為相似性測(cè)度的GSSC方法和SS-GSSC方法進(jìn)行對(duì)比實(shí)驗(yàn)。設(shè)置參數(shù)σ=10,α=0.1,標(biāo)簽數(shù)量選擇時(shí),每一類地物隨機(jī)選擇3~25個(gè)標(biāo)簽,例如標(biāo)簽數(shù)量選擇為{3,5,10,15,20,25},分別測(cè)試各數(shù)據(jù)集在不同標(biāo)簽數(shù)量情況下的分類效果。為了避免隨機(jī)選取標(biāo)簽帶來(lái)實(shí)驗(yàn)結(jié)果的偶然性,對(duì)每種參數(shù)情況進(jìn)行10次測(cè)試,取平均值進(jìn)行分類精度評(píng)價(jià)。
2.2Indian Pines數(shù)據(jù)集的分類結(jié)果
當(dāng)每類地物標(biāo)簽數(shù)量取25時(shí),16類地物的分類精度及總體分類精度如表1所示。
表1 Indian Pines數(shù)據(jù)集訓(xùn)練與測(cè)試樣本數(shù)及各類別分類精度
從表1可以看出,利用基于光譜特征的GSSC方法,分類精度較低,總體精度僅為56.20%; 加入空間信息后,采用SS-GSSC算法總體分類精度提高到了92.09%。由此可見,空間信息的參與大大提高了影像的分類效果。此外,本文算法SS-GSSC相對(duì)于傳統(tǒng)算法GSSC能更好地區(qū)分玉米、干草、大豆、木材和大廈等地物。
2.3DC sub數(shù)據(jù)集的分類結(jié)果
在DC sub數(shù)據(jù)集中6類地物的分類精度如表2所示。
表2 DC sub數(shù)據(jù)集訓(xùn)練與測(cè)試樣本數(shù)及各類別分類精度
分別采用GSSC算法和SS-GSSC算法進(jìn)行分類的結(jié)果如圖1所示。
(a) RGB假彩色合成影像 (b) 地面真實(shí)數(shù)據(jù) (c) GSSC 分類結(jié)果
(d) SS-GSSC分類結(jié)果(e) SS-GSSC全圖分類結(jié)果
圖1DC Sub數(shù)據(jù)集分類結(jié)果
Fig.1Classification results of DC Sub
為了便于定量評(píng)價(jià)本文方法的分類精度,分類對(duì)象全部選擇有地面真實(shí)數(shù)據(jù)的區(qū)域,如圖1(b)所示。標(biāo)簽數(shù)量取25時(shí),僅利用光譜特征的GSSC算法分類結(jié)果,在大塊圖斑中有較明顯的異類散點(diǎn)出現(xiàn),如圖1(c)所示; 采用SS-GSSC算法分類,分類精度由95.57%提升到了99.62%,且消除了同類圖斑中夾雜異類散點(diǎn)的現(xiàn)象,只在類別邊界區(qū)域出現(xiàn)少量誤分類點(diǎn),如圖1(d)所示。
進(jìn)一步驗(yàn)證分類效果,將分類對(duì)象擴(kuò)大到全圖所有像元,標(biāo)簽數(shù)量仍取每類25個(gè),采用SS-GSSC算法分類,總體分類效果良好,分類結(jié)果如圖1(e)所示。影像右側(cè)的小路、草地、樹和建筑物等都得到了很好的區(qū)分,同類別內(nèi)異類散點(diǎn)較少。但受標(biāo)簽點(diǎn)位置的影響,在標(biāo)簽點(diǎn)較少的區(qū)域,出現(xiàn)了少量誤分類點(diǎn)。例如影像左側(cè)的部分草地、樹被誤分成了道路。
2.4標(biāo)簽數(shù)量對(duì)分類精度影響分析
分別選取標(biāo)簽數(shù)量為3,5,10,15,20和25個(gè),采用SS-GSSC算法對(duì)數(shù)據(jù)集Indian Pines進(jìn)行分類,其分類結(jié)果如圖2所示。
(a) RGB假彩色合成影像 (b) 地面真實(shí)數(shù)據(jù)(c) 3個(gè)標(biāo)簽分類結(jié)果 (d) 5個(gè)標(biāo)簽分類結(jié)果
圖2-1 不同標(biāo)簽數(shù)量Indian Pines數(shù)據(jù)集分類結(jié)果
(e) 10個(gè)標(biāo)簽分類結(jié)果(f) 15個(gè)標(biāo)簽分類結(jié)果 (g) 20個(gè)標(biāo)簽分類結(jié)果(h) 25個(gè)標(biāo)簽分類結(jié)果
圖2-2 不同標(biāo)簽數(shù)量Indian Pines數(shù)據(jù)集分類結(jié)果
從圖2中可以發(fā)現(xiàn),每類標(biāo)簽數(shù)量取3時(shí),在地類復(fù)雜區(qū)域有明顯的誤分類現(xiàn)象,隨著標(biāo)簽數(shù)量的增加,分類精度逐漸提高。當(dāng)標(biāo)簽數(shù)量增加到15時(shí),分類精度的提升較為緩慢。但整體上,采用本文算法都能不同程度地消除同類圖斑中部夾雜異類散點(diǎn)的現(xiàn)象,誤分類點(diǎn)只在區(qū)域邊緣出現(xiàn)。
為了進(jìn)一步比較本文算法的分類效果,在實(shí)驗(yàn)條件相同的情況下與文獻(xiàn)[5]中提出的(spatial-spectral label propagation based on the SVM,SS-LPSVM)算法比較,SS-GSSC算法在標(biāo)簽數(shù)量很少時(shí),例如標(biāo)簽數(shù)量取3和5時(shí),已具有較高的分類精度; 隨著標(biāo)簽數(shù)量的增加,該算法分類精度仍略高于SS-LPSVM算法。分類精度比較如圖3所示。
圖3 Indian Pines數(shù)據(jù)集分類精度比較
3結(jié)論
本文提出的空間-光譜約束的圖半監(jiān)督高光譜影像分類算法克服了以往基于像元光譜特征分類算法的局限性,增加了相鄰像元之間的空間信息,提高了影像的分類精度,減少了同一類地物圖斑中夾雜異類地物散點(diǎn)的情況,對(duì)高光譜影像分類具有一定的普遍適用性。
分別對(duì)Indian Pines影像和DC Sub影像進(jìn)行的分類實(shí)驗(yàn)表明: 與傳統(tǒng)的基于光譜特征分類算法相比,本文算法有較明顯的精度提升; 在Indian Pines影像上進(jìn)一步做標(biāo)簽數(shù)量對(duì)分類精度的影響分析,發(fā)現(xiàn)即使在標(biāo)簽數(shù)據(jù)較少的情況下,該算法仍然具有較高的分類精度; 同等實(shí)驗(yàn)條件下,與文獻(xiàn)[5]中提出的SS-LPSVM算法比較,本文算法分類精度也略有提高。
但在標(biāo)簽數(shù)據(jù)分布非常不均勻的情況下,本文算法容易產(chǎn)生明顯的誤分類現(xiàn)象。這是該算法的不足之處,也將是下一步研究的重點(diǎn)。
參考文獻(xiàn)(References):
[1]Fauvel M,Tarabalka Y,Benediktsson J A,et al.Advances in spectral-spatial classification of hyperspectral images[J].Proceedings of the IEEE,2013,101(3):652-675.
[2]趙銀娣,張良培,李平湘.廣義馬爾可夫隨機(jī)場(chǎng)及其在多光譜紋理影像分類中的應(yīng)用[J].遙感學(xué)報(bào),2006,10(1):123-129.
Zhao Y D,Zhang L P,Li P X.Universal Markov random fields and its application in multispectral textured image classification[J].Journal of Remote Sensing,2006,10(1):123-129.
[3]黃昕,張良培,李平湘.融合形狀和光譜的高空間分辨率遙感影像分類[J].遙感學(xué)報(bào),2007,11(2):193-200.
Huang X,Zhang L P,Li P X.Classification of high spatial resolution remotely sensed imagery based on the fusion of spectral and shape features[J].Journal of Remote Sensing,2007,11(2):193-200.
[4]Xia J S,Chanussot J,Du P J,et al.Spectral-spatial classification for hyperspectral data using rotation forests with local feature extraction and Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(5):2532-2546.
[5]Wang L G,Hao S Y,Wang Q M,et al.Semi-supervised classification for hyperspectral imagery based on spatial-spectral label propagation[J].ISPRS Journal of Photogrammetry and Remote Sensing,2014,97:123-137.
[6]Ji R R,Gao Y,Hong R C,et al.Spectral-spatial constraint hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(3):1811-1824.
[7]Ghamisi P,Benediktsson J A,Ulfarsson M O.Spectral-spatial classification of hyperspectral images based on hidden Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2565-2574.
[8]Li J Y,Zhang H Y,Huang Y C,et al.Hyperspectral image classification by nonlocal joint collaborative representation with a locally adaptive dictionary[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(6):3707-3719.
[9]Zhu X J.Semi-Supervised Learning with Graphs[D].Pittsburgh,Pennsylvania State:Carnegie Mellon University,2005.
[10]Landgrebe D.Multispectral Data Analysis:A Signal Theory Perspective[R].West Lafayette:School of Electrical and Computer Engineering,Purdue University,1998.
(責(zé)任編輯: 陳理)
Spatial-spectral constrained graph-based semi-supervised classification for hyperspectral image
HE Hao1,3, SHEN Yonglin1, LIU Xiuguo1, MA Li2
(1. Faculty of Information Engineering, China University of Geosciences(Wuhan), Wuhan 430074, China; 2. Faculty ofMechanicalandElectronicInformation,ChinaUniversityofGeosciences(Wuhan),Wuhan430074,China;3.FacultyofArchitectureEngineering,XinjiangUniversity,Urumqi830047,China)
Abstract:It is difficult to obtain labels of samples for hyperspectral data. Few labeled samples usually lead to low classification accuracy. In view of this situation, an improved spatial and spectral constraint graph-based semi-supervised classification algorithm (SS-GSSC) is proposed. First of all, Euclidean distance combined with radial basis function (RBF) is used to construct the spatial similarity edge weight; Spectral correlation angle (SCA) is used to calculate spectral similarity weights; Then, the two kinds of weights are combined to the form of product to restrict the similarity measurement; Finally, the label propagation algorithm is used to predict the test data labels so as to obtain the classification results. Classification experiments on Indian Pines image and DC Sub image show that, compared with the previous classification algorithm, the algorithm designed by the authors can better eliminate the phenomenon of the existence of the same category map spot included in other categories of scattered points, and can achieve higher classification accuracy under the condition of less label points (25 per class).
Keywords:semi-supervised classification; graph; spatial-spectral; hyperspectral remote sensing
doi:10.6046/gtzyyg.2016.03.06
收稿日期:2015-03-23;
修訂日期:2015-05-18
基金項(xiàng)目:中國(guó)博士后科學(xué)基金面上項(xiàng)目“基于分形的玉米作物物候動(dòng)態(tài)檢測(cè)算法研究”(編號(hào): 2013M542086)和中央高校新青年教師科研啟動(dòng)基金項(xiàng)目“基于結(jié)構(gòu)推理的農(nóng)作物多參量旱情監(jiān)測(cè)方法研究”(編號(hào): CUGL140834)共同資助。
中圖法分類號(hào):TP 79
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-070X(2016)03-0031-06
第一作者簡(jiǎn)介:何浩(1979-),男,博士研究生,講師,主要從事高光譜遙感數(shù)據(jù)處理方面的研究。Email: hehao_1216@126.com。
引用格式: 何浩,沈永林,劉修國(guó),等.空間-光譜約束的圖半監(jiān)督高光譜影像分類算法[J].國(guó)土資源遙感,2016,28(3):31-36.(He H,Shen Y L,Liu X G,et al.Spatial-spectral constrained graph-based semi-supervised classification for hyperspectral image[J].Remote Sensing for Land and Resources,2016,28(3):31-36.)