基于改進核聯(lián)合稀疏表示的高光譜圖像分類算法

2023-08-04 05:52:02李佳遜

電腦知識與技術 2023年18期

李佳遜

（南陽師范學院，河南南陽 473000)

0 引言

高光譜遙感圖像包含地表物體上大量的光譜信息和空間信息，通過對高光譜遙感圖像進行分類，可以實現(xiàn)對地物目標的識別，是實現(xiàn)對地觀測的重要手段。目前廣泛應用于環(huán)境監(jiān)測、精細化農(nóng)業(yè)、海洋勘探[1-3]等領域。由于訓練樣本標記數(shù)量有限，這會導致數(shù)據(jù)“維數(shù)災難”[4]，這些問題對高光譜數(shù)據(jù)分類帶來巨大挑戰(zhàn)。目前，常用的高光譜遙感圖像分類方法包括：K-近鄰法(K-Nearest Neighbor,KNN)[5]、支持向量機(Support Vector Machine,SVM)[6]、稀疏表示(Sparse Representation,SR)[7]、深度學習(Deep Learning)[8]等。稀疏表示作為一種新型機器學習分類器受到研究人員的廣泛關注，該方法需要對原始圖像進行降維，利用光譜特征進行樣本分類，沒有考慮圖像的空間特征。同時高光譜遙感圖像中往往存在“同類異譜”和“同譜異類”現(xiàn)象，以及其數(shù)據(jù)結構呈現(xiàn)高度非線性，因此僅采用稀疏表示進行圖像分類的效果大多不太理想。

針對上述問題，研究人員將空間信息與稀疏表示相結合，提出了一系列空間信息與光譜信息相結合的分類算法。Chen 等人[9]提出聯(lián)合稀疏表示(Joint Sparse Representation,JSR) 算法，通過建立測試像元與訓練樣本集之間的稀疏線性近似，結合殘差確定測試像元類別。但是對于非線性可分的數(shù)據(jù)集，稀疏表示無法進行分類，文獻[10]在JSR 基礎上提出了一種基于核聯(lián)合稀疏表示的高光譜圖像分類算法(Kernel Simultaneous Orthogonal Matching Pursuit,KSOMP)，核技術可將那些非可分的數(shù)據(jù)集映射到一個線性可分的特征空間，從而提高分類精度。Zhang 等人[11]利用核技巧和加權方法，提出非局部加權核聯(lián)合稀疏表示方法，有效利用鄰域像元的相似性，分類精度有了明顯提高。受正則化啟發(fā)，文獻[12]提出近鄰正則化核聯(lián)合稀疏表示(Nearest Regularized Kernel Joint Sparse Representation,NRKJSR) 分類算法，自適應優(yōu)化鄰域權重，進而優(yōu)化加權相鄰像素的重構誤差的總和。

考慮鄰域外的像元也存在光譜信息相近的情況，以及噪聲及區(qū)域邊界對分類效果的影響。我們對原始數(shù)據(jù)進行濾波處理、降維和超像素分割，來保護邊緣像元和充分提取圖像空間信息；將鄰域像元和超像素分割得到的像元相結合，通過譜聚類算法對參與核聯(lián)合稀疏表示的像元進行篩選，選出優(yōu)質像元作為測試樣本集；在確定類別時，將核聯(lián)合稀疏表示的殘差與基于超像素分割的KNN算法相結合，在決策函數(shù)中加入正則化參數(shù)，用殘差和KNN算法得到的距離共同確定測試像元的類別。

1 基本原理

1.1 遞歸濾波處理

遞歸濾波[13]可以去除圖像中的紋理和噪聲，同時很好地保留了圖像的尖銳邊緣和邊界。具體地說，給定一個變換域Un，將原域U中的一維信號I轉換到新域Un中，則一個輸入信號I可以轉換為一個域轉換信號，如下所示:

其中，Ii為第i個輸入信號。Un表示第n域變換信號，δs和δr分別為濾波器的空間參數(shù)和距離參數(shù)。經(jīng)過域變換處理后，對變換后的信號進行射頻處理如下:

其中，Jn是第n個信號的濾波輸出結果，a=為反饋系數(shù)，且a∈[0,1]，通過調(diào)節(jié)a實現(xiàn)圖像的平滑。

定義變換域中相鄰信號Un與Un-1之間的距離為（|新域Un中的相鄰樣本之間的歐幾里得距離必須等于原域U相鄰樣本之間的歐幾里得距離）。隨著c增加，ac→0，公式(1)的遞歸過程會逐漸收斂，迭代終止，在變換域Un中，位于同側信號的兩個樣本距離會越來越近，而位于不同側的兩個樣本則距離越來越遠，從而起到了對邊緣信號的保護作用。

1.2 熵率超像素分割

超像素分割[14]是一種將圖像按照紋理、顏色和其他具有視覺意義的特征進行分塊的圖像分割技術，該方法廣泛應用于圖像處理和機器視覺領域，可以充分利用高光譜圖像的空間信息。

文中采用的是改進的超像素分割方法——基于圖上隨機熵率的超像素分割方法[15]。具體的目標函數(shù)表達式為：

式(3) 分為兩部分，H(A)是熵率項，B(A)是平衡項，參數(shù)λ≥0是控制熵率項和平衡項貢獻的權重。

如果說熵率項是為了獲得緊湊和均勻的集群，那么，平衡項就是有利于降低不平衡的集群個數(shù)，使集群能夠具有相同的尺寸，定義：

NA代表對圖進行分割之后獲得子群的數(shù)目，ZA為集群成員的分布，pZA(i)為第i個子集項中所含點數(shù)比例大小。

針對高光譜遙感圖像而言，主要使用超像素分割對圖像進行空間特征的提取。首先需要通過特征變換的方法，將原始數(shù)據(jù)轉換到低秩特征空間，常用的方法是采用主成分分析得到圖像的前三個主成分光譜波段，然后使用圖像的光譜信息和空間信息進行熵率超像素分割，采用貪婪算法有效地得到分割后的圖像塊，從而得到圖像中每個像元的分割標簽。

1.3 核稀疏表示模型

高光譜圖像的高維特性、不確定性、信息冗余以及噪聲等原因，導致高光譜數(shù)據(jù)結構極其復雜，利用傳統(tǒng)的線性分類算法得到的分類結果有待于進一步提高。核函數(shù)可以將高維數(shù)據(jù)集映射到特征空間中，在這個特征空間中，數(shù)據(jù)集為線性可分的[10]。原始向量空間的核函數(shù)可定義為特征空間中元素內(nèi)積的形式：

文中采用的是徑向基核函數(shù)：κ(xi,xj)=exp(-γ。

給定一個原始像元x∈?B，φ(x)為該像元在特征空間中的表示形式，原始空間中像元x的核稀疏表示為：

Aφ的列向量表示訓練樣本在特征空間中的表示形式，α′為像元x的稀疏表示。原始空間中的核線性稀疏模型為：

K0為稀疏度，上述問題可以通過基于核的正交匹配追蹤算法求解。

(Aφ):,m為第m類訓練樣本，為像元x在特征空間中用第m類訓練樣本表示的稀疏系數(shù)矩陣，(kA,x)m表示特征空間中像元x與第m類訓練樣本的核表示，(KA)m,m表示特征空間中訓練樣本集A中第m類訓練樣本的核表示。

1.4 核聯(lián)合稀疏表示模型

高光譜圖像除了光譜信息外，還存在豐富的空間信息，例如鄰域像元屬于同一類的可能性很大，因此提出核聯(lián)合稀疏表示模型，利用了鄰域像元的空間相關性，默認鄰域像元具有共同的稀疏模式，即鄰域像元的稀疏矩陣中非0元素在同一行。

原始鄰域像元集X=[x1,…,xT]在特征空間中的表示形式為：

行稀疏矩陣E′的求解可表示為如下的優(yōu)化模型：

計算每類訓練樣本對應的重構殘差：

測試樣本x的最終類別為具有最小重構殘差的類別：class(x)=。

2 基于改進核聯(lián)合稀疏表示和KNN 算法的高光譜圖像分類算法

2.1 基于超像素分割的KNN算法

雖然超像素分割方法的原理是將光譜信息相似的像元定義為相同的超像素，但是超像素塊包含的像元越多，同一超像素中屬于同一類別的概率就越低，如果超像素塊中所有的像元都參與測試樣本的分類，將會存在一定的誤差，另一方面，在選擇訓練樣本時也存在隨機性和同類異譜、同譜異類的現(xiàn)象。因此，對超像素像元集XC進行KNN 算法，通過k1參數(shù)的設定，篩選出每類中最具有代表性的訓練樣本，通過k2參數(shù)的設定，篩選出超像素塊中最具有代表性的測試樣本。算法步驟如下：

圖1 基于改進核聯(lián)合稀疏表示算法流程圖

設第c個超像素塊XC中有n1個像元，XC,{i}為XC的第i個像元，Am為第m類訓練樣本，包含n2個訓練樣本，Am,{j}為第m類訓練樣本的第j個像元，定義XC,{i}與Am,{j}的距離：

Step1：依次選擇n2個訓練樣本，計算d(XC,{i},Am,{1}),…,d(XC,{i},Am,{n2})；

Step2：按從大到小的順序依次排列，重新定義為d1(i,1),…,d1(i,k1),…,d1(i,n2)；

Step3：選擇與前k1個訓練樣本的距離的平均值作為第i個測試像元XC,{i}與第j類訓練樣本Am的距離，定義為：；

Step4：依次計算n1個測試樣本與第m類訓練樣本的距離d(XC,{1},Am),…,d(XC,{n1},Am)；

Step5：按從大到小的順序依次排列，重新定義為d(1,m),…,d(k2,m),…,d(n1,m)；

Step6：選擇前k2個數(shù)的平均值作為第C個超像素塊XC與第m 類訓練樣本Am的距離，定義為：；

Step7：每一個像元x與各類訓練樣本集的距離：d(x,Am)=d(XC,Am),x∈XC.

2.2 超像素分割和鄰域相結合的核聯(lián)合稀疏表示模型

在實際情況中，鄰域以外的像元也存在光譜信息相近的情況，只考慮鄰域像元，會造成空間信息利用不充分的情況，會直接影響分類結果。而超像素分割后的圖形區(qū)域恰好彌補了鄰域的缺陷，同時，在這些選中的區(qū)域內(nèi)，同譜異類和同類異譜的現(xiàn)象普遍存在又無法避免，因此提出超像素分割和鄰域相結合的核聯(lián)合稀疏表示模型，對參與核聯(lián)合稀疏表示的像元進行篩選，選出優(yōu)質像元集。具體步驟如下：

定義與測試樣本x屬于同一超像素的像元集定義為XC，鄰域內(nèi)的像元集定義為XL,定義混合像元集XM={XC,XL}；

Step1：計算XM的相似度矩陣，定義為W；

Step2：若W中的所有元素均大于參數(shù)δ，令X=XM進行步驟(4)，否則，Step3；

Step3：利用譜聚類將XM分為兩類，定義x∈X(1)，其余為X(2)，若X(1)所包含的像元個數(shù)超出X(2)所含像元個數(shù)或與X(2)所含像元個數(shù)相差不大，則X=X(1)；反之，X=X(2)；

Step4：利用公式計算相關矩陣

Step6：更新迭代次數(shù)t=t+1；

Step7：索引集Λ=Λt-1，稀疏系數(shù)矩陣=((KA)Λ,Λ+λI)-1(KA,X)Λ,:；

在確定測試像元的類別時要同時，考慮超像素像元和鄰域像元，在決策函數(shù)中加入正則化參數(shù)ξ，來平衡兩者之間的關系，如式(13)所示：

3 實驗結果及分析

3.1 實驗數(shù)據(jù)集

為了驗證本文方法的有效性，使用兩個廣泛使用的真實數(shù)據(jù)集Indian Pines和Salinas高光譜數(shù)據(jù)進行實驗。

Indian Pines數(shù)據(jù)集：由機載成像光譜儀采集的位于印第安納州西北部關于印第安納松樹的高光譜影像，空間分辨率為20 m，波長范圍為0.4～2.5 微米，由145×145 個像素點和220 個波段組成，除去吸水和噪聲波段后保留200個有效波段，數(shù)據(jù)集中的地物類別共16 類，有幾類地物如Alfalfa、Grass-pasture-mowed和Oats等的樣本數(shù)量非常少，這在一定程度上為分類增加了難度。

Salinas數(shù)據(jù)集：由機載成像光譜儀采集的位于美國加利福尼亞州的Salinas山谷所成的影像，空間分辨率3.7m，波長范圍0.4～2.5 微米，由512×217 像素點和224 個波段組成，除去吸水和噪聲波段還保留204 個有效波段，數(shù)據(jù)集中的地物類別共有16類。

3.2 實驗結果

Indian pines 實驗中隨機抽取各類樣本的10%作為訓練樣本、剩余90%作為測試樣本，鄰域大小為9x9，k1=5，k2=9，稀疏度k0=25，超像素塊N=2 800,正則化參數(shù)λ=0.2，取10 次實驗的平均值作為最終的實驗結果。Salinas實驗中隨機抽取各類樣本的5%作為訓練樣本、剩余95%作為測試樣本，鄰域大小為7×7，k1=5,k2=9,稀疏度k0=20，超像素塊N=3 500,正則化參數(shù)λ=0.3，取10次實驗的平均值作為最終的實驗結果。分別與OMP、KNN、SVM、SOMP、KSPCK 方法進行對比，評價標準有總體分類精度(OA)、平均分類精度(AA)、Kappa系數(shù)三個指標。

Indian pines實驗中，OMP、KNN、SVM方法的分類精度均不超過85%，并且含有很多離散錯分點，如圖2(a-c)所示；SOMP、KSPCK 方法的分類精度分別為95.88%和98.40%，而本文方法的分類精度為99.06%，邊界更加清晰，小樣本地物的分錯率更低。除此以外，由表1 得，第1、6-9、13、15 類地物的分類精度為100%。

表1 Indian pines及Salinas數(shù)據(jù)集分類精度對比

圖2 Indian pines數(shù)據(jù)集分類圖

Salinas實驗中，OMP、KNN、SVM方法的分類精度均不超過86%，并且含有很多離散錯分點，如圖3(a-c)所示；SOMP、KSPCK 方法的分類精度分別為92.55%和96.54%，而本文方法的分類精度為98.78%，邊界更加清晰，小樣本地物的分錯率更低。除此以外，由表1得，第1、3、9、11類地物的分類精度為100%。

圖3 Salinas數(shù)據(jù)集分類圖

4 結論

針對高光譜圖像同譜異類和同類異譜現(xiàn)象以及邊界噪聲對分類精度的影響，提出一種基于改進核聯(lián)合稀疏表示和KNN 算法的高光譜圖像分類方法。利用光譜信息和空間信息，將鄰域像元集和超像素分割像元集相結合，通過改進的核稀疏表示計算殘差，再通過KNN算法計算測試像元與各訓練樣本集的距離，最后建立決策函數(shù)完成分類。與其他方法相比，整體分類精度與每類分類精度都有明顯提高。