謝水根 李文娟
(1. 武漢中地數(shù)碼科技有限公司, 湖北 武漢 430073;2. 杭州海康威視數(shù)字技術股份有限公司 浙江 杭州 310000)
高光譜圖像分類是高光譜領域的研究熱點。高光譜圖像分類技術是指通過對圖像各像元進行特征提取及唯一性表達,然后利用一定的算法依據(jù)像元所表達特征,依次賦予特定類別標簽的過程。高光譜圖像分類已廣泛應用于土地利用、環(huán)境調查、精準農(nóng)業(yè)等領域。
高光譜圖像分類研究已取得較好的進展。引入空間特征進行高光譜圖像分類是當前高光譜圖像分類中主要的方法手段,根據(jù)實現(xiàn)手段可以分為超像元、特征融合、深度網(wǎng)絡、復合核、基于圖等方式,其中特征融合是當前利用空間特征進行高光譜圖像分類的主流方式之一,但特征融合方式多為直接堆疊式,但由于不同圖像因其面向對象不同,因此對不同特征的適用性不同,故而直接采取堆疊式特征融合過于機械。
雖然空間特征的利用方式多樣,但其本質皆是利用了像元分布上的空間相關性,而地物的分布往往具有聚類性和延續(xù)性,因此地物的邊界信息對于圖像分類來說具有一定的應用價值,而傳統(tǒng)分類方法中往往忽略了地物邊界信息。此外,訓練樣本是高光譜圖像監(jiān)督分類中的重要基礎,對于訓練樣本的選取與標定需要耗費大量人力物力,因此,研究基于小訓練樣本的高光譜圖像分類方法具有重要意義。
綜上所述,本文提出顧及小樣本及權重融合的極限學習機高光譜圖像分類方法,首先通過主成分分析(principal component analysis,PCA)對高光譜圖像進行降維,以降低運算復雜度;其次利用第一主成分作為引導圖對剩余主成分進行引導濾波,以保留邊界信息;再次利用拓展形態(tài)學屬性剖面提取圖像結構特征并與引導濾波進行權重融合;最后利用極限學習機對融合結果進行分類,得到最終分類結果。
I
,引導圖G
,濾波輸出圖像O
,G
與O
在以像元點c
為中心的領域窗口存在局部線性轉換,如式(1)所示。(1)
式中,w
表示以像元點c
為中心的窗口;a
和b
為窗口w
的線性系數(shù);G
表示引導圖在窗口w
中的像元點。為求解式(1)中的線性系數(shù)a
、b
,通過對輸入圖像I
進行約束以決定線性系數(shù)的取值,在保持局部線性關系的同時,通過最小化I
和O
之間的最小差距,從而將求解線性系數(shù)問題轉化為求最優(yōu)解問題,如式(2)所示。(2)
式中,ε
為正則化參數(shù),其作用為避免a
值過大,且ε
>0,I
表示輸入圖像的一個像元點i
。通過線性回歸模型,可對式(2)求解,如式(3)所示。(3)
但由于像元點在空間上往往會被包含在多個窗口的重疊區(qū)域,每個窗口的線性系數(shù)不一致,其計算得出的結果也必然不同,因此,為解決這個問題,最簡單的辦法就是對所有得到的值求取平均值,如式(4)所示。
(4)
根據(jù)窗口對稱性,式(4)可以轉化為式(5)。
(5)
拓展形態(tài)學多屬性剖面(extended multi-attribute profiles,EMAPs)是通過形態(tài)學屬性剖面(morphological attribute profiles,MAP)進行一系列不同屬性指標的濾波器進行圖像濾波以獲取不同屬性特征信息,再將不同屬性信息進行疊加即可得到拓展形態(tài)學屬性剖面。
具體原理為:假設有灰度圖像I
,某屬性指標f
,連通分量C
,閾值T
,則根據(jù)式(6)判斷進行細化或粗化操作。(6)
當滿足式(6)時,則該連通分量并入相近區(qū)域,根據(jù)并入相近區(qū)域灰度值大小劃定細化和粗化操作。當給定多個閾值時,即可產(chǎn)生一系列結果,基于此,對不同的多個屬性進行操作,最后疊加即可生成EMAPs。詳細原理可見文獻[13]。
極限學習機(extreme learning machine,ELM)是由黃廣斌教授提出的一種快速、高效的單隱層學習網(wǎng)絡,已被廣泛應用于高光譜圖像分類,詳細原理可參見文獻[14]。
為應對高光譜圖像分類中邊緣信息丟失、特征融合方式機械等問題,本文基于權重特征融合與極限學習機進行分類,方法流程圖見圖1所示。
圖1 本文方法流程圖
如圖1所示,首先利用PCA對高光譜圖像進行處理,以達到降維目的,降低運算復雜度,然后利用GF和EMAPs分別提取保存邊緣信息的GF結果以及拓展形態(tài)學屬性剖面特征,值得注意的是,對GF中所需引導圖以第一主成分代替,隨后通過分別設置1∶4、2∶3、1∶1、3∶2、4∶1的權重比值進行特征融合,尋找對該數(shù)據(jù)最合適的權值比值,并以此作為最終輸入至ELM進行分類的融合特征,得到最終分類結果。
為驗證本文方法的有效性和穩(wěn)定性,采用當前國內外公認的三組標準數(shù)據(jù)集,印第安納松樹數(shù)據(jù)集(Indian Pines,IP)、帕維亞大學數(shù)據(jù)集(Pavia University,PU)、薩利納斯場景數(shù)據(jù)集(Salinas,SA),各數(shù)據(jù)集具體信息如表1所示。
表1 實驗數(shù)據(jù)信息表
表1中,AVIRIS是指美國的機載可見光近紅外成像光譜儀(airborne visible infrared imaging spectrometer,AVIRIS),ROSIS則為德國的高光譜傳感器反射光學系統(tǒng)成像光譜儀(reflective optics system imaging spectrometer,ROSIS)。
為客觀的驗證本文方法的效果,對方法及比較方法中所用的相關算法進行參數(shù)設定,主要有:
(1)PCA為取對應前99%信息量的主成分。
(2)GF為取第一主成分為引導圖,濾波窗口3×3。
(3)EMAPs為閾值設置為100、200、500、1 000。
(4)ELM為正則化因子為2、2、…2,隱層節(jié)點數(shù)設為1 000。
支持向量機(support vector machine,SVM):正則化因子為2、2、…2,徑向基核參數(shù)為2、2、…2。
此外,本文實驗環(huán)境為Intel(R) Core(TM) i5-10300H,主頻2.5 GHz,內存16 GB,操作系統(tǒng)Windows 10,算法實現(xiàn)環(huán)境為Matlab R2020。
為比較本文方法的優(yōu)劣,利用ELM、SVM、ELM-EMAPs三類方法進行對比實驗,以常用的總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)、KAPPA系數(shù)(Kappa系數(shù)用于衡量分類精度,K)三類指標作為本文精度評價指標,且實驗中分別隨機選取每類5、10個像元作為訓練樣本,以驗證本文方法在小訓練樣本中的適用性,其中ELM-EMAPs指利用ELM對EMAPs特征進行分類。
2.3.1
權重確定由于不同特征對不同場景圖像適用性不一,因此需根據(jù)具體圖像數(shù)據(jù)對GF特征和EMAPs特征進行權重設定。在本文中,以每類5像元作為訓練樣本,對應GF特征和EMAPs特征,按權重比值,分別設定為1∶4、2∶3、1∶1、3∶2、4∶1(即GF特征比例為20%、40%、50%、60%、80%),并進行特征融合分類,三組實驗數(shù)據(jù)集的分類結果見圖2。
圖2 引導濾波權重值與三組實驗數(shù)據(jù)分類精度關系
從圖2可知,當特征權重不同時,分類的總體精度存在一定差異,且每組實驗數(shù)據(jù)都存在一個最優(yōu)的權重取值,圖2中,IP、PU、SA分別在GF權重為0.8、0.5、0.5時取得最優(yōu),因此,以此作為后續(xù)每組實驗數(shù)據(jù)分類中GF和EMAPs特征融合權重值。
2.3.2
分類及精度以每類5、10個像元作為訓練樣本,分別利用SVM、ELM、ELM-EMAPs、本文方法進行分類,并計算分類精度與運算時間,分類結果如圖3~圖4所示(本文僅展示IP數(shù)據(jù)在2組訓練樣本及4種方法下的分類結果)。
本文方法分類效果是在如圖3、圖4所示每類5及10個像元的情況下,皆要優(yōu)于3類對比方法,圖中各分類圖虛線框所標注的可知,SVM及ELM方法僅使用光譜特征,存在眾多誤分錯分現(xiàn)象,當EMAPs被引入后,錯分誤分現(xiàn)象有所減少,這是因為EMAPs利用了高光譜圖像的空間特征,而本文方法可在ELM-EMAPs的基礎上得到進一步的精度提升,相比前面3種對比方法,本文方法具有最優(yōu)分類精度。具體分類精度及運算時間如表2~表4所示。其中,最優(yōu)分類精度和最短運算時間已加粗表示。
圖3 每類5個像元IP數(shù)據(jù)分類結果
圖4 每類10個像元IP數(shù)據(jù)分類結果
表2 印第安納松樹數(shù)據(jù)集不同方法分類結果評價表
表3 帕維亞大學數(shù)據(jù)集不同方法分類結果評價表
表4 薩利納斯場景數(shù)據(jù)集不同方法分類結果評價表
可知,本文方法相比其他三類比較方法,在面向小訓練樣本時具有精度優(yōu)勢,且運算時間較短,具備一定的實際應用意義。
面對高光譜圖像分類中的邊緣及特征融合問題,提出了一種面向小樣本、結合權重融合及極限學習機的高光譜圖像分類方法。本方法通過引導濾波提取圖像邊緣信息,利用拓展形態(tài)學多屬性剖面提取結構信息,通過列出多組權值進行實驗選擇最優(yōu)的權重,然后通過極限學習機完成分類。實驗結果表明,本文方法在精度和時效性上皆具有一定優(yōu)勢,具備一定應用價值。