郭志民,孫玉寶,耿俊成,周 強(qiáng)
1(國(guó)網(wǎng)河南省電力公司 電力科學(xué)研究院,鄭州 450052 2(南京信息工程大學(xué) 信息與控制學(xué)院,江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京 210044)
近年來,遙感成像技術(shù)發(fā)展迅速,高光譜圖像的空間與光譜分辨率越來越高.與傳統(tǒng)的多光譜圖像不同,高光譜圖像中每個(gè)像素通常由幾十至幾百個(gè)光譜波段組成,形成連續(xù)的光譜曲線,包含更加豐富的光譜信息,能夠更加準(zhǔn)確地判別每個(gè)像素所反映的地物類別,因此在電力監(jiān)測(cè)、電力規(guī)劃、土地測(cè)繪、農(nóng)業(yè)等領(lǐng)域的應(yīng)用也越來越廣泛.然而,高的光譜分辨率在帶來優(yōu)點(diǎn)的同時(shí),也引入了一些新的挑戰(zhàn).第一個(gè)挑戰(zhàn)是維數(shù)災(zāi)難問題.高光譜圖像的標(biāo)注代價(jià)昂貴,而每個(gè)像素通常位于幾百維的高維空間中,很容易導(dǎo)致“維數(shù)災(zāi)難”現(xiàn)象[1].第二個(gè)挑戰(zhàn)是信息冗余問題.高光譜傳感器是在電磁波譜上進(jìn)行的稠密采樣,使得高維光譜特征具有很大的相關(guān)性.這種冗余的信息不僅會(huì)帶來計(jì)算和存儲(chǔ)的損耗,還會(huì)降低分類性能[2].
降維是解決以上問題的常用方法之一[3-5].在高光譜圖像處理中,波段選擇和特征變換是兩種最常用的降維方法.波段選擇[6,7]的目的是從給定波段中篩選出一個(gè)子集,以捕獲盡可能多的有效信息.而特征變換嘗試將原始的光譜波段按照一定的準(zhǔn)則投影到一個(gè)維度更低的子空間中,如主成分分析[8]和線性判別分析[9,10]等方法.主成分分析旨在最大化投影之后的數(shù)據(jù)方差,而線性判別分析則期望最大化類間散度矩陣并最小化類內(nèi)散度矩陣.不同于這兩種方法,局部流形保持投影[11]旨在保持相鄰數(shù)據(jù)間的幾何結(jié)構(gòu).在文獻(xiàn)[12]中,保局投影被成功地應(yīng)用于高光譜圖像分類中.
近年來,圖模型在遙感圖像分析中得到了非常廣泛的關(guān)注[13,14].構(gòu)造圖的關(guān)鍵在于確定鄰接關(guān)系和計(jì)算圖中任意兩點(diǎn)間的權(quán)重.其中,k近鄰法和ε球面鄰域法是常用來建立鄰接關(guān)系的兩種方法[15,16],而“高斯核”函數(shù)則是廣泛采用的計(jì)算頂點(diǎn)間權(quán)重的方法.為了更好地構(gòu)建圖模型,一些改進(jìn)的方法逐漸涌現(xiàn)出來.例如,在文獻(xiàn)[17]中,Wang和Zhang將非負(fù)局部線性重構(gòu)系數(shù)作為邊的權(quán)重,充分利用了每個(gè)鄰域的幾何結(jié)構(gòu)信息.類似地,Liu等人提出了基于彈性網(wǎng)稀疏表示的圖權(quán)重計(jì)算方法[18],該方法能夠很好地編碼數(shù)據(jù)的判別信息,并同時(shí)確定圖模型的鄰接關(guān)系和邊權(quán)重.
對(duì)于高光譜圖像分類而言,盡管圖模型能夠取得一定的效果,但已有的模型大多只考慮了光譜特征,而忽視了空間上下文信息.隨著成像光譜儀技術(shù)的不斷更新,現(xiàn)有的傳感器獲得的高光譜影像往往還具有非常高的空間分辨率.因此,局部區(qū)域的像素點(diǎn)通常隸屬同一目標(biāo)物體.對(duì)于一個(gè)較大的均勻區(qū)域,內(nèi)部的像素點(diǎn)可能具有不同的光譜響應(yīng).如果僅使用光譜特征,這些像素點(diǎn)可能會(huì)被劃分到不同的子區(qū)域中,顯然會(huì)帶來一定的問題.相反,對(duì)于多個(gè)相鄰的區(qū)域,如果僅使用空間信息,則這些區(qū)域很可能被劃分到同一個(gè)區(qū)域中.綜上所述,融合光譜和空間信息有利于獲得更為精確的結(jié)果.
現(xiàn)有的組合光譜和空間上下文信息的方法大致包含三種不同類型:特征級(jí)融合、決策級(jí)融合以及基于正則化的融合[2].特征級(jí)融合技術(shù)首先分別提取光譜特征和空間特征,然后將這些特征串聯(lián)成向量或構(gòu)建核函數(shù)[19,20]后再送入分類器.決策級(jí)融合技術(shù)首先利用光譜和空間信息得到多個(gè)預(yù)測(cè)結(jié)果,然后利用投票方法等策略將這些結(jié)果組合在一起[21].基于正則化的融合技術(shù)通常利用空間信息構(gòu)建一個(gè)正則項(xiàng),加入到原始的目標(biāo)函數(shù)中[22].
本文提出了一種基于譜-空?qǐng)D嵌入降維的多核融合分類算法(如圖1所示),屬于特征級(jí)融合方法.該算法主要由三個(gè)步驟組成:首先,將訓(xùn)練集中的每個(gè)像素點(diǎn)作為頂點(diǎn),每個(gè)頂點(diǎn)用對(duì)應(yīng)像素的光譜特征描述,以此構(gòu)造一個(gè)光譜圖,利用圖嵌入模型求得一個(gè)低維投影矩陣;其次,利用主成分分析模型提取高光譜圖像的第一個(gè)主成分,并將其劃分成不同大小的超像素塊,以每個(gè)超像素塊為頂點(diǎn),每個(gè)頂點(diǎn)用超像素塊中所有像素點(diǎn)的平均值來描述,從而構(gòu)造一個(gè)空間圖,使用圖嵌入模型再次求得一個(gè)低維投影矩陣;最后,對(duì)于高光譜圖像中的每個(gè)像素點(diǎn),可用兩個(gè)不同的投影矩陣分別求得其對(duì)應(yīng)的低維特征表示,利用多核學(xué)習(xí)的方法對(duì)兩者進(jìn)行融合,自適應(yīng)學(xué)習(xí)兩種特征的融合權(quán)重,可提升后續(xù)SVM分類的準(zhǔn)確性.
圖1 本文算法框圖
假設(shè)矩陣X=[x1,x2,…,xn]∈Rm×n表示由n個(gè)數(shù)據(jù)組成的訓(xùn)練集,其中,m為每個(gè)數(shù)據(jù)的特征維度.降維的目的是利用給定的數(shù)據(jù)將X∈Rm×n投影為Y∈Rd×n,其中,d?m.給定投影矩陣V,線性降維可表示為:Y=VTX.
圖嵌入模型基于譜圖理論,旨在保持?jǐn)?shù)據(jù)之間的幾何結(jié)構(gòu),其目標(biāo)函數(shù)可以寫成如下形式:
(1)
式(1)中,yi和yj分別表示樣本xi和xj的低維投影,權(quán)重矩陣W中元素wij表示xi和xj之間的連接權(quán)重,若頂點(diǎn)間沒有連接,則權(quán)重wij=0.
為了去除尺度的影響,圖嵌入模型通常需要添加額外的約束項(xiàng),比如VTXDXTV=I.因此,(1)式可以重新寫成如下形式:
(2)
式中,tr(·)表示矩陣的跡,D為對(duì)角矩陣,其對(duì)角元素為Dii=∑jwij,L=D-W為圖拉普拉斯矩陣.式(2)的解可通過求解泛化的特征值問題獲得:
XLXTV=λXDXTV
(3)
針對(duì)高光譜圖像中豐富的譜-空信息,本文提出了一種譜-空?qǐng)D嵌入模型.首先,分別利用光譜和空間信息構(gòu)造兩個(gè)不同的圖:光譜圖和空間圖.然后,利用圖嵌入模型提取每個(gè)像素的光譜特征和空間特征.最后,利用多核學(xué)習(xí)的方式對(duì)光譜和空間特征進(jìn)行有效融合.
為了減少光譜信息間的冗余性,本文采用圖嵌入模型對(duì)光譜特征進(jìn)行進(jìn)一步提取.具體而言,以H中的像素為頂點(diǎn)構(gòu)造一個(gè)光譜圖,任意兩個(gè)頂點(diǎn)xi和xj之間的權(quán)重通過“熱核”函數(shù)求解:
(4)
其中,N(xj)表示xj像素的k個(gè)最近鄰像素,t為“熱核”函數(shù)的尺度參數(shù).由式(4)中求得的wij可推導(dǎo)出光譜圖拉普拉斯矩陣L1,代入式(2),可得投影矩陣V1.
類似地,可以通過H中的空間信息構(gòu)造一個(gè)空間圖.由于H中通常包含不同大小和形狀的目標(biāo)物體,因此采用固定大小的空間鄰域進(jìn)行特征提取很容易造成信息的丟失.基于超像素的方法[23]能夠很好地解決此類問題,每個(gè)超像素的大小和形狀可根據(jù)局部結(jié)構(gòu)信息自適應(yīng)地調(diào)整.過分割是形成超像素塊的常用方法,受文獻(xiàn)[24]啟發(fā),本文采用基于熵率的超像素分割方法生成超像素[25].為了減少計(jì)算量,首先利用主成分分析模型提取H的第一個(gè)主成分H1∈Rw×h,然后采用文獻(xiàn)[25]中的方法對(duì)H1進(jìn)行過分割,整個(gè)過程如圖2所示,其中白色的分割線即為超像素的輪廓.
在得到超像素后,以它們?yōu)轫旤c(diǎn),構(gòu)建空間圖.圖中任意兩點(diǎn)的權(quán)重同樣可由式(4)求得,此時(shí)xi和xj為第i和第j個(gè)超像素中所有像素的平均值.最后,利用式(2),可得第二個(gè)投影矩陣V2.對(duì)于H中的任意一個(gè)像素點(diǎn)xk∈Rm,其光譜和空間特征可分別表示為:
(5)
譜-空特征融合的主要目標(biāo)是通過多核方法自動(dòng)地學(xué)習(xí)融合權(quán)重d1和d2,使得生成的融合特征為:
(6)
(7)
(8)
式(8)可看作一個(gè)典型的多核學(xué)習(xí)問題.為了同時(shí)優(yōu)化融合權(quán)重d1和d2,以及拉格朗日乘子αk和αl,本文采用Simple MKL算法[26]進(jìn)行求解.
進(jìn)一步本文依據(jù)一對(duì)多(one-verse-all)策略,由(8)式訓(xùn)練C個(gè)二分類SVM,其中第i(1≤i≤c)個(gè)SVM分類器將輸入樣本分類為第i類與非i類.要判別測(cè)試樣本屬于哪一類,需把該樣本分別代入C個(gè)SVM分類器中,取值最大的那個(gè)類別就是測(cè)試樣本所屬類別,進(jìn)而實(shí)現(xiàn)C類樣本的分類.高光譜圖像的譜-空?qǐng)D嵌入與多核分類算法完整流程如下:
算法1.譜-空?qǐng)D嵌入的高光譜圖像多核分類算法
輸入?yún)?shù):高光譜圖像H∈Rw×h×m及其類別標(biāo)簽,
Step1.構(gòu)建光譜域圖,由(4)式計(jì)算光譜圖權(quán)種矩陣;
Step2.由(2)式求解得到光譜域投影矩陣V1;
Step3.采用熵率分割生成超像素,構(gòu)建空域圖,計(jì)算空間圖權(quán)種矩陣;
Step4.根據(jù)(2)式求解得到空間域投影矩陣V2;
Step5.根據(jù)(5)式計(jì)算降維后的光譜和空間特征
Step6.由(6)式生成降維后的融合特征;
Step7.由(7)式計(jì)算融合權(quán)重與SVM分類器(二分類)
Step8.依據(jù)一對(duì)多策略,訓(xùn)練C個(gè)SVM分類器
輸出:投影矩陣V1,V2,C個(gè)SVM分類器(二分類)
為了驗(yàn)證本文方法(簡(jiǎn)稱SSGE)的有效性,本實(shí)驗(yàn)在兩個(gè)通用的數(shù)據(jù)集上進(jìn)行了測(cè)試.第一個(gè)數(shù)據(jù)集為Indian Pines(IP),該數(shù)據(jù)由AVIRIS傳感器觀測(cè)美國(guó)印第安納西北部地區(qū)所得,獲取時(shí)間為1992年6月12日.原數(shù)據(jù)包含224個(gè)光譜波段,去除4個(gè)含有0值的波段以及20個(gè)受噪聲干擾的波段,利用剩余200個(gè)波段進(jìn)行實(shí)驗(yàn).該圖像的空間分辨率為20米,大小為145×145,每個(gè)像素對(duì)應(yīng)一定類型的地面覆蓋物,總共包含16種,如Alfalfa(苜蓿)、Corn(玉米)、Wheat(小麥)等等.圖3(a)展示了由波段57,27和17組成的三波段偽彩色圖.表1給出了IP數(shù)據(jù)集中樣本分布情況,第二列為數(shù)據(jù)集中各類地物所包含的樣本總數(shù),并將其分為訓(xùn)練集與測(cè)試集.第二列與第三列分別給出了后續(xù)實(shí)驗(yàn)中針對(duì)各類像素所使用的訓(xùn)練樣本數(shù)與測(cè)試樣本數(shù).
圖3 IP數(shù)據(jù)集(a)與PUS數(shù)據(jù)集(b)的偽彩色圖
表1 IP數(shù)據(jù)集中樣本分布情況
第二個(gè)數(shù)據(jù)集為Pavia University Scene(PUS),該數(shù)據(jù)為ROSIS傳感器于2002年7月8日,觀測(cè)意大利北部帕維亞大學(xué)所得.原影像包含115個(gè)光譜通道,覆蓋了0.43微米的可見光波段到0.86微米的紅外波段.去除含有噪聲的波段,利用其它103個(gè)波段進(jìn)行實(shí)驗(yàn).圖像大小為610×340,空間分辨率為1.3米.圖3(b)了三波段(90,60和40)偽彩色圖和類標(biāo)圖.表2詳細(xì)記錄了PUS數(shù)據(jù)集各類樣本(如:Asphalt(瀝青)、Meadows(草地)等)的分布情況以及實(shí)驗(yàn)中所使用的訓(xùn)練樣本數(shù)與測(cè)試樣本數(shù).
表2 PUS數(shù)據(jù)集中樣本分布情況
為了驗(yàn)證本文SSGE算法的性能,與四種不同的方法進(jìn)行了對(duì)比,即廣泛使用的主成分分析法(簡(jiǎn)稱PCA)、光譜圖嵌入法(簡(jiǎn)稱SpeGE)、空間圖嵌入法(簡(jiǎn)稱SpaGE)以及串聯(lián)光譜圖嵌入特征和空間圖嵌入特征法(簡(jiǎn)稱SpeSpa).對(duì)于這些方法,降維后的數(shù)據(jù)維度為5到50之間.分類器選用支持向量機(jī)模型[20],核函數(shù)選用徑向基核函數(shù),其參數(shù)采用交叉驗(yàn)證的方法從候選值{10-3,10-2,…,103}中進(jìn)行篩選.式(4)中的參數(shù)t和k分別設(shè)為1和5.所有算法的分類性能通過整體分類準(zhǔn)確率(OA)、平均分類準(zhǔn)確率(AA)、每類分類準(zhǔn)確率和Kappa系數(shù)進(jìn)行度量.
圖4 不同方法在IP數(shù)據(jù)上準(zhǔn)確率隨維度的變化
圖5 不同方法在PUS數(shù)據(jù)上準(zhǔn)確率隨維度的變化
圖4和圖5展示了四種算法的OA在兩個(gè)數(shù)據(jù)集上隨維度的變化情況.從中可以看出,不同方法的OA隨著維度的提高先呈現(xiàn)增長(zhǎng)的趨勢(shì)而后趨于穩(wěn)定,因?yàn)榫S度過低時(shí),會(huì)造成判別信息的丟失,而維度過高時(shí)又會(huì)存在信息冗余的情況.與PCA和SpeGE相比,在相同的維度下,SpaGE能夠獲得更高的準(zhǔn)確率,說明對(duì)于這兩幅高光譜圖像,空間信息比光譜信息更重要.此外,將光譜信息與空間信息直接串聯(lián)在一起,獲得的分類結(jié)果與SpaGE接近,并沒有充分發(fā)揮兩種特征的優(yōu)勢(shì).與之不同,當(dāng)用多核學(xué)習(xí)融合兩種特征時(shí),SSGE能進(jìn)一步提升分類性能,充分證明了本文算法的有效性.
表3 不同方法在IP數(shù)據(jù)集上的分類結(jié)果
表4 不同方法在PUS數(shù)據(jù)集上的分類結(jié)果
圖6 不同方法在IP數(shù)據(jù)上的可視化結(jié)果
為了驗(yàn)證算法的每類分類結(jié)果,表3和表4測(cè)試了當(dāng)數(shù)據(jù)維度降為40時(shí),不同方法的分類準(zhǔn)確率,黑色加粗字體表示同一類中最高的分類結(jié)果.與其它方法相比,SSGE在大部分類中都能獲得最高的分類結(jié)果,進(jìn)一步證明了SSGE算法的優(yōu)越性.此外,圖6和圖7對(duì)分類結(jié)果進(jìn)行了可視化,圖6(a),圖7(a)分別給出了兩個(gè)數(shù)據(jù)集的真實(shí)類標(biāo)圖(ground-truth),對(duì)比真實(shí)結(jié)果,SSGE能夠獲得更加平滑均勻的結(jié)果,異常點(diǎn)明顯少于其它幾種算法.
圖7 不同方法在PUS數(shù)據(jù)上的可視化結(jié)果
本文提出了一種譜-空?qǐng)D嵌入的降維算法,用于有效提取并融合高光譜圖像的光譜和空間信息.利用光譜信息和空間信息分別構(gòu)造光譜圖和空間圖,再將構(gòu)造的圖送入圖嵌入模型進(jìn)行特征提取,最后使用多核學(xué)習(xí)的方式將提取到的光譜和空間最優(yōu)地組合起來,從而得到良好的分類效果.本文的分類算法可推廣應(yīng)用于電力監(jiān)測(cè)、電力規(guī)劃等領(lǐng)域,提供有效的地物分類支撐.