高 劍,孫 輝,2,潘之騰,李建梅
(1.菏澤市科學(xué)技術(shù)信息研究所,山東 菏澤 274000;2.南京郵電大學(xué),江蘇 南京 210003;3.菏澤市產(chǎn)品檢驗(yàn)檢測(cè)研究院,山東 菏澤 274000)
近年來,人們對(duì)于遙感信息的清晰程度有著更高的要求,如何快速地提取遙感圖像信息已經(jīng)成為該領(lǐng)域重要的研究?jī)?nèi)容。傳統(tǒng)的信息快速提取方法大致分為兩類,分別為監(jiān)督分類和非監(jiān)督分類,兩類方法的原理均為概率統(tǒng)計(jì)[1-2],但是由于遙感圖像具有一定復(fù)雜性,容易出現(xiàn)“同物異譜”或“異物同譜”等現(xiàn)象,而傳統(tǒng)的概率統(tǒng)計(jì)方法對(duì)于圖像光譜的特征正態(tài)分布具有先驗(yàn)性要求,采用這種方法無法提高遙感圖像的識(shí)別精度?;诖?,國(guó)內(nèi)外的專家學(xué)者積極研究,以期優(yōu)化遙感信息的提取過程,提高圖像提取精度和提取效率。如文獻(xiàn)[3]提出的基于小波核局部Fisher 判別分析的遙感圖像特征提取方法,利用小波變換映射數(shù)據(jù)集,分析數(shù)據(jù)的局部信息,利用加權(quán)矩陣計(jì)算散度矩陣,利用局部Fisher 判別方法求解最優(yōu)特征矩陣。文獻(xiàn)[4]提出基于點(diǎn)特征檢測(cè)的航空遙感圖像配準(zhǔn)方法,基于SNS 算法完成空間極值點(diǎn)坐標(biāo)值和特征尺度的獲取,消除偽特征點(diǎn),獲取特征點(diǎn)定位,最后利用奇異值分解法完成矩陣優(yōu)化,實(shí)現(xiàn)數(shù)據(jù)降維和重構(gòu)。以上兩種方法未能引用分類回歸樹方法,導(dǎo)致遙感信息特征提取存在偏差,提取時(shí)間增加,容錯(cuò)率下降。為此,本文提出一種基于分類回歸樹方法的城市綠化遙感信息快速提取方法。仿真實(shí)驗(yàn)結(jié)果表明,所提方法能夠有效減少遙感信息提取時(shí)間和偏差,同時(shí)全面增加容錯(cuò)率。
本文先采用主成分分析法對(duì)圖像進(jìn)行去噪處理。利用該方法通過線性投影將遙感信息投影到新的坐標(biāo)系中,以促使新成分通過信息量分布[5]。其信息量的大小并不意味著主成分信噪比的高低,還受噪聲方差等參數(shù)的影響[6-7]。利用經(jīng)過噪聲調(diào)整的主成分分析法(Noise Adjusted PCA, NAPCA)完成原始信息的去噪,提高遙感信息的特征提取效果,以此在保證圖像信息完整的前提下有效抑制噪聲。
設(shè)P=[x1,x2,…,xP]T表示P×Q維矩陣,E(X)=0表示行向量均值,Σ=D(X)表示協(xié)方差矩陣,當(dāng)均值不為0 時(shí),采用Y=X-E(X)將行向量均值轉(zhuǎn)換為0,則有:
如果X=S+N,S和N兩者均為X中的噪聲,S和N兩者不存在任何關(guān)聯(lián),則有:
式中:ΣS代表S的協(xié)方差矩陣;ΣN代表N的協(xié)方差矩陣。
NAPCA 的操作過程如下所示:
1)對(duì)遙感圖像進(jìn)行向量處理[8],形成一個(gè)m行n列的圖像,同時(shí)將其排列成為一個(gè)Q元列向量,即:
2)讓各個(gè)向量減去均值向量,即Y=X-E(X)。
3)計(jì)算ΣN的特征值向量矩陣E和對(duì)角矩陣ΛN,其中:
5)利用矩陣F進(jìn)行去噪處理[9]。
6)計(jì)算協(xié)方差矩陣的特征向量G,使其滿足約束條件,同時(shí)設(shè)定特征值對(duì)角矩陣。
7)進(jìn)行NAPCA 變換,同時(shí)使其滿足A=FG。
傳統(tǒng)小波具有良好的時(shí)域特性,但其在進(jìn)行遙感圖像重建時(shí)邊緣位置會(huì)出現(xiàn)失真等情況,導(dǎo)致重建后的圖像效果并不理想,這主要是由于傳統(tǒng)小波不具有平移不變性,且其圖像處理易混疊導(dǎo)致的[10-11]?;诖?,本文采用復(fù)小波變換(Complex Wavelet Transform, CWT)對(duì)圖像進(jìn)行重建。本文選用的方法不僅時(shí)頻分析能力較好,還可消除冗余數(shù)據(jù),能較好地完成圖像重建。復(fù)小波系數(shù)的幅值能夠精確表達(dá)任意位置的頻譜分量,有效克服圖像混疊和振蕩問題。
在小波域上,設(shè)定:
式中:設(shè)ω1和ω2為純凈信號(hào)系數(shù),其中ω2是ω1的父小波系數(shù);n1和n2代表噪聲系數(shù)。以下給出BivaShrink 函數(shù)的表達(dá)式:
式中,σn代表噪聲方差,其中:
式中M代表鄰域S中所包含的像素點(diǎn)數(shù)量。
以下給出具體的遙感信息去噪操作步驟:
1)利用NAPCA 法完成圖像數(shù)據(jù)的降維處理[12],獲取內(nèi)含能量的波段。
2)對(duì)少能量波段先進(jìn)行去噪再進(jìn)行復(fù)小波變換,然后利用BivaShrink 算法對(duì)小波系數(shù)進(jìn)行收縮處理,最后對(duì)波段進(jìn)行復(fù)小波變換處理。
3)先采用復(fù)小波對(duì)少能量數(shù)據(jù)塊進(jìn)行變換,然后利用鄰域閾值法對(duì)小波系數(shù)進(jìn)行收縮,最后對(duì)其進(jìn)行復(fù)小波逆變換。鄰域閾值方法對(duì)應(yīng)的計(jì)算式為:
4)利用前期保存的波段和重新得到的波段進(jìn)行數(shù)據(jù)重構(gòu),獲取去噪的圖像。
分類回歸樹分析方法主要對(duì)測(cè)試變量和目標(biāo)變量組成的訓(xùn)練集進(jìn)行訓(xùn)練,最終完成數(shù)據(jù)分類或回歸[13]。在城市綠化遙感信息快速提取的過程中,目標(biāo)變量為本文需要提取的信息類型,測(cè)試量為信息提取時(shí)的分類特征。整個(gè)算法主要具有以下幾方面的優(yōu)勢(shì),分別為:
1)操作過程簡(jiǎn)單;
2)運(yùn)行速度快;
3)具有較高的準(zhǔn)確性;
4)能夠處理大規(guī)模的數(shù)據(jù)以及高維數(shù)據(jù);
5)能夠有效處理非線性關(guān)系。
在訓(xùn)練過程中,其最佳測(cè)試變量選取為基尼系數(shù),其計(jì)算公式如下所示:
其中:
式中:p(j|h)表示訓(xùn)練集中隨機(jī)一個(gè)樣本,當(dāng)任意測(cè)試變量為h時(shí)屬于第j類概率的樣本數(shù)量;n(h)代表訓(xùn)練樣本中測(cè)試變量值為h的樣本數(shù);j代表遙感信息的類型數(shù)量。
大部分分類回歸樹的建立是作為訓(xùn)練樣本的假設(shè)數(shù)據(jù),但是這樣會(huì)導(dǎo)致算法的容錯(cuò)性能較差。以下重點(diǎn)針對(duì)分類回歸樹的特點(diǎn)構(gòu)建特征提取準(zhǔn)則。
分析不同的城市綠化遙感信息快速提取準(zhǔn)則可知,遙感信息的不同分類特征對(duì)信息的分類能力也完全不同。結(jié)合地物表面的粒子粗糙程度以及光線入射波長(zhǎng)的基礎(chǔ)理論可知,地物的反射光為確定的,但是由于不同地物表面具有非均勻性和多變性,促使各個(gè)地物的反射模型以及光譜也完全不同。
假設(shè)選定的特征提取準(zhǔn)則為Bayes 判別準(zhǔn)則,能夠獲取如下形式的概率密度函數(shù):
通過Bayes 判別準(zhǔn)則可知:
式中:P(ωi)代表ωi出現(xiàn)的先驗(yàn)概率;P(X|ωi)代表ωi中X出現(xiàn)的條件概率;P(ωi|X)代表X屬于ωi的后驗(yàn)概率。
其中后驗(yàn)概率的等效形式為:
為了簡(jiǎn)化計(jì)算過程,后驗(yàn)概率選取自然對(duì)數(shù),則能夠?qū)⑵浔硎緸椋?/p>
去掉和i無關(guān)的選項(xiàng)并沒有對(duì)判別結(jié)果產(chǎn)生影響,則公式(14)能夠簡(jiǎn)化為以下的形式:
通過對(duì)應(yīng)的判別準(zhǔn)則,考慮兩個(gè)類別進(jìn)行判別過程,決策邊界的取值為di(X)=dj(X)。
如果遙感信息中含有兩種不同類型的信息,分別為A和B,兩者各自出現(xiàn)的先驗(yàn)概率為α和β,則整個(gè)圖像的混合概率密度函數(shù)為:
在上述分析的基礎(chǔ)上,采用分類回歸樹方法進(jìn)行樣本訓(xùn)練,同時(shí)結(jié)合Bayes 判別準(zhǔn)則完成遙感信息快速提取,即:
為了驗(yàn)證所提基于分類回歸樹方法的遙感信息快速提取方法的綜合有效性,在Matlab 2017b 軟件中進(jìn)行實(shí)驗(yàn)測(cè)試。掃描DPI 為1 000,分辨率為1.27 m。
選取山東省某市作為研究區(qū)域,航空遙感圖像如圖1 所示,對(duì)其城市綠化的遙感信息進(jìn)行快速提取。
圖1 航空遙感影像實(shí)驗(yàn)區(qū)域
為便于與面向?qū)ο蟮姆诸惤Y(jié)果進(jìn)行比較,采用基于點(diǎn)特征檢測(cè)的航空遙感圖像配準(zhǔn)方法(文獻(xiàn)[4]方法)為對(duì)比方法,其主要采用SNS 算法進(jìn)行空間極值點(diǎn)坐標(biāo)值和特征尺度的獲取,讓其與本文方法一同對(duì)原始圖像進(jìn)行特征提取,對(duì)比其結(jié)果,如圖2 所示。利用本文方法完成遙感數(shù)據(jù)特征提取時(shí),先選擇合適樣本進(jìn)行訓(xùn)練,建立提取模板,其特征提取結(jié)果如圖2b)所示,其精度為96.7%,優(yōu)于對(duì)比方法。
圖2 特征提取結(jié)果圖
1)城市綠化遙感信息快速提取時(shí)間
本文選取基于小波核局部Fisher 判別分析的遙感圖像特征提取方法(文獻(xiàn)[3]方法)和基于點(diǎn)特征檢測(cè)的遙感圖像配準(zhǔn)方法(文獻(xiàn)[4]方法)作為對(duì)比方法,對(duì)比三種不同方法城市綠化遙感信息快速提取時(shí)間,具體實(shí)驗(yàn)對(duì)比結(jié)果如圖3 所示。
圖3 不同方法的城市綠化遙感信息快速提取時(shí)間對(duì)比
分析圖3 中的實(shí)驗(yàn)數(shù)據(jù)可知,本文所提方法的城市綠化遙感信息快速提取時(shí)間明顯低于另外兩種方法。最為主要的原因是采用分類回歸樹方法進(jìn)行樣本訓(xùn)練,簡(jiǎn)化操作過程,促使整個(gè)方法的城市綠化遙感信息快速提取時(shí)間得到明顯降低。
2)城市綠化遙感信息快速提取偏差
以下實(shí)驗(yàn)在9 個(gè)不同類型的測(cè)試樣本上進(jìn)行,分別對(duì)各個(gè)方法的城市綠化遙感信息快速提取偏差進(jìn)行對(duì)比,具體的實(shí)驗(yàn)測(cè)試結(jié)果如表1 所示。
表1 不同方法的城市綠化遙感信息快速提取偏差對(duì)比 %
根據(jù)表1 數(shù)據(jù)完成不同方法信息提取偏差的分析,由于測(cè)試樣本類型不同,所以各個(gè)方法的城市綠化遙感信息快速提取偏差也存在十分明顯的差異。本文方法將分類回歸樹方法引入到遙感信息快速提取過程中,促使整個(gè)方法的城市綠化遙感信息快速提取偏差明顯低于另外兩種方法,全面驗(yàn)證了本文方法的優(yōu)越性。
3)容錯(cuò)率
為更加全面地驗(yàn)證本文方法的有效性,以下實(shí)驗(yàn)測(cè)試將容錯(cuò)率設(shè)定為評(píng)價(jià)指標(biāo),具體的實(shí)驗(yàn)測(cè)試結(jié)果如圖4 所示。
圖4 不同方法的容錯(cuò)率對(duì)比
分析圖4 中的實(shí)驗(yàn)數(shù)據(jù)可知:本文方法的容錯(cuò)率最高;文獻(xiàn)[3]方法的容錯(cuò)率次之;文獻(xiàn)[4]方法的容錯(cuò)率最低。在實(shí)際應(yīng)用的過程中,本文方法引入了分類回歸樹方法,從而建立對(duì)應(yīng)的分類準(zhǔn)則,促使整個(gè)方法的容錯(cuò)率得到大幅度的提升。
針對(duì)目前已有方法存在遙感信息快速提取存在偏差、時(shí)間較長(zhǎng)及容錯(cuò)率較低等問題,本文結(jié)合分類回歸樹方法,提出一種基于分類回歸樹方法的遙感信息快速提取方法。仿真實(shí)驗(yàn)結(jié)果表明,本文方法能夠有效提升容錯(cuò)率,降低遙感信息快速提取偏差,縮短提取時(shí)間,獲取了更加滿意的特征提取結(jié)果。
現(xiàn)階段本文方法仍然存在一定的不足,需要進(jìn)一步進(jìn)行完善,具體內(nèi)容如下:
1)在采用分類樹回歸方法進(jìn)行樣本訓(xùn)練的過程中,如何降低整個(gè)方法計(jì)算的盲目性。
2)隨著研究的不斷深入,后續(xù)將進(jìn)一步對(duì)分類樹回歸方法進(jìn)行完善和固定,方便后續(xù)推廣及使用。
注:本文通訊作者為孫輝。