周亞文,董廣軍,崔愛紅,姚強(qiáng)強(qiáng)
信息工程大學(xué),河南 鄭州,450001
?
基于CDS工具的高光譜影像降維與維度估計(jì)方法研究
周亞文,董廣軍,崔愛紅,姚強(qiáng)強(qiáng)
信息工程大學(xué),河南 鄭州,450001
高光譜影像降維策略是進(jìn)行高光譜影像處理和分析的重要基礎(chǔ),相關(guān)降維方法已經(jīng)被提出很多,可是絕對(duì)有效的方法仍未確定。本文對(duì)近年來(lái)一些具有代表性和前沿性的降維方法(PCA, ICA, MNF, LDA, MDS, PPCA, FA)進(jìn)行對(duì)比分析,在此基礎(chǔ)上,進(jìn)一步對(duì)比采用的幾種內(nèi)在維度估計(jì)方法(CD, EV, GMST, MLE, PN),最后選擇降維后的影像與原影像在非監(jiān)督分類后運(yùn)用CDS工具進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明,PCA方法整體較好,適應(yīng)性更廣泛;PN估計(jì)具有極大局限性;不同維度估計(jì)下同種降維效果相差不大,相同維度估計(jì)下不同降維方法效果相差較大。
高光譜遙感;內(nèi)在維度估計(jì);降維;非監(jiān)督分類;CDS對(duì)比
影像地物自動(dòng)識(shí)別分類一直是測(cè)繪學(xué)者追求的目標(biāo),高光譜遙感影像有光譜分辨率高和“圖譜合一”特點(diǎn),具有地物屬性信息精細(xì)探測(cè)能力,通過(guò)分析光譜影像的光譜信息和空間特征信息,能夠達(dá)到精細(xì)識(shí)別典型地物的目的[1]。目前,越來(lái)越多的國(guó)家開始重視高光譜遙感的利用,逐漸開始發(fā)射裝配有高光譜傳感器的衛(wèi)星,如:中國(guó)計(jì)劃2016年發(fā)射CCRSS,德國(guó)2018年發(fā)射EnMAP(Environmental Monitoring and Analysis Program)。高光譜數(shù)據(jù)存在一定限制:空間分辨率無(wú)法達(dá)到理想要求,計(jì)算處理復(fù)雜度增加卻未明顯增加分類精度。在這種情況下,數(shù)據(jù)量增加必然會(huì)對(duì)地物識(shí)別乃至分類造成阻礙。地物識(shí)別分類是遙感影像的應(yīng)用目的,而降維是高光譜影像下實(shí)現(xiàn)分類的一個(gè)重要技術(shù)。
高維空間本身的稀疏性與多重共線性是高光譜影像中主要存在的問(wèn)題,除此之外,過(guò)多的變量會(huì)影響查找規(guī)律的建立,數(shù)據(jù)過(guò)多造成的冗余計(jì)算量即我們熟知的維數(shù)災(zāi)難不容忽視,僅在變量層面上分析會(huì)把變量之間潛在聯(lián)系忽略。針對(duì)這一系列問(wèn)題,降維可以達(dá)到減少變量個(gè)數(shù)、確保變量之間相互獨(dú)立、提供一個(gè)概括性框架來(lái)解釋結(jié)果等目的。
由于高光譜數(shù)據(jù)波段數(shù)多、波段間冗余大,容易帶來(lái) “Hughes”現(xiàn)象和計(jì)算量大的缺點(diǎn),多位學(xué)者針對(duì)不丟失相關(guān)信息的情況對(duì)實(shí)現(xiàn)高光譜影像數(shù)據(jù)降維的方法進(jìn)行研究。本文共選取三個(gè)5種內(nèi)在維度估計(jì)方法和7種降維方法進(jìn)行對(duì)比分析。
2.1內(nèi)在維度估計(jì)方法
通常情況下,降維結(jié)果波段的選取是根據(jù)每個(gè)波段包含數(shù)據(jù)方差的累計(jì)百分比與特征值等判別標(biāo)準(zhǔn),因此帶來(lái)的結(jié)果是降維結(jié)果受主觀因素影響較大。在降維前進(jìn)行內(nèi)在維度估計(jì)可以大大避免人為選擇波段數(shù)的誤差。內(nèi)在維度估計(jì)方法包括基于數(shù)據(jù)局部特征的估計(jì)方法和基于數(shù)據(jù)全局特征的估計(jì)方法。本文選取兩種局部?jī)?nèi)在維度估計(jì)方法:最大似然估計(jì)(Maximum Likelihood Estimator, MLE)[2]和關(guān)聯(lián)維度估計(jì)(Estimator based on correlation dimension, CD)[3];三種全局內(nèi)在維度估計(jì)方法:基于特征值估計(jì)(Eigenvalue-based estimation, EV)[4]、測(cè)地線最小生成樹估計(jì)(Estimator based on geodesic minimum spanning tree, GMST)[5]和包裝數(shù)估計(jì)(Estimator based on packing numbers, PN)[6]。
2.2降維方法
高光譜遙感影像降維是把影像從高維空間轉(zhuǎn)換到低維空間,來(lái)降低計(jì)算復(fù)雜度并提高分類精度。影像分類作為圖像處理的一個(gè)較為重要的終端應(yīng)用,精度和效率應(yīng)該被充分提高。高光譜影像包含連續(xù)的光譜反射曲線,因此成為自動(dòng)分類影像數(shù)據(jù)源的最佳選擇。一般情況下,光譜波段的增加也會(huì)提高我們對(duì)土地以及覆蓋類型分類的能力。然而由于高光譜影像的冗余信息(各波段間的相關(guān)性)很大,降維已成為分類以及特征提取的必要手段。多位學(xué)者已經(jīng)提出了很多降維方法,不過(guò)絕對(duì)精確有效的降維方法一直未確定,這就給分類以及其他應(yīng)用帶來(lái)了很多不便。因此,尋找一種相對(duì)理想并且有效的降維方法對(duì)分類具有重大意義。
降維方法根據(jù)其性質(zhì)可分為線性與非線性、監(jiān)督與非監(jiān)督、全局與局部以及特征提取與波段選擇。文章中綜合考慮各方面性質(zhì)選取7種降維方法(見表1),選取的降維方法包括主成分分析(Principal Component Analysis, PCA)[7]、獨(dú)立成分分析(Independent Component Correlation Algorithm, ICA)[8]、最小噪聲分離(Minimum Noise Fraction Rotation, MNF)[9]、線性判別分析(Linear Discriminant Analysis, LDA)[10]、多維尺度分析(Multidimensional scaling, MDS)[11]、概率主成分分析(Probabilistic Principal Component Analysis, PPCA)[12]和因子分析(Factor analysis, FA)[13]。
表1降維方法對(duì)比
方法線性/非線性監(jiān)督/非監(jiān)督全局/局部PCA線性非監(jiān)督全局ICA線性監(jiān)督全局MNF線性非監(jiān)督全局LDA線性監(jiān)督全局MDS線性非監(jiān)督全局PPCA非線性非監(jiān)督局部FA線性非監(jiān)督全局
2.3分類以及對(duì)比方法
由于非監(jiān)督分類僅需一定知識(shí)識(shí)別分類的集群組,不需要對(duì)分類區(qū)域有詳細(xì)的了解,因此可減少人為誤差并且所需參數(shù)較少。非監(jiān)督分類可以形成范圍很小但具有獨(dú)特光譜特征的集群,所分的類別比監(jiān)督分類的類別更均質(zhì),獨(dú)特的、覆蓋量小的類別均能夠被識(shí)別。綜合考慮多方面原因,本文選用非監(jiān)督分類進(jìn)行分類實(shí)驗(yàn),影像在實(shí)現(xiàn)不同方法的降維后分別進(jìn)行非監(jiān)督分類。為了更加直觀地對(duì)比降維方法的優(yōu)劣,使用對(duì)比工具將不同降維方法非監(jiān)督分類后的結(jié)果均與原圖的非監(jiān)督分類結(jié)果進(jìn)行對(duì)比。
分類后比較法包括CDS(Change Detection Statistics)工具和TC(Thematic Change)工具,本文采用CDS工具。CDS工具對(duì)兩幅分類圖像進(jìn)行差異分析,是遙感動(dòng)態(tài)監(jiān)測(cè)中常見的方法,但在分類研究中并不經(jīng)常使用,文中使用此方法對(duì)比分類后的影像,獲得其差別度。CDS可對(duì)兩影像中像元值直接運(yùn)算以及變換處理,最后統(tǒng)計(jì)變化像元并成圖顯示。變化像元按數(shù)量、百分比和面積三個(gè)方面輸出,成掩膜圖像顯示,掩膜圖像記錄兩個(gè)分類圖像對(duì)應(yīng)像元的變化信息,相比于統(tǒng)計(jì)數(shù)據(jù)能更加直觀地顯示圖像之間的區(qū)別[14]。它的優(yōu)點(diǎn)是可以回避其他對(duì)比方法要求的影像時(shí)相一致性條件,避免影像間輻射校正和配準(zhǔn)等問(wèn)題,最小化地減少非地物變化因素的影響,同時(shí)還可以確定變化信息的空間位置并提供變化信息的類型[15,16]。
文章中選取三個(gè)不同遙感器數(shù)據(jù)源為實(shí)驗(yàn)影像,實(shí)驗(yàn)影像分別為:2008年6月份美國(guó)加利福尼亞州莫菲特場(chǎng)地區(qū)的一幅機(jī)載可見光/紅外成像光譜儀(AVIRIS)影像,該影像數(shù)據(jù)包含224個(gè)波段,尺寸為139*159像素,大小為9.44MB,包含10類地物;Landsat影像,包含6個(gè)波段,尺寸為233*186像素,大小為254KB,包含10類地物;MODIS影像,包含22個(gè)波段,尺寸為151*178像素,大小為2.25MB,包含5類地物。
文中主要實(shí)驗(yàn)步驟包括內(nèi)在維度估計(jì)、降維、分類以及對(duì)比,具體流程如圖1所示。內(nèi)在維度估計(jì)選取5種方法,針對(duì)三個(gè)實(shí)驗(yàn)影像,不同維度估計(jì)方法所估計(jì)維度結(jié)果均不同。在進(jìn)行內(nèi)在維度估計(jì)后,實(shí)驗(yàn)根據(jù)估計(jì)出的維數(shù)對(duì)影像降維。以此類推,直至使用所有維度估計(jì)方法估計(jì)的維數(shù)進(jìn)行降維。其次對(duì)原始圖像以及降維后的影像進(jìn)行非監(jiān)督分類,本實(shí)驗(yàn)中不同實(shí)驗(yàn)區(qū)地物種類不同,不同實(shí)驗(yàn)區(qū)降維后影像地物類別數(shù)選取與原影像非監(jiān)督分類地物種類保持相同。最終將降維后影像分類圖與原圖像分類圖使用CDS工具進(jìn)行對(duì)比。
表2內(nèi)在維度估計(jì)方法及結(jié)果
內(nèi)在維度估計(jì)方法EVMLECDGMSTPNAVIRIS維度795110Landsat維度24352MODIS維度16240
圖1 實(shí)驗(yàn)流程圖
5種維度估計(jì)方法對(duì)三個(gè)實(shí)驗(yàn)區(qū)進(jìn)行維度估計(jì)結(jié)果見表2??梢钥闯觯煌跋?、相同維度估計(jì)方法所估計(jì)的結(jié)果不同;相同影像、不同降維估計(jì)方法所估計(jì)的結(jié)果也不同。在三個(gè)實(shí)驗(yàn)區(qū)域中PN估計(jì)方法對(duì)AVIRIS和MODIS影像估計(jì)為0,僅對(duì)Landsat影像估計(jì)成功,說(shuō)明了PN估計(jì)較選取的其他估計(jì)方法存在一定的局限性。
在內(nèi)在維度估計(jì)之后對(duì)影像進(jìn)行降維處理,實(shí)驗(yàn)中選擇7種降維方法進(jìn)行降維處理。由維度估計(jì)方法與降維方法任意組合,實(shí)驗(yàn)區(qū)1可得到28幅降維后影像。同理,實(shí)驗(yàn)區(qū)2可得到35幅降維后影像,實(shí)驗(yàn)區(qū)3可得到28幅降維后影像。在此基礎(chǔ)上對(duì)以上影像以及三幅原始影像分別進(jìn)行分類處理,可得到CDS對(duì)比工具所需要的全部圖像共94(29+36+29)幅。
最終使用CDS工具讓各實(shí)驗(yàn)區(qū)降維后分類影像與源數(shù)據(jù)分類影像對(duì)比,在輸出的變化數(shù)量、百分比和面積三種變化信息中,本文選擇原影像與降維影像分類后相似性百分比來(lái)展示變化效果,統(tǒng)計(jì)結(jié)果如表3~5。結(jié)果顯示相同實(shí)驗(yàn)區(qū)不同維度估計(jì)與降維方法組合的相似百分比差異較大。
表3AVIRIS影像(實(shí)驗(yàn)區(qū)1)相似性百分比結(jié)果統(tǒng)計(jì)
PCAICAMNFLDAMDSPPCAFAEV85.47643.83847.39138.04781.93465.14631.008MLE85.34447.57146.29441.19384.65064.01944.522CD85.58343.66342.95744.34883.09164.62544.375GMST85.47839.42651.05640.59784.72365.99044.002
表4Landsat影像(實(shí)驗(yàn)區(qū)2)相似性百分比結(jié)果統(tǒng)計(jì)
PCAICAMNFLDAMDSPPCAFAEV35.65242.00518.94544.28834.86430.05428.065MLE34.67434.95223.45138.59633.73539.79235.902CD43.02238.26719.04725.87442.98435.47630.074GMST25,80420.96132.01342.13325.83530.61640.781PN35.65242.00518.94544.28834.86430.05428.065
表5MODIS影像(實(shí)驗(yàn)區(qū)3)相似性百分比結(jié)果統(tǒng)計(jì)
PCAICAMNFLDAMDSPPCAFAEV65.28699.20323.54920.42364.36848.93260.393MLE64.47576.83226.43827.41663.85345.82958.726CD60.39271.30825.98723.87160.36443.24357.012GMST63.95879.93729.64522.09763.65342.43561.291
利用CDS工具,對(duì)三個(gè)實(shí)驗(yàn)區(qū)不同內(nèi)在維度估計(jì)及降維后的分類圖與原圖分類圖進(jìn)行對(duì)比,從而得到在某類內(nèi)在維度估計(jì)下較好的降維方法,以及不同影像相對(duì)較好的內(nèi)在維度估計(jì)方法。圖2給出三個(gè)試驗(yàn)區(qū)每種內(nèi)在維度估計(jì)方法下最好的降維后分類圖,圖3是各實(shí)驗(yàn)區(qū)降維后分類圖像與原影像分類圖像利用CDS工具對(duì)比后得到的掩膜圖像。
精度分析:針對(duì)在實(shí)驗(yàn)區(qū)域一(AVIRIS影像224波段):無(wú)論哪種內(nèi)在維度估計(jì)均是PCA主成分分析降維方法最優(yōu),其次為MDS、PPCA方法。而在基于同一種降維方法時(shí)對(duì)維度估計(jì)方法進(jìn)行對(duì)比發(fā)現(xiàn),PCA降維情況下CD維度估計(jì)方法較好,PPCA核主成分分析降維方法下GMST較優(yōu),LDA線性判別分析降維方法整體較差。圖2(a)給出四種維度估計(jì)下的PCA降維后分類圖,可看出,與原圖差異較小。針對(duì)實(shí)驗(yàn)區(qū)域二(Landsat影像6個(gè)波段):整體降維效果不理想,原因?yàn)橛跋駜?nèi)在維度較少,每個(gè)波段均存儲(chǔ)了大量影像信息且相關(guān)性較弱。表4顯示,Landsat影像中CD維度估計(jì)下PCA降維效果更好;EV、GMST維度估計(jì)與LDA降維搭配效果更佳;MLE估計(jì)與PPCA降維結(jié)合效果較好。圖2(b)給出四種搭配(CD與PCA、EV與LDA、GMST與LDA、MLE與PPCA)分類圖。由表4可知,這四種組合相對(duì)于其他組合較優(yōu)。針對(duì)實(shí)驗(yàn)區(qū)域三(MODIS影像22波段):每種內(nèi)在維度估計(jì)方法下均是ICA降維方法效果最好,圖2(c)給出四種內(nèi)在維度估計(jì)下ICA降維后分類圖。
耗時(shí)分析:在實(shí)驗(yàn)過(guò)程中經(jīng)過(guò)粗略觀察各降維方法所用時(shí)間,F(xiàn)A以及PPCA方法比其他方法耗時(shí)長(zhǎng),這也從另一方面體現(xiàn)出其的不精確性。
圖2 各實(shí)驗(yàn)區(qū)降維效果圖
圖3 各實(shí)驗(yàn)區(qū)分類后對(duì)比掩膜圖像
文章中選用三個(gè)不同傳感器的實(shí)驗(yàn)影像進(jìn)行內(nèi)在維度估計(jì)以及降維后分類對(duì)比,采用CDS工具分別使降維后分類圖像與原影像分類圖像進(jìn)行對(duì)比,避免了精度評(píng)價(jià)造成的誤差,更直觀地展示了降維效果的優(yōu)劣。文章中選取了5種內(nèi)在維度估計(jì)方法和7種降維方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:
(1)主成分分析和多維尺度分析降維后影像相似性較高。
(2)在不同的內(nèi)在維度估計(jì)方法下,同種降維效果相差較?。煌N內(nèi)在維度估計(jì)方法下,不同降維方法效果相差較大。
(3)并非保留維數(shù)越多分類效果越好,應(yīng)使內(nèi)在維度估計(jì)與降維算法搭配使用。
(4)影像數(shù)據(jù)不同,內(nèi)在維度估計(jì)方法的選擇不同,降維方法的選取也不同。
[1]余旭初,馮伍法,楊國(guó)鵬等.高光譜影像分析與應(yīng)用[M].北京:科學(xué)出版社,2013.
[2]Levina E, Bickel P J. Maximum likelihood estimation of intrinsic dimension[C]. Advances in neural information processing systems, 2004:777-784.
[3]Grassberger P, Procaccia I. Measuring the strangeness of strange attractors[M]. New York :Springer, 2004.
[4]Fukunaga K, Olsen D R. An algorithm for finding intrinsic dimensionality of data[J]. IEEE Transactions on Computers, 1971, 100(2):176-183.
[5]董廣軍. 高光譜影像流形降維與融合分類技術(shù)研究[D]. 鄭州:信息工程大學(xué), 2008.
[6]Kégl B. Intrinsic dimension estimation using packing numbers[C]. Advances in neural information processing systems, 2002:681-688.
[7]臧卓, 林輝, 楊敏華. 利用PCA算法進(jìn)行喬木樹種高光譜數(shù)據(jù)降維與分類[J]. 測(cè)繪科學(xué), 2014, 39(2):146-149.
[8]Wang J, Chang C I. Independent component analysis-based dimensionality reduction with applications in hyperspectral image analysis[J]. IEEE transactions on geoscience and remote sensing, 2006, 44(6):1586-1600.
[9]Denghui Z, Le Y. Support Vector Machine Based Classification for Hyperspectral Remote Sensing Images after Minimum Noise Fraction Rotation Transformation[C]. Internet Computing & Information Services (ICICIS), 2011:132-135.
[10]Wang Z Q, Chen G H, Yu Z Z. Linear Discriminant Analysis Based on Ensemble Learning[J]. Advances in Biomedical Engineering, 2012(9):265-270.
[11]卿湘運(yùn), 王行愚. 基于RJMCMC的多維尺度分析維數(shù)選擇[C].北京:中國(guó)控制會(huì)議, 2007.
[12]穆向陽(yáng), 張?zhí)? 周亞同. 一種魯棒的概率主成分分析方法[J]. 西安交通大學(xué)學(xué)報(bào), 2008, 42(10):1217-1220.
[13]Fodor I K. A Survey of Dimension Reduction Techniques[J]. Neoplasia, 2008, 7(5):475-485.
[14]鄧書斌. ENVI遙感圖像處理方法[M].北京:科學(xué)出版社, 2010:259-262.
[15]Ridd K, Liu J, A comparison of four algorithms for change detection in all urban environments[J].Remote Sensing of Environment, 2007, 65(2):95-100.
[16]蔣玉峰. 基于混合模型和分類后比較法的SAR圖像變化檢測(cè)[D].西安電子科技大學(xué),2013.
Dimensionality Reduction and Dimension Estimation Method for Hyper-spectral Imagery Based on CDS
Zhou Yawen, Dong Guangjun, Cui Aihong, Yao Qiangqiang
Information Engineering University, Zhengzhou 450001, China
Dimensionality reduction strategy is an important basis for hyper-spectral imagery processing and analysis, and many relevant methods have been proposed, but none of them is considered to be absolutely effective. In this paper, some typical and cutting-edge methods put forward in recent years are compared and analyzed, including PCA, ICA, MNF, LDA, MDS, PPCA and FA. Based on the comparison of above methods, further analysis of several intrinsic dimension estimation methods is conducted, namely CD, EV, GMST, MLE and PN. Finally, the imagery after dimensionality reduction is compared with the original one which has undergone non-supervised classification using CDS tools. The results of three experiment areas show that the PCA method is good in general and has a better adaptability; while PN has many limitations. The reduction effects of the same dimensionality in different dimension estimation are similar, while the effects of different dimensionalities in the same dimension estimation vary greatly.
hyper-spectral remote sensing; intrinsic dimension estimation; dimensionality reduction; unsupervised classification; CDS comparison
2016-02-16。
國(guó)家自然科學(xué)基金資助項(xiàng)目(61272146)。
周亞文(1991—),女,碩士研究生,主要從事高光譜影像處理與模式識(shí)別方面的研究。
TP751
A