崔會(huì)麗, 魏 航, 張 軍
(數(shù)學(xué)地質(zhì)四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610059)
高光譜影像的光譜分辨率高,波段眾多,光譜覆蓋范圍廣,能為每個(gè)像元提供一條完整且連續(xù)的光譜曲線[1],可以揭示單一波段或者多譜段圖像多不能反應(yīng)的地物信息,這為更多、更精細(xì)的端元提取以及解決混合像元分解問題提供了條件,也使得高光譜影像在混合光譜分解方面具有更大的優(yōu)勢(shì).同時(shí)高光譜影像的空間分辨率相對(duì)較低,混合像元現(xiàn)象更加嚴(yán)重,因此混合像元分解的解決問題也更亟待.
高光譜數(shù)據(jù)端元的提取是處理高光譜數(shù)據(jù)、繼而對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析(比如分類識(shí)別等)的前提[2].目前混合像元解混成熟的算法較多,一般上都是分為兩個(gè)步驟:先是提取出圖像中的所有端元信息,然后再根據(jù)線性光譜解混模型進(jìn)行混合像元分解,這種類型的解混算法由于利用了端元的先驗(yàn)信息,稱之為監(jiān)督分解算法.然而在某些特殊情況下可能無法從影像中得到部分或全部地物的端元信息,在空間分辨率較低的星載高光譜影像中這種情況更加普遍.本文引入了基于負(fù)熵的快速獨(dú)立成分分析算法(fast independent component analysis,fastICA)的盲源分離算法對(duì)高光譜影像進(jìn)行混合像元分解,這類算法能在光譜解混的同時(shí)估計(jì)出影像的端元光譜信息,且不需要影像的先驗(yàn)信息,將這類算法稱之為非監(jiān)督分解算法.
獨(dú)立成分分析是一種新穎的解混算法,它的目的是從多元(多維)數(shù)據(jù)中尋找其內(nèi)在的因子或成分,即它所得到的是既統(tǒng)計(jì)獨(dú)立又非高斯的成分,這些獨(dú)立成分就是在解混過程中要得到的源信號(hào)的信息[3].在實(shí)際處理實(shí)際影像數(shù)據(jù)時(shí),假設(shè)各類地物在圖像中的分布是相互獨(dú)立的,在一定程度上是符合實(shí)際情況的.
在實(shí)際情形中,一般不能找到一個(gè)其成分真正獨(dú)立的表示,但是至少可以找到一個(gè)成分盡量獨(dú)立的表示,對(duì)獨(dú)立成分分析(ICA)的定義如下:
式中s為獨(dú)立成分(端元)或稱源信號(hào);A為混合矩陣;X為觀測(cè)信號(hào);
式(1)中定義的統(tǒng)計(jì)模型稱為ICA模型,它表示被觀測(cè)的信號(hào)數(shù)據(jù)是由獨(dú)立成分混合變換而得到的.在實(shí)際情況中,所有能知道的僅僅只有觀測(cè)到的信號(hào)信息X,所以就必須在盡量少的假設(shè)條件下估計(jì)出A和s.式(1)中的ICA模型中很容易發(fā)現(xiàn)存在兩個(gè)不確定性的因素,即獨(dú)立成分的方差和次序[4].
為了確保ICA模型能被準(zhǔn)確估計(jì),假設(shè)獨(dú)立成分是統(tǒng)計(jì)獨(dú)立的,且也必須具有非高斯的分布,而未知的混合矩陣變?yōu)榉疥?也就是說,獨(dú)立成分的個(gè)數(shù)與觀測(cè)到的混合量的個(gè)數(shù)相同.如果能計(jì)算出混合矩陣A的逆W(解混矩陣),這樣獨(dú)立成分可由(1)得到
所以估計(jì)混合矩陣A的問題轉(zhuǎn)化為不斷改進(jìn)的解混矩陣 W[5]的問題.
目前用在極大化非高斯性的ICA估計(jì)方法中的較普遍的實(shí)現(xiàn)算法中根據(jù)目標(biāo)函數(shù)的不同主要是分為基于峭度和負(fù)熵的快速不動(dòng)點(diǎn)算法,而在實(shí)際處理數(shù)據(jù)時(shí),基于負(fù)熵的FastICA算法可以更有效地把不動(dòng)點(diǎn)迭代所帶來的優(yōu)良算法特性與負(fù)熵所帶來的更好統(tǒng)計(jì)特性結(jié)合起來[6].由于事先并不知道高光譜遙感數(shù)據(jù)的源信號(hào)的光譜信息,所以利用觀測(cè)到的信號(hào)的各個(gè)分量之間的最大獨(dú)立性來建立對(duì)比函數(shù),從而尋找一種迭代算法從觀測(cè)到的信號(hào)中同時(shí)估計(jì)出源信號(hào)的信息[7].該算法計(jì)算過程當(dāng)中不需要進(jìn)行矩陣求逆,減少運(yùn)行步驟,而其收斂需要的步驟與牛頓法也大致相同,從而減少了算法的運(yùn)行時(shí)間,直到每一個(gè)獨(dú)立成分被分離出來,實(shí)現(xiàn)有效率的解決問題[8].
使用FastICA算法對(duì)高光譜數(shù)據(jù)進(jìn)行混合像元分解的步驟如下:
(l)讀取將高光譜影像數(shù)據(jù),將得到的數(shù)據(jù)設(shè)置為X;
(2)對(duì)數(shù)據(jù)x進(jìn)行中心化使其均值為0和白化的處理;
(3)初始化估計(jì)向量的個(gè)數(shù),令p=1;并選擇一個(gè)初始的權(quán)矢量w,令w=w/‖w‖;
(4)令 w+=E[xg(wTx)]-E[g'(wTx)]w;
(5)采用正交化處理,使得 w+=w+-∑wT(wjwj);
(6)令w=w++‖w+‖;如果w不收斂,則返回(4),直到收斂為止;
(7)使p=p+1,返回(3),繼續(xù)提取下一個(gè)獨(dú)立成分.
根據(jù)前面所介紹的理論,可以知道在高光譜影像混合像元分解技術(shù)中,必須使用含有多個(gè)光譜波段的影像,而不是只含有用全色波段或多光譜圖像的一個(gè)波段的高光譜影像[9].在本文所介紹的算法中子像元(端元)的精確位置是無法通過分解確定的.本文使用的高光譜圖像包含158個(gè)光譜波段,在實(shí)驗(yàn)之前通過MNF變化,經(jīng)過分析研究選擇了較大特征值和與之對(duì)應(yīng)的特征圖像進(jìn)行試驗(yàn),因此選擇了其中特征值較大的120個(gè)光譜波段.圖1為其中部分波段圖像及3波段合成的假彩色圖像(波段8為紅波段,波段7為綠波段,波段6為藍(lán)波段).
圖1 部分波段的圖像以及假彩色合成圖像
圖2 混合像元分解之后的圖像
在運(yùn)用該算法處理圖像時(shí),首先針對(duì)觀測(cè)信號(hào)進(jìn)行去均值和白化的預(yù)處理,使得簡(jiǎn)化了算法,并且在試驗(yàn)中調(diào)用了虛擬維數(shù)估計(jì)算法,這里得到的虛擬維數(shù)就是高光譜影像中特殊光譜信號(hào)的數(shù)量[10-11],而這里所得到的特殊光譜信號(hào)并不單單只是端元,其中還包括了噪聲點(diǎn)和異常點(diǎn)等,因此所得到的端元結(jié)果往往要大于實(shí)際端元數(shù)量.
對(duì)影像進(jìn)行混合像元分解過程中,所使用的是FastICA算法可以得到式(1)和(2)中的混合矩陣和解混矩陣.這就可以通過式(2)得到源信號(hào)的信息,從而得到獨(dú)立成分的信息.混合像元分解過后的部分波段圖像(這里的部分波段我們還是選擇圖1中的波段),如圖像2所示.
在實(shí)驗(yàn)結(jié)果中,我們選擇了混合像元分解之后的部分波段的圖像來看實(shí)驗(yàn)的效果,比較亮的像元表示被采為波譜極值的次數(shù)較多,像元波譜比較純.較暗的像元表示波譜純度較低.
盡管本文介紹的算法的單個(gè)像元的分解結(jié)果不盡如人意,但是在缺少先驗(yàn)知識(shí)的情況下,實(shí)現(xiàn)了獨(dú)立成分(端元)和解混矩陣的提取,混合像元分解后整幅圖像的分解結(jié)果還是令人滿意的.在高光譜影像混合像元分解之后,對(duì)之后的高光譜圖像分類識(shí)別有更好的效果.此外由于ICA模型中的兩個(gè)不確定性,分離出來的獨(dú)立成分是無序的,在以后的工作中可以考慮改進(jìn)算法解決這一問題.
[1]張立福.張良培.高光譜遙感[M].武漢:武漢大學(xué)出版社.2005:1:87-101.
[2]童慶禧,張兵,鄭蘭芬.高光譜遙感—原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社.2006:246-282.
[3]耿修瑞.高光譜遙感圖像目標(biāo)探測(cè)與分類技術(shù)研究[D].北京.中國(guó)科學(xué)院研究生院.2005.
[4]Bijaoui A,Nuzillard D,Barma T D.Bss,Classification and Pixel Demixing.Proceedings of the 5th International Conference on Independent Component Analysis and Blind Source Separation,2004:96-103.
[5]AaPoHyvarinen Juha Karhunen Erkki Oja,Independent Component Analysis[M],2007.
[6]Hyvarinen A,Oja E.Independent Component Analysis:Algorithms and Applications.Neural Networks,2000,13(4 -5):411-430.
[7]AaPoHyvarinen·Afamily of Fixed-Point Algorithms For Independent Component Analysis[J].IEEE Transitions On Neural Networks,1997(10):3917 -3920.
[8]陳華富.獨(dú)立成分分析及其應(yīng)用的研究進(jìn)展[J].生物醫(yī)學(xué)工程學(xué)雜志,2003.20(2):366-370.
[9]WANG Xuhong,GUO Jianming,JIA Baijun,et al.Mixed Pixels Classification of Remote Sensing Images Based on Cellular Automata[J].Acta Geodaetica et Car - tographica Sinica,2008,37(1):42 -48.
[10]萬余慶,譚克龍,周日平.高光譜遙感應(yīng)用研究[M].北京:科學(xué)出版社,2006:106.
[11]CHANG C.2I,DU Q.Estimation of Number of Spectrally Distinct Signal Sources in Hyperspectral Imagery[J].IEE E Transaction on Geoscience and Remote Sensing,2004,42(3):6082619.