縱清華,王志宇,過仲陽,馬 品
(華東師范大學地理科學學院,上海 200241)
基于小波變換和K-means算法的遙感影像分類
縱清華,王志宇,過仲陽,馬 品
(華東師范大學地理科學學院,上海 200241)
在研究K均值聚類算法的基礎上,采用小波變換輔助K均值算法對遙感影像進行分類,以此提高遙感影像的分類精度.以云南省玉溪市撫仙湖附近地區(qū)作為研究區(qū),結(jié)合研究區(qū)的具體情況,根據(jù)查維茨最佳指數(shù)因子法OIF計算得到遙感影像的最佳波段組合,并通過對各類地物的樣本圖像和遙感影像進行二維小波分解,得出樣本特征向量;然后利用K均值算法結(jié)合樣本特征向量對遙感影像進行分類,得到分類結(jié)果并進行精度驗證.再與單純采用K均值算法的分類結(jié)果進行對比分析,結(jié)果表明:其總體精度和Kappa 系數(shù)分別達到 83.74%、0.7753,比單純采用K-means算法分別高出14.26%、0.1697,尤其是林地、裸地和農(nóng)田的分類精度得到了顯著提高.
遙感影像分類;小波變換;K均值算法
遙感影像分類一直是遙感研究領域的重要內(nèi)容,如何在解決多類別圖像分類的同時滿足一定的精度,是遙感圖像處理研究中的一個關鍵問題,具有十分重要的意義.在計算機視覺研究領域,紋理是描述圖像的一個重要特征,而且隨著對高分辨率衛(wèi)星的探索與應用,遙感影像的空間分辨率在不斷提升,地物的內(nèi)部結(jié)構(gòu)也更加清晰,使遙感影像中的紋理信息更加明顯、更加豐富[1].以往僅僅依靠地物的光譜信息進行分類時會出現(xiàn)很多誤分和錯分,因此為了提高遙感影像的分類精度,可將紋理信息作為擴展的特征向量加入特征空間中[2].
2004年李峰提出了一種基于多進制小波變換的紋理特征提取方法[3],通過對小波系數(shù)的標準差作為紋理測度以生成特征向量,利用C均值聚類算法進行紋理分割;他利用小波變換提取出遙感影像的紋理信息,進行遙感影像的分類.1967年J.B.MacQueen提出K-means算法[4],并且直到目前為止,它都是科學和工業(yè)應用諸多聚類算法中一種極有影響的算法,同時也是模式識別中的經(jīng)典算法.K-Means算法是一種以平均值作為聚類中心的分割聚類方法,以其簡單的算法思想、較快的聚類速度和良好的聚類效果得到了廣泛的應用.
對遙感影像進行小波變換,得到的高頻小波可以用作精細信息的表述,而低頻小波可以用作為全局的近似表述.通過小波變換能夠獲得遙感影像的全局和精細特征,對提高遙感影像的分類精度有很大幫助.同時K-means算法計算簡單高效、動態(tài)聚類、自適應性比較強,能夠得到很好的聚類效果.
1.1 技術路線簡介
圖1 技術路線圖Fig. 1 Technique flow charts
本文技術路線如圖1 所示,首先對原始遙感影像進行預處理(包括幾何精校正、影像配準與裁剪、輻射校正),再結(jié)合研究區(qū)域的具體情況,根據(jù)查維茨最佳指數(shù)因子法OIF計算得到遙感影像的最佳波段組合.然后通過對各類地物的樣本圖像進行二維小波分解,并分別重構(gòu)分解得到高頻和低頻部分,將所有重構(gòu)圖像切分成大小為N*N的若干子塊,通過計算每一子塊的統(tǒng)計特征,得出樣本特征向量.再利用K-Means算法結(jié)合樣本特征向量對所有子塊進行聚類,得到分類結(jié)果,并進行精度評價.
1.2 基于小波變換的特征提取
1.2.1 小波變換
小波變換(Wavelet transform WT)是當前應用數(shù)學和工程科學中一個迅速發(fā)展的領域,沿用圖像變換的概念,強調(diào)圖像信號在不同值域間的變換,即圖像多尺度分解[5].小波變換的過程是頻率窗和時間窗都可以改變并且小波形狀可變但其窗口大小固定不變的時頻局部化分析方法,其被譽為信號分析中的“放大鏡”和“顯微鏡”.小波變換通過對信號進行多尺度細化分析,可將圖像分解為不同尺度的近似分量和細節(jié)分量,并可持續(xù)分解當前層的近似分量,直到某個條件不滿足為止.這種特性有利于在不同尺度層提取圖像特征,或聚焦到感興趣的任意細節(jié).
相應的小波分解公式為:
對圖像進行小波分解可將其分為小波近似與小波細節(jié)(水平細節(jié)、垂直細節(jié)、斜線細節(jié))之和[6].
1.2.2 特征提取
進行遙感影像分類時,為了盡量將所有同類地物歸為一類,同時避免特征值相近的非同類地物的干擾,這對提取特征值提出了很高的挑戰(zhàn).小波變換中的關鍵點就在于母小波的選擇,本文中我們選擇的母小波是比較常見和基本的母小波函數(shù)Daubechies1小波.Daubechies1小波是雙正交小波函數(shù),支撐的濾波器長度為2n,支撐寬度為2n-1,對于二維圖像小波變換具有很好的濾波作用,在檢測邊緣信息時具有良好的性能,并且計算簡單可靠[7-8].所以本文采用Daubechies1小波進行特征提取.設定小波分解的層數(shù)為m,對每個圖像子塊分別進行m層二維小波分解;對于每個圖像子塊,均得到4m個分解子頻帶圖像.本文是進行單尺度的小波變換,即m設為1,首先對遙感影像每個類別的樣本進行小波分解和重構(gòu),共得到4個分解子頻帶,如圖2所示.
(a)表示小波近似子頻帶圖;(b)表示水平細節(jié)子頻帶圖;(c)表示垂直細節(jié)子頻帶圖;(d)表示斜線細節(jié)子頻帶圖.圖2 小波變換結(jié)果灰度圖Fig. 2 Wavelet transform results gray image
1.3 K均值聚類
K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標,即兩個對象的距離越近,其相似性就越大.算法的目的是使各個樣本與所在類均值的誤差平方和達到最小.其工作原理是:首先確定分類數(shù)目K,并隨機從數(shù)據(jù)集中選取K個點作為初始聚類中心,然后計算各個樣本到聚類中心的距離,把樣本歸到離它最近的那個聚類中心所在的類[9].計算新生成的每一個聚類數(shù)據(jù)對象的平均值來得到新的聚類中心,如果相鄰兩次的聚類中心沒有任何變化,說明樣本調(diào)整結(jié)束,聚類準則函數(shù)已經(jīng)收斂.本算法的一個特點是它屬于動態(tài)聚類法,其迭代過程采用按批修改方法,即在每次迭代中都要考察每個樣本的分類是否正確.如果不正確,就要調(diào)整,在全部樣本調(diào)整完后,再修改聚類中心,進入下一次迭代.最終使得各樣本到其判屬類別中心的距離平方之和最小.
本文以云南省玉溪市撫仙湖附近地區(qū)的Landsat-5 TM遙感影像作為數(shù)據(jù)源,影像分辨率是30 m.該地區(qū)海拔較高,湖面平均海拔1720 m,地物類型較為豐富,包括林地、農(nóng)田,水體以及建設用地等多種土地利用類型.根據(jù)查維茨最佳指數(shù)因子法OIF(The Optimum Index Factor)[10]并結(jié)合研究區(qū)域的具體情況,計算得到影像的最佳波段組合為一波段、四波段和五波段,將三個波段組合后,生成最初待分類的TM 影像如圖3(a).然后先利用K-means算法直接對遙感影像進行分類,得到分類結(jié)果如圖3(b)所示;再利用小波變換輔助K-means算法進行分類,得到分類結(jié)果如圖3(c)所示.
圖3 原始遙感影像及其分類結(jié)果Fig. 3 The original image and image classification results
將此地區(qū)遙感影像中的地物類別分成6類,分別為:水體、山林地、林地、裸地、農(nóng)田和建設用地.對比圖3(b),圖3(c)分類結(jié)果圖,同時和圖3(a)進行比較,可以看出采用小波變換輔助K-means算法的分類精度較高,尤其對林地、裸地和建設用地的區(qū)分效果明顯比單純采用K-means算法的效果要好.
本文利用總體分類精度(Overall Accuracy)、生產(chǎn)者精度(PA)[11]、用戶精度(UA)和 Kappa 系數(shù)[12]對遙感影像的分類結(jié)果進行評價和分析.影像分類后需進行精度評定,在分類后的影像中選取100個具有代表性的點,在原影像上相應的位置也選取100個點,然后把分類后影像的點與原影像的點進行比較,并分別計算兩種分類方法的比較結(jié)果.最后結(jié)合分類結(jié)果的混淆矩陣和Kappa系數(shù)進行精度比較和效果總結(jié).利用K-means算法對此遙感影像進行分類的精度評價表如表1所示,利用小波變換輔助K-means算法對此遙感影像進行分類的精度評價表如表2所示.
表1 K-means算法分類的精度評價表
Tab. 1 Accuracy evaluation of K-means algorithm classification
分類類型生產(chǎn)者精度用戶精度水體96.08%92.70%山林地45.76%51.21%林地45.43%42.15%裸地26.24%25.80%農(nóng)田53.20%55.35%建設用地92.75%90.50%總體精度=69.48%;Kappa系數(shù)=0.6056
表2 小波變換輔助K-means算法分類的精度評價表
Tab. 2 Accuracy evaluation of wavelet transform based on K-means algorithm classification
分類類型生產(chǎn)者精度用戶精度水體96.23%93.50%山林地69.01%65.75%林地62.09%63.43%裸地58.70%55.90%農(nóng)田70.46%78.35%建設用地95.53%94.80%總體精度=83.74%;Kappa系數(shù)=0.7753
從上表1可以看出,采用K-means算法進行分類的總體精度為69.48%,Kappa系數(shù)為0.6056.可以看出這種方法的總體分類精度是比較低的,特別是對于山林地、林地、裸地和農(nóng)田這4種類別的區(qū)分程度很低,混淆程度十分嚴重,表現(xiàn)出較低的精度,分別為45.76 %、45.43 %、26.24 %、53.20%.從分類結(jié)果圖中可以看出把山林地的大部分分到了水體類別,同時把林地的很大一部分分到了山林地類別,農(nóng)田和裸地這兩類嚴重混淆.以上分析說明在此次遙感影像分類中,單純的采用K-means算法并不適合本研究區(qū)的分類,精度很難滿足需求.
從表2可以看出,利用小波變換輔助K-means算法對此遙感影像進行分類時,總體精度和Kappa 系數(shù)分別為 83.74%、0.7753,比單純采用K-means算法分別高出14.26%、0.1697,總體分類效果很好.尤其對于農(nóng)田、裸地、山林地和林地這4種地物類型,生產(chǎn)者精度分別提升至69.01%、62.09%、58.70%、70.46%,可以看出其生產(chǎn)者精度和用戶精度都得到很大程度的提高,使分類效果得到很大改善.
綜合幾個分類精度評價指標,得到兩種分類方法的結(jié)果對比圖(見圖4),可以直接看出:采用小波變換輔助K-means算法進行分類時,這6種用地類型的分類精度都有所提高,所以采用小波變換與K-means算法相結(jié)合的分類方法更適合本研究區(qū)的遙感影像分類.
圖4 兩種方法分類精度對比圖Fig. 4 Two classification methods accuracy comparison chart
對遙感影像進行小波分解時可將其分解為小波近似與小波細節(jié)之和,小波近似能夠提供豐富的紋理特征,小波細節(jié)能夠提供圖像的邊緣信息,并可以很好的保留原來的光譜特征;而K-means算法對于解決模式分布呈現(xiàn)類內(nèi)團聚狀的問題,其聚類效果很好;所以在此將這兩種方法相結(jié)合,采用小波變換輔助K-means算法對研究區(qū)的遙感影像進行分類.經(jīng)過對比分析驗證,采用小波變換和K-means算法相結(jié)合對遙感影像進行分類時要比單純利用K-means算法的分類效果更理想,分類精度更高.
[1] 楊玉靜,于彥偉,馮建輝.紋理特征輔助遙感影像分類技術的探討[J].測繪與空間地理信息,2008,31(6):82-85.
[2] 華媛媛.紋理信息在遙感圖像分類中的應用與研究[D].西安:西安科技大學,2009.
[3] 李峰,黃達人,畢寧,等.基于多進制小波變換的紋理圖像分割[J].模式識別與人工智能,2004,17(3):286-290.
[4] XU Junling, XU Baowen, ZHANG Weifeng.Stable Initialization Scheme for K-Means Clustering[J]. Wuhan University Journal of Natural Sciences,2009,14(1):24-28.
[5] 王建宇,張峰,周獻中,等.利用小波變換和K均值聚類實現(xiàn)字幕區(qū)域分割[J].計算機輔助設計與圖形學學報,2006,18(10):1508-1512.
[6] 徐麗華,岳文澤,李先華,等.基于二維小波變換的遙感分類研究[J].遙感技術與應用,2003,18(5):317-321.
[7] 毛安定,管一弘,段銳,等.基于Daubechies小波的圖像邊緣檢測技術[J].圖學學報,2012,33(1):63-67.
[8]LEE J D, HSIAO Y L. Extraction of tumor region in color images using wavelets[J].Computers & Mathematics with Applications,2000,40(6):793-803.
[9] 周堅華.遙感圖像分析與空間數(shù)據(jù)挖掘[M].上海:上??萍冀逃霭嫔纾?010:51-52.
[10] 陳愛京,肖繼東,張旭,等.基于TM/ETM+影像的區(qū)域土地利用/覆蓋變化研究[J].沙漠與綠洲氣象,2008,2(4):45-48.
[11] 曾志遠.衛(wèi)星遙感圖像計算機分類與地學應用研究[M].北京:科學出版社,2004.
[12] 任建斌.基于小波變換和BP人工神經(jīng)網(wǎng)絡的遙感影像分類研究[D].呼和浩特:內(nèi)蒙古師范大學,2012.
[13] 劉金亨.基于小波變換的遙感圖像處理研究[D].重慶:重慶大學,2010.
Remote Sensing Image Classification Based on Wavelet Transform and K-means Algorithm
ZONG Qinghua, WANG Zhiyu, GUO Zhongyang, MA Pin
(School of Geographic Sciences, East China Normal University, Shanghai 200241, China)
On the basis of studying the K-means clustering algorithm, combine wavelet transform is combined with K-means algorithm for remote sensing image classification to improve the classification accuracy of remote sensing image. Fuxian Lake area in Yuxi city of Yunnan Province is taken as a study area, combined with the specific circumstances of the area, the optimal bands combination of remote sensing image is obtained according to the OIF calculation. Through the two-dimensional wavelet decomposition of various terrain samples and remote sensing image, the sample feature vector is obtained. Using K-means algorithm with the sample feature vector for classifying the remote sensing image, the result of image classification is got and the accuracy is verified. Comparing with the classification result using K-means algorithm simply, the results show that its overall accuracy and Kappa coefficient are 83.74% and 0.7753 respectively, increasing by 14.26%, 0.1697. Especially the classification accuracy of forest land, bare land and farmland is greatly improved.
remote sensing image classification; wavelet transform; K-means algorithm
2015-06-20
國家自然科學基金項目(J1310028).
過仲陽(1964—),男,教授,博士,主要從事遙感影像分析和數(shù)據(jù)挖掘研究.E-mail:zyguo@geo.ecnu.edu.cn
10.3969/j.issn.1674-232X.2016.02.015
TP751
A
1674-232X(2016)02-0203-05