梁曉莉,李利偉,程 鋼,高連如
(1.河南理工大學礦山空間信息技術國家測繪地理信息局重點實驗室,河南焦作454000;2.中國科學院遙感與數字地球研究所數字地球科學重點實驗室,北京100094)
城市化進程中欠發(fā)達村落變化最為劇烈,給城市管理帶來了不便,因此,及時準確地掌握這些地區(qū)的信息,有助于城市化的推進和政府部門的管理決策。高分辨率遙感影像能夠提供大量豐富的地面信息,能夠更加詳細地表現城市地物復雜多樣的形態(tài)和紋理結構。目前,利用高分辨率影像進行城市地物信息的自動提取已經取得了一定的進展。Hofmann利用面向對象的分類方法,充分考慮影像對象的光譜、紋理、形狀等信息,實現了IKONOS影像中居民地的分類[1]。Mayunga等利用蛇算法和徑向投射方法,提出一種半自動建筑物提取方法[2]。郭舟等提出一種面向對象結合兩種分辨率的城市建設區(qū)提取方法,在低分辨率影像上粗提取,在高分辨率影像上精提取,實現了QuickBird影像上建設區(qū)的自動識別和提?。?]。近些年利用形態(tài)學特征和分類器結合進行高分辨率影像分類的研究也取得了一定的進展。Benediktsson等利用形態(tài)學結合神經網絡分類方法對IKONOS城市影像進行分類,通過DAFE和DBFE算法實現特征提取和選擇,最終得到較好的分類結果[4]。Chanussot將提取的DMP特征放入模糊模型中進行分類,得到比利用神經網絡分類更好的結果[5]。欠發(fā)達村落在高分辨率遙感影像中呈現出復雜多樣的形態(tài)結構,并且易與其他類型的居民地混淆。目前,關于這種敏感地物信息提取的研究很少。
紋理特征是一種不依賴于顏色或亮度而反映圖像中同質現象的視覺特征[6],它是物體表面共有的內在特性,包含了物體表面結構組織排列的重要信息及它們與周圍環(huán)境的聯系[7]。因此,紋理特征廣泛應用于遙感影像分類。高分辨率遙感影像中常會出現混合像元和不同地物光譜相似的情況,傳統的分類方法只考慮光譜信息,會出現錯分、漏分等問題,導致分類精度不高[8]。Zadeh提出模糊集理論,為地物類別的軟劃分提供了強有力的分析工具[9]。模糊分類技術允許像元在每個類別中存在一個隸屬度,從而能夠更好地表示真實數據的不確定性。
本文提出一種將灰度共生矩陣(GLCM)和模糊分類原理相結合進行欠發(fā)達村落信息提取的方法,并利用京津地區(qū)樣本和圖像進行試驗驗證,結果表明,該方法能有效區(qū)分欠發(fā)達村落和其他地物。
本研究主要利用GLCM和模糊分類原理進行欠發(fā)達村落信息提取,主要技術包括3部分:類別體系構建與樣本采集、紋理特征提取及模糊分類。具體流程如圖1所示。
本文依據國家土地利用現狀分類標準(GB/T 21010—2007)[10]并結合研究區(qū)域地物特點進行類別體系構建。為強調欠發(fā)達村落信息及光學影像中土地利用與覆蓋的內部紋理差異,將研究區(qū)地物分為14類,包括林地、草地、交通運輸用地、水體、耕地、欠發(fā)達村落、裸地、工礦廠房用地、公共管理與公共服務用地、商服用地、混合用地、農用設施用地、高密度低層小區(qū)和低密度低層小區(qū)。本研究旨在提取欠發(fā)達村落信息,即類別體系中的第6類。構建詳細的類別體系有助于識別易與第6類混淆的類別,構建的類別體系見表1。
表1 類別體系
圖1 技術流程
根據實地調查和專家知識,在構建的類別體系下選取300 m×300 m大小的樣本,并將樣本分為訓練樣本和驗證樣本兩類。
特征提取是基于GLCM選取的紋理特征和訓練樣本實現的。特征提取前需要對樣本進行預處理,這里選取G波段將RGB圖像變?yōu)榛叶葓D像。為了減少計算量,將灰度值的范圍線性壓縮為64(N=26)級。特征提取時,選取對比度、熵、同質性和能量 4 種常用紋理特征,采用 0°、45°、90°、135°這 4 個方向的均值作為最終特征值,并通過步長1、2、3獲得多尺度紋理特征。利用上述參數計算訓練樣本在每種紋理下的特征值,并繪制在箱線圖中。據此得到每種紋理特征區(qū)分第6類與其他類別的能力,從中選出區(qū)分性能好的紋理特征參與分類。4種常用紋理特征的統計測度與統計特性參考黃昕關于高分辨率影像的紋理特征提取的相關內容[11]。
模糊分類是接近于神經網絡和概率方法的一種非常強大的軟分類器,是典型的專家分類系統[12]。模糊分類系統主要由3個步驟構成,即模糊化、模糊推理和去模糊化。
模糊化是指將布爾系統轉化到模糊系統,為每個特征值分配一個[0,1]之間的隸屬度,而隸屬度值由隸屬度函數來定義[13]。本文通過計算訓練樣本在選擇特征下的直方圖分布來實現模糊化。對于復雜的多類識別問題,不同特征的量綱往往不同,一般先對特征進行歸一化處理,以解決量綱不同的問題[14]。在每個特征下檢索所有類別的訓練樣本,計算出樣本的特征值直方圖,并歸一化到[0,1]范圍內。為保證離散分布的特征值落在隸屬度函數范圍內,采用一個預定義的一維核函數對歸一化后的直方圖進行卷積,以泛化特征空間提高算法精度。模糊推理時,計算每個輸入對象在各個類別中的模糊隸屬度,這是通過計算選擇的所有特征值在各類別中的最大隸屬度來確定的。去模糊化時,首先比較輸入對象在所有類中的隸屬度,然后將具有最大隸屬度的類別賦給該對象。若得到的隸屬度過低則輸入對象的類別難以確定,另外,訓練樣本的局限性也會影響算法的推廣。
本文選取北京和天津作為研究區(qū),京津地區(qū)位于我國華北地區(qū),地物類型豐富多樣,在偏遠農村、郊區(qū)及城市中都散落分布著一定數量的欠發(fā)達村落。試驗使用的數據是借助Google Earth在京津地區(qū)1 m分辨率下獲得的,包括126個300像素×300像素大小的樣本和兩幅900像素×2100像素大小的影像,其中,樣本又包括45個訓練樣本和81個驗證樣本。
試驗中所用的紋理特征是通過計算45個訓練樣本的特征值并繪制在箱線圖中提取出來的。試驗選用第6類的特征描述進行分類,在模糊化時也只對第6類的訓練樣本進行訓練。在所有試驗的直方圖計算中,區(qū)間數設為32,卷積運算的核函數設為[0.05,0.1,0.2,0.3,1,0.3,0.2,0.1,0.05]。為驗證算法的有效性和普適性,分別利用81個驗證樣本和截取的兩幅高空間分辨率影像進行試驗驗證。從每個類別中選取的典型樣本如圖2所示。
圖2 14類典型樣本圖
試驗選取4種常用的紋理特征,并分別計算每種特征在步長1、2、3下的特征值,共設計12組試驗進行特征提取。將計算出的特征值放入箱線圖中,在箱線圖中對比不同步長、紋理的特征值分布。通過特征值對比發(fā)現,第6類易于與第1、11、12、14類混淆,其中能最佳區(qū)分第1類和第6類的特征是步長為2和3時的同質性特征,即Hom2和Hom3特征。45個訓練樣本在Hom2和Hom3下的特征值分布如圖3所示。
圖3中步長為2和3時同質性特征箱線圖中矩形盒兩端邊的位置分別對應數據的上下四分位數(Q1和Q3),矩形盒內的線段稱為中位線,在Q3+1.5IQR(四分位數距)和 Q1-1.5IQR 處的兩條線段為異常值截斷點,稱為內限。位于內限范圍外的點稱為異常值,下限用“Δ”標記,上限用“*”標記。
(1)試驗一
利用81個驗證樣本,以及上述選擇的特征和參數對算法的有效性進行驗證。試驗利用 Hom2、Hom3、Hom2+Hom3 3組特征進行驗證,根據得到的驗證樣本的混淆矩陣計算出生產者精度和用戶精度,據此對分類結果進行評價。3組特征的精度分析見表2—表4。
圖3
表2 Hom2分類結果
表3 Hom3分類結果
表4 Hom2+Hom3分類結果
通過對比可知,Hom2得到的精度最高,生產者精度為93.3%,用戶精度為63.6%,第6類中有14個樣本正確分類,其他類樣本中錯分為第6類的僅有8個。Hom3精度比 Hom2低些,生產者精度為86.7%,用戶精度為 56.5%;Hom2+Hom3 得到與Hom2近似的精度。3組試驗中錯分類別均為第11、12、14類,這與特征提取時箱線圖中結果相符。
(2)試驗二
為進一步驗證算法對大幅圖像的適用性,分別截取兩幅京津地區(qū)900像素×2100像素大小的影像進行試驗驗證。逐塊讀取300像素×300像素大小的影像,然后利用上述算法對讀取的影像塊進行處理,從中提取出欠發(fā)達村落。對隸屬度設定適當的閾值,然后輸出分類結果圖和隸屬度圖,并對分類結果進行分析。
圖4為兩幅影像的分類結果,分類結果圖中,白色塊為識別出的欠發(fā)達村落,黑色為其他地物類型,對應的隸屬度圖中影像塊越亮隸屬度越高。通過對上述兩幅影像的分類結果和隸屬度分析可知,Img1中除了第2塊(虛線方框中)錯分為第6類外,其他欠發(fā)達村落塊均能正確識別出來,且錯分的第2塊隸屬度不高。Img2中欠發(fā)達村落均能區(qū)分出來,第5塊(白色方框中)因包含了部分道路信息隸屬度不高。另外,在欠發(fā)達村落與其他地物混淆的邊緣部位區(qū)分性不太好,這與算法中欠發(fā)達村落(第6類)易與混合地物(第11類)錯分的情況一致。
從分類結果可知,Img1中共有5塊欠發(fā)達村落,其中有4塊能正確分類;Img2中共5塊欠發(fā)達村落,且所有塊均能正確識別出來,兩幅影像的精度分析見表5。
圖4 高分辨率影像分類結果圖
表5 影像分類精度
本文提出一種將GLCM紋理特征和模糊分類原理相結合提取高分辨率光學影像中欠發(fā)達村落信息的方法,并借助IDL語言編碼實現。試驗選取京津地區(qū)1 m分辨率下126個300像素×300像素大小的影像,并設計試驗驗證了方法的可行性和有效性。試驗表明,該算法在同質性特征下最高精度可達93.3%,且對于大范圍影像也具有較好的適用性。算法的主要困難在于欠發(fā)達村落與其他類型居民住宅的區(qū)分及混合邊界地區(qū)的信息提取。該算法比較靈活,利用特征描述就可以達到較好的分類結果,并且僅對欠發(fā)達村落樣本進行訓練,避免了其他地物的干擾。算法涉及的技術流程和試驗設計能夠為相關領域研究提供參考依據。
下一步將會利用更大范圍影像對算法進行測試,并考慮不同成像條件對算法的影響。為有效實現所有類別信息的自動提取,算法將進一步建立所有地物類型的樣本庫,并為每種地物選擇最佳的尺度和特征組合進行分層分析,從而提高算法的精度和普適性。
[1]HOFMANN P.Detecting Informal Settlements from IKONOS Image Data Using Methods of Object Oriented Image Analysis—An Example from Cape Town(South Africa)[C]∥Remote Sensing of Urban Areas/Fernerkundung in Urbanen R?uman.Regensburg:Geographische Schriften,2001:107-118.
[2]MAYUNGA S D,COLEMAN D J,ZHANG Y.A Semiautomated Approach for Extracting Buildings from Quick Bird Imagery Applied to Informal Settlement Mapping[J].International Journal of Remote Sensing,2007,28(10):2343-2357.
[3]郭舟,杜世宏,張方利.基于高分辨率遙感影像的城市建設區(qū)提取[J].北京大學學報:自然科學版,2013(4):1-8.
[4]BENEDIKTSSON J A,PESARESI M,ARNASON K.Classification and Feature Extraction for Remote Sensing Images from Urban Areas Based on Morphological Transformations[J].IEEE Transaction on Geoscience and Remote Sensing,2003,41(9):1940-1949.
[5]CHANUSSOT J,BENEDIKTSSON J A,FAUVEL M.Classification of Remote Sensing Images from Urban Areas U-sing a Fuzzy Possibilistic Model[J].IEEE Geoscience and Remote Sensing Lettes,2006,3(l):40-44.
[6]SMITH J R,CHANG S F.Automated Binary Texture Feature Sets for Image Retrieval[C]∥IEEE International Conference on Acoustics Speech and Signal Processing.Atlanta:[s.n.],1996.
[7]HARALICK R M,SHANMUGAM K,DINSTEIN I.Textural Features for Image Classification[J].IEEE Trans on Systems,Man and Cybernetics,1973,3(6):610-621.
[8]SHACKELFORD A K,DAVIS C H.A Hierarchical Fuzzy Classification Approach for High-Resolution Multispectral Data Over Urban Areas [J].IEEE Transaction on Geoscience and Remote Sensing,2003,41(9):1920-1932.
[9]ZADEH L A .Fuzzy Sets[J].Information and Control,1965,8(l):338-353.
[10]中華人民共和國國家質量監(jiān)督檢驗檢疫總局,中國國家標準化管理委員會.GB/T 21010—2007土地利用現狀分類[S].北京:國土資源部,2007.
[11]黃昕.高分辨率遙感影像多尺度紋理、形狀特征提取與面向對象分類研究[D].武漢:武漢大學,2009.
[12]顏宏娟.面向對象的遙感影像模糊分類方法研究[D].西安:西安科技大學,2008.
[13]BENZ U C,HOFMANN P,WILLHAUCK G,et al.Multiresolution,Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information [J].ISPRS Journal of Photogrammetry& Remote Sensing,2004(58):239-258.
[14]李煒,黃心漢,陳曦.一種基于模式類特征空間統計分布的離散模糊隸屬度函數模型[J].信號處理,2004,20(2):170-173.