田 丹,劉 愛(ài) 利,丁 滸,張 雯,齊 威
(1.南京信息工程大學(xué)地理與遙感學(xué)院,江蘇 南京 210044;2.南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210023)
地貌形態(tài)類型面向?qū)ο蠓诸惙ǖ母倪M(jìn)
田 丹1,劉 愛(ài) 利1,丁 滸2,張 雯1,齊 威1
(1.南京信息工程大學(xué)地理與遙感學(xué)院,江蘇 南京 210044;2.南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210023)
提出一種改進(jìn)的基于隨機(jī)森林因子重要性分析和灰度共生矩陣紋理的地貌形態(tài)類型面向?qū)ο髣澐址椒?。以中?guó)1∶100萬(wàn)DEM為數(shù)據(jù)源,利用相關(guān)分析和雪氏熵值法篩選確定地貌分類的地形因子組合,并利用隨機(jī)森林分類樹評(píng)價(jià)各地形因子的重要性,將求得的各因子重要性數(shù)值作為面向?qū)ο蠖喑叨确指罡鲌D層的閾值,最后基于灰度共生矩陣紋理信息構(gòu)成分類樣本的知識(shí)庫(kù)進(jìn)行地貌分類。全國(guó)地貌分類以《中國(guó)及毗鄰地區(qū)1∶400萬(wàn)地貌圖》為精度評(píng)價(jià)標(biāo)準(zhǔn),結(jié)果顯示該文提出的分類方法總體精度為71.4%,比ISODATA非監(jiān)督分類法精度提高5.7%,比常用的面向?qū)ο蠓诸惙ň忍岣?5.7%;陜西省地貌分類以《中華人民共和國(guó)1∶100萬(wàn)地貌圖》為精度評(píng)價(jià)標(biāo)準(zhǔn),分類的總體精度為72.9%。通過(guò)分析該文方法對(duì)不同分辨率DEM分類精度的影響,得出分辨率越高總體精度越高。
地貌分類;面向?qū)ο蠓诸?隨機(jī)森林;灰度共生矩陣
地貌是自然地理環(huán)境的基本要素之一。地貌分類是數(shù)字地形分析的基礎(chǔ),同時(shí)也是地貌制圖研究的依據(jù)以及地貌分布規(guī)律研究的前提,故其在生產(chǎn)實(shí)踐和科學(xué)研究中都具有重要價(jià)值[1-3]。
但前人研究顯示目前面向?qū)ο蟮牡孛卜诸惥热圆桓?,多尺度分割算法閾值的確定存在主觀性。因此,本文以中國(guó)1∶100萬(wàn)DEM為數(shù)據(jù)源,探索地貌形態(tài)類型面向?qū)ο笞詣?dòng)劃分方法的改進(jìn)。
本文采用國(guó)家地理信息中心生產(chǎn)的1∶100萬(wàn)DEM數(shù)據(jù),該數(shù)據(jù)是在我國(guó)1∶5萬(wàn)及1∶10萬(wàn)基本比例尺地形圖上,按照28.125″(經(jīng)差)×18.750″(緯差)的格網(wǎng)間隔,高精度讀取方里網(wǎng)交點(diǎn)高程所構(gòu)建的1 km柵格分辨率的地面高程數(shù)字矩陣[15]。該數(shù)據(jù)采樣精度較高且能從宏觀反映我國(guó)地形的起伏變化特征[16],數(shù)據(jù)高程0~8 848 m,標(biāo)準(zhǔn)差為1 147.1 m。受數(shù)據(jù)所限,本文以《中國(guó)及毗鄰地區(qū)1∶400萬(wàn)地貌圖》作為全國(guó)尺度精度評(píng)價(jià)的依據(jù)。為驗(yàn)證本文提出的分類方法對(duì)于小尺度的適用性,本文還以《中華人民共和國(guó)1∶100萬(wàn)地貌圖》陜西省分幅作為分類結(jié)果精度評(píng)價(jià)標(biāo)準(zhǔn)。
本文技術(shù)路線見(jiàn)圖1。首先,篩選并提取地形起伏度、地表粗糙度、高程、高程變異系數(shù)、坡度變率、光照暈渲圖和全累計(jì)曲率7種地形因子作為地貌劃分因子組合;其次,將隨機(jī)森林分類樹計(jì)算得到的因子重要性作為閾值,對(duì)組合結(jié)果進(jìn)行多尺度圖像分割;選取灰度共生矩陣(GLCM)紋理信息構(gòu)建分類知識(shí)庫(kù),利用最鄰近分類法進(jìn)行地貌自動(dòng)分類;最后以《中國(guó)及毗鄰地區(qū)1∶400萬(wàn)地貌圖》為基準(zhǔn),對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)。
圖1 技術(shù)路線Fig.1 The technology flow chart
2.1 地貌分類因子的確定
將多種地形因子結(jié)合能夠較為完整地反映地貌實(shí)體的形態(tài)特征[17,18]。本研究選取了在數(shù)字地形分析中常用于地貌分類的宏觀地形因子:高程、地形起伏度、地表粗糙度、地表切割深度、高程變異系數(shù);以及微觀地形因子,坡度、坡度變率、全累計(jì)曲率。此外,地貌暈渲圖可產(chǎn)生地形表面陰影效果,能夠增強(qiáng)地面的起伏感,也作為地貌形態(tài)類型劃分的指標(biāo)。
不同地形因子從不同角度表達(dá)地貌形態(tài)特征和空間特征,其間往往存在相關(guān)性,相關(guān)性強(qiáng)的地形因子所反映的地貌形態(tài)信息具有較大重疊,故在進(jìn)行地貌形態(tài)類型劃分時(shí)勢(shì)必會(huì)造成信息的冗余,故應(yīng)篩選相關(guān)性弱的地形因子組合進(jìn)行地貌劃分。在對(duì)上述9種地形因子進(jìn)行相關(guān)系數(shù)篩查前,為避免量綱的影響,先對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,使其值域落在0~255之間。得到9種地形因子相關(guān)系數(shù)見(jiàn)表1,其中,坡度、地表切割深度和地形起伏度3個(gè)地形因子間存在高度相關(guān)性,故應(yīng)選擇其中一種地形因子與其余6種因子組合以進(jìn)行地貌形態(tài)類型的劃分。本研究采用雪氏熵值法對(duì)坡度、地表切割深度和地形起伏度3個(gè)地形因子進(jìn)行取舍:
(1)
式中:S為n維數(shù)據(jù)子集的熵;|Ms|為n維數(shù)據(jù)子集的協(xié)方差矩陣行列值,該值越大則該影像的熵越大,越有利于影像分類。
將坡度、地表切割深度和地形起伏度分別與其他6種地形因子組合,利用式(1)計(jì)算熵值S,得到3種組合的熵值分別為:26.89、26.86、27.20,即地形起伏度與其他6種地形因子的組合能夠獲得最大的熵值,也即地形起伏度、地表粗糙度、高程、高程變異系數(shù)、坡度變率、光照暈渲圖和全累計(jì)曲率為地貌分類的最佳因子組合。
2.2 地形因子重要性的計(jì)算
面向?qū)ο笥跋穹治鏊枷氲暮诵氖菍⒂跋駥?duì)象作為最小處理單元,其核心技術(shù)是影像分割與特征空間聚類。分割一般從像素級(jí)開始,采取自下而上迭代的區(qū)域融合方法,將光譜和空間特征同質(zhì)性高的相鄰像素合并[19],將分割后的影像對(duì)象按照最大隸屬度值劃分到某一確定的類別中,從而完成分類。在分割開始前,當(dāng)輸入信息源是單一圖層即單通道影像時(shí),僅利用單個(gè)圖層進(jìn)行分割,當(dāng)輸入信息源是多通道復(fù)合影像時(shí),則需對(duì)每一圖層設(shè)置權(quán)重后再進(jìn)行多尺度分割。通過(guò)上述分析,本文篩選了7種地形因子作為地貌形態(tài)劃分的因子組合,并將每一個(gè)地形因子作為一個(gè)圖層輸入組合成7波段特征影像,在進(jìn)行多尺度分割時(shí)需設(shè)置7種地形因子的權(quán)重,由于每種地形因子表征不同地貌類型的能力不同,在地貌分類中的重要性亦不同,重要性高的地形因子賦予較高的權(quán)重,故在對(duì)地形因子賦權(quán)重值前需先定量計(jì)算地形因子的重要性。本文提出一種基于隨機(jī)森林分類因子重要性估計(jì)的多尺度分割圖層閾值確定方法。
(2)
計(jì)算得到各地形因子重要性度量如圖2,將重要性數(shù)值取整后作為各圖層的閾值進(jìn)行多尺度分割,通過(guò)多次實(shí)驗(yàn)后將分割尺度設(shè)為90,最終得到的多尺度分割結(jié)果如圖3所示(見(jiàn)封2)。
2.3 基于GLCM的面向?qū)ο蠓诸?/p>
本文采用標(biāo)準(zhǔn)最鄰近分類器進(jìn)行地貌類型的劃分,在類層次結(jié)構(gòu)中插入7個(gè)類別:平原、丘陵、低山、低中山、高中山、高山和極高山,為每一類別選取GLCM紋理性構(gòu)建分類特征空間,并選擇樣本。
圖2 各地形因子重要性度量Fig.2 Importance measure for each terrain factor
DEM模擬的數(shù)字地形表面,本質(zhì)上是一個(gè)空間場(chǎng)模型,而由于內(nèi)插技術(shù)的存在,DEM柵格高程間存在較強(qiáng)的空間自相關(guān)性,GLCM模型以估計(jì)二階組合條件概率密度函數(shù)為基礎(chǔ),描述在θ方向上相距為d的一對(duì)像元灰度值分別為i和j的出現(xiàn)概率,將像元間的空間關(guān)系用空間距離、角度等為參數(shù)引入紋理分析模型中,并由此揭示圖像的紋理特征,故該模型能夠顧及像元間的空間自相關(guān)性,是行之有效的針對(duì)DEM進(jìn)行紋理分析的方法[22]。在構(gòu)建特征空間時(shí)為充分利用GLCM的方向性,選擇全方向工具,對(duì)7個(gè)地形因子圖層分別構(gòu)建同質(zhì)性(Homogeneity)、對(duì)比度(Contrast)、差異性(Dissimilarity)、熵(Entropy)、角二階矩(Ang.2nd moment)、中值(Mean)、標(biāo)準(zhǔn)差(StdDev)和相關(guān)度(Correlation) 8種GLCM紋理參數(shù)特征,組成特征空間知識(shí)庫(kù),然后為特征空間選擇訓(xùn)練樣本。在初次分類時(shí),為了充分利用對(duì)象間的異質(zhì)性,訓(xùn)練樣本選擇數(shù)量不能過(guò)多,由圖3可知,三大平原區(qū)對(duì)象面積較大且較完整,訓(xùn)練樣本選擇的數(shù)量較少,而西部橫斷山脈和喜馬拉雅山脈附近的高山區(qū)和極高山區(qū)的對(duì)象面積較小且較破碎,故訓(xùn)練樣本選擇的數(shù)量要多于平原丘陵區(qū)。
由于GLCM計(jì)算量較大,時(shí)間復(fù)雜度較高,在執(zhí)行分類前,還需進(jìn)行特征空間最優(yōu)化的選取。特征空間最優(yōu)化即計(jì)算特征空間中所有分類的樣本間的歐式幾何距離,將能產(chǎn)生最優(yōu)類間距的特征組合作為最優(yōu)特征組合,這里最優(yōu)類間距定義為不可分類間最小距離的最大值[23](圖4)。圖4表示不同維數(shù)的特征空間對(duì)應(yīng)的類間距,當(dāng)特征組合維數(shù)為9時(shí)取得最大類間距0.176,此時(shí)的特征空間為:光照暈渲圖的熵、差異性和對(duì)比度,坡度變率的相關(guān)度,地表粗糙度的相關(guān)度和熵,地形起伏度的熵和同質(zhì)性以及高程變異系數(shù)的相關(guān)度。將這9種特征作為地貌形態(tài)類型劃分的特征空間組合。
圖4 特征組合維數(shù)類間距Fig.4 The separation distance of feature combination dimension
利用最優(yōu)特征空間對(duì)影像進(jìn)行初次分類,得到的結(jié)果易出現(xiàn)錯(cuò)分、漏分現(xiàn)象,且多發(fā)生于高中山、高山和極高山等紋理信息較為近似的區(qū)域,因此基于初次分類的結(jié)果去掉效果不佳的樣本,并更正錯(cuò)分樣本,再次進(jìn)行分類。需要注意的是,由于特征空間最優(yōu)化是基于樣本的,故增加或刪除樣本需要重新計(jì)算最優(yōu)特征空間組合,如此迭代3~4次得到最終分類結(jié)果(圖5,見(jiàn)封2)。
2.4 精度檢驗(yàn)
2.4.1 分類精度檢驗(yàn) 為對(duì)分類結(jié)果進(jìn)行精度檢驗(yàn),以《中國(guó)及毗鄰地區(qū)1∶400萬(wàn)地貌圖》除去黃土高原區(qū)與沙漠區(qū)以外的基本形態(tài)類型地貌區(qū)域?yàn)榛A(chǔ),對(duì)分類結(jié)果與之對(duì)應(yīng)部分的全部共8 569 210個(gè)像素構(gòu)建混淆矩陣進(jìn)行精度評(píng)價(jià)(表2)。由表2可知,低中山類的用戶精度最高(84.1%),低山類用戶精度最低(47.7%),表明分類結(jié)果中低中山類具有最高的可信度,而低山地貌類型的分類結(jié)果可信度最低;制圖精度最高的是平原地貌(83.7%),最低的是低山地貌(50.2%),表明平原的地貌特征明顯,而低山的地貌特征不明顯且易與其他地貌類別(如低中山和丘陵)相混淆。實(shí)驗(yàn)總體精度71.4%,Kappa系數(shù)0.67,分類結(jié)果完整度好,精度較高。
表2 精度評(píng)價(jià)結(jié)果Table 2 Accuracy evaluation of classification result
2.4.2 總體精度檢驗(yàn) 將本文分類方法的分類精度與前人基于ISODATA非監(jiān)督分類法[16]以及文獻(xiàn)[18]面向?qū)ο蠓诸惙ǖ姆诸惥冗M(jìn)行對(duì)照,結(jié)果顯示,本文分類方法在精度上具有明顯優(yōu)勢(shì)(表3),比ISODATA非監(jiān)督分類法精度提高5.7%,比常用的面向?qū)ο蠓诸惙ň忍岣?5.7%。將本文分類方法應(yīng)用于陜西省地貌分類,以《中華人民共和國(guó)1∶100萬(wàn)地貌圖》為精度評(píng)價(jià)標(biāo)準(zhǔn),總體精度為72.9%。
表3 總體精度與Kappa系數(shù)對(duì)比Table 3 Comparison of classification accuracy and Kappa
2.4.3 本文方法對(duì)不同分辨率DEM分類精度的影響 為驗(yàn)證本文方法對(duì)不同分辨率DEM分類精度的影響,以SRTM (Shuttle Radar Topography Mission) DEM(90 m分辨率)為數(shù)據(jù)源,在我國(guó)西南山地地貌較為復(fù)雜的區(qū)域選取研究區(qū)進(jìn)行地貌分類;同時(shí)將SRTM DEM重采樣成500 m和1 000 m,采用本文分類法分別進(jìn)行地貌劃分及精度評(píng)價(jià)(表4)。由表4可知,隨著數(shù)據(jù)分辨率降低,地貌分類精度逐級(jí)下降,SRTM DEM(90 m分辨率)分類結(jié)果總體精度和Kappa系數(shù)最高。分辨率均為1 000 m情況下,SRTM DEM分類總體精度高于國(guó)家基礎(chǔ)地理信息中心DEM數(shù)據(jù),這可能是由于國(guó)家基礎(chǔ)地理信息中心DEM數(shù)據(jù)插值的原因,存在精度問(wèn)題,在計(jì)算參數(shù)時(shí)不準(zhǔn)確。
表4 不同數(shù)據(jù)格式不同分辨率DEM分類精度對(duì)比Table 4 Classification accuracy comparison of different DEM formation and resolution
本文以國(guó)家基礎(chǔ)地理信息中心1∶100萬(wàn)DEM為數(shù)據(jù)源,通過(guò)定量化分析確定了適宜進(jìn)行地貌劃分的地形因子組合;在進(jìn)行多尺度分割時(shí),通過(guò)構(gòu)建隨機(jī)森林分類樹計(jì)算因子重要性的方式確定各地形因子的分割閾值;利用GLCM紋理信息構(gòu)建特征分類知識(shí)庫(kù),對(duì)分類知識(shí)庫(kù)進(jìn)行篩選得到最優(yōu)特征組合,進(jìn)而對(duì)多尺度分割得到的對(duì)象進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,該方法得到的分類結(jié)果較完整、精度較高,分類過(guò)程主觀性低,且實(shí)現(xiàn)過(guò)程簡(jiǎn)單。此外,與現(xiàn)有面向?qū)ο蠓诸惙椒ㄟM(jìn)行對(duì)比,本文方法在精度上具有明顯優(yōu)勢(shì)。
通過(guò)分析本文方法對(duì)不同分辨率DEM分類精度的影響,隨著數(shù)據(jù)分辨率降低,地貌分類精度逐級(jí)下降,SRTM DEM (90 m分辨率)分類結(jié)果總體精度和Kappa系數(shù)最高。但SRTM DEM(90 m分辨率)數(shù)據(jù)量較大,進(jìn)行多尺度分割且基于紋理的地貌分類非常耗時(shí);同時(shí)本文在執(zhí)行多尺度分割操作時(shí)通過(guò)多次實(shí)驗(yàn)確定分割尺度,實(shí)驗(yàn)過(guò)程略微繁瑣,如何根據(jù)不同的地形因子組合自適應(yīng)確定分割尺度以及針對(duì)SRTM DEM(90 m分辨率)設(shè)計(jì)相應(yīng)的分類方法將是下一步研究工作中的重點(diǎn)。
[1] 李炳元,潘保田,程維明,等.中國(guó)地貌區(qū)劃新論[J].地理學(xué)報(bào),2013,68(3):291-306.
[2] 高玄彧.地貌基本形態(tài)的主客分類法[J].山地學(xué)報(bào),2004,22(3):261-266.
[3] GERCEK D,TOPRAK V,STROBL J.Object-based classification of landforms based on their local geometry and geomorphometric context[J].International Journal of Geographical Information Science,2011,25(6):1011-1023.
[4] BENZ U C,HOFMANN P,WILLHAUCK G,et al.Multi-resolution,object-oriented fuzzy analysis of remote sensing data for GIS-ready information[J].ISPRS Journal of Photogrammetry and Remote Sensing,2004,58(3):239-258.
[5] 胡惠萍.面向?qū)ο蠓诸惣夹g(shù)的景觀信息獲取[D].長(zhǎng)沙:中南大學(xué),2007.17.
[7] MANAKOS I,SCHNEIDER T,AMMER U.A comparison between the ISODATA and the eCognition classification methods on basis of field data[J].IAPRS,2000,33:133-139.
[8] BLASCHKE T.Object based image analysis for remote sensing[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(1):2-16.
[9] VAN NIEKERK A.A comparison of land unit delineation techniques for land evaluation in the Western Cape,South Africa[J].Land Use Policy,2010,27(3):937-945.
[11] MYINT S W,GOBER P,BRAZEL A,et al.Per-pixel vs.object-based classification of urban land cover extraction using high spatial resolution imagery[J].Remote Sensing of Environment,2011,115(5):1145-1161.
[12] CIARAN R,LAN W,NEIL A,et al.A semi-automated method for mapping glacial geomorphology tested at Brei amerkurj kull,Iceland[J].Remote Sensing of Environment,2015,163:80-90.
[13] SHRUTHI R B V,KERLE N,JETTEN V,et al.Quantifying temporal changes in gully erosion areas with object oriented analysis[J].Catena,2015,128:262-277.
[14] 宋曉陽(yáng),姜小三,江東,等.基于面向?qū)ο蟮母叻钟跋穹诸愌芯縖J].遙感技術(shù)與應(yīng)用,2015,30(1):99-105.
[15] 宋佳.基于DEM的我國(guó)地貌型類型自動(dòng)劃分研究[D].西安:西北大學(xué),2006.9.
[16] 劉愛(ài)利,湯國(guó)安.中國(guó)地貌基本形態(tài) DEM 的自動(dòng)劃分研究[J].地球信息科學(xué),2006,8(4):8-14.
[17] 湯國(guó)安.我國(guó)數(shù)字高程模型與數(shù)字地形分析研究進(jìn)展[J].地理學(xué)報(bào),2014,69(9):1305-1325.
[18] 汪禹芹,李艷,劉愛(ài)利.基于面向?qū)ο笏枷氲闹袊?guó)地貌形態(tài)類型劃分[J].遙感信息,2012,1:13-18.
[19] 黃昕.高分辨率遙感影像多尺度紋理形狀特征提取與面向?qū)ο蠓诸愌芯縖D].武漢:武漢大學(xué),2009.6.
[20] BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.
[21] 雷震.隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D].上海:上海交通大學(xué),2012.
[22] 劉凱,湯國(guó)安,陶旸,等.基于灰度共生矩陣的 DEM 地形紋理特征量化研究[J].地球信息科學(xué)學(xué)報(bào),2013,14(6):751-760.
[23] LALIBERTE A S,BROWNING D M,RANGO A.A comparison of three feature selection methods for object-based classification of sub-decimeter resolution UltraCam-L imagery[J].International Journal of Applied Earth Observation and Geoinformation,2012,15:70-78.
Improvement of Object-Oriented Classification Method for Landform Types
TIAN Dan1,LIU Ai-li1,DING Hu2,ZHANG Wen1,QI Wei1
(1.SchoolofGeographyandRemoteSensing,NanjingUniversityofInformationScienceandTechnology,Nanjing210044;2.KeyLaboratoryofVirtualGeographicEnvironment,MinistryofEducation,NanjingNormalUniversity,Nanjing210023,China)
This paper proposes an improved object-oriented classification for landform types,based on analysis of random forest and gray-level co-occurrence matrix.In the research,based on 1∶1 000 000 DEM of China,terrain factors for terrain classification are selected by correlation analysis and Sheffield′s entropy method.Random forest classification tree is applied to evaluate the importance of the terrain factors,which are used as object-oriented multi-scale segmentation threshold of each terrain factor.Then GLCM is conducted for the knowledge base of classification.Experiments show that the classification method of this paper is up by 5.7% than ISODATA unsupervised classification,and by 15.7% than object-oriented classification method with the landform map of 1∶4 000 000 of China as precision evaluation criteria.On Shaanxi Province,results indicated that the overall accuracy of classification is 72.9% with the landform map of 1∶1 000 000 of China as precision evaluation criteria.By analyzing the influence of the method on the classification accuracy of DEM with different resolutions,the higher the resolution is,the higher the overall accuracy is.
landform classification;object-oriented classification;random forest;gray-level co-occurrence matrix
2015-10-21;
2015-12-29
國(guó)家自然科學(xué)基金項(xiàng)目(41401471)
田丹(1991-),女,碩士研究生,主要從事數(shù)字地形分析方面的研究。E-mail:870814482@qq.com
10.3969/j.issn.1672-0504.2016.02.009
P931;P208
A
1672-0504(2016)02-0046-05