張成才,李 飛,王艷梅,羅蔚然
(鄭州大學(xué) 水利與環(huán)境學(xué)院,河南 鄭州 450001)
遙感影像分類是提取地物信息的重要手段,被廣泛應(yīng)用在專題制圖、專題信息提取、動(dòng)態(tài)變化監(jiān)測和地理空間數(shù)據(jù)庫建設(shè)中[1-3]。其中,分類算法是遙感影像研究的重點(diǎn)內(nèi)容,選擇合適的分類算法能夠有效地提高分類精度。模糊聚類算法是聚類分析研究的主要算法之一,其中模糊C均值聚類(fuzzyC-means, FCM)算法的應(yīng)用最為廣泛[4-5]。傳統(tǒng)的FCM算法存在很多不足,為此研究學(xué)者對(duì)其進(jìn)行改進(jìn)使其適用于遙感影像分類。郝玉等[6]利用直方圖選取聚類中心和聚類數(shù)并使用叉熵距離代替歐式距離,克服了傳統(tǒng)FCM算法選樣時(shí)的隨機(jī)性和依賴球狀分布的缺點(diǎn),從而提高了遙感影像分類的精度。謝福鼎等[7]通過改進(jìn)FCM算法的目標(biāo)函數(shù)和迭代過程,充分發(fā)揮了有標(biāo)簽樣本點(diǎn)在迭代過程中的作用,實(shí)驗(yàn)結(jié)果表明,樣本點(diǎn)越多,分類精度也越高。但這些改進(jìn)的FCM算法在對(duì)遙感影像進(jìn)行分類時(shí)并沒有體現(xiàn)像元間具有相關(guān)性、相鄰像元間具有相似特征值的依賴關(guān)系,只是簡單地依據(jù)像元特征向量的維數(shù)構(gòu)成特征空間進(jìn)而對(duì)影像進(jìn)行分類[8]。在這樣的特征空間中,像元間的空間特性使得表示不同地物的像元通常是線性不可分的,從而降低了遙感影像的分類精度。為了彌補(bǔ)FCM算法在這方面的不足,史云松等[9]將單個(gè)核函數(shù)引入到FCM算法對(duì)遙感影像進(jìn)行分類。該算法通過非線性變化關(guān)系將像元的特征向量映射到高維空間中,提高了異物像元在特征空間中的線性可分性,從而改善了影像的分類精度。但當(dāng)遙感數(shù)據(jù)特征含有異構(gòu)信息并且在高維特征空間中分布不平坦時(shí),使用單個(gè)核函數(shù)進(jìn)行映射處理就不合理了[10-12]。
綜上所述,多光譜遙感影像中的像元記錄了不同波段的波譜響應(yīng)強(qiáng)度,在分類時(shí)這些波段值組成了像元的特征向量。由于相鄰像元間具有相關(guān)性,使得相鄰異物像元的特征向量在特征空間中常常是線性不可分的。FCM算法進(jìn)行分類時(shí)僅考慮了像元的特征向量,忽略了相鄰像元間具有空間關(guān)系的特性。引入單個(gè)核函數(shù)時(shí)增加了數(shù)據(jù)的線性可分性,但單個(gè)核函數(shù)并不能很好地對(duì)具有多個(gè)特征的數(shù)據(jù)進(jìn)行映射。為了使FCM算法更加適合遙感影像的分類,筆者將多個(gè)核函數(shù)與FCM算法融合,構(gòu)建多核模糊C均值算法(multiple kernel fuzzyC-mean, MKFCM)。為了檢驗(yàn)MKFCM算法對(duì)不同分辨率影像的分類結(jié)果,選取鄭州市區(qū)中高分辨率Landsat8 OLI影像和鄭州大學(xué)新校區(qū)的高分辨率的Pleiades衛(wèi)星影像對(duì)地物進(jìn)行分類,并與FCM算法、KFCM算法的分類結(jié)果進(jìn)行了對(duì)比分析。
FCM算法被研究人員廣泛地應(yīng)用在遙感影像分類中[13-14],它把n個(gè)向量xi(i=1,2, 3,…,n)分為c個(gè)模糊組,分別計(jì)算出每個(gè)模糊組的聚類中心,然后利用迭代法使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。代價(jià)函數(shù)的表達(dá)式為:
(1)
式中:uij為隸屬度矩陣;指數(shù)m為平滑因子,間接影響著聚類的效果;dij=‖xj-vi‖為向量xj與聚類中心vi的距離[15]。
利用拉格朗日乘子法對(duì)方程(1)進(jìn)行求解,得到更新公式為:
(2)
(3)
目前大多數(shù)改進(jìn)的FCM算法在對(duì)遙感影像進(jìn)行分類時(shí)并沒有考慮到異物相鄰像元間具有特殊的空間相關(guān)性關(guān)系。因此,筆者在FCM算法基礎(chǔ)上引入多個(gè)核函數(shù)建立MKFCM算法,其優(yōu)點(diǎn)是多核函數(shù)通過非線性映射關(guān)系將原始數(shù)據(jù)映射到新的特征空間中。這樣不僅可以增強(qiáng)數(shù)據(jù)的線性可分性,而且也可以將數(shù)據(jù)的多種特征用不同的核函數(shù)進(jìn)行描述,并能根據(jù)數(shù)據(jù)的分布特點(diǎn),自動(dòng)選取最佳權(quán)重進(jìn)行核函數(shù)間的組合。本文MKFCM的目標(biāo)函數(shù)為:
(φ(xi)-Vj);
(4)
φ(x)=ω1φ1(x)+ω2φ2(x)+…+ωMφM(x),
(5)
式中:φM為第M個(gè)特征映射;M為特征映射的個(gè)數(shù)及核函數(shù)的個(gè)數(shù);ωM為第M個(gè)核函數(shù)的權(quán)重值;U為隸屬度矩陣;V為聚類中心矩陣。使用拉格朗日乘子法對(duì)方程進(jìn)行求解,得到更新公式為:
(6)
(7)
其中,
(8)
(9)
在核函數(shù)的選擇方面,筆者使用高斯函數(shù)進(jìn)行實(shí)驗(yàn),該函數(shù)屬于魯棒徑向基核。該徑向基核對(duì)數(shù)據(jù)有很好的抗噪作用,并且高斯核函數(shù)的取值是0~1,有效地簡化了計(jì)算過程[16]。
以鄭州市區(qū)和鄭州大學(xué)新校區(qū)作為研究區(qū)域,鄭州包括鄭州市區(qū)和登封、鞏義、新密、滎陽、新鄭5市和中牟縣,總面積達(dá)7 446 km2,其中鄭州市區(qū)面積占1 010.3 km2。鄭州大學(xué)新校區(qū)位于鄭州市,校區(qū)南北長約2.1 km,東西寬約1.1 km,占地面積約2.31 km2。選取鄭州市區(qū)2017年12月8日的Landsat8 OLI影像作為地物分類的數(shù)據(jù)源,如圖1(a)所示。為對(duì)比不同影像的分類結(jié)果,又選取鄭州大學(xué)新校區(qū)2014年5月15日的Pleiades影像融合產(chǎn)品作為地物分類的數(shù)據(jù)源,如圖1(b)所示。
圖1 研究區(qū)影像圖Figure 1 Image of study area
對(duì)于Landsat8 OLI影像數(shù)據(jù)源,選擇影像的前6個(gè)波段進(jìn)行實(shí)驗(yàn),分別為藍(lán)波段(0.450~0.515 μm)、綠波段(0.525~0.600 μm)、紅波段(0.630~0.680 μm)、近紅外波段(0.845~0.885 μm)、短波紅外1波段(1.560~1.660 μm)和短波紅外2波段(2.100~2.300 μm),空間分辨率30 m×30 m。為了提高影像的質(zhì)量,需要對(duì)研究區(qū)的影像進(jìn)行預(yù)處理,主要操作包括輻射定標(biāo)和大氣校正。輻射定標(biāo)使用ENVI中的Radiometric Calibration工具,大氣校正使用Flash工具。由于Landsat8數(shù)據(jù)在發(fā)布前做過基于地形數(shù)據(jù)的幾何校正,因此本研究中不再對(duì)研究區(qū)域的Landsat8數(shù)據(jù)進(jìn)行幾何校正操作。Pleiades影像數(shù)據(jù)源屬于SPOT衛(wèi)星家族的后續(xù)衛(wèi)星,由兩顆完全相同的衛(wèi)星Pleiades 1和Pleiades 2組成,具有0.5 m的超高分辨率,幅寬可達(dá)20 km×20 km[17]。選擇Pleiades融合影像的3個(gè)波段進(jìn)行實(shí)驗(yàn),分別為藍(lán)波段(0.430~0.550 μm)、綠波段(0.500~0.620 μm)、紅波段(0.590~0.710 μm)。
使用FCM、KFCM與MKFCM 3種算法分別對(duì)Landsat8影像和Pleiades影像進(jìn)行分類,分類結(jié)果如圖2、3所示。
圖2 Landsat8影像分類結(jié)果Figure 2 Landsat8 image classification results
圖3 Pleiades影像分類結(jié)果Figure 3 Pleiades image classification results
通過對(duì)精度的分析可以有效地評(píng)價(jià)分類結(jié)果的好壞,所以精度評(píng)價(jià)是遙感分類過程中必不可少的一部分。在驗(yàn)證Landsat8影像的分類結(jié)果時(shí),利用高分辨率影像驗(yàn)證低分辨遙感數(shù)據(jù)的方法[18],選用谷歌高分辨率遙感數(shù)據(jù)作為驗(yàn)證影像。谷歌影像是目前全球最大的免費(fèi)影像數(shù)據(jù)庫,可以方便快捷地獲取不同時(shí)期各個(gè)地區(qū)的影像數(shù)據(jù),在一定程度上給遙感、地信工作者帶來許多便利[19]。本研究選取2018年2月22日第18級(jí)的影像作為驗(yàn)證影像,該級(jí)影像分辨率為0.5 m×0.5 m。該影像包括0~19級(jí),共20級(jí),共選取1 629個(gè)驗(yàn)證像元,其中道路323個(gè)像元,建筑用地352個(gè)像元,水體620個(gè)像元,植被127個(gè)像元,裸地207個(gè)像元。對(duì)Pleiades影像分類結(jié)果的驗(yàn)證則通過實(shí)地勘察測量的方式,在鄭州大學(xué)新校區(qū)中選取2 515個(gè)驗(yàn)證像元進(jìn)行精度檢驗(yàn),其中建筑用地628個(gè)像元,水體770個(gè)像元,植被644個(gè)像元,道路473個(gè)像元。
混淆矩陣能夠直觀展示出每類地物的分類正確率以及該類地物錯(cuò)分為其他地物的情況。對(duì)采用不同算法處理不同影像數(shù)據(jù)得到的分類結(jié)果建立混淆矩陣,如表1和表2所示。由于遙感影像上水體與建筑陰影和植被陰影有著相似的光譜特征,道路與建筑用地也有著相似的光譜特征,因此相互之間錯(cuò)分的可能性較高。通過表1的混淆矩陣可知,F(xiàn)CM和KFCM算法對(duì)建筑、植被、水體、裸地和道路錯(cuò)分比較嚴(yán)重,特別是與水體光譜特征相似的建筑物的陰影存在大量的錯(cuò)分;MKFCM算法能清晰地將道路、建筑和水體提取出來,并能夠正確地區(qū)分建筑物的陰影區(qū)域,分類效果明顯優(yōu)于FCM算法。而對(duì)于表2的混淆矩陣可知,3種算法都能將建筑用地比較明顯地提取出來,但FCM與KFCM算法對(duì)與水體光譜特征相似的陰面植被存在嚴(yán)重錯(cuò)分的現(xiàn)象,MFKCM算法能將二者正確地區(qū)分開來。
表1 鄭州市區(qū)Landsat8 OLI影像分類的混淆矩陣Table 1 Confusion matrix of Landsat8 OLI image classification in Zhengzhou urban area
表2 鄭州大學(xué)新校區(qū)Pleiades影像分類的混淆矩陣Table 2 Confusion matrix of Pleiades image classification in new campus of Zhengzhou university
為了對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià),采用用戶精度、生產(chǎn)者精度、總體分類精度和Kappa系數(shù)4個(gè)評(píng)價(jià)指標(biāo)[20]。用戶精度和生產(chǎn)者精度評(píng)價(jià)特定類別的分類精度如圖4和圖5所示,其中同比增長是指與FCM相比,KFCM、MKFCM分類精度的增長值。采用總體分類精度和Kappa系數(shù)評(píng)價(jià)整體分類結(jié)果的精度,如圖6所示。
圖4 Landsat8影像中MKFCM的用戶精度、生產(chǎn)者精度及其同比增長Figure 4 User accuracy,producer accuracy and growth rate of MKFCM in Landsat8 images
圖5 Pleiades影像中MKFCM的用戶精度、生產(chǎn)者精度及其同比增長Figure 5 User accuracy, producer accuracy and growth rate of MKFCM in Pleiades images
圖6 總體分類精度及Kappa系數(shù)對(duì)比圖Figure 6 Comparison chart of overall classification accuracy and Kappa coefficient
由圖4和圖5可知,MKFCM算法對(duì)兩種影像單個(gè)地物的分類,無論用戶精度還是生產(chǎn)者精度其百分比都很高,且與FCM與KFCM算法的分類結(jié)果相比有明顯提升。在Landsat8影像中,與其他兩種算法相比,MKFCM算法對(duì)建筑的分類精度同比增長最多; Pleiades影像中對(duì)建筑和道路的分類精度同比增長的最多。這是因?yàn)榻ㄖ写嬖诘慕ㄖ幱芭c水體有著相似的像元特征值,而建筑又與道路有著類似的像元特征值。FCM算法并不能很好地區(qū)分具有相似特征值的異物像元,KFCM中只有單個(gè)核函數(shù)不能對(duì)具有多個(gè)特征值的像元進(jìn)行區(qū)分,而MKFCM算法不僅能將像元的特征向量通過核函數(shù)映射到高維空間中,還能依據(jù)多個(gè)核函數(shù)對(duì)不同的特征值進(jìn)行映射,從而提高了異物像元間的可分性。
由圖6可知,在對(duì)Landsat8影像分類時(shí),MKFCM比FCM算法總體分類精度提高了11.5%,Kappa系數(shù)提高了0.089;與KFCM算法相比,MKFCM算法在總體精度上提高了9.31%,Kappa系數(shù)提高了0.049。在對(duì)Pleiades影像進(jìn)行分類時(shí),MKFCM比FCM算法總體精度提高了6.6%,Kappa系數(shù)提高了0.15;與KFCM算法相比,MKFCM算法在總體精度上提高了3.64%,Kappa系數(shù)提高了0.13。相比之下,MKFCM算法在兩種影像的分類上無論是總體分類精度還是Kappa系數(shù)都是最佳的。
綜上所述,MKFCM算法能通過核函數(shù)將原始特征向量映射到高維特征空間中,并根據(jù)特征向量在空間中的分布特點(diǎn)自動(dòng)對(duì)核函數(shù)進(jìn)行最優(yōu)化組合,提高不同類型數(shù)據(jù)間的線性可分性,從而能區(qū)分相似光譜特征的異類地物,尤其是對(duì)道路、建筑和植被的分類精度明顯提高。
將多個(gè)核函數(shù)與FCM算法融合構(gòu)建MKFCM算法,不僅能提高遙感影像在特征空間中的線性可分性,而且還能將像元具有的不同特征分量分別輸入到對(duì)應(yīng)的核函數(shù)進(jìn)行映射,使像元在組合的特征空間中得到更好地表達(dá),進(jìn)而提高遙感影像的分類精度。筆者采用FCM、KFCM和MKFCM算法分別對(duì)中高分辨率(Landsat8)和高分辨率(Pleiades)遙感影像進(jìn)行分類,并使用混淆矩陣和4個(gè)評(píng)價(jià)指標(biāo)對(duì)分類精度進(jìn)行評(píng)價(jià)。結(jié)果表明,MKFCM算法對(duì)兩種影像的分類結(jié)果,無論是單個(gè)類別的精度還是整體的分類精度都高于FCM與KFCM算法,尤其對(duì)具有相似光譜的像元具有很好的區(qū)分效果,提高了土地覆蓋信息提取的準(zhǔn)確度。