高子為, 程朋根, 趙亞男
(東華理工大學(xué) 測(cè)繪工程學(xué)院,江西 南昌 330013)
科學(xué)規(guī)劃國(guó)土空間,需要對(duì)土地利用現(xiàn)狀和城市功能區(qū)空間分布情況進(jìn)行深入分析,如何準(zhǔn)確有效地識(shí)別城市土地利用類型成為關(guān)鍵問題。遙感作為一種可以快速獲取地表覆蓋信息的技術(shù),具有快速、宏觀、綜合、準(zhǔn)確、周期性、低成本等優(yōu)勢(shì),已經(jīng)成為城市用地信息提取與監(jiān)測(cè)的重要手段(楊朝斌等,2016;方正等,2020)。傳統(tǒng)的基于像元特性信息的影像分類為大面積獲取城市土地利用現(xiàn)狀和土地覆蓋分類提供了便捷的手段,為城市定量分析應(yīng)用提供了重要技術(shù)支撐。有學(xué)者結(jié)合遙感技術(shù)(RS)和地理信息系統(tǒng)(GIS)技術(shù)構(gòu)建了城市生態(tài)監(jiān)測(cè)與評(píng)價(jià)系統(tǒng),并對(duì)某城市綜合生態(tài)指數(shù)進(jìn)行提取與分級(jí)(程朋根等,2015;徐看等,2021),也有學(xué)者利用Landsat遙感影像對(duì)珠江三角洲區(qū)域進(jìn)行土地利用變化檢測(cè)(樊風(fēng)雷等,2007)。單一利用遙感影像分類僅僅使用了地物的物理特征,但不同的地物可能具有相同的物理特征。所以,僅使用低層語義特征進(jìn)行分類結(jié)果往往不夠準(zhǔn)確。對(duì)此,有學(xué)者研究證明通過引入高層語義特征,利用遙感影像物理特征構(gòu)建虛擬單詞,并通過詞袋模型(BOW)將光譜、紋理和尺度不變特征轉(zhuǎn)換(SIFT)等多特征信息融合到一起,可以縮小場(chǎng)景分類中的“語義差距”,提高土地利用的分類精度(Zhong et al.,2015)。
遙感影像中提取的特征僅僅描述了地物的自然屬性,無法完全對(duì)接社會(huì)經(jīng)濟(jì)屬性明顯的城市土地利用類型。隨著互聯(lián)網(wǎng)的快速發(fā)展,大量基于位置服務(wù)的社交媒體數(shù)據(jù)為城市土地利用分類和城市空間結(jié)構(gòu)分析研究提供了豐富的數(shù)據(jù)源。社交媒體數(shù)據(jù)能夠反映人類經(jīng)濟(jì)社會(huì)活動(dòng)的內(nèi)在特征,補(bǔ)充了高分辨率遙感影像數(shù)據(jù)無法描述的地物內(nèi)部經(jīng)濟(jì)社會(huì)屬性,有助于城市土地利用分類。例如,POI數(shù)據(jù)為城市土地利用分類研究提供了大量的語義信息,包括名稱、地址、功能、經(jīng)緯度等,可以描述地理空間中各類商業(yè)性設(shè)施和社會(huì)服務(wù)性設(shè)施,蘊(yùn)含著豐富的人文經(jīng)濟(jì)特征,補(bǔ)充了遙感影像所缺乏的語義信息,是城市空間分析中的重要基礎(chǔ)地理數(shù)據(jù)之一。已有研究表明,POI的分布特征可以有效地說明地塊的功能(Jiang et al.,2015)。因此,研究遙感影像數(shù)據(jù)與POI數(shù)據(jù)支持下的城市土地利用分類,可以有效挖掘社交媒體數(shù)據(jù)中的有效信息,有效提高識(shí)別城市土地利用類型的精度。
以寧波市某廣場(chǎng)作為研究區(qū)域,利用詞袋模型和潛在狄利克雷分布 (LDA)主題模型,將高分辨率遙感影像數(shù)據(jù)特征信息與POI數(shù)據(jù)特征信息融合來實(shí)現(xiàn)城市土地利用類型分類。
研究技術(shù)路線如圖1所示。首先,對(duì)高分辨率遙感影像和POI數(shù)據(jù)進(jìn)行格網(wǎng)劃分,提取每一塊影像的多源特征信息作為具有一定表達(dá)能力的視覺單詞,建立影像的高層次語義表達(dá);其次,利用主題模型提取上述多源數(shù)據(jù)的潛在語義特征;最后,選擇迭代最優(yōu)價(jià)值的樣本用于訓(xùn)練支持向量機(jī)(SVM)來進(jìn)行城市土地利用分類。
圖1 技術(shù)流程圖Fig.1 Technical flow chart
高分辨率圖像具有豐富的光譜信息和空間信息。本次研究選取影像的光譜、紋理、幾何以及POI特征來充分刻畫影像的視覺單詞,從多個(gè)角度對(duì)地物特征進(jìn)行描述。
1.1.1 光譜特征
遙感影像的光譜特征能夠反映物體表面的物理屬性以及色調(diào)變化(胡勇等,2015)。筆者分別采用公式(1)與(2)計(jì)算每個(gè)波段的均值與標(biāo)準(zhǔn)差。
(1)
(2)
1.1.2 紋理特征
紋理特征能夠反映地物表面周期性變化的表面結(jié)構(gòu)排列屬性(張伐伐等,2012)。局部二值模式(LBP)是一種描述圖像紋理特征的描述符,它含有灰度不變性和旋轉(zhuǎn)不變性的特點(diǎn)(Bay et al.,2008)。
描述符LBP定義在一個(gè)3像素×3像素的窗口內(nèi),比較該窗口中心像素(x,y)與相鄰8個(gè)像素的灰度值,若周圍像素的灰度值大于中心像素的灰度值,則將該中心像素標(biāo)記為1;反之,標(biāo)記為0。通過公式(3),每個(gè)窗口可以得到一個(gè)二進(jìn)制數(shù)值,將該數(shù)值作為窗口中心像素點(diǎn)的LBP特征值,用于反映這個(gè)區(qū)域的紋理特征。
(3)
式中,LBP為局部二值模式,p為每個(gè)窗口中除了中心點(diǎn)以外的第p個(gè)像素點(diǎn),I(p)為相鄰像素點(diǎn)的灰度值,I(c)為窗口中心像素的灰度值,利用公式(4)計(jì)算符號(hào)函數(shù)s(x)。
(4)
1.1.3 幾何特征
加速穩(wěn)健特征(SURF)能夠克服仿射變換、光照變化、三維視點(diǎn)變化等問題,可用于偵測(cè)與描述影像中的幾何特征(Zhang et al.,2010)。SURF算法通過Hessian矩陣行列式獲取近似值圖像,每個(gè)像素(x,y)都可以用公式(5)計(jì)算其Hessian矩陣。
(5)
若Hessian矩陣的判別式在某一點(diǎn)取到局部極大值,則說明該點(diǎn)比周圍區(qū)域內(nèi)其他像素點(diǎn)的灰度值更高或更低,由此尋找特征點(diǎn)的位置,公式(6)為其判別式。
(6)
對(duì)上述圖像進(jìn)行盒子濾波計(jì)算,并構(gòu)建尺度空間,在該尺度空間中使用非最大值抑制檢測(cè)極值點(diǎn),并記錄該點(diǎn)的位置作為特征點(diǎn)。以特征點(diǎn)作為圓心的扇形區(qū)域?qū)D像進(jìn)行Haar小波響應(yīng)運(yùn)算,計(jì)算鄰域內(nèi)特征點(diǎn)在水平和垂直兩個(gè)方向的小波響應(yīng),并將更靠近圓心的特征點(diǎn)賦予更高的權(quán)重,再將扇形區(qū)域轉(zhuǎn)動(dòng)一定角度,計(jì)算小波響應(yīng)值。通過公式(7)和(8)對(duì)圖像Haar小波響應(yīng)值進(jìn)行求和。
mω=∑dx+∑dy
(7)
θω=arctan(∑dx∕∑dy)
(8)
式中,m為小波響應(yīng)值之和,ω為扇形轉(zhuǎn)動(dòng)角度,θ為最大Haar響應(yīng)累加值所對(duì)應(yīng)的主方向,SURF描述子具有良好的尺度、旋轉(zhuǎn)和光照不變性。
1.1.4 POI特征
POI特征反映了人文經(jīng)濟(jì)信息,可以作為反映社會(huì)經(jīng)濟(jì)屬性的視覺詞匯。有學(xué)者利用格網(wǎng)單元分割遙感影像進(jìn)行城市土地利用分類并取得了較高的精度(高晨,2017)。基于格網(wǎng)單元分割思路,采用與分割遙感影像大小一致的格網(wǎng)單元分割研究區(qū)域,根據(jù)OpenStreetMap路網(wǎng)劃分區(qū)塊,計(jì)算每個(gè)區(qū)塊中POI類型的比例,并將該比例值賦予區(qū)塊內(nèi)的每一個(gè)格網(wǎng),使得每個(gè)格網(wǎng)都包含POI特征值。
詞袋模型(BOW)最初應(yīng)用于自然語言處理和文檔分類領(lǐng)域,因其簡(jiǎn)單而有效的優(yōu)點(diǎn)得到了廣泛應(yīng)用,有學(xué)者將該模型的思想移植到遙感影像信息提取(Csurka et al.,2004)。其基本思路是通過對(duì)影像進(jìn)行特征提取和描述,獲取大量的特征信息,以此用一些關(guān)鍵詞來描述影像,在此基礎(chǔ)上構(gòu)建視覺詞典,挖掘遙感影像的高層語義特征。
將分割后的城市區(qū)域看作文檔集,將區(qū)域的土地利用類型看作主題,將區(qū)域中的各類特征信息作為單詞?;谝陨霞僭O(shè),一個(gè)格網(wǎng)可以用類型的分布表示,一個(gè)主題可以用特征的分布表示。分別對(duì)多個(gè)特征進(jìn)行K-means聚類,每個(gè)聚類中心為一個(gè)關(guān)鍵詞,所有的聚類中心組成一個(gè)單詞表,并計(jì)算每個(gè)格網(wǎng)的特征值與各關(guān)鍵詞之間的距離,將每個(gè)特征值與單詞表中與之距離最近的關(guān)鍵詞相匹配,統(tǒng)計(jì)各特征在各個(gè)關(guān)鍵詞中出現(xiàn)的詞頻,生成一個(gè)特征向量,再將多個(gè)特征向量以堆棧方式拼接在一起。這樣每個(gè)格網(wǎng)的多特征信息就可以用一個(gè)多維向量fi來表示:
fi={spei,lbpi,suri,poii}
(9)
式中,spe為光譜特征的特征向量,lbp為紋理的特征向量,sur為幾何的特征向量,poi為興趣點(diǎn)的特征向量,i表示第i個(gè)格網(wǎng)。
主題模型是發(fā)現(xiàn)文檔集合中隱藏語義結(jié)構(gòu)的統(tǒng)計(jì)工具,近年來主題模型廣泛運(yùn)用于自然語言處理領(lǐng)域,并在許多交叉學(xué)科中得以運(yùn)用。許多研究者利用詞袋模型和概率主題模型來解決自然圖像理解中的相關(guān)問題,如圖像自動(dòng)標(biāo)注、場(chǎng)景分類等,一定程度上能夠在圖像底層視覺特征與高層語義之間建立橋梁(Chu et al.,2014;Tokarczyk et al. ,2015)。在上述構(gòu)建的BOW字典的基礎(chǔ)上,利用主題模型來挖掘遙感影像數(shù)據(jù)和POI數(shù)據(jù)的潛在語義特征。
LDA是一種無監(jiān)督的貝葉斯模型(Blei et al., 2003),該模型被廣泛應(yīng)用于主題建模和文檔主題分類中。它通過挖掘文檔所包含的潛在語義特征,通過公式(10)計(jì)算文檔屬于某一種主題的概率。
P(w|d)=P(w|t)×P(t|d)
(10)
式中,w為詞,d為文檔,t為主題。以主題為中間層,通過兩個(gè)向量(θd,φt)實(shí)現(xiàn)主題分類和文檔生成,θd表示對(duì)每個(gè)文檔集中的文檔d對(duì)應(yīng)到不同主題的概率向量,φt表示對(duì)每個(gè)主題集中的主題t生成不同單詞的概率向量。
每個(gè)視覺單詞即為各類特征的描述,每篇文檔即為每個(gè)格網(wǎng)所包含的融合后特征向量,通過單詞的分布特征來推斷每個(gè)格網(wǎng)所屬的城市土地利用類型,以此達(dá)到識(shí)別城市土地利用類型的目的。
寧波市位于浙江省東部,是長(zhǎng)江三角洲南翼經(jīng)濟(jì)中心,社會(huì)經(jīng)濟(jì)發(fā)展水平較高,第三產(chǎn)業(yè)發(fā)達(dá),城市土地利用類型復(fù)雜多樣。為便于實(shí)驗(yàn),選取寧波市某廣場(chǎng)及周邊區(qū)域作為研究區(qū)(圖2),其大小為5 200 m×5 900 m,面積約為30.7 km2。該區(qū)域作為寧波市的經(jīng)濟(jì)中心,高度集中了城市的商業(yè)、工業(yè)、居住和公共服務(wù)設(shè)施用地,區(qū)域內(nèi)建筑分布密度高且建筑物外觀相似,POI數(shù)據(jù)豐富,適合作為城市土地利用分類研究的實(shí)驗(yàn)區(qū)域。
圖2 研究區(qū)范圍Fig.2 The study areaa.寧波市遙感影像;b.研究區(qū)遙感影像
采用高分二號(hào)衛(wèi)星1 m全色分辨率和4 m多光譜分辨率傳感器影像作為高分辨率影像數(shù)據(jù)源。影像獲取時(shí)間為2019年6月16日,數(shù)據(jù)來源于地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn)。在提取遙感影像特征前,對(duì)高分二號(hào)影像數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正、正射校正、圖像融合等預(yù)處理,并根據(jù)研究區(qū)域范圍對(duì)預(yù)處理后影像進(jìn)行裁剪,得到研究區(qū)域1 m分辨率的遙感影像。
選取與研究區(qū)域范圍一致,且與影像為同一時(shí)間的POI數(shù)據(jù),共12 377個(gè)點(diǎn)(數(shù)據(jù)來源于百度地圖)。每個(gè)POI點(diǎn)都包含POI的名稱、功能、地址、經(jīng)緯度等屬性。根據(jù)《城市用地分類與規(guī)劃建設(shè)用地標(biāo)準(zhǔn)》(中華人民共和國(guó)住房和城鄉(xiāng)建設(shè)部,2011),同時(shí)考慮到數(shù)據(jù)類別的普遍性和顯著性,將POI數(shù)據(jù)分為公共管理與公共服務(wù)用地、商業(yè)服務(wù)業(yè)設(shè)施用地、綠地與廣場(chǎng)用地、工業(yè)用地和居住用地等5個(gè)較具代表性的類別,統(tǒng)計(jì)結(jié)果見表1。
表1 研究區(qū)各類型POI統(tǒng)計(jì)
考慮到研究區(qū)大小以及POI分布密度,本次采用100 m×100 m 大小的格網(wǎng)單元對(duì)影像進(jìn)行分塊,共得到3 068個(gè)格網(wǎng),并通過目視解譯與實(shí)地考察結(jié)合的方式確定每個(gè)格網(wǎng)的真實(shí)土地利用類型。
為了驗(yàn)證每種特征對(duì)城市土地利用分類是否有正向作用,使用不同的特征組合方式分別進(jìn)行實(shí)驗(yàn)。表2為使用不同的特征組合方法的精度,從表2可以看出,使用遙感影像特征時(shí),幾何特征的加入能夠提高分類的準(zhǔn)確性,且相對(duì)于使用光譜+紋理+幾何特征,在融合加工特征后,研究區(qū)域的總體分類精度提高了13.98%。這表明融合多源數(shù)據(jù)的多特征信息可以大幅提高城市土地利用分類的精度。
表2 研究區(qū)選取不同特征的分類結(jié)果
為探究每種土地利用類型的分類結(jié)果,對(duì)研究區(qū)中的3 068個(gè)格網(wǎng)進(jìn)行結(jié)果檢驗(yàn),其中2 583個(gè)格網(wǎng)類型符合真實(shí)地物情況,研究區(qū)域的分類結(jié)果總體精度為84.19%。城市土地利用分類圖如圖3所示,每塊格網(wǎng)的功能類型分類混淆矩陣如表3所示。
圖3 不同特征組合的分類結(jié)果圖Fig.3 The classification result diagram of different feature combinationsa.光譜+紋理特征;b.光譜+紋理+幾何特征;c.POI特征;d.光譜+紋理+幾何+POI特征;e.真實(shí)土地利用類型分布
由表3生產(chǎn)者精度可以看出,和綠地與廣場(chǎng)用地、工業(yè)用地、水域相比,公共管理與公共服務(wù)用地、商業(yè)服務(wù)業(yè)設(shè)施用地、居住用地和道路的分類精度較低。由于公共管理與公共服務(wù)用地中服務(wù)類設(shè)施POI數(shù)量較少,且其在遙感物理特征上與商業(yè)服務(wù)業(yè)設(shè)施用地和居住用地較為相似,導(dǎo)致分類精度相對(duì)不高;在商業(yè)服務(wù)業(yè)設(shè)施用地周圍往往包含著大量服務(wù)類設(shè)施POI點(diǎn),一定程度上降低了其分類結(jié)果;居住用地中往往包含一些商業(yè)類型POI導(dǎo)致住宅類型POI所占比例較低,使居住用地被誤分為商業(yè)設(shè)施用地;道路因其與建筑物頂層有相似的光譜特征,得到的分類結(jié)果較差。綠地與廣場(chǎng)用地因?yàn)橹脖坏奈锢硖卣?,所以能保持較高的分類精度;工業(yè)用地因?yàn)槠鋷в絮r明的物理特征如藍(lán)色屋頂和高大的煙囪在城市土地利用類型分類時(shí)也能保持較高的精度;水域因?yàn)槲锢硖卣魃系倪B續(xù)性以及光譜特征上的獨(dú)特性也能得到較高的分類精度。
表3 每塊格網(wǎng)的功能類型分類混淆矩陣
單獨(dú)使用遙感影像物理特征的城市土地利用分類結(jié)果,每塊格網(wǎng)的類型分布都較為零散,沒有明顯的邊界,分類精度較低。而結(jié)合遙感影像物理特征和POI特征的分類結(jié)果圖中格網(wǎng)的類型分布緊湊,不同土地利用類型之間分割界限明顯,分類精度相對(duì)較高(圖3)。
本研究結(jié)果證明了相對(duì)于利用遙感影像數(shù)據(jù)分類,加入POI數(shù)據(jù)以后可以明顯提高城市土地利用類型分類精度,多源數(shù)據(jù)融合對(duì)土地利用分類有正向作用,為城市土地利用分類提供了新的思路。但本次研究所使用的社交媒體數(shù)據(jù)僅為POI數(shù)據(jù),其不能完全表達(dá)建筑物的內(nèi)部屬性;實(shí)際上,許多城市建筑物可能同時(shí)擁有多種類型混合屬性,但本次實(shí)驗(yàn)沒有考慮,這是下一步將要研究考慮的問題,以期待得到更準(zhǔn)確的分類結(jié)果。