李 政 李何超 吳 璽 李永樹 謝嘉麗 魯 恒
(1.西南交通大學地球科學與環(huán)境工程學院, 成都 611756; 2.四川省土地統(tǒng)征整理事物中心, 成都 610041;3.四川大學水力學與山區(qū)河流開發(fā)保護國家重點實驗室, 成都 610065; 4.四川大學水利水電學院, 成都 610065)
基于詞袋特征的空心村高分影像建筑物解譯模型
李 政1李何超2吳 璽2李永樹1謝嘉麗1魯 恒3,4
(1.西南交通大學地球科學與環(huán)境工程學院, 成都 611756; 2.四川省土地統(tǒng)征整理事物中心, 成都 610041;3.四川大學水力學與山區(qū)河流開發(fā)保護國家重點實驗室, 成都 610065; 4.四川大學水利水電學院, 成都 610065)
如何利用高分影像構(gòu)建自動解譯模型是快速高效獲取空心村建筑物的關(guān)鍵,對空心村調(diào)查研究具有重要意義。針對傳統(tǒng)目視解譯需要專業(yè)知識,效率低、工作量大的問題,提出一種基于詞袋特征的空心村高分影像建筑物解譯模型。首先,對比了多種影像特征提取方法;然后,選取詞袋特征(BoW)和支持向量機(SVM)構(gòu)建建筑物自動解譯模型;最后,為檢驗方法的有效性,選取空心村高分影像構(gòu)建了建筑物樣本庫,并基于該樣本庫進行實驗研究。結(jié)果表明本文方法的分類準確度可以達到0.86,所提方法可用于空心村內(nèi)建筑物自動解譯,具有較高的實用價值。
空心村; 詞袋模型; 高分影像; 機器學習; 建筑物解譯
引言
隨著中國城鎮(zhèn)化進程的不斷深入,農(nóng)村人地關(guān)系發(fā)生巨大變化,空心村問題日益突出[1]??招拇逍纬墒加?0世紀90年代中期,隨著近郊農(nóng)村就業(yè)結(jié)構(gòu)的轉(zhuǎn)型和經(jīng)濟條件的改善,空心村規(guī)模發(fā)展較為迅速,尤其是進入21世紀以來,土地保護、鄉(xiāng)村城鎮(zhèn)化發(fā)展與空心村的矛盾逐漸凸顯[2-4]。有學者認為,鄉(xiāng)村土地使用管理制度不完善,原有居住設(shè)施條件差,土地邊際生產(chǎn)力低下,拆舊建新和新地建新的成本存在明顯差異以及鄉(xiāng)村傳統(tǒng)觀念(掙錢建房、拆老屋破風水等)等眾多原因?qū)е铝丝招拇宓男纬蒣5-7]。在自然條件和經(jīng)濟發(fā)展影響下,沿公路形成新居住集中區(qū),造成傳統(tǒng)沿河分布的村落逐漸衰敗、廢棄,也是造成部分空心村的原因之一[8-9]。國務(wù)院批復國土資源部發(fā)布的《全國土地整治規(guī)劃(2011—2015)》提出以空心村整治和鄉(xiāng)(鎮(zhèn))企業(yè)用地整治為重點,加強閑置和低效利用的農(nóng)村建設(shè)用地整治[10]。因此,如何利用高分影像自動、高效、準確地獲取建筑物信息、統(tǒng)籌城鄉(xiāng)土地利用配置、促進鄉(xiāng)村空間重構(gòu)、開展空心村土地整治,對于空心村的調(diào)查研究具有重要意義,也是中國城鄉(xiāng)轉(zhuǎn)型期推進新農(nóng)村建設(shè)和全面建設(shè)小康社會的關(guān)鍵問題。
遙感作為一種有效的對地檢測手段,已經(jīng)廣泛應(yīng)用于土地利用調(diào)查、災害信息獲取、測繪以及地理國(省)情監(jiān)測等領(lǐng)域,特別是無人機高分遙感以其高空間分辨率、視場范圍廣等特點,得到了廣泛的應(yīng)用,其應(yīng)用于空心村建筑物快速檢測、空心化評估及整治等方面具有得天獨厚的優(yōu)勢[11-13]。傳統(tǒng)空心村建筑物的面積、數(shù)量、分布情況等數(shù)據(jù)的獲取主要依靠外業(yè)大比例尺測圖和利用遙感影像人工矢量化兩種方式獲取。外業(yè)大比例尺測圖會受到天氣等環(huán)境因素制約,耗費大量的人力、物力,具有制圖周期長、容易漏測等缺點。在遙感影像上獲取高精度的建筑物信息一般采取人工目視解譯的方法,該方法效率低、工作量大[14]。因此,研究行之有效的高分影像建筑物解譯模型對空心村研究及整治具有較高的實用價值。
本文選取空心村高分影像建筑物作為研究對象,基于實驗區(qū)域構(gòu)建建筑物樣本庫,比較多種影像建筑物特征提取方法的優(yōu)劣,最終采用詞袋特征(Bag-of-words,BoW)[15]結(jié)合支持向量機(Support vector machines,SVM)[16]分類方法對建筑物影像進行自動解譯,提出一種基于詞袋特征的空心村高分影像建筑物解譯模型,并基于構(gòu)建的樣本庫進行訓練研究。
高分影像建筑物解譯模型構(gòu)建的方法流程如圖1所示,主要由4部分組成:①高分影像的獲取,本文實驗數(shù)據(jù)為無人機高分影像。②圖像預處理,本文對獲取的高分影像進行畸變糾正、影像平滑及增強等預處理。③將預處理的影像進行拼接,得到研究區(qū)域的全景圖。④解譯模型的構(gòu)建,首先通過采集大量的建筑物樣本(正樣本)及背景樣本(負樣本)構(gòu)建了樣本庫,用于解譯模型的訓練;其次設(shè)計建筑物特征提取方法,如原始光譜特征、詞袋特征BoW、梯度方向直方圖特征HoG[17]、SIFT[18]、Surf[19]等;最后選取支持向量機SVM作為分類模型,并基于交叉驗證法進行模型訓練。
圖1 高分影像建筑物解譯模型構(gòu)建流程Fig.1 Construction flow chart of building interpretation model with high resolution image
其中特征提取是自動解譯的關(guān)鍵,選取特征決定了最終的解譯結(jié)果。特征提取是對高分影像信息進行抽象,得到一組可以描述解譯目標的特征向量,一般通過人工目視解譯可以獲得較好的解譯結(jié)果,但工作量大,效率低,具有主觀性強和非定量等缺陷。本文基于高分影像采集樣本數(shù)據(jù),分析發(fā)現(xiàn)樣本中建筑物空間形狀復雜,空間光譜變化大,因此需要大量的樣本支持特征訓練。本文選取多個空心村的高分影像構(gòu)建了建筑物樣本庫,然后通過引入詞袋特征(BoW)結(jié)合支持向量機(SVM)方法,構(gòu)建了一種基于詞袋特征的建筑物解譯模型。本文選取被廣泛應(yīng)用的HoG特征與BoW特征進行對比實驗。
1.1 HoG特征
HoG特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子,由DALAL等[17]在2005年的CVPR上提出。首先是通過統(tǒng)計將圖像劃分為區(qū)塊,然后分別統(tǒng)計其邊緣強度直方圖分布,最后將各個區(qū)塊直方圖組裝在一起,形成圖像的特征描述符。
由于HoG是在圖像的局部方格單元上操作,空間領(lǐng)域小,所以它對圖像幾何和光學形變都能保持很好的不變性。HoG特征結(jié)合SVM分類器已經(jīng)被廣泛應(yīng)用于圖像識別中,尤其在行人檢測中獲得了極大的成功??紤]到影像中建筑物與周邊環(huán)境形成鮮明梯度變化,本文利用HoG特征加以區(qū)分。HoG特征提取流程如圖2所示。
圖2 HoG特征提取流程圖Fig.2 Flow chart of HoG feature extraction
實驗中HoG參數(shù)如下:梯度直方圖投影時采用8個直方圖的bin,單個Cell的尺寸為32像素×32像素,每一個Block由2×2個Cell組成,樣本尺寸統(tǒng)一為256像素×256像素,最終合并得到特征向量長度為1 568。建筑物樣本的HoG特征可視化結(jié)果如圖3所示。
1.2 詞袋特征
用詞袋做圖像表示模型被稱之為視覺詞袋模型,能夠?qū)⒍S的圖像信息映射成視覺關(guān)鍵詞集合,這樣既保存了圖像的局部特征又有效地壓縮了圖像的描述。為了使用視覺詞袋模型,首先要在學習階段建立視覺關(guān)鍵詞集合并且提取出所有局部特征,然后對這些特征進行聚類,得到的結(jié)果是訓練集中的普遍特征。稱這些原型特征為“字典”。
視覺詞袋模型從訓練圖像集圖片中提取低級特征,結(jié)合K-means的無監(jiān)督算法對這些低級別特征進行給定聚類中心數(shù)目k的聚類,給定一組觀察值序列(x1,x2,…,xn),每一個觀察值都是一個d維實值向量,K-means的目標是劃分這n個觀察值到k個序列S=(S1,S2,…,Sk)(k 圖3 建筑物樣本及HoG特征Fig.3 Building samples and HoG feature (1) 式中μi——Si的均值 視覺關(guān)鍵詞(“字典:圖4中用w1,w2,…,wp,wr,…,wm表示”)是通過聚類中心獲得的,把每一個從圖像中提取的特征映射到它最接近的視覺詞典上,圖像可以表示為一個視覺詞典上的直方圖特征描述符。 本文實驗中局部特征提取128維Surf特征,字典學習過程中,基于K-means構(gòu)建“字典”,設(shè)置字典數(shù)量為400。最后將Surf特征對應(yīng)到字典中統(tǒng)計其直方圖分布作為圖像的BoW特征。具體采用的BoW特征提取流程如圖4所示。 圖4 BoW特征提取流程Fig.4 Flow chart of BoW feature extraction 2.1 實驗數(shù)據(jù) 實驗區(qū)域位于四川省成都市,總面積約為46.48 km2,實驗數(shù)據(jù)包含多個空心村無人機高分影像,影像空間分辨率為0.2 m。采用的無人機是固定翼機型,搭載了SONY Cyber shot DSC RX1數(shù)碼相機,飛行時預設(shè)的航向重疊度為70%,旁向重疊度為40%。通過觀察發(fā)現(xiàn)研究區(qū)域內(nèi)建筑物建設(shè)多為農(nóng)民的自發(fā)行為,缺乏統(tǒng)一規(guī)劃,分布散亂,房屋多為磚瓦結(jié)構(gòu),建筑物高度普遍較低(一般為平房或?qū)訑?shù)較少的樓房),基本沒有建筑陰影的影響。鑒于篇幅,圖5僅給出試驗區(qū)域關(guān)帝村的高分影像圖作為示例。 2.2 建筑物樣本庫 樣本是建筑物目標解譯模型構(gòu)建的基礎(chǔ),通過收集研究區(qū)域內(nèi)高分影像,利用目視解譯的方法,為不同建筑物類型采集樣本,并按照標準規(guī)范格式進行存儲。本文根據(jù)研究區(qū)建立了樣本庫,其中包括建筑物正樣本2 500個,建筑物負樣本5 000個,所有樣本尺寸均縮放到256像素×256像素。從采集到的樣本可以看出,建筑物空間形狀復雜,空間光譜變化較大,這增加了自動解譯難度。圖6為樣本示例數(shù)據(jù)。 圖5 局部研究區(qū)域Fig.5 Local study area 圖6 樣本庫示例數(shù)據(jù)Fig.6 Samples of building sample library 2.3 精度分析 在機器學習中,普遍使用混淆矩陣(Confusion matrix)[20]來更好地了解分類中的錯誤。針對本文建筑物識別的二分類問題,實驗采用表1所示評價指標體系。 其中TP表示真正例,即將一個正例判為正例;TN表示真反例,即對一個反例判為正例。相應(yīng)地,另外2種情況分別稱為偽反例(FN)和偽正例(FP)。 同時定義真正類率Tpr用于刻畫分類器所識別出的正實例占所有正實例的比例;負正類率Fpr用于計算分類器錯認為正類的負實例占所有負實例的比例;以及分類的準確度Acc用于刻畫分類器正確分類占整體的比例。計算公式為 (2) 實驗采用支持向量機(SVM)分類模型,采用線性核函數(shù),通過L2正則化實現(xiàn)對模型空間的限制,在一定程度上避免過擬合。選取平方損失函數(shù)作為損失函數(shù),用來估量模型預測值與真實值的不一致程度,損失函數(shù)越小,模型的魯棒性就越好。在訓練過程中留10%的樣本(750個)用于測試,其中SVM分類器的關(guān)鍵參數(shù)C采用6-fold(6文件夾)交叉驗證確定,訓練結(jié)果如下:HoG特征和BoW特征交叉驗證最佳參數(shù)分別為{‘C’:8 000}和{‘C’: 6 000},混淆矩陣如表2所示。 表2 混淆矩陣 由于高分影像建筑物識別模型產(chǎn)生連續(xù)概率輸出,通過劃定不同閾值可以得到一系列Tpr和Fpr對,上述2個參數(shù)作為坐標軸可以繪制接受者操作特性曲線ROC[21],并定義ROC曲線下面積AUC指標,AUC取值在0.5~1.0,AUC越接近1,說明分類效果越好。AUC在0.5~0.7時分類準確性較低,AUC在0.7~0.9時準確性較高。由上述訓練結(jié)果以及圖7的ROC曲線可以看出,BoW(Acc:0.861,AUC:0.85)與HoG(Acc:0.797,AUC:0.73)特征相比,在分類精度方面具有一定優(yōu)勢,因此可以選取詞袋特征構(gòu)建建筑物解譯模型。 在獲取了建筑物解譯模型后,可以用于大面積高分影像中建筑物快速定位及檢測,為空心村的整治及研究提供必要的理論依據(jù)及數(shù)據(jù)支持。 圖7 ROC曲線Fig.7 ROC curves 大量空心村的涌現(xiàn),成為我國當前農(nóng)村發(fā)展暴露的諸多問題中最普遍、最直接的表象,農(nóng)村空心化已成為我國推進新農(nóng)村建設(shè)和統(tǒng)籌城鄉(xiāng)協(xié)調(diào)發(fā)展面臨的最大障礙之一。面對空心村高分影像形狀光譜差異大、規(guī)模各不相同的建筑物,研究行之有效的特征提取方法構(gòu)建建筑物解譯模型,是實現(xiàn)建筑物自動解譯的關(guān)鍵。本文基于無人機高分影像構(gòu)建了建筑物樣本庫,以空心村為研究對象,通過對比多種影像特征提取方法,最終選取詞袋特征進行建筑物解譯模型構(gòu)建,提出了一種基于詞袋特征的空心村高分影像建筑物解譯模型。實驗結(jié)果表明,BoW(Acc:0.861,AUC:0.85)相比于HoG(Acc:0.797,AUC:0.73)及傳統(tǒng)目視解譯有一定的優(yōu)勢,因此本文所提模型可以準確高效地自動解譯空心村內(nèi)建筑物,對于空心村調(diào)查和研究具有較高的實用價值。 1 陳玉福,孫虎,劉彥隨. 中國典型農(nóng)區(qū)空心村綜合整治模式[J]. 地理學報,2010,65(6):727-735. CHEN Yufu, SUN Hu, LIU Yansui. Reconstruction models of hollowed villages in key agricultural regions of China[J]. Acta Geographica Sinica, 2010, 65(6):727-735. (in Chinese) 2 SUN H, LIU Y, XU K. Hollow villages and rural restructuring in major rural regions of China: a case study of Yucheng City, Shandong Province[J]. Chinese Geographical Science, 2011, 21(3): 354-363. 3 歐定華,夏建國. 城市近郊區(qū)景觀格局變化特征、潛力與模擬——以成都市龍泉驛區(qū)為例[J]. 地理研究,2016,35(3):534-550. OU Dinghua, XIA Jianguo. Characteristics, potential and simulation of landscape pattern change in peri-urban areas: a case of Longquanyi district, Chengdu city[J]. Geographical Research, 2016, 35(3):534-550. (in Chinese) 4 劉彥隨,劉玉,翟榮新. 中國農(nóng)村空心化的地理學研究與整治實踐[J]. 地理學報,2009,64(10):1193-1202. LIU Yansui, LIU Yu, ZHAI Rongxin. Geographical research and optimizing practice of rural hollowing in China[J]. Acta Geographica Sinica, 2009, 64(10):1193-1202. (in Chinese) 5 XU S, ZHAO Q, YIN K, et al. Research on remote sensing identification of rural abandoned homesteads using multi parameter characteristics method[C]∥Proceedings of SPIE 10005, Earth Resources and Environmental Remote Sensing/GIS Applications VII, 2016: 100050K-100050K-15. 6 劉彥隨,劉玉. 中國農(nóng)村空心化問題研究的進展與展望[J]. 地理研究,2010,29(1):35-42. LIU Yansui, LIU Yu. Progress and prospect on the study of rural hollowing in China[J]. Geographical Research, 2010, 29(1):35-42. (in Chinese) 7 HAN S. “Hollow village” evolution and policy control from the perspective of rural urbanization: a case study of Jiangsu province[J]. Asian Agricultural Research, 2016, 8(3):22-26. (in Chinese) 8 朱曉華,丁晶晶,劉彥隨,等. 村域尺度土地利用現(xiàn)狀分類體系的構(gòu)建與應(yīng)用——以山東禹城牌子村為例[J]. 地理研究,2010,29(5):883-890. ZHU Xiaohua, DING Jingjing, LIU Yansui, et al. Construction and application of land use classification system on village scale: a case study of Paizi village, Lun zhen, Yucheng city, Shandong province[J]. Geographical Research, 2010, 29(5):883-890. (in Chinese) 9 史舟,梁宗正,楊媛媛,等.農(nóng)業(yè)遙感研究現(xiàn)狀與展望[J/OL]. 農(nóng)業(yè)機械學報,2015,46(2):247-260. https:∥www.j-csam.org/ch/reader/view_abstract.aspx?file_no=20150237&flag=1.DOI:10.6041/j.issn.1000-1298.2015.02.037. SHI Zhou, LIANG Zongzheng, YANG Yuanyuan, et al. Status and prospect of agricultural remote sensing[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(2):247-260. (in Chinese) 10 龍花樓. 論土地整治與鄉(xiāng)村空間重構(gòu)[J]. 地理學報,2013,68(8):1019-1028. LONG Hualou. Land consolidation and rural spatial restructuring[J]. Acta Geographica Sinica, 2013, 68(8):1019-1028. (in Chinese) 11 李政,李永樹,郭加偉,等.詞袋特征支持下的無人機影像滑坡解譯模型[J].遙感信息,2016, 31(5):24-29. LI Zheng, LI Yongshu, GUO Jiawei, et al. An automatic landslide interpretation model of UAV imagery based on BoW[J]. Remote Sensing Information, 2016, 31(5):24-29. (in Chinese) 12 張明媚. 面向?qū)ο蟮母叻直媛蔬b感影像建筑物特征提取方法研究[D].太原:太原理工大學,2012. ZHANG Mingmei. The method of object-oriented building features extraction from high resolution remote sensing images[D]. Taiyuan: Taiyuan University of Technology, 2012. (in Chinese) 13 魯恒, 付蕭, 賀一楠, 等. 基于遷移學習的無人機影像耕地信息提取方法[J/OL]. 農(nóng)業(yè)機械學報, 2015, 46(12): 274-279. https:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20151237&flag=1. DOI:10.6041/j.issn.1000-1298.2015.12.037. LU Heng,FU Xiao, HE Yi’nan, et al. Cultivated land information extraction from high resolution UAV images based on transfer learning [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015,46(12):274-279. (in Chinese) 14 鄧曾,李丹,柯櫻海,等. 基于改進SVM算法的高分辨率遙感影像分類[J]. 國土資源遙感,2016,28(3):12-18. DENG Zeng, LI Dan, KE Yinghai, et al. An improved algorithm for high spatial resolution remote sensing image classification[J]. Remote Sensing for Land and Resources, 2016, 28(3):12-18. (in Chinese) 15 FEI-FEI L, PERONA P. A bayesian hierarchical model for learning natural scene categories[C]∥2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), 2005, 2: 524-531. 16 CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273-297. 17 DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]∥2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2005), 2005, 1: 886-893. 18 LOWE D G. Object recognition from local scale-invariant features[C]∥Proceedings of the Seventh IEEE International Conference on Computer Vision, 1999, 2: 1150-1157. 19 BAY H, TUYTELAARS T, VAN GOOL L. Surf: speeded up robust features[C]∥European Conference on Computer Vision, 2006: 404-417. 20 HARRINGTON P. Machine learning in action[M]. Cherry Hill, NJ: Manning Publications, 2012:116-133. 21 FAWCETT T. An introduction to ROC analysis [J]. Pattern Recognition Letters, 2006, 27(8): 861-874. Building Interpretation Model of Hollow Village High Resolution Images Based on Bag-of-words LI Zheng1LI Hechao2WU Xi2LI Yongshu1XIE Jiali1LU Heng3,4 (1.FacultyofGeosciencesandEnvironmentalEngineering,SouthwestJiaotongUniversity,Chengdu611756,China2.CenterofLandAcquisitionandConsolidationinSichuanProvince,Chengdu610041,China3.StateKeyLaboratoryofHydraulicsandMountainRiverEngineering,SichuanUniversity,Chengdu610065,China4.CollegeofHydraulicandHydroelectricEngineering,SichuanUniversity,Chengdu610065,China) With the rapid development of remote sensing technology, remote sensing image resolution has been greatly improved and the ground targets can be obtained from high resolution remote sensing image. But the traditional visual interpretation has low work efficiency and needs for professional knowledge. Thus using high resolution remote sensing image to construct automatic interpreting model is the key to quickly and efficiently obtain the building of hollow village. Meanwhile, it is important for the hollow village renovation and research. Based on this, a novel automatic building interpretation model of hollow village high resolution images based on bag-of-words (BoW) was proposed. Firstly, several existing feature extraction methods were compared, and then based on the BoW and support vector machines (SVM) the automatic interpretation model for the building was constructed. In order to verify the validity of this method, the high resolution remote sensing image of typical hollow village was selected to construct the building sample library. Finally, the model for building interpretation was experimentally studied based on the sample library. The results showed that the classification accuracy (ACC) of this method can reach 0.86. Therefore, the proposed method can be used for the building automatic interpretation, and it had high practical value to hollow village research and renovation. hollow village; bag-of-words model; high resolution images; machine learning; building interpretation 10.6041/j.issn.1000-1298.2017.06.017 2016-11-09 2016-11-29 “十二五”國家科技支撐計劃項目(2014BAL01B04) 李政(1989—),男,博士生,主要從事遙感影像處理和圖像理解研究,E-mail: lizswjtu@163.com P231.5; TP75 A 1000-1298(2017)06-0132-062 實驗分析
3 結(jié)束語