葉遠(yuǎn)斌
摘要:開展常態(tài)化地理國情監(jiān)測是廣東省基礎(chǔ)測繪“十三五”規(guī)劃重要內(nèi)容,本文綜合利用多時相影像、專題資料及已有矢量成果數(shù)據(jù),研究基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國情地表覆蓋變化檢測。實(shí)驗表明:國情地表覆蓋信息提取總體精度優(yōu)于86.22%,KAPPA系數(shù)達(dá)到83.04%;與傳統(tǒng)人工目視判別方法比較,誤檢率小于7.05%,漏檢率小于10.52%,在人力投入、作業(yè)效率、成果質(zhì)量等有明顯優(yōu)勢。
關(guān)鍵字:地理國情監(jiān)測;深度學(xué)習(xí);特征提??;變化發(fā)現(xiàn)
引言
地理國情是指與地理相關(guān)的自然和人文要素的國情,是從地理的角度采用空間化的方法,對國情進(jìn)行持續(xù)觀測并對觀測結(jié)果進(jìn)行描述、分析、預(yù)測和可視化的過程。按照國務(wù)院對地理國情監(jiān)測工作總體部署和測繪地理信息事業(yè)轉(zhuǎn)型發(fā)展需要,從2016年起地理國情信息獲取進(jìn)入常態(tài)化監(jiān)測階段,在地理國情普查的基礎(chǔ)上,進(jìn)行地理國情監(jiān)測業(yè)務(wù)化運(yùn)行建設(shè),構(gòu)建功能完備的地理國情動態(tài)監(jiān)測與綜合信息分析發(fā)布系統(tǒng),形成常態(tài)化地理國情監(jiān)測機(jī)制,提供地理國情信息業(yè)務(wù)化、常態(tài)化服務(wù)。
傳統(tǒng)基礎(chǔ)性地理國情監(jiān)測方法主要通過對遙感衛(wèi)星影像及相關(guān)專題資料整合預(yù)處理后,將上年度成果數(shù)據(jù)疊加到監(jiān)測影像上,人工逐格網(wǎng)進(jìn)行檢查識別,對于局部或個別的地物、地類變化,可在變化區(qū)域識別的同時完成變化信息提??;對于范圍較大,內(nèi)部變化比較復(fù)雜的變化區(qū)域,可先勾畫出變化區(qū)域的整體范圍,然后由專門的信息采集人員完成變化信息提取,存在人工投入大、作業(yè)效率較低、自動化智能化不足、對漏判錯判等圖斑難以發(fā)現(xiàn)等突出問題,監(jiān)測成果能較好滿足《基礎(chǔ)性地理國情監(jiān)測數(shù)據(jù)技術(shù)規(guī)定GQJC 01-2017》要求。本文探索采用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法對地理國情地表覆蓋變化信息進(jìn)行提取研究,并綜合已有樣本成果,與傳統(tǒng)人工目視判讀成果進(jìn)行比較,結(jié)果表明該方法具有較高的準(zhǔn)確度,變化信息提取效率明顯提高。
1.深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)
2006年,Hinton首次提出了“深度信念網(wǎng)絡(luò)”的概念。與傳統(tǒng)的訓(xùn)練方式不同,“深度信念網(wǎng)絡(luò)”有一個“預(yù)訓(xùn)練”(pre-training)的過程,這可以方便的讓神經(jīng)網(wǎng)絡(luò)中的權(quán)值找到一個接近最優(yōu)解的值,之后再使用“微調(diào)”(fine-tuning)技術(shù)來對整個網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練。這兩個技術(shù)的運(yùn)用大幅度減少了訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的時間,并將多層神經(jīng)網(wǎng)絡(luò)相關(guān)的學(xué)習(xí)方法賦予了一個新名詞即“深度學(xué)習(xí)”。
在淺層神經(jīng)網(wǎng)絡(luò)的輸出層繼續(xù)添加層次,原來的輸出層變成中間層,新加的層次成為新的輸出層.依照這樣的方式不斷添加,可以得到更多層的多層神經(jīng)網(wǎng)絡(luò)。使用矩陣運(yùn)算的話就僅僅是加一個公式而已。在已知輸入a(1),參數(shù)W(1)、W(2)、W(3)的情況下,輸出z的推導(dǎo)公式如式1所示。隨著層數(shù)的增加,整個網(wǎng)絡(luò)的參數(shù)就越多。而神經(jīng)網(wǎng)絡(luò)其實(shí)本質(zhì)就是模擬特征與目標(biāo)之間的真實(shí)關(guān)系函數(shù)的方法,更多的參數(shù)意味著其模擬的函數(shù)可以更加的復(fù)雜,可以有更多的容量(eapeity)去擬合真正的關(guān)系。
在單層神經(jīng)網(wǎng)絡(luò)時,使用的激活函數(shù)是sgn函數(shù)。兩層神經(jīng)網(wǎng)絡(luò)時,使用的最多的是sigmoid函數(shù)。而到了多層神經(jīng)網(wǎng)絡(luò)時,ReLU函數(shù)在訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)時,更容易收斂,并且預(yù)測性能更好。因此,本文采用非線性函數(shù)是ReLU函數(shù)。ReLU函數(shù)不是傳統(tǒng)的非線性函數(shù),而是分段線性函數(shù)。其表達(dá)式y(tǒng)=max(x,0)。在x大于0,輸出就是輸入,而在x小于0時,輸出就保持為0。這種函數(shù)的設(shè)計啟發(fā)來自于生物神經(jīng)元對于激勵的線性響應(yīng),以及當(dāng)?shù)陀谀硞€閾值后就不再響應(yīng)的模擬。
2.神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)提取國情地表變化
針對基于人工判讀地理國情監(jiān)測方法在人力物力強(qiáng)度等方面的劣勢,探索地理國情監(jiān)測自動化、智能化變化檢測技術(shù)成為迫切需求。人工智能、模式識別等新理論新技術(shù)特別是機(jī)器學(xué)習(xí)密切結(jié)合面向?qū)ο筮b感技術(shù)應(yīng)運(yùn)而生,是當(dāng)前遙感學(xué)界、計算機(jī)學(xué)界研究熱點(diǎn)之一。
傳統(tǒng)機(jī)器學(xué)習(xí)傾向于使用符號表示知識而不是數(shù)值表示,使用啟發(fā)式方法而不是算法,使用歸納而不是演繹,前一傾向使它有別于人工智能的模式識別,后一傾向使它有別于定理證明、經(jīng)典邏輯等分支。其中,基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)是一類基于生物學(xué)對人腦進(jìn)一步認(rèn)識,將神經(jīng)-中樞-大腦的工作原理設(shè)計成一個不斷迭代、不斷抽象的過程,以便得到最優(yōu)數(shù)據(jù)特征表示的機(jī)器學(xué)習(xí)算法。該算法從原始信號開始,先做低級抽象,然后逐漸向高級抽象迭代,由此組成深度學(xué)習(xí)算法的基本框架。多隱含層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)特征對數(shù)據(jù)有更本質(zhì)的刻畫,有利于可視化或分類。同時,深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過逐層初始化來克服。
2.1學(xué)習(xí)樣本庫及訓(xùn)練
地理國情成果樣本庫是提高機(jī)器自動分類精度重要數(shù)據(jù)支撐,利用機(jī)器學(xué)習(xí)方法,通過實(shí)驗測試,原則上每類地物樣本量不低于1萬,以提高學(xué)習(xí)成果的準(zhǔn)確性。建立地理國情監(jiān)測不同地物類型的樣本庫,其中國情要素樣本庫內(nèi)容劃分為鐵路與道路、構(gòu)筑物、人工堆掘地、水域、地理單元5大類。利用深度網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行訓(xùn)練的實(shí)質(zhì)就是通過構(gòu)建具有多隱層機(jī)器學(xué)習(xí)模型和海量樣本訓(xùn)練數(shù)據(jù),學(xué)習(xí)記憶優(yōu)化特征參數(shù)(即連接權(quán)值),從而提升分類精度。本次設(shè)計模型結(jié)構(gòu)具有6層隱層節(jié)點(diǎn),通過逐層特征變換,將樣本在原空間的特征表示變換到一個新的特征空間。圖2為某建筑物所建立的樣本庫,圖3為訓(xùn)練樣本分布。
2.2特征信息提取
深度神經(jīng)網(wǎng)絡(luò)用于變化識別是一種基于特征的方法,這些特征主要包括:光譜特征、指數(shù)特征、形狀特征、紋理特征、鄰接關(guān)系、層次關(guān)系等,涵蓋了高分辨率影像上可以利用的圖像信息。監(jiān)督/非監(jiān)督分類等基于傳統(tǒng)統(tǒng)計分析的分類方法難以充分采用上述特征信息,同時,區(qū)別于傳統(tǒng)的人工特征提取和針對特征的高性能分類器設(shè)計,經(jīng)過多層非線性映射,使網(wǎng)絡(luò)可以從未經(jīng)特殊處理的訓(xùn)練樣本中,自動學(xué)習(xí)形成適應(yīng)該識別任務(wù)的特征提取器和分類器,該方法降低了對訓(xùn)練樣本的要求,而且網(wǎng)絡(luò)的層數(shù)越多,學(xué)習(xí)到的特征更具有全局性。
通過該方法對某研究區(qū)域地表覆蓋進(jìn)行圖像分類,如圖4。結(jié)果表明:該方法分類總體精度優(yōu)于86%,Kappa系數(shù)達(dá)到83%,具有較好的分類精度。
2.3變化發(fā)現(xiàn)與精度比較
自動化智能化變化發(fā)現(xiàn)是開展常態(tài)化地理國情監(jiān)測關(guān)鍵技術(shù)之一,本文通過在前時相矢量和后時相分類結(jié)果中進(jìn)行分析,并與CC碼比較,得到研究區(qū)域變化圖斑,如圖5所示。
對變化圖斑按照面積大小進(jìn)行排序,從面積大的開始,人工確認(rèn)是否發(fā)生變化。變化發(fā)現(xiàn)圖斑與人工變化檢測圖斑進(jìn)行比較,如圖6、7所示。
假定基于人工判讀變化檢測結(jié)果為標(biāo)準(zhǔn)成果,采用誤檢率、漏檢率兩項指標(biāo)進(jìn)行統(tǒng)計評價,并結(jié)合作業(yè)生產(chǎn)效率指標(biāo)進(jìn)行比較,如表1所示。
可見基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的地理國情地表覆蓋變化與基于人工判讀方法相比,能夠較準(zhǔn)確的提取出變化點(diǎn)及范圍,有更快的效率。但也存在一定問題,對識別出的范圍或區(qū)域分類錯誤還較高,尚需要人工進(jìn)行圖面檢查。
3.結(jié)束語
本文在結(jié)合地理國情監(jiān)測某實(shí)驗區(qū)域?qū)嵺`基礎(chǔ)上,在基于主動學(xué)習(xí)的樣本庫構(gòu)建技術(shù)、面向?qū)ο蠓诸惣夹g(shù)、人機(jī)交互的變化圖斑確認(rèn)與編輯等核心技術(shù)基礎(chǔ)上,利用多時相影像、專題資料及前期矢量成果數(shù)據(jù),研究探索利用基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國情地表覆蓋變化檢測算法,包括樣本庫構(gòu)建、樣本選擇與訓(xùn)練、影像分割、特征提取、變化檢測、精度評價等主要環(huán)節(jié)。試驗表明該方法能夠較快識別變化區(qū)域的位置,但提取變化區(qū)域范圍、識別變化類型等方面表現(xiàn)不佳,需要進(jìn)一步研究完善。