葉遠(yuǎn)斌
摘要:開(kāi)展常態(tài)化地理國(guó)情監(jiān)測(cè)是廣東省基礎(chǔ)測(cè)繪“十三五”規(guī)劃重要內(nèi)容,本文綜合利用多時(shí)相影像、專(zhuān)題資料及已有矢量成果數(shù)據(jù),研究基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國(guó)情地表覆蓋變化檢測(cè)。實(shí)驗(yàn)表明:國(guó)情地表覆蓋信息提取總體精度優(yōu)于86.22%,KAPPA系數(shù)達(dá)到83.04%;與傳統(tǒng)人工目視判別方法比較,誤檢率小于7.05%,漏檢率小于10.52%,在人力投入、作業(yè)效率、成果質(zhì)量等有明顯優(yōu)勢(shì)。
關(guān)鍵字:地理國(guó)情監(jiān)測(cè);深度學(xué)習(xí);特征提??;變化發(fā)現(xiàn)
引言
地理國(guó)情是指與地理相關(guān)的自然和人文要素的國(guó)情,是從地理的角度采用空間化的方法,對(duì)國(guó)情進(jìn)行持續(xù)觀測(cè)并對(duì)觀測(cè)結(jié)果進(jìn)行描述、分析、預(yù)測(cè)和可視化的過(guò)程。按照國(guó)務(wù)院對(duì)地理國(guó)情監(jiān)測(cè)工作總體部署和測(cè)繪地理信息事業(yè)轉(zhuǎn)型發(fā)展需要,從2016年起地理國(guó)情信息獲取進(jìn)入常態(tài)化監(jiān)測(cè)階段,在地理國(guó)情普查的基礎(chǔ)上,進(jìn)行地理國(guó)情監(jiān)測(cè)業(yè)務(wù)化運(yùn)行建設(shè),構(gòu)建功能完備的地理國(guó)情動(dòng)態(tài)監(jiān)測(cè)與綜合信息分析發(fā)布系統(tǒng),形成常態(tài)化地理國(guó)情監(jiān)測(cè)機(jī)制,提供地理國(guó)情信息業(yè)務(wù)化、常態(tài)化服務(wù)。
傳統(tǒng)基礎(chǔ)性地理國(guó)情監(jiān)測(cè)方法主要通過(guò)對(duì)遙感衛(wèi)星影像及相關(guān)專(zhuān)題資料整合預(yù)處理后,將上年度成果數(shù)據(jù)疊加到監(jiān)測(cè)影像上,人工逐格網(wǎng)進(jìn)行檢查識(shí)別,對(duì)于局部或個(gè)別的地物、地類(lèi)變化,可在變化區(qū)域識(shí)別的同時(shí)完成變化信息提?。粚?duì)于范圍較大,內(nèi)部變化比較復(fù)雜的變化區(qū)域,可先勾畫(huà)出變化區(qū)域的整體范圍,然后由專(zhuān)門(mén)的信息采集人員完成變化信息提取,存在人工投入大、作業(yè)效率較低、自動(dòng)化智能化不足、對(duì)漏判錯(cuò)判等圖斑難以發(fā)現(xiàn)等突出問(wèn)題,監(jiān)測(cè)成果能較好滿(mǎn)足《基礎(chǔ)性地理國(guó)情監(jiān)測(cè)數(shù)據(jù)技術(shù)規(guī)定GQJC 01-2017》要求。本文探索采用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法對(duì)地理國(guó)情地表覆蓋變化信息進(jìn)行提取研究,并綜合已有樣本成果,與傳統(tǒng)人工目視判讀成果進(jìn)行比較,結(jié)果表明該方法具有較高的準(zhǔn)確度,變化信息提取效率明顯提高。
1.深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)
2006年,Hinton首次提出了“深度信念網(wǎng)絡(luò)”的概念。與傳統(tǒng)的訓(xùn)練方式不同,“深度信念網(wǎng)絡(luò)”有一個(gè)“預(yù)訓(xùn)練”(pre-training)的過(guò)程,這可以方便的讓神經(jīng)網(wǎng)絡(luò)中的權(quán)值找到一個(gè)接近最優(yōu)解的值,之后再使用“微調(diào)”(fine-tuning)技術(shù)來(lái)對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練。這兩個(gè)技術(shù)的運(yùn)用大幅度減少了訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的時(shí)間,并將多層神經(jīng)網(wǎng)絡(luò)相關(guān)的學(xué)習(xí)方法賦予了一個(gè)新名詞即“深度學(xué)習(xí)”。
在淺層神經(jīng)網(wǎng)絡(luò)的輸出層繼續(xù)添加層次,原來(lái)的輸出層變成中間層,新加的層次成為新的輸出層.依照這樣的方式不斷添加,可以得到更多層的多層神經(jīng)網(wǎng)絡(luò)。使用矩陣運(yùn)算的話(huà)就僅僅是加一個(gè)公式而已。在已知輸入a(1),參數(shù)W(1)、W(2)、W(3)的情況下,輸出z的推導(dǎo)公式如式1所示。隨著層數(shù)的增加,整個(gè)網(wǎng)絡(luò)的參數(shù)就越多。而神經(jīng)網(wǎng)絡(luò)其實(shí)本質(zhì)就是模擬特征與目標(biāo)之間的真實(shí)關(guān)系函數(shù)的方法,更多的參數(shù)意味著其模擬的函數(shù)可以更加的復(fù)雜,可以有更多的容量(capcity)去擬合真正的關(guān)系。
在單層神經(jīng)網(wǎng)絡(luò)時(shí),使用的激活函數(shù)是sgn函數(shù)。兩層神經(jīng)網(wǎng)絡(luò)時(shí),使用的最多的是sigmoid函數(shù)。而到了多層神經(jīng)網(wǎng)絡(luò)時(shí),ReLU函數(shù)在訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)時(shí),更容易收斂,并且預(yù)測(cè)性能更好。因此,本文采用非線(xiàn)性函數(shù)是ReLU函數(shù)。ReLU函數(shù)不是傳統(tǒng)的非線(xiàn)性函數(shù),而是分段線(xiàn)性函數(shù)。其表達(dá)式y(tǒng)=max(x,0)。在x大于0,輸出就是輸入,而在x小于0時(shí),輸出就保持為0。這種函數(shù)的設(shè)計(jì)啟發(fā)來(lái)自于生物神經(jīng)元對(duì)于激勵(lì)的線(xiàn)性響應(yīng),以及當(dāng)?shù)陀谀硞€(gè)閾值后就不再響應(yīng)的模擬。
2.神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)提取國(guó)情地表變化
針對(duì)基于人工判讀地理國(guó)情監(jiān)測(cè)方法在人力物力強(qiáng)度等方面的劣勢(shì),探索地理國(guó)情監(jiān)測(cè)自動(dòng)化、智能化變化檢測(cè)技術(shù)成為迫切需求。人工智能、模式識(shí)別等新理論新技術(shù)特別是機(jī)器學(xué)習(xí)密切結(jié)合面向?qū)ο筮b感技術(shù)應(yīng)運(yùn)而生,是當(dāng)前遙感學(xué)界、計(jì)算機(jī)學(xué)界研究熱點(diǎn)之一。
傳統(tǒng)機(jī)器學(xué)習(xí)傾向于使用符號(hào)表示知識(shí)而不是數(shù)值表示,使用啟發(fā)式方法而不是算法,使用歸納而不是演繹,前一傾向使它有別于人工智能的模式識(shí)別,后一傾向使它有別于定理證明、經(jīng)典邏輯等分支。其中,基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)是一類(lèi)基于生物學(xué)對(duì)人腦進(jìn)一步認(rèn)識(shí),將神經(jīng)一中樞一大腦的工作原理設(shè)計(jì)成一個(gè)不斷迭代、不斷抽象的過(guò)程,以便得到最優(yōu)數(shù)據(jù)特征表示的機(jī)器學(xué)習(xí)算法。該算法從原始信號(hào)開(kāi)始,先做低級(jí)抽象,然后逐漸向高級(jí)抽象迭代,由此組成深度學(xué)習(xí)算法的基本框架。多隱含層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)特征對(duì)數(shù)據(jù)有更本質(zhì)的刻畫(huà),有利于可視化或分類(lèi)。同時(shí),深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過(guò)逐層初始化來(lái)克服。
2.1學(xué)習(xí)樣本庫(kù)及訓(xùn)練
地理國(guó)情成果樣本庫(kù)是提高機(jī)器自動(dòng)分類(lèi)精度重要數(shù)據(jù)支撐,利用機(jī)器學(xué)習(xí)方法,通過(guò)實(shí)驗(yàn)測(cè)試,原則上每類(lèi)地物樣本量不低于1萬(wàn),以提高學(xué)習(xí)成果的準(zhǔn)確性。建立地理國(guó)情監(jiān)測(cè)不同地物類(lèi)型的樣本庫(kù),其中國(guó)情要素樣本庫(kù)內(nèi)容劃分為鐵路與道路、構(gòu)筑物、人工堆掘地、水域、地理單元5大類(lèi)。利用深度網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行訓(xùn)練的實(shí)質(zhì)就是通過(guò)構(gòu)建具有多隱層機(jī)器學(xué)習(xí)模型和海量樣本訓(xùn)練數(shù)據(jù),學(xué)習(xí)記憶優(yōu)化特征參數(shù)(即連接權(quán)值),從而提升分類(lèi)精度。本次設(shè)計(jì)模型結(jié)構(gòu)具有6層隱層節(jié)點(diǎn),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新的特征空間。圖2為某建筑物所建立的樣本庫(kù),圖3為訓(xùn)練樣本分布。
2.2特征信息提取
深度神經(jīng)網(wǎng)絡(luò)用于變化識(shí)別是一種基于特征的方法,這些特征主要包括:光譜特征、指數(shù)特征、形狀特征、紋理特征、鄰接關(guān)系、層次關(guān)系等,涵蓋了高分辨率影像上可以利用的圖像信息。監(jiān)督/非監(jiān)督分類(lèi)等基于傳統(tǒng)統(tǒng)計(jì)分析的分類(lèi)方法難以充分采用上述特征信息,同時(shí),區(qū)別于傳統(tǒng)的人工特征提取和針對(duì)特征的高性能分類(lèi)器設(shè)計(jì),經(jīng)過(guò)多層非線(xiàn)性映射,使網(wǎng)絡(luò)可以從未經(jīng)特殊處理的訓(xùn)練樣本中,自動(dòng)學(xué)習(xí)形成適應(yīng)該識(shí)別任務(wù)的特征提取器和分類(lèi)器,該方法降低了對(duì)訓(xùn)練樣本的要求,而且網(wǎng)絡(luò)的層數(shù)越多,學(xué)習(xí)到的特征更具有全局性。
通過(guò)該方法對(duì)某研究區(qū)域地表覆蓋進(jìn)行圖像分類(lèi),如圖4。結(jié)果表明:該方法分類(lèi)總體精度優(yōu)于86%,Kappa系數(shù)達(dá)到83%,具有較好的分類(lèi)精度。
2.3變化發(fā)現(xiàn)與精度比較
自動(dòng)化智能化變化發(fā)現(xiàn)是開(kāi)展常態(tài)化地理國(guó)情監(jiān)測(cè)關(guān)鍵技術(shù)之一,本文通過(guò)在前時(shí)相矢量和后時(shí)相分類(lèi)結(jié)果中進(jìn)行分析,并與CC碼比較,得到研究區(qū)域變化圖斑,如圖5所示。
對(duì)變化圖斑按照面積大小進(jìn)行排序,從面積大的開(kāi)始,人工確認(rèn)是否發(fā)生變化。變化發(fā)現(xiàn)圖斑與人工變化檢測(cè)圖斑進(jìn)行比較,如圖6、7所示。
假定基于人工判讀變化檢測(cè)結(jié)果為標(biāo)準(zhǔn)成果,采用誤檢率、漏檢率兩項(xiàng)指標(biāo)進(jìn)行統(tǒng)計(jì)評(píng)價(jià),并結(jié)合作業(yè)生產(chǎn)效率指標(biāo)進(jìn)行比較,如表1所示。
可見(jiàn)基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的地理國(guó)情地表覆蓋變化與基于人工判讀方法相比,能夠較準(zhǔn)確的提取出變化點(diǎn)及范圍,有更快的效率。但也存在一定問(wèn)題,對(duì)識(shí)別出的范圍或區(qū)域分類(lèi)錯(cuò)誤還較高,尚需要人工進(jìn)行圖面檢查。
3.結(jié)束語(yǔ)
本文在結(jié)合地理國(guó)情監(jiān)測(cè)某實(shí)驗(yàn)區(qū)域?qū)嵺`基礎(chǔ)上,在基于主動(dòng)學(xué)習(xí)的樣本庫(kù)構(gòu)建技術(shù)、面向?qū)ο蠓诸?lèi)技術(shù)、人機(jī)交互的變化圖斑確認(rèn)與編輯等核心技術(shù)基礎(chǔ)上,利用多時(shí)相影像、專(zhuān)題資料及前期矢量成果數(shù)據(jù),研究探索利用基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國(guó)情地表覆蓋變化檢測(cè)算法,包括樣本庫(kù)構(gòu)建、樣本選擇與訓(xùn)練、影像分割、特征提取、變化檢測(cè)、精度評(píng)價(jià)等主要環(huán)節(jié)。試驗(yàn)表明該方法能夠較快識(shí)別變化區(qū)域的位置,但提取變化區(qū)域范圍、識(shí)別變化類(lèi)型等方面表現(xiàn)不佳,需要進(jìn)一步研究完善。