神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法在地理國情監(jiān)測中的應(yīng)用研究

2018-11-05 03:49:54葉遠(yuǎn)斌

西部資源 2018年4期

葉遠(yuǎn)斌

摘要：開展常態(tài)化地理國情監(jiān)測是廣東省基礎(chǔ)測繪“十三五”規(guī)劃重要內(nèi)容，本文綜合利用多時相影像、專題資料及已有矢量成果數(shù)據(jù)，研究基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國情地表覆蓋變化檢測。實(shí)驗表明：國情地表覆蓋信息提取總體精度優(yōu)于86.22%，KAPPA系數(shù)達(dá)到83.04%；與傳統(tǒng)人工目視判別方法比較，誤檢率小于7.05%，漏檢率小于10.52%，在人力投入、作業(yè)效率、成果質(zhì)量等有明顯優(yōu)勢。

關(guān)鍵字：地理國情監(jiān)測；深度學(xué)習(xí)；特征提??；變化發(fā)現(xiàn)

引言

地理國情是指與地理相關(guān)的自然和人文要素的國情，是從地理的角度采用空間化的方法，對國情進(jìn)行持續(xù)觀測并對觀測結(jié)果進(jìn)行描述、分析、預(yù)測和可視化的過程。按照國務(wù)院對地理國情監(jiān)測工作總體部署和測繪地理信息事業(yè)轉(zhuǎn)型發(fā)展需要，從2016年起地理國情信息獲取進(jìn)入常態(tài)化監(jiān)測階段，在地理國情普查的基礎(chǔ)上，進(jìn)行地理國情監(jiān)測業(yè)務(wù)化運(yùn)行建設(shè)，構(gòu)建功能完備的地理國情動態(tài)監(jiān)測與綜合信息分析發(fā)布系統(tǒng)，形成常態(tài)化地理國情監(jiān)測機(jī)制，提供地理國情信息業(yè)務(wù)化、常態(tài)化服務(wù)。

傳統(tǒng)基礎(chǔ)性地理國情監(jiān)測方法主要通過對遙感衛(wèi)星影像及相關(guān)專題資料整合預(yù)處理后，將上年度成果數(shù)據(jù)疊加到監(jiān)測影像上，人工逐格網(wǎng)進(jìn)行檢查識別，對于局部或個別的地物、地類變化，可在變化區(qū)域識別的同時完成變化信息提??；對于范圍較大，內(nèi)部變化比較復(fù)雜的變化區(qū)域，可先勾畫出變化區(qū)域的整體范圍，然后由專門的信息采集人員完成變化信息提取，存在人工投入大、作業(yè)效率較低、自動化智能化不足、對漏判錯判等圖斑難以發(fā)現(xiàn)等突出問題，監(jiān)測成果能較好滿足《基礎(chǔ)性地理國情監(jiān)測數(shù)據(jù)技術(shù)規(guī)定GQJC 01-2017》要求。本文探索采用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法對地理國情地表覆蓋變化信息進(jìn)行提取研究，并綜合已有樣本成果，與傳統(tǒng)人工目視判讀成果進(jìn)行比較，結(jié)果表明該方法具有較高的準(zhǔn)確度，變化信息提取效率明顯提高。

1.深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)

2006年，Hinton首次提出了“深度信念網(wǎng)絡(luò)”的概念。與傳統(tǒng)的訓(xùn)練方式不同，“深度信念網(wǎng)絡(luò)”有一個“預(yù)訓(xùn)練”（pre-training）的過程，這可以方便的讓神經(jīng)網(wǎng)絡(luò)中的權(quán)值找到一個接近最優(yōu)解的值，之后再使用“微調(diào)”（fine-tuning）技術(shù)來對整個網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練。這兩個技術(shù)的運(yùn)用大幅度減少了訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的時間，并將多層神經(jīng)網(wǎng)絡(luò)相關(guān)的學(xué)習(xí)方法賦予了一個新名詞即“深度學(xué)習(xí)”。

在淺層神經(jīng)網(wǎng)絡(luò)的輸出層繼續(xù)添加層次，原來的輸出層變成中間層，新加的層次成為新的輸出層.依照這樣的方式不斷添加，可以得到更多層的多層神經(jīng)網(wǎng)絡(luò)。使用矩陣運(yùn)算的話就僅僅是加一個公式而已。在已知輸入a（1），參數(shù)W（1）、W（2）、W（3）的情況下，輸出z的推導(dǎo)公式如式1所示。隨著層數(shù)的增加，整個網(wǎng)絡(luò)的參數(shù)就越多。而神經(jīng)網(wǎng)絡(luò)其實(shí)本質(zhì)就是模擬特征與目標(biāo)之間的真實(shí)關(guān)系函數(shù)的方法，更多的參數(shù)意味著其模擬的函數(shù)可以更加的復(fù)雜，可以有更多的容量（eapeity）去擬合真正的關(guān)系。

在單層神經(jīng)網(wǎng)絡(luò)時，使用的激活函數(shù)是sgn函數(shù)。兩層神經(jīng)網(wǎng)絡(luò)時，使用的最多的是sigmoid函數(shù)。而到了多層神經(jīng)網(wǎng)絡(luò)時，ReLU函數(shù)在訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)時，更容易收斂，并且預(yù)測性能更好。因此，本文采用非線性函數(shù)是ReLU函數(shù)。ReLU函數(shù)不是傳統(tǒng)的非線性函數(shù)，而是分段線性函數(shù)。其表達(dá)式y(tǒng)=max（x，0）。在x大于0，輸出就是輸入，而在x小于0時，輸出就保持為0。這種函數(shù)的設(shè)計啟發(fā)來自于生物神經(jīng)元對于激勵的線性響應(yīng)，以及當(dāng)?shù)陀谀硞€閾值后就不再響應(yīng)的模擬。

2.神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)提取國情地表變化

針對基于人工判讀地理國情監(jiān)測方法在人力物力強(qiáng)度等方面的劣勢，探索地理國情監(jiān)測自動化、智能化變化檢測技術(shù)成為迫切需求。人工智能、模式識別等新理論新技術(shù)特別是機(jī)器學(xué)習(xí)密切結(jié)合面向?qū)ο筮b感技術(shù)應(yīng)運(yùn)而生，是當(dāng)前遙感學(xué)界、計算機(jī)學(xué)界研究熱點(diǎn)之一。

傳統(tǒng)機(jī)器學(xué)習(xí)傾向于使用符號表示知識而不是數(shù)值表示，使用啟發(fā)式方法而不是算法，使用歸納而不是演繹，前一傾向使它有別于人工智能的模式識別，后一傾向使它有別于定理證明、經(jīng)典邏輯等分支。其中，基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)是一類基于生物學(xué)對人腦進(jìn)一步認(rèn)識，將神經(jīng)-中樞-大腦的工作原理設(shè)計成一個不斷迭代、不斷抽象的過程，以便得到最優(yōu)數(shù)據(jù)特征表示的機(jī)器學(xué)習(xí)算法。該算法從原始信號開始，先做低級抽象，然后逐漸向高級抽象迭代，由此組成深度學(xué)習(xí)算法的基本框架。多隱含層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力，學(xué)習(xí)特征對數(shù)據(jù)有更本質(zhì)的刻畫，有利于可視化或分類。同時，深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度，可以通過逐層初始化來克服。

2.1學(xué)習(xí)樣本庫及訓(xùn)練

地理國情成果樣本庫是提高機(jī)器自動分類精度重要數(shù)據(jù)支撐，利用機(jī)器學(xué)習(xí)方法，通過實(shí)驗測試，原則上每類地物樣本量不低于1萬，以提高學(xué)習(xí)成果的準(zhǔn)確性。建立地理國情監(jiān)測不同地物類型的樣本庫，其中國情要素樣本庫內(nèi)容劃分為鐵路與道路、構(gòu)筑物、人工堆掘地、水域、地理單元5大類。利用深度網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行訓(xùn)練的實(shí)質(zhì)就是通過構(gòu)建具有多隱層機(jī)器學(xué)習(xí)模型和海量樣本訓(xùn)練數(shù)據(jù)，學(xué)習(xí)記憶優(yōu)化特征參數(shù)（即連接權(quán)值），從而提升分類精度。本次設(shè)計模型結(jié)構(gòu)具有6層隱層節(jié)點(diǎn)，通過逐層特征變換，將樣本在原空間的特征表示變換到一個新的特征空間。圖2為某建筑物所建立的樣本庫，圖3為訓(xùn)練樣本分布。

2.2特征信息提取

深度神經(jīng)網(wǎng)絡(luò)用于變化識別是一種基于特征的方法，這些特征主要包括：光譜特征、指數(shù)特征、形狀特征、紋理特征、鄰接關(guān)系、層次關(guān)系等，涵蓋了高分辨率影像上可以利用的圖像信息。監(jiān)督/非監(jiān)督分類等基于傳統(tǒng)統(tǒng)計分析的分類方法難以充分采用上述特征信息，同時，區(qū)別于傳統(tǒng)的人工特征提取和針對特征的高性能分類器設(shè)計，經(jīng)過多層非線性映射，使網(wǎng)絡(luò)可以從未經(jīng)特殊處理的訓(xùn)練樣本中，自動學(xué)習(xí)形成適應(yīng)該識別任務(wù)的特征提取器和分類器，該方法降低了對訓(xùn)練樣本的要求，而且網(wǎng)絡(luò)的層數(shù)越多，學(xué)習(xí)到的特征更具有全局性。

通過該方法對某研究區(qū)域地表覆蓋進(jìn)行圖像分類，如圖4。結(jié)果表明：該方法分類總體精度優(yōu)于86%，Kappa系數(shù)達(dá)到83%，具有較好的分類精度。

2.3變化發(fā)現(xiàn)與精度比較

自動化智能化變化發(fā)現(xiàn)是開展常態(tài)化地理國情監(jiān)測關(guān)鍵技術(shù)之一，本文通過在前時相矢量和后時相分類結(jié)果中進(jìn)行分析，并與CC碼比較，得到研究區(qū)域變化圖斑，如圖5所示。

對變化圖斑按照面積大小進(jìn)行排序，從面積大的開始，人工確認(rèn)是否發(fā)生變化。變化發(fā)現(xiàn)圖斑與人工變化檢測圖斑進(jìn)行比較，如圖6、7所示。

假定基于人工判讀變化檢測結(jié)果為標(biāo)準(zhǔn)成果，采用誤檢率、漏檢率兩項指標(biāo)進(jìn)行統(tǒng)計評價，并結(jié)合作業(yè)生產(chǎn)效率指標(biāo)進(jìn)行比較，如表1所示。

可見基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的地理國情地表覆蓋變化與基于人工判讀方法相比，能夠較準(zhǔn)確的提取出變化點(diǎn)及范圍，有更快的效率。但也存在一定問題，對識別出的范圍或區(qū)域分類錯誤還較高，尚需要人工進(jìn)行圖面檢查。

3.結(jié)束語

本文在結(jié)合地理國情監(jiān)測某實(shí)驗區(qū)域?qū)嵺`基礎(chǔ)上，在基于主動學(xué)習(xí)的樣本庫構(gòu)建技術(shù)、面向?qū)ο蠓诸惣夹g(shù)、人機(jī)交互的變化圖斑確認(rèn)與編輯等核心技術(shù)基礎(chǔ)上，利用多時相影像、專題資料及前期矢量成果數(shù)據(jù)，研究探索利用基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的地理國情地表覆蓋變化檢測算法，包括樣本庫構(gòu)建、樣本選擇與訓(xùn)練、影像分割、特征提取、變化檢測、精度評價等主要環(huán)節(jié)。試驗表明該方法能夠較快識別變化區(qū)域的位置，但提取變化區(qū)域范圍、識別變化類型等方面表現(xiàn)不佳，需要進(jìn)一步研究完善。