崔珂瑋 張亞豪 劉彤 黃猛
摘? 要:隨著互聯(lián)網(wǎng)的高速發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)到來,時(shí)效性強(qiáng)的數(shù)據(jù)不斷涌現(xiàn),數(shù)據(jù)在各行業(yè)中的重要性愈發(fā)凸顯。傳統(tǒng)的人工數(shù)字化方法存在耗時(shí)長(zhǎng)、效率低、需要大量人力的問題。采用ENVI衛(wèi)星影像深度學(xué)習(xí)處理技術(shù)對(duì)西部地區(qū)房屋建筑進(jìn)行數(shù)字化,該算法將遙感影像中ROI感興趣區(qū)作為目標(biāo)檢測(cè)對(duì)象,通過參數(shù)優(yōu)化、類激活柵格輸出、密度分割等過程,得到此衛(wèi)星影像的SHP圖。此方法提高了數(shù)字化的效率,提供了有力的數(shù)據(jù)支持。
關(guān)鍵詞:ENVI;數(shù)據(jù)數(shù)字化;衛(wèi)星影像處理
中圖分類號(hào):TP183;TP751? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)01-0057-03
Abstract:With the rapid development of the internet,the era of big data has come,and data with strong timeliness is emerging,and the crucial importance of data in various industries is becoming increasingly prominent. The traditional manual digital method has the problems of time-consuming,low efficiency and large amount of manpower. ENVI satellite image deep learning processing technology is used to digitize the buildings in the western region. This algorithm takes ROI region of interest in the remote sensing image as the object of detection,through parameter optimization,class activation grid output,density segmentation and other processes,and then the SHP image of the satellite image can be obtained. This method improves the efficiency of digitization and provides powerful data support.
Keywords:ENVI;data digitization;satellite image processing
0? 引? 言
采用人工的方法需要6個(gè)月完成一個(gè)省份的數(shù)字化,按照此效率一年僅能完成2個(gè)省份,照此速度,完成全國數(shù)字化至少需要10年?,F(xiàn)在我國處在快速發(fā)展階段,許多城市每年都會(huì)發(fā)生巨大變化,雖然10年后可以完成數(shù)字化,但是數(shù)據(jù)已失去意義。因此,需要利用當(dāng)前的最新的技術(shù)去實(shí)現(xiàn)全國的數(shù)字化。IT行業(yè)當(dāng)前最火的技術(shù)為AI-深度學(xué)習(xí),本文采用ESRI公司提供的ENVI深度學(xué)習(xí)模型進(jìn)行了探索和實(shí)踐。
ENVI是由ESRI公司研發(fā)的一個(gè)完整的遙感圖像處理平臺(tái),它提供了專業(yè)可靠的波譜分析工具和高光譜分析工具,應(yīng)用中匯集的軟件處理技術(shù)覆蓋了圖像分類、圖像數(shù)據(jù)的輸入/輸出、圖像定標(biāo)、圖像增強(qiáng)、糾正、正射校正、數(shù)據(jù)融合以及各種變換、信息提取、基于知識(shí)的決策樹分類、DEM及地形信息提取、與GIS的整合、雷達(dá)數(shù)據(jù)處理、三維立體顯示分析,還可以利用IDL為ENVI編寫擴(kuò)展功能。本文主要涉及該應(yīng)用的圖像分類技術(shù)。
1? 方法研究
1.1? 生成標(biāo)簽圖像
標(biāo)簽圖像是模型訓(xùn)練中的樣本數(shù)據(jù),創(chuàng)建標(biāo)簽圖像前,需要輸入ROI(感興趣區(qū))以及所對(duì)應(yīng)的柵格圖像。ROI在圖像處理領(lǐng)域是將圖像中所關(guān)注的區(qū)域圈出,并且作為目標(biāo)檢測(cè)的對(duì)象。使用ENVI中Vector to ROI工具項(xiàng)便可以將已準(zhǔn)確數(shù)字化的矢量文件轉(zhuǎn)化為ROI,如圖1所示。再使用Deep Learning模塊中的Build Lable Raster from ROI工具項(xiàng),便可以生成標(biāo)簽圖像。這個(gè)過程中,轉(zhuǎn)換成ROI的矢量數(shù)據(jù)的準(zhǔn)確度以及合適的數(shù)量尤為重要,準(zhǔn)確度低會(huì)導(dǎo)致訓(xùn)練出的模型無法識(shí)別出建筑房屋區(qū)域,數(shù)量過多過少都無法訓(xùn)練出識(shí)別建筑房屋的模型。
1.2? 訓(xùn)練模型
得到標(biāo)簽圖像后,訓(xùn)練模型便有了數(shù)據(jù)基礎(chǔ)。模型可以簡(jiǎn)單地理解成函數(shù),訓(xùn)練模型就是用已有的數(shù)據(jù),通過某種方法確定函數(shù)的參數(shù),參數(shù)確定后的函數(shù)就是訓(xùn)練的結(jié)果。ENVI中使用Deep Learning模塊下的Train TensorFlow Mask Model工具項(xiàng),對(duì)得到的標(biāo)簽圖像進(jìn)行訓(xùn)練,如圖2所示。在此過程中,需要調(diào)整Patch Size(切片大?。?、Number of Epochs(迭代數(shù))、Number of Patches per Epoch(每次迭代訓(xùn)練的切片數(shù))、Patch Sampling Rate(切片采樣比率)參數(shù)來創(chuàng)建合適的模型。
在開始訓(xùn)練之前,必須設(shè)置或初始化TensorFlow模型,此過程定義了模型的結(jié)構(gòu),包括架構(gòu)、patch尺寸和將用于訓(xùn)練的波段數(shù),在ENVI深度學(xué)習(xí)中使用的框架為ENVINet5,它是一種基于掩碼的編碼器-解碼器架構(gòu),可對(duì)圖像中的每個(gè)像素進(jìn)行分類。而patch是用于訓(xùn)練模型的圖像塊??梢栽贗nitialize ENVINet5 TensorFlow Model對(duì)話框中指定模型的patch尺寸和波段數(shù)。
初始化新模型后,需要對(duì)標(biāo)簽圖像進(jìn)行訓(xùn)練,訓(xùn)練涉及反復(fù)將標(biāo)簽圖像傳遞給模型。一段時(shí)間后,模型將學(xué)習(xí)標(biāo)簽柵格中的光譜和空間信息轉(zhuǎn)換為類激活柵格,突出訓(xùn)練期間明顯的特征。在第一次訓(xùn)練過程中,模型嘗試初始預(yù)測(cè)并生成隨機(jī)類激活柵格,將該柵格與標(biāo)簽柵格的掩膜波段進(jìn)行比較。通過擬合優(yōu)度函數(shù)(也稱為損失函數(shù)),模型可以了解隨機(jī)預(yù)測(cè)誤差的位置。調(diào)整模型的內(nèi)部參數(shù)或權(quán)重以優(yōu)化準(zhǔn)確率,并將標(biāo)簽圖像再次傳遞給模型。
訓(xùn)練模型的過程中,ENVI使用專有技術(shù)訓(xùn)練深度學(xué)習(xí)模型,該模型基于有偏置的patch選擇。引入有偏置的選擇以便模型能夠更頻繁地看到具有更高密度的特征像素的patch。該方法基于逆變換抽樣的統(tǒng)計(jì)技術(shù),其中向模型顯示的實(shí)例與它們的概率密度函數(shù)的貢獻(xiàn)成正比。這種偏差是使用Train TensorFlow Mask模型工具中的類權(quán)重參數(shù)來控制的,可以為類權(quán)重設(shè)置最小值和最大值。當(dāng)訓(xùn)練開始時(shí),最大值用于偏置patch選擇,此值在訓(xùn)練結(jié)束時(shí)降至最小值。在大多數(shù)情況下,最小值應(yīng)為0,以便模型完成上一個(gè)Epoch,同時(shí)查看特征與背景像素的實(shí)際比率。除此之外,還可以設(shè)置Patch Sampling Rate參數(shù)以指示應(yīng)發(fā)生的采樣密度,這是每個(gè)像素在訓(xùn)練和驗(yàn)證標(biāo)簽圖像中所屬的平均patch數(shù)。當(dāng)特征不明顯時(shí),增加此值可能會(huì)有所幫助,因?yàn)檫x擇包含特征足夠的patch的可能性更大。
1.3? 圖像識(shí)別
訓(xùn)練出模型后,使用Deep Learning模塊下的TensorFLow Mask Classification工具項(xiàng)對(duì)其他柵格影像進(jìn)行識(shí)別。輸入即將識(shí)別的柵格圖像和訓(xùn)練完成的模型,選擇輸出路徑即可完成識(shí)別。此過程生成一個(gè)類激活柵格,它是一個(gè)灰度圖像,其像素大致表示屬于給定特征的概率,明亮像素表示與要素的高匹配。最后通過密度分割,選定0.8~1.0的范圍創(chuàng)建高像素值的分類圖像。導(dǎo)出SHP圖層即完成此柵格的數(shù)字化工作。
2? 問題分析
訓(xùn)練模型過程中,參數(shù)的選擇對(duì)創(chuàng)建的模型有著重要的影響,因此尋找合適的參數(shù)是非常重要的。起初訓(xùn)練模型時(shí),同時(shí)改變多個(gè)參數(shù)進(jìn)行訓(xùn)練,即使最后產(chǎn)生較好的效果也無法確定是通過改變哪個(gè)參數(shù)產(chǎn)生的影像。因此,采用控制變量的方法,在四個(gè)參數(shù)中改變一個(gè)參數(shù),其他參數(shù)使用默認(rèn)值,改變的參數(shù)從最大值開始調(diào)整。每個(gè)參數(shù)都采用相同的方式進(jìn)行測(cè)試,經(jīng)過一段時(shí)間的測(cè)試總結(jié)發(fā)現(xiàn),每一個(gè)參數(shù)使用控制變量的方法從大到小進(jìn)行調(diào)整生成模型時(shí),識(shí)別的效果都會(huì)呈先上升后下降的效果。因此最后確定出每個(gè)參數(shù)的數(shù)值是Patch Size:380;Number of Epochs:16;Number of Patches per Epoch:300;Patch Sampling Rate:6。此參數(shù)下的模型可以將衛(wèi)星影像柵格圖中的建筑區(qū)圈出,代替人力完成數(shù)字化工作。
但經(jīng)過比對(duì)后,人工數(shù)字化的效果最好,目前使用ENVI的方法能完成75%左右自動(dòng)工作,由于識(shí)別是按照像素塊為單位進(jìn)行識(shí)別,許多相似的非建筑區(qū)域同樣被圈出,因此經(jīng)過ENVI數(shù)字化過后,還需要人工審核。
同時(shí),在使用ENVI識(shí)別各省的過程中發(fā)現(xiàn),不同的居民地分布使用的模型各不相同。在識(shí)別的過程中需要區(qū)分城市與農(nóng)村兩種類型,需要使用特定的模型識(shí)別特定的居民地,否則會(huì)產(chǎn)生圖3的效果。
3? 結(jié)? 論
通過使用ENVI對(duì)中國部分省份數(shù)字化后可以得出,使用ENVI深度學(xué)習(xí)模型的方法可以節(jié)省75%左右的工作量,僅需要人工對(duì)ENVI數(shù)字化結(jié)果進(jìn)行審查。而人工作業(yè)的數(shù)字化質(zhì)量和工作時(shí)間成負(fù)相關(guān),和工作人員的疲勞度成正相關(guān),工作時(shí)間越長(zhǎng),疲勞度也高,導(dǎo)致數(shù)字化質(zhì)量降低,使用ENVI可以節(jié)省80%以上的人力。此方法在很大程度上節(jié)約了時(shí)間和人力,提高了數(shù)據(jù)的精確性,滿足軟件研發(fā)人員在軟件開發(fā)中對(duì)數(shù)據(jù)完整性的要求,說明了該方法在數(shù)字化房屋建筑應(yīng)用中的有效性,同時(shí)也為以后的矢量地理數(shù)據(jù)采集提供了參考和借鑒。
參考文獻(xiàn):
[1] 程許龍,黨光普,李致博.地籍信息化管理中老舊鐵路用地圖數(shù)字化方法研究 [J].北京測(cè)繪,2018,32(8):923-927.
[2] 李賢江,陳佑啟,鄒金秋,等.卷積神經(jīng)網(wǎng)絡(luò)在高分辨率影像分類中的應(yīng)用 [J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2019,1(1):67-77.
[3] 王增林,朱大明.基于遙感影像的最大似然分類算法的探討 [J].河南科學(xué),2010,28(11):458-461.
[4] 趙元元.數(shù)字化城市數(shù)字地圖及空間數(shù)據(jù)庫建設(shè) [J].居業(yè),2019(5):14-15+18.
[5] 金杰,朱海巖,李子瀟,等.ENVI遙感圖像處理中幾種監(jiān)督分類方法的比較 [J].水利科技與經(jīng)濟(jì),2014,20(1):146-148+160.
[6] 李穎玥,劉朝暉.中國數(shù)字化城市管理發(fā)展綜述 [J].智能建筑與智慧城市,2017(2):28-32.
[7] 鄧書斌,陳秋錦,杜會(huì)建,等.ENVI遙感圖像處理方法:第2版 [M].北京:高等教育出版社,2014.
[8] 李穎玥,劉朝暉.中國數(shù)字化城市管理發(fā)展綜述 [J].智能建筑與智慧城市,2017(2):28-32.
作者簡(jiǎn)介:崔珂瑋(2000.03-),男,漢族,山東臨沂人,本科,計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),學(xué)士學(xué)位,研究方向:人工智能和軟件開發(fā)應(yīng)用。