閆凱,沈汀,陳正超?,閆弘軒
(1 中國(guó)科學(xué)院遙感與數(shù)字地球研究所, 北京 100094; 2 中國(guó)科學(xué)院大學(xué)電子電氣與通信工程學(xué)院, 北京 100094)
尾礦庫是由筑壩攔截谷口或圍地建成,用于堆放選礦中的尾砂或其他工業(yè)廢渣的場(chǎng)所[1]。尾礦庫的存在有助于尾砂中礦物成分的再回收、水資源循環(huán)利用,但其結(jié)構(gòu)決定了它是一個(gè)高勢(shì)能的危險(xiǎn)源,具有潰壩的風(fēng)險(xiǎn),同時(shí)尾砂中的重金屬在雨水的沖刷下也有污染土壤和地下水系的可能[2]。為保障尾礦庫周邊人民的生命財(cái)產(chǎn)安全,國(guó)家應(yīng)急管理部《遏制尾礦庫“頭頂庫”重特大事故工作方案》中確定了“一庫一檔”、“一庫一策”的工作目標(biāo)。
對(duì)于尾礦庫這類分布廣泛且不均勻,實(shí)地調(diào)研困難的地物,已有不少科研工作者借助遙感圖像實(shí)現(xiàn)尾礦庫監(jiān)測(cè)與統(tǒng)計(jì)分析。2012年,郝利娜等[3]借助WorldView-2圖像對(duì)鄂東南尾礦庫結(jié)構(gòu)特征、分布特征、光譜特征、紋理特征進(jìn)行分析,通過人機(jī)交互的方式目視解譯該區(qū)域內(nèi)572個(gè)尾礦庫;2013年,中國(guó)煤炭地質(zhì)總局航測(cè)遙感局的強(qiáng)建華[4]借助SPOT-5、RAPIDEYE等衛(wèi)星遙感數(shù)據(jù)解譯陜西省尾庫礦庫分布情況,并對(duì)其存在的環(huán)境問題進(jìn)行分析;2015年,高永志等[5]基于中國(guó)遙感14號(hào)、24號(hào)、5號(hào)和高分2號(hào)等衛(wèi)星提供的高分辨率遙感圖像解譯出山東省內(nèi)585個(gè)尾礦庫,并分析這些尾礦庫的分布位置及其潛在的危害。上述主要借助目視解譯的方法,依據(jù)先驗(yàn)知識(shí)人工判讀,尾礦庫提取速度慢,主觀性強(qiáng),難以從大區(qū)域內(nèi)快速獲取尾礦庫分布信息。
深度學(xué)習(xí)[6]是一種通過構(gòu)建網(wǎng)絡(luò)模型實(shí)現(xiàn)計(jì)算機(jī)模擬人腦對(duì)大量數(shù)據(jù)進(jìn)行分析、統(tǒng)計(jì)去解譯分析圖像、語音等信息的技術(shù),隨著深度學(xué)習(xí)的蓬勃發(fā)展,越來越多的網(wǎng)絡(luò)模型被應(yīng)用在自然語言處理[7]、圖像識(shí)別[8]、目標(biāo)檢測(cè)[9]、語音辨識(shí)[10]等領(lǐng)域;此外,在遙感領(lǐng)域利用神經(jīng)網(wǎng)絡(luò)獲取地表發(fā)射率[11]、SAR圖像的目標(biāo)識(shí)別[12]、遙感圖像的色彩校正[13]等研究也在與日俱增,并為尾礦庫的自動(dòng)獲取提供了解決思路。
2013年加州大學(xué)伯克利分校的Krizhevsky等[14]提出R-CNN算法將PASCAL VOC數(shù)據(jù)集的檢測(cè)精度從35.1%提升到53.7%;2014年,He等[15]提出SPP-Net算法,減少了計(jì)算的冗余程度;2015年,微軟研究院的Girshick[16]借鑒SPP-Net算法,提出一種改進(jìn)的Fast R-CNN算法;2015年,Redmon等[17]提出YOLO算法,將目標(biāo)檢測(cè)問題轉(zhuǎn)換為回歸問題;2016年12月北卡大學(xué)教堂山分校的Liu等[18]針對(duì)YOLO算法定位精度差以及對(duì)小目標(biāo)檢測(cè)精度差等問題提出SSD算法,將YOLO的回歸思想和Faster R-CNN的anchor box機(jī)制相結(jié)合,在整幅圖像上各個(gè)位置用多尺度區(qū)域的局部特征圖邊框回歸,保持YOLO算法快速特性的同時(shí),也保證了邊框定位效果和Faster R-CNN[19]類似,是當(dāng)前最優(yōu)秀的目標(biāo)檢測(cè)算法之一。對(duì)于尾礦庫目標(biāo)而言,通常由壩體、尾砂、廢水3部分組成(如圖1所示),但不同類型的尾礦庫又具有差異,尺寸大小不一,通常為50~3 000 m,分布廣泛且不均勻,相對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)算法,基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型往往是最佳的選擇。因此,本文利用SSD模型實(shí)現(xiàn)尾礦庫的自動(dòng)提取。
圖1 尾礦庫結(jié)構(gòu)圖Fig.1 Structural chart of tailing pond
為實(shí)現(xiàn)尾礦庫目標(biāo)的自動(dòng)提取,本文主要貢獻(xiàn)有:1)首次完成華北地區(qū)尾礦庫樣本庫的制作,其中包括制定出尾礦庫的訓(xùn)練樣本標(biāo)準(zhǔn),標(biāo)記出2 000個(gè)尾礦庫樣本,隨機(jī)挑選1 500個(gè)作為訓(xùn)練樣本,剩余500個(gè)樣本作為測(cè)試樣本驗(yàn)證尾礦庫檢測(cè)的精度;2)首次將深度學(xué)習(xí)應(yīng)用于尾礦庫檢測(cè)領(lǐng)域,成功驗(yàn)證了SSD模型提取遙感圖像中尾礦庫目標(biāo)的可行性;3)針對(duì)尾礦庫的特殊性,改進(jìn)原始SSD模型結(jié)構(gòu)提高尾礦庫的檢測(cè)精度。
本節(jié)詳細(xì)介紹基于卷積神經(jīng)網(wǎng)絡(luò)SSD目標(biāo)檢測(cè)模型的結(jié)構(gòu)及其理論,分析原始SSD模型相對(duì)于尾礦庫這類地物目標(biāo)存在的問題,提出增加CONV12_2卷積層和增加CONV1_2層卷積核步長(zhǎng)的改進(jìn)策略,以此提高SSD模型對(duì)尾礦庫大型目標(biāo)地物的檢測(cè)精度。
Liu等提出的SSD(single shot detector)模型[18]參考YOLO模型的思想,不同于生成候選區(qū)域之類的網(wǎng)絡(luò)模型,將目標(biāo)檢測(cè)問題轉(zhuǎn)換為目標(biāo)坐標(biāo)位置以及對(duì)應(yīng)類別置信度的回歸問題,以VGG-16為基礎(chǔ)網(wǎng)絡(luò)提取圖像特征,如圖2所示。將VGG-16最后2個(gè)全連接層修改為卷積層[20]即CONV6和CONV7,中間還夾雜有池化層[20],并在最后增加4個(gè)卷積層構(gòu)成目標(biāo)檢測(cè)網(wǎng)絡(luò),分別對(duì)應(yīng)圖2中的CONV8_2、CONV9_2、CONV10_2、CONV11_2。所謂卷積是指特定大小的n×n的卷積核在圖像的相應(yīng)位置乘積求和,卷積運(yùn)算的目的是提取輸入圖像的不同特征。淺層的卷積提取一些低級(jí)的特征如邊緣、線條和角等層級(jí),更深層次的卷積能從低級(jí)特征中迭代提取更復(fù)雜的特征,卷積運(yùn)算后獲得圖像稱為特征圖(feature map)。在不同層次的特征圖上預(yù)測(cè)目標(biāo)矩形框的位置以及類別信息從而保證不同尺度下目標(biāo)的檢測(cè)精度。
圖2 SSD模型結(jié)構(gòu)圖Fig.2 Structural chart of SSD model
特征圖其本質(zhì)仍是圖像,組成圖像的最小單元稱為像元,組成特征圖的單個(gè)像元又記為cell[18]。在SSD模型中參與預(yù)測(cè)目標(biāo)位置及類別信息的卷積層包括CONV4_3、CONV7、CONV8_2、CONV10_2、CONV11_2共5層,這些卷積層生成的特征圖中每個(gè)像元預(yù)設(shè)不同比例大小的預(yù)設(shè)框(default box)[18],如圖3所示,圖3(a)是訓(xùn)練樣本圖像,左側(cè)框標(biāo)記貓的真實(shí)位置,右側(cè)框標(biāo)記狗的真實(shí)位置,圖3(b)、3(c)分別是8×8、4×4,即特征圖分辨率為8×8、4×4,特征圖中虛線標(biāo)記的是不同比例的預(yù)設(shè)框,左側(cè)加粗虛線框?yàn)轭A(yù)設(shè)框與貓的真值框最佳匹配的,右側(cè)加粗虛線框?yàn)轭A(yù)設(shè)框與狗的真值框最佳匹配的。設(shè)特征圖的大小為m×m,每個(gè)像元位置處有k個(gè)預(yù)設(shè)框,則該特征圖總的預(yù)設(shè)框個(gè)數(shù)為m×m×k。SSD模型中不同卷積層特征圖對(duì)應(yīng)的預(yù)設(shè)框大小和寬高比例不同,參與檢測(cè)目標(biāo)位置和類別的特征圖共m個(gè),每個(gè)特征圖對(duì)應(yīng)的預(yù)設(shè)框大小計(jì)算公式如下
(1)
模型訓(xùn)練過程中輸入樣本圖像的真值與特征圖中的預(yù)設(shè)框相匹配,每個(gè)預(yù)設(shè)框與輸入樣本的真值框匹配時(shí),只要二者的jaccard overlap[21]大于閾值即為匹配成功,匹配成功的預(yù)設(shè)框作為正類參與迭代訓(xùn)練,未匹配成功的預(yù)設(shè)框設(shè)為負(fù)類或背景。關(guān)于jaccard overlap的計(jì)算公式如下
(2)
式中:A、B分別對(duì)應(yīng)圖4中A、B,jaccard overlap為真值框和預(yù)設(shè)框的交集與并集的比值。
圖3 特征圖中的預(yù)設(shè)框示意圖Fig.3 The default box in the feature maps
圖4 區(qū)域A與區(qū)域B的匹配演示Fig.4 The matching demonstration between region A and region B
(3)
式中:N是匹配預(yù)設(shè)方框數(shù)量,如果N=0,那么loss=0;權(quán)重項(xiàng)α一般設(shè)為1用于交叉驗(yàn)證;Lloc(x,c)位置損失是預(yù)測(cè)框與真值框的Smooth L1損失,包括預(yù)設(shè)方框中心點(diǎn)(cx,cy)的偏移以及寬高(w,h);Lconf(x,c)置信度損失是所有類別置信度的softmax損失[18]。模型訓(xùn)練過程中通過梯度下降確定損失函數(shù)最小的各種參數(shù)即得到最終的目標(biāo)檢測(cè)模型。
原始的SSD模型中利用CONV4_3、CONV7、CONV8_2、CONV10_2、CONV11_2卷積層從輸入圖像中提取特征輸出相應(yīng)的特征圖,特征圖的單個(gè)像元對(duì)應(yīng)原始輸入圖像的像元個(gè)數(shù)稱為感受野,即通過特征圖單個(gè)像元值描述原始圖像中一定范圍內(nèi)的特征,通過特征圖與標(biāo)記樣本真值的匹配最終確定目標(biāo)矩形框位置信息以及所屬類別的置信度。當(dāng)感受野的尺度無法覆蓋完整的提取目標(biāo)時(shí)將會(huì)導(dǎo)致卷積層提取的目標(biāo)特征不完整,無法用足夠完整的特征描述目標(biāo),進(jìn)而導(dǎo)致目標(biāo)檢測(cè)精度降低。
對(duì)于本文所檢測(cè)的尾礦庫目標(biāo)而言,輸入圖像大小為1 500×1 500個(gè)像元,谷歌圖像16級(jí)產(chǎn)品的空間分辨率為2 m,尾礦庫大小尺度為30~3 000 m,即尾礦庫可能占用的像元個(gè)數(shù)為15~1 500;此外,為了使模型預(yù)測(cè)不同的形狀、大小尺寸的圖像時(shí)擁有更強(qiáng)的魯棒性,訓(xùn)練樣本圖像在輸入后會(huì)隨機(jī)地將圖像切割成包含目標(biāo)對(duì)象的小圖像塊,并且重采樣成1 500×1 500像元大小的圖像,這就導(dǎo)致訓(xùn)練樣本中有大量的大尺度目標(biāo)。原始的SSD模型中CONV11_2層對(duì)應(yīng)的感受野大小只有740個(gè)像元,即CONV11_2層輸出的特征圖單個(gè)像元對(duì)應(yīng)的原始輸入圖像大小為740×740,無法完全覆蓋所有尺寸的尾礦庫目標(biāo),導(dǎo)致大型尾礦庫提取精度差,進(jìn)而影響整體目標(biāo)提取精度。
經(jīng)過上述分析,本文提出增加額外的卷積層CONV12_2,并修改原始SSD網(wǎng)絡(luò)中的CONV1_2層卷積步長(zhǎng)為2的策略以增大特征圖的感受野,如圖5所示。SSD模型修改前后對(duì)應(yīng)卷積層特征圖的分辨率和感受野的變化表1所示。通過修改模型結(jié)構(gòu),將原始SSD模型最大感受野740個(gè)像元提升到2 499個(gè)像元,此外每一層卷積層的特征圖感受野都得到一定程度的增大,提高卷積層對(duì)大型尾礦庫完整特征的捕獲能力,以此優(yōu)化SSD模型對(duì)尾礦庫這類地物的提取精度。
本章節(jié)以數(shù)據(jù)準(zhǔn)備為主,詳細(xì)分析研究區(qū)選擇華北地區(qū)的重要意義,依據(jù)尾礦庫尺寸分布特征,將Google圖像切割成1 500×1 500像元大小,并介紹樣本標(biāo)記方法、流程以及最終使用樣本的分布;此外,還詳細(xì)介紹用于目標(biāo)檢測(cè)精度評(píng)價(jià)的精確率、召回率以及在不同置信度下的目標(biāo)監(jiān)測(cè)精度的評(píng)價(jià)。
在原始SSD模型的基礎(chǔ)上增加額外的卷積層,即圖中虛線框標(biāo)記位置。圖5 修改后SSD模型結(jié)構(gòu)圖Fig.5 Structural chart of the modilied SSD model
VGG+SSDCONV4_3CONV7CONV8_2CONV9_2CONV10_2CONV11_2CONV12_2修改前修改后分辨率187×187103×10352×5226×2613×137×7—感受野92260292356484740—分辨率93×9356×5628×2814×147×74×42×2感受野17951557970796314752499
本文選擇的研究區(qū)域是華北地區(qū),包括北京市、天津市、河北省、山西省和內(nèi)蒙古自治區(qū)共5個(gè)省級(jí)行政單位。該區(qū)域礦產(chǎn)資源豐富,其中內(nèi)蒙古發(fā)現(xiàn)礦產(chǎn)128種,礦產(chǎn)地達(dá)786處,稀土礦產(chǎn)更是世界之冠;山西礦產(chǎn)地765處,煤、鋁土礦、鐵、耐火黏土等保有儲(chǔ)量居全國(guó)首位;河北是中國(guó)礦產(chǎn)資源大省,有40 余種礦產(chǎn)儲(chǔ)量位居全國(guó)前11 位[22]。全國(guó)的尾礦庫在地理位置上分布不均勻,主要集中在華北、東北、華中地區(qū),而尾礦庫數(shù)量最多的應(yīng)數(shù)河北省、山西省。以華北區(qū)域尾礦庫作為研究對(duì)象,包含的尾礦庫類型復(fù)雜,提取的尾礦庫更加具有代表性和普遍性。此外,華北地區(qū)屬于暖溫帶大陸性季風(fēng)氣候,降水在年內(nèi)分配高度集中且多暴雨,這種降水特征增加了尾礦庫潰壩的風(fēng)險(xiǎn)性,因此研究華北區(qū)域的尾礦庫目標(biāo)格外重要。
本文使用的數(shù)據(jù)是覆蓋華北區(qū)域的Google圖像16級(jí)產(chǎn)品,空間分辨率為2 m,將圖像裁剪成1 500×1 500像元大小的圖像后導(dǎo)入RS-label軟件進(jìn)行樣本標(biāo)記。RS-Label軟件是利用python語言開發(fā)的專門用于目標(biāo)檢測(cè)樣本標(biāo)記和樣本篩選的工具,通過軟件中的矩形工具框選出圖像中的尾礦庫,完成標(biāo)記后在xml文件路徑下自動(dòng)生成對(duì)應(yīng)的xml文件,xml文件名字與圖像的名字相同,后綴為.xml,存儲(chǔ)矩形框相對(duì)于圖像的位置信息。xml文件中,filename為圖像文件的名字,size標(biāo)簽中的width為圖像寬度,height為圖像高度,depth為圖像波段數(shù),本文中使用的圖像是三波段真彩色合成圖像,即depth值為3。已知尾礦庫目標(biāo)的尺寸大小為30~3 000 m,而Google圖像16級(jí)產(chǎn)品空間分辨率為2 m,因此制作目標(biāo)檢測(cè)樣本時(shí)將圖像切割為1 500×1 500大小,即圖像的寬度和高度都是1 500個(gè)像元。bndbox標(biāo)簽中的xmin、ymin、xmax、ymax分別對(duì)應(yīng)樣本標(biāo)記過程中畫的矩形框相對(duì)于圖像的位置,矩形左上角點(diǎn)的列數(shù)、行數(shù),右下角點(diǎn)的列數(shù)、行數(shù),利用左上角點(diǎn)和右下角點(diǎn)的坐標(biāo)即可確定圖像中尾礦庫的位置信息。標(biāo)記完成后共標(biāo)記尾礦庫正樣本2 000個(gè),從中隨機(jī)挑選500個(gè)樣本作為測(cè)試集,剩余1 500個(gè)樣本作為訓(xùn)練集,樣本分布如圖6所示。
紅色標(biāo)記為訓(xùn)練集分布情況,黃色標(biāo)記為測(cè)試集分布情況。圖6 華北地區(qū)尾礦庫樣本Fig.6 The tailing pond samples in North China
尾礦庫的目標(biāo)檢測(cè)本質(zhì)上是二分類問題,即尾礦庫目標(biāo)作為一類地物,圖像中的其余地物目標(biāo)作為背景一類。對(duì)于目標(biāo)檢測(cè)精度評(píng)價(jià)常用的評(píng)價(jià)因子主要是精確率和召回率,而要計(jì)算這兩個(gè)評(píng)價(jià)因子首先需要統(tǒng)計(jì)的是混淆矩陣。
混淆矩陣[23]中橫軸True class是測(cè)試集中樣本標(biāo)記的數(shù)量統(tǒng)計(jì),縱軸Hypothesized class是模型預(yù)測(cè)結(jié)果的數(shù)量統(tǒng)計(jì),如圖7所示。p為測(cè)試集樣本中標(biāo)記為尾礦庫的個(gè)數(shù),n為測(cè)試集樣本中標(biāo)記為非尾礦庫的個(gè)數(shù);Y為測(cè)試集樣本預(yù)測(cè)為尾礦庫的個(gè)數(shù),N為測(cè)試集樣本預(yù)測(cè)為非尾礦庫的個(gè)數(shù);TP(true positives)為測(cè)試集樣本標(biāo)記為尾礦庫并且模型預(yù)測(cè)結(jié)果也為尾礦庫的個(gè)數(shù);FP(false positives)為測(cè)試集樣本標(biāo)記為非尾礦庫,但模型預(yù)測(cè)結(jié)果為尾礦庫的個(gè)數(shù),即誤檢數(shù);FN(false negatives)為測(cè)試集樣本標(biāo)記為尾礦庫,但模型預(yù)測(cè)結(jié)果為非尾礦庫的個(gè)數(shù),即漏檢數(shù);TN(true negatives)為測(cè)試集樣本標(biāo)記為非尾礦庫并且模型預(yù)測(cè)結(jié)果也是非尾礦庫的個(gè)數(shù)。有了上述混淆矩陣的統(tǒng)計(jì)信息,就可以很方便地計(jì)算尾礦庫檢測(cè)的精確率和召回率。
圖7 混淆矩陣Fig.7 The confusion matrix
精確率(precision)描述的是識(shí)別出來的樣本中,TP的個(gè)數(shù)所占的比重,即樣本標(biāo)記為尾礦庫并且被準(zhǔn)確預(yù)測(cè)為尾礦庫在所有預(yù)測(cè)為尾礦庫中的比重。計(jì)算公式為
(4)
召回率(recall)描述的是所有的預(yù)測(cè)樣本中,TP所占的比重,即預(yù)測(cè)樣本中所有標(biāo)記為尾礦庫的個(gè)數(shù)中,被準(zhǔn)確預(yù)測(cè)為尾礦庫的個(gè)數(shù)所占的比重。計(jì)算公式為
(5)
目標(biāo)檢測(cè)結(jié)果中除尾礦庫目標(biāo)的位置標(biāo)記信息外,還包含預(yù)測(cè)尾礦庫的置信度,即模型將目標(biāo)判定為尾礦庫的可能性大小。不同的置信度閾值下,模型檢測(cè)出尾礦庫的個(gè)數(shù)不同,隨著置信度閾值的不斷增大,檢測(cè)出的尾礦庫正檢的個(gè)數(shù)TP會(huì)減少,誤檢的個(gè)數(shù)FP也會(huì)減少,漏檢的個(gè)數(shù)FN則會(huì)增加,對(duì)應(yīng)的精確率和召回率也會(huì)發(fā)生相應(yīng)的變化,在同等置信度閾值下精確率、召回率大的模型則判斷為優(yōu)。為了更加整體和全面地對(duì)比評(píng)價(jià)改進(jìn)后的模型與原始SSD模型的檢測(cè)精度,本文統(tǒng)計(jì)了閾值為0.1、0.2、0.3、0.4下尾礦庫檢測(cè)的正檢個(gè)數(shù)、誤檢個(gè)數(shù)、漏檢個(gè)數(shù)、精確率和召回率。
本文共標(biāo)記2 000個(gè)尾礦庫樣本,從中隨機(jī)挑選500個(gè)作為測(cè)試樣本,測(cè)試集樣本中共有842個(gè)尾礦庫目標(biāo)。分別利用原始SSD模型和改進(jìn)后的SSD模型迭代訓(xùn)練100 000次后獲得的模型預(yù)測(cè)測(cè)試集中的圖像,圖像中預(yù)測(cè)出的尾礦庫中按照不同的置信度進(jìn)行篩選,置信度大于0.1、大于0.2、大于0.3、大于0.4分別對(duì)應(yīng)的正檢個(gè)數(shù)TP,誤檢個(gè)數(shù)FP,漏檢個(gè)數(shù)FN以及精確率和召回率如表2所示。
置信度閾值是SSD模型判定目標(biāo)地物為尾礦庫的可能性,是一個(gè)概率值。通過表2的統(tǒng)計(jì)信息可以看出,隨著置信度閾值的增大,修改前后的SSD模型預(yù)測(cè)出的尾礦庫逐漸減少,正檢與誤檢的尾礦庫同樣在減少,漏檢的尾礦庫則會(huì)隨之增加,伴隨著尾礦庫檢測(cè)精確率和召回率的變化。通過對(duì)比多組不同置信度閾值,發(fā)現(xiàn)置信度閾值為0.3時(shí),精確率與召回率有較好的平衡。對(duì)比修改后SSD模型檢測(cè)測(cè)試集的統(tǒng)計(jì)結(jié)果發(fā)現(xiàn),在相同置信度閾值下,修改后的SSD模型正檢、誤檢、漏檢個(gè)數(shù)都優(yōu)于原始SSD模型的檢測(cè)結(jié)果;當(dāng)置信度閾值為0.3時(shí),改進(jìn)后的模型相較于原始模型,檢測(cè)精確率提高10.0%,召回率提高14.4%。由于本文在原始SSD模型結(jié)構(gòu)的基礎(chǔ)上增加額外的卷積層以及修改了CONV1_2層卷積步長(zhǎng),導(dǎo)致模型訓(xùn)練過程中計(jì)算量有所增加。
表2 SSD模型修改前后訓(xùn)練和檢測(cè)結(jié)果Table 2 The training and detection results of SSD model before and after modification
本文統(tǒng)計(jì)了 SSD模型修改前后的訓(xùn)練所需時(shí)間,修改后的模型相對(duì)于原始模型訓(xùn)練時(shí)間僅增加0.112 h。
除去定量分析,本文還對(duì)原始SSD模型預(yù)測(cè)結(jié)果與改進(jìn)后預(yù)測(cè)結(jié)果以人工解譯的方式目視對(duì)比分析,圖8所示為預(yù)測(cè)結(jié)果。其中圖8(a)、8(c)為原始SSD模型的預(yù)測(cè)結(jié)果,而圖8(b)、8(d)為修改后模型相對(duì)應(yīng)圖像的預(yù)測(cè)結(jié)果,紅色矩形框?yàn)槟繕?biāo)檢測(cè)模型檢測(cè)出的尾礦庫在圖像中的位置。
圖8 SSD模型預(yù)測(cè)測(cè)試集結(jié)果圖Fig.8 SSD model prediction results for test set
通過對(duì)比可以發(fā)現(xiàn),對(duì)于這種大型的尾礦庫目標(biāo),原始的SSD模型受最大感受野的限制無法將整個(gè)目標(biāo)捕獲到,僅僅捕獲到的局部特征導(dǎo)致原始SSD模型會(huì)將單個(gè)大型的尾礦庫識(shí)別為多個(gè)尾礦庫目標(biāo);而改進(jìn)后的模型,因?yàn)樵黾泳矸e層并修改CONV1_2層的步長(zhǎng),增大了特征圖感受野,因此提高了模型對(duì)大型尾礦庫目標(biāo)的檢測(cè)精度。
本文首次利用RS-label軟件標(biāo)記華北區(qū)域2 000個(gè)尾礦庫樣本,其中1 500個(gè)樣本作為訓(xùn)練樣本參與模型訓(xùn)練,將基于深度學(xué)習(xí)的目標(biāo)檢測(cè)模型應(yīng)用于遙感圖像尾礦庫目標(biāo)檢測(cè)中,實(shí)現(xiàn)尾礦庫目標(biāo)的自動(dòng)提取。針對(duì)原始SSD模型對(duì)大型尾礦庫目標(biāo)誤檢、漏檢嚴(yán)重的問題,本文修改原始SSD模型的結(jié)構(gòu),在網(wǎng)絡(luò)模型最后增加額外的卷積層,修改CONV1_2卷積層的步長(zhǎng),增大了參與預(yù)測(cè)的特征圖的感受野尺寸,使得特征圖單個(gè)像元可以從圖像更大范圍內(nèi)提取特征,減少了大型尾礦庫目標(biāo)檢測(cè)時(shí)的漏檢和誤檢情況,提高了尾礦庫這類大型地物目標(biāo)的檢測(cè)精度。本文改進(jìn)的SSD模型精確率達(dá)0.882,召回率達(dá)0.857,相比原始SSD模型,精確率提高10.0%,召回率提高14.4%。
基于深度學(xué)習(xí)的SSD模型自動(dòng)提取目標(biāo)時(shí),通過分析目標(biāo)在圖像中所占像元范圍改進(jìn)SSD模型以達(dá)到調(diào)整特征圖感受野的效果,進(jìn)而提高相應(yīng)尺度下目標(biāo)的檢測(cè)精度。本文獲取的尾礦庫目標(biāo)檢測(cè)模型訓(xùn)練樣本是華北區(qū)域的Google圖像,而不同的研究區(qū)域、不同的遙感圖像中尾礦庫盡管結(jié)構(gòu)差異性很小,但尾砂組成成分、廢水含量、色調(diào)等差異較為明顯,當(dāng)更換不同的遙感圖像或研究區(qū)域,用該模型檢測(cè)圖像中的尾礦庫目標(biāo)精確率和召回率會(huì)受到影響。為了使該模型在尾礦庫檢測(cè)應(yīng)用中具有更強(qiáng)、更穩(wěn)定的泛化能力,將該模型推廣到全國(guó)范圍內(nèi)、多元遙感圖像中尾礦庫目標(biāo)檢測(cè)將成為后續(xù)研究目標(biāo)。