蔡 衡,楚 恒,單德明
(1.重慶郵電大學(xué)通信與信息工程學(xué)院,重慶 400065;2.重慶高校市級光通信與網(wǎng)絡(luò)重點實驗室,重慶 400065; 3.泛在感知與互聯(lián)重慶市重點實驗室,重慶 400065;4.重慶市勘測院,重慶 400020)
從遙感影像中提取道路信息是許多城市應(yīng)用的前提,如交通管理、城市規(guī)劃、道路監(jiān)測、地理信息系統(tǒng)更新等[1]。伴隨著高分辨率遙感衛(wèi)星的發(fā)展,影像分辨率也顯著提高,地物細(xì)節(jié)信息更加豐富,紋理更加清晰,但也給道路提取帶來了挑戰(zhàn)。而且在實際成像中,除了影像中本身的噪聲以外,還存在著同譜異物和同物異譜現(xiàn)象[2],如空地、房屋等與道路具有很大的相似性,道路輪廓會直接受到干擾目標(biāo)的影響,造成道路提取斷裂、模糊及錯分現(xiàn)象。因此,如何高效且準(zhǔn)確地從遙感影像中提取道路信息具有極其重要的意義。
傳統(tǒng)手動標(biāo)記道路需要大量的人力和時間,且局限性較大,難以滿足社會生產(chǎn)建設(shè)的需要。近年來,深度學(xué)習(xí)通過學(xué)習(xí)高級特征表現(xiàn)出優(yōu)異的性能,在自動道路提取、節(jié)省手動提取成本方面都取得了理想效果。目前常用的道路提取方法主要有CNN(Convolutional Neural Network)[3]、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[4]、ELM(Extreme Learning Machine)[5]、SVM(Support Vector Machine)[6]等。洪紹軒等[7]將SVM與模糊C均值結(jié)合進(jìn)行道路提取,通過模糊C均值聚類得到建筑類地物,然后利用SVM完成道路提取,但道路最終的提取效果受聚類中心影響較大,難以取得穩(wěn)定的提取精度。Cheng等[8]提出一種CNN網(wǎng)絡(luò)實現(xiàn)級聯(lián)端到端的自動道路提取,利用CNN網(wǎng)絡(luò)的表現(xiàn)能力,能夠較好地解決樹木和汽車的復(fù)雜背景和遮擋問題,以獲得良好的道路提取效果。李洪川等[9]提出了一種道路多特征多核SVM提取方法,以全局核函數(shù)和局部核函數(shù)加權(quán)組合方式構(gòu)建多核SVM對影像分類,但是該方法需要大量訓(xùn)練樣本,核函數(shù)的引入導(dǎo)致耗時過多??偟膩砜?,上述方法都能在一定程度上提取道路,但遇到復(fù)雜影像時,仍存在精度和提取自動化程度低的問題。
因此,本文提出了一種基于ELM的高分辨率遙感影像道路提取方法。首先,對原始布谷鳥搜索CS(Cuckoo Search)算法進(jìn)行差分進(jìn)化改進(jìn),從而減少種群迭代次數(shù),加快CS算法的收斂速度;其次,將改進(jìn)后的CS算法同ELM結(jié)合,自適應(yīng)選擇隱含層神經(jīng)元個數(shù)及其所對應(yīng)的輸入權(quán)值和偏置值,以提高模型的穩(wěn)定性;再次,在ELM模型中引入數(shù)據(jù)樣本的幾何特征和數(shù)據(jù)蘊含的判別信息,通過最大化異類離散度和最小化同類離散度,優(yōu)化ELM輸出權(quán)值,彌補(bǔ)ELM學(xué)習(xí)不夠充分的問題,進(jìn)而提高ELM分類性能;最后,結(jié)合數(shù)學(xué)形態(tài)學(xué)處理,完成道路最終提取結(jié)果優(yōu)化。通過重慶市某地區(qū)的影像實驗表明:本文方法可以較好地提取出道路信息,并且能準(zhǔn)確、較為完整地提取具有一定復(fù)雜形狀的道路目標(biāo)。
Figure 1 Network structure diagram of extreme learning machine圖1 極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)圖
具有L個隱含層節(jié)點激活函數(shù)g(x)的ELM數(shù)學(xué)表達(dá)式如下所示:
(1)
其中,i∈[1,N];ωj=[ω1j,ω2j,…,ωmj]T是連接第j個隱含層神經(jīng)元和所有輸入神經(jīng)元的權(quán)重向量,bj是第j個隱含層神經(jīng)元的偏置值,βj=[βj1,βj2,…,βjn]T是連接第j個隱含層神經(jīng)元和所有輸出神經(jīng)元的權(quán)重向量,ωj·xi表示ωj和xi的內(nèi)積。對式(1)的N個方程進(jìn)行簡化合并后等價為:
Hβ=Y
(2)
其中,H表示隱含層輸出矩陣,β為輸出權(quán)值矩陣,Y為期望輸出矩陣:
(3)
(4)
ELM的訓(xùn)練過程是一個非線性優(yōu)化問題,其學(xué)習(xí)過程可以看作求取線性系統(tǒng)Hβ=Y的最小范數(shù)的最小二乘解,解的數(shù)學(xué)計算公式表示為:
(5)
在ELM模型中,隱含層節(jié)點的輸入權(quán)值和偏置值是隨機(jī)生成的,難免會使網(wǎng)絡(luò)結(jié)構(gòu)中的某些節(jié)點成為死節(jié)點,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)不穩(wěn)定,無法滿足數(shù)據(jù)要求。本文通過對原始CS算法進(jìn)行差分變異策略,增加CS算法種群的多樣性,提高全局搜索能力,加快CS算法收斂速度;并利用改進(jìn)后的CS算法來自適應(yīng)選擇ELM隱含層節(jié)點數(shù),從而提高ELM的精度和穩(wěn)定性。
CS算法是通過模擬布谷鳥寄生性育雛行為,來有效求解最優(yōu)化問題的算法[10]。同時,CS也與鳥類的Levy飛行行為搜索機(jī)制結(jié)合,使優(yōu)化算法更有效。每個鳥巢中的卵代表一個解,布谷鳥的卵代表新解,目標(biāo)是利用新解或者潛在優(yōu)解替代巢中的劣解。尋找宿主鳥巢的路徑和位置更新公式為:
(6)
本文引入一種差分進(jìn)化算法對CS進(jìn)行改進(jìn),策略如下:
V=Xb+δ(Xi1+Xi2-Xi3-Xi4)
(7)
其中,V代表變異后的鳥巢位置;Xb代表目前群體中最優(yōu)鳥巢位置;Xik(k=1,2,3,4)是在當(dāng)前群體中隨機(jī)選取4個鳥巢;δ是縮放因子,取值為[0,1]。將式(7)引入CS算法中,式(6)變?yōu)椋?/p>
(8)
(9)
如果當(dāng)前鳥巢的適應(yīng)度值小于Levy搜索更新后鳥巢的適應(yīng)度值,則進(jìn)行位置更新;反之,則不變。
(10)
利用改進(jìn)后的CS算法自適應(yīng)地選擇隱含層節(jié)點數(shù),選取輸入權(quán)重和偏置值。對ELM模型網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的過程如下所示:
步驟1訓(xùn)練樣本歸一化處理。
步驟2設(shè)置改進(jìn)CS算法的各項參數(shù)。被寄主發(fā)現(xiàn)的概率參數(shù)pa,N個初始鳥巢位置,最大迭代次數(shù)T。
步驟4產(chǎn)生隨機(jī)數(shù)rand,如果rand 步驟5若達(dá)到最大的迭代次數(shù),則停止搜索和更新,跳轉(zhuǎn)步驟6,否則跳轉(zhuǎn)步驟3。 步驟6選擇適應(yīng)度值最小的鳥巢位置,取整數(shù)作為ELM的隱含層節(jié)點數(shù)L,最終確定當(dāng)前網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。 通過對基本CS算法引入差分變異策略進(jìn)行改進(jìn),使鳥巢種群多樣性增加,并擴(kuò)大了搜索范圍,增強(qiáng)了全局搜索能力。綜上所述,ELM采用改進(jìn)CS算法自適應(yīng)地選擇適應(yīng)度值最小的鳥巢位置,然后取整數(shù)作為ELM的隱含層節(jié)點數(shù)L,并選取輸入權(quán)值和偏置值,增強(qiáng)了模型的穩(wěn)定性,提高了精度。 在確定ELM的隱含層節(jié)點數(shù)之后,由于道路樣本的復(fù)雜多變性,將會導(dǎo)致ELM學(xué)習(xí)過程中訓(xùn)練不充分問題,于是在優(yōu)化后的ELM中引入判別信息[11]。對于N個不同的數(shù)據(jù)樣本(xi,yi),同類離散度矩陣Sa、異類離散度矩陣Sb數(shù)學(xué)表達(dá)式為: (11) 其中,N為樣本類別數(shù),Nc為第c類樣本個數(shù),ui為樣本類內(nèi)均值,u為樣本總體均值。異類離散度矩陣和同類離散度矩陣分別體現(xiàn)了輸入樣本的空間分布特征以及蘊含的判別信息。將這2種離散度矩陣進(jìn)行融合得到信息差矩陣S=Sa-(1-η)Sb,0≤η≤1,η為常量。 信息差矩陣中的η主要用來平衡同類和異類判別信息,當(dāng)參數(shù)η增大時,側(cè)重于類內(nèi)信息;反之,則偏向類間差異信息。通過上述網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和調(diào)整后,改進(jìn)的ELM優(yōu)化問題可表示為: (12) 其中,C為正則化參數(shù),ξ為訓(xùn)練誤差矩陣。式(12)的優(yōu)化問題可通過構(gòu)建拉格朗日函數(shù)表示: (13) 令式(13)對β,α,ξ的偏導(dǎo)數(shù)為零,可得到如下方程: β=HTα (14) (15) h(xi)β=yi-ξi,i=1,…,N (16) 將式(14)、式(15)代入式 (16)便可以得到: (17) 然后將式(14)代入式(16)可以得到: (18) 由式(18)得到網(wǎng)絡(luò)的輸出函數(shù)為: (19) 其中,h(x)為待測試樣本數(shù)據(jù),將選取的影像測試樣本歸一化后通過式(19)得到期望輸出結(jié)果,獲得相應(yīng)的道路提取信息。 經(jīng)過上述改進(jìn)后的ELM提取的道路信息,仍存在由于其它噪聲干擾造成的斷裂和孔洞等現(xiàn)象。數(shù)學(xué)形態(tài)學(xué)利用結(jié)構(gòu)元素可以平滑道路邊緣,填充孔洞和斷裂,以及去除噪聲,從而達(dá)到優(yōu)化所提取的道路信息的目的。 本文2組實驗樣本由重慶市勘測院提供,第1組實驗樣本選取重慶市某郊區(qū)的QuickBird道路高分辨率遙感影像。該影像包含空間分辨率為0.5 m的全色影像和空間分辨率為1.8 m的多光譜影像,融合后影像分辨率達(dá)到0.5 m,樣本大小為340×340,原始影像如圖2a所示。 為驗證本文方法的準(zhǔn)確性和高效性,采用參考文獻(xiàn)[7]的SVM方法、文獻(xiàn)[8]的CNN方法作為對比算法,通過客觀與主觀相結(jié)合的方式對提取效果進(jìn)行評價,不同方法的道路提取效果如圖2所示。 Figure 2 Road extraction map 1 of different methods圖2 不同方法道路提取圖1 (1) 主觀分析:從目視提取效果圖來看,SVM的道路提取效果最差,存在大量的道路斷裂、畸變,同時一些建筑物或裸地被錯分為道路;CNN相較于SVM方法,能夠較好地提取道路輪廓,但仍存在錯分、孔洞以及道路不連貫等問題;而本文方法通過結(jié)合CS算法和判別信息,能明顯提高網(wǎng)絡(luò)穩(wěn)定性和準(zhǔn)確性,道路提取效果要明顯優(yōu)于其它2種方法。同時結(jié)合數(shù)學(xué)形態(tài)學(xué)處理后道路信息提取完整,未出現(xiàn)錯分、斷裂和孔洞等情況。 (2) 客觀分析:為客觀評價道路提取效果,本文通過正確率、完整率和提取質(zhì)量3個指標(biāo)對道路提取效果進(jìn)行客觀評價。 ①正確率。 正確率是正確提取的道路長度與提取道路總長度的比值: (20) ②完整率。 完整率是提取道路總長度與影像中實際道路總長度的比值: (21) ③提取質(zhì)量。 提取質(zhì)量是正確提取的道路長度與影像中實際道路總長度的比值: (22) 為進(jìn)一步定量分析道路提取效果,驗證本文方法的有效性和準(zhǔn)確性,通過在原始影像中隨機(jī)選取5 000個測試樣本點,并對道路和非道路樣本點數(shù)量進(jìn)行個數(shù)統(tǒng)計。圖3為隨機(jī)測試樣本點分布圖。道路提取評價如表1和表2所示。 Figure 3 Distribution of test sample points圖3 測試樣本點分布圖 從表2中可以看出,本文方法的正確率達(dá)到了93.5%,在道路提取完整率上遠(yuǎn)遠(yuǎn)優(yōu)于另外2種方法,達(dá)到了97.3%。相比較SVM和ELM,提取質(zhì)量分別提高了5.7%和2.6%,能夠有效地提取出完整的道路信息。 Table 1 Extraction results of road test sample points 表1 道路測試樣本點提取結(jié)果 Table 2 Road extraction evaluation 1 of different methods表2 不同方法道路提取評價1 % 為了更好地驗證本文方法的有效性,采用另外一幅重慶市某城區(qū)的WordView-2影像(數(shù)據(jù)大小為340×340,分辨率為1 m(如圖4a所示)),進(jìn)行驗證實驗,不同方法的提取效果如圖4所示。 Figure 4 Road extraction map 2 of different methods圖4 不同方法道路提取圖2 從圖4可以看出,SVM和CNN均存在錯分現(xiàn)象,致使道路提取不連續(xù)、斷裂和畸變等,道路提取不完整。本文方法能夠很好地抑制不連續(xù)和斷裂情況的發(fā)生,道路提取效果更好。道路提取評價指標(biāo)如表3所示。 從表3中可以看出,本文所提方法與SVM方法和CNN方法相比,正確率和完整率明顯提高,正確率分別提高了9.1%和5.5%,完整率分別提高了11.4%和6%,同時提取質(zhì)量也明顯優(yōu)于它們。在運行時間方面,本文方法遠(yuǎn)遠(yuǎn)小于另外2種方法的,比用時最長的CNN縮短近百倍。由上述分析可知,本文方法在訓(xùn)練時間上有突出的優(yōu)勢,且道路提取效果更好。 Table 3 Road extraction evaluation 2 of different methods表3 不同方法道路提取評價2 針對高分辨率遙感影像中城市道路的復(fù)雜多變性及ELM快速分類能力,本文提出了一種基于ELM的城市道路提取方法。利用改進(jìn)的CS算法來優(yōu)化ELM的網(wǎng)絡(luò)結(jié)構(gòu),確定隱含層節(jié)點數(shù),提高模型穩(wěn)定性;引入數(shù)據(jù)樣本的幾何特征和蘊含的判別信息,進(jìn)一步提高ELM的提取性能,實現(xiàn)城市道路的有效提取。通過實驗分析和比較可知,本文方法能夠完整地提取出道路信息,在地圖更新、城市規(guī)劃、災(zāi)害檢測等方面有著一定的應(yīng)用意義。3.3 判別信息下的ELM
4 數(shù)學(xué)形態(tài)學(xué)優(yōu)化
5 實驗結(jié)果與分析
6 結(jié)束語