李 杰
(銀川能源學院 寧夏 銀川 750100)
在對圖像識別的過程中,傳統(tǒng)的單一方法已經(jīng)無法實現(xiàn)高準確率、高分辨率和高光譜的需求,因此要改進傳統(tǒng)機器分類方法。遙感圖像識別檢測技術能夠通過單波段得出高光譜圖像,分辨率在不斷地提高。目前,遙感圖像的分類是各個領域的研究重點,如何集中技術的優(yōu)勢,是今后研究過程中的重點[1]。
目前機器學習分類的方法比較多,包括最大似然法、基于統(tǒng)計模式識別方法、通用線性回歸等,研究人員復合使用對象信息、空間信息和光譜信息具有一定的效果。
基于回歸的機器學習方法原始輸入數(shù)據(jù)為X,輸出數(shù)據(jù)為Y:
g(x)=ρ0+ρ1X1+ρ2X2=ρTX
(1)
式(1)中,ρ0指的是截距,一般使用最小方差法創(chuàng)建回歸模型,g(x)代價函數(shù)表示為式(2):
(2)
通過Widrow-Hoff所提出的最小均方差算法,利用不斷嘗試全新ρ使代價函數(shù)為式(3):
(3)
通過式(3)推導出式(4):
(4)
將式(4)代入式(3)得式(5):
ρj:ρj+β(y(i)-gρ(x(i)))xj(i)
(5)
此算法使用梯度下降的方法能夠滿足代價函數(shù)最小值,并且發(fā)展批量梯度下降方法,從而促進了收斂速度。分類中最大似然法為傳統(tǒng)算法,假設隨機量滿足高斯分布,那么相似最大似然模型定義為:
(6)
此Softmax算法,可理解為Logistic算法的一般化。上述方法總體為基于統(tǒng)計對各個像元各波段光譜和空間信息特征進行處理,之后以特征實現(xiàn)分類識別的方法[2]。
通過灰度直方圖對圖像頻率與灰度進行全面分析,繪制灰度分布統(tǒng)計圖,能夠直觀地反映出灰度分布情況。具體過程為:以目標像素為中心,設置M×N鄰域范圍,實現(xiàn)范圍中全部像素值設置為統(tǒng)計排列,中間位置值為目標像素灰度值。為了改善效果,在一個像素點處理過程中調整窗口大小。全面判斷當前區(qū)域中的值是否為噪聲點:假如是,就要擴大窗口尺寸,尋找合適中值;假如不是,就要全面判斷中心像素點的噪點[4]。
圖像識別重點就是提取特征,為了全面了解圖像特征,要使人類視覺圖像抽象描述成為向量、數(shù)值等。特征能夠通過統(tǒng)計圖像局部區(qū)域的方向梯度直方圖(histogram of oriented gradient, HOG)得出,詳細描述圖像中的目標形狀與表象,算法的流程詳見圖1。
圖1 算法流程示意圖
Gamma校正能夠壓縮圖像,光照會影響到圖像紋理,通過校正降低圖像陰影。以圖像的不同改變校正幅度,對圖像顯示效果進行調整[5]。
在對圖像縱橫坐標計算的過程中,可以使用[-1,0,1]算子與[-1,0,1]轉置算子實現(xiàn)圖像卷積運算,全面計算梯度方向和幅值。將圖像實現(xiàn)多個單元格Cell的劃分,統(tǒng)計梯度方向的分布情況。在檢測道路的過程中,角度范圍設置為180°。由于局部對比度和光照的變化,會改變梯度強度的變化,從而解決梯度強度歸一化的問題。利用多個單元格實現(xiàn)連通Block空間的創(chuàng)建,根據(jù)Block形狀區(qū)分環(huán)形和矩形的區(qū)間。最后,利用重疊后Block塊實現(xiàn)特征向量的創(chuàng)建,對比其他特征的提取方法,HOG特征提取能夠局部處理圖像,并且不會使圖像光學形態(tài)改變。本文將圖像拆解為大量的小Cell,使HOG化得到實現(xiàn),對Cell大小調整,從而實現(xiàn)區(qū)域特征信息精度的控制[6]。
反向傳播算法(back propagation, BP)通過誤差反饋創(chuàng)建神經(jīng)網(wǎng)絡。能夠逐層和網(wǎng)絡中神經(jīng)元進行連接,通過誤差反饋層實現(xiàn)。BP神經(jīng)網(wǎng)絡還能夠滿足輸出結果的需求,假如數(shù)據(jù)不滿足,就要返回到中心處理。利用BP神經(jīng)網(wǎng)絡訓練樣本,并且對樣本進行識別和反饋?;驹硎峭ㄟ^傳輸層、隱藏層傳輸信息,并且對傳輸?shù)男畔⑦M行對比,如果計算結果無法使預期需求得到滿足,就要對系統(tǒng)參數(shù)重新計算。調整信息的閾值和權值,以此實現(xiàn)循環(huán)計算,直到結果能夠滿足需求,在目標層中存儲[7]。
通過量化共軛梯度的方法進行分類,傳統(tǒng)的梯度下降法收斂負梯度,本文所設計的共軛梯度算法能夠使負梯度的方向和上次搜索結果結合,計算全新的方向。因為共軛梯度在算法過程中對方向重新計算,所以計算時間得到增加。量化共軛梯度法能夠避免單一的線性搜索,使網(wǎng)絡訓練速度得到提高。
通過損失模型能夠判斷模型預測的好壞,充分反映出模型與實際的差距,交叉熵損失函數(shù)、損失函數(shù)等為常見的損失模型。在二分類問題中,為了衡量神經(jīng)網(wǎng)絡輸出向量,利用交叉熵進行評價,當熵值較小時,兩個概率分布就會比較接近。交叉熵設定兩個概率分布p和q,p指的是理想結果,q指的是神經(jīng)網(wǎng)絡輸出結果,兩者滿足p+q=1的關系,交叉熵計算公式為:
M(p,q)=-∑xp(x)logq(x)
(7)
熵值越小,兩個概率分布就會越近。
圖像處理方法被廣泛應用到道路網(wǎng)提取中,膨脹腐蝕屬于形態(tài)學變換,復式操作能夠降低物體邊界比較小的部分,使物體得到擴大,連接原本已經(jīng)斷開的物體。開閉運算能夠組合腐蝕和膨脹,在開運算過程中能夠先腐蝕然后膨脹,閉運算能夠先膨脹之后進行腐蝕,利用同種結構元素進行計算。在開運算過程中,能使圖像的邊緣更加光滑,使細小連接斷開,消除邊緣細小的毛刺[8]。
為了對本文方法優(yōu)越性進行驗證,通過景視圖得到高分辨彩色遙感影像數(shù)據(jù),使用全自動方法作為對比算法,對比視覺與統(tǒng)計分析。
在同個場景中包括不同類型道路,紋理與顏色不同,對完整提取道路是不利的。因此,不同類型道路通過繪制矩形框的方法標記。
因為道路光譜特征的相似性,從而使粗提取操作存儲在零星偽道路中,利用道路區(qū)域的大范圍聯(lián)通點對結果進行提取,之后進行精細化處理。為了評價本文的方法,要求在原始圖像中實現(xiàn)提取的道路結果疊加。通過疊加方式表示,本文方法提取結果為全部類型道路,提取結果能夠使實際道路邊界需求得到滿足,表示本文方法的便捷定位與道路類型提取具有密切關系。表1為各個緩沖區(qū)半徑中的提取精度,說明手工邊界線與本文方法邊界線最高的精度為2 pixel時,本文方法的準確性比較高[9]。
圖2為本文方法提取結果,使粗提取結果存儲到零星偽道路中,通過道路區(qū)域大范圍的連通特點和形態(tài)特征實現(xiàn)結果精細化處理。
從圖2可以看出,本文方法結果能夠對所有道路進行提取,而且實際道路和提取結果的道路邊界是相互吻合的,說明本文的方法在提取道路方面具有良好的準確性和完整性。針對本文方法的定量化評價,利用Modava的基于鄰域像素評價標準,實現(xiàn)手工提取道路邊界的評價,從而創(chuàng)建緩沖區(qū),對不同半徑緩沖區(qū)累加百分比進行計算。使提取的結果在原始圖像中疊加,通過對比,本文方法所提取的邊界線與實際邊界線吻合性良好,驗證了本文方法的有效性與可行性。另外,針對鄰域像素評價標準對比算法開展定量評價,詳見表2。對比表1和表2,在完全重疊情況下,劉修宇方法[2]與何曉軍方法[4]和本文的方法沒有太大的平均提取精度差異。在半徑為2 pixel的時候,本文設計方法的半徑提取精度已經(jīng)超過80%,說明本文方法對圖像的檢測準確度比較高。
表2 算法在不同緩沖區(qū)的半徑提取精度
針對無法提取高分辨率遙感圖像道路的問題,本文使用多標記像素匹配為基礎的技術,標記多類型道路提取正確匹配模板,使道路區(qū)域提取效果的需求得到滿足。通過局部紋理特征實現(xiàn)匹配像素的篩選,使計算復雜度降低,利用道路區(qū)域形態(tài)特征劃分真實道路區(qū)域,對高分辨率遙感圖像道路的結果進行提取。通過試驗測試,證明了本文方法的檢測精度高,優(yōu)越性顯著。