付寶晶,李自立
(廣西師范大學(xué)電子工程學(xué)院,廣西桂林 541000)
河流是自然環(huán)境中最常見的地形特征之一,也是人類生產(chǎn)生活的重要依靠。從遙感圖像中進行河流區(qū)域提取,對掌握某地區(qū)的水文特性、環(huán)境保護和發(fā)展建設(shè)等都有著十分重要的理論和實際意義。
近年來,河流提取是圖像分割的熱點,研究算法大致可分為像素閾值法[1]、紋理特征法[2]、形狀輪廓法、機器學(xué)習(xí)法等。閾值法是圖像分割中的經(jīng)典思想,劉煒[3]等通過創(chuàng)建特征空間進行全局閾值分割粗提水域分布信息。此類方法通常能進行有效分割,但在圖像復(fù)雜或者目標灰度范圍接近的區(qū)域,很難分割目標?;诩y理特征分割在光學(xué)圖像中有很好的應(yīng)用,Moslem Ouled Sghaier[4]等基于局部紋理特征和全局形態(tài)學(xué)算子的方法對河流和湖泊進行提取和區(qū)分。此類方法能夠?qū)D像進行全局的紋理分析,但是也忽略了局部紋理細節(jié),也就使得它不能在紋理和像素之間建立聯(lián)系。形狀輪廓提取法在河流提取中也有良好的表現(xiàn),張祝鴻[5]等利用河流的邊緣形狀特征運用筆畫寬度變換與幾何特征集結(jié)合的方法提取河流。此類算法依賴于檢測到的河流邊緣,在受到橋梁、山體陰影的干擾下會影響河流結(jié)構(gòu)的準確性。機器學(xué)習(xí)近年來在河流提取方面有很大的優(yōu)勢和突飛猛進的發(fā)展,李寧[6]等將精致Lee 濾波與卷積結(jié)合,基于河道幾何優(yōu)化的權(quán)值卷積核,提出一種新型的河道提取網(wǎng)絡(luò)模型。章斯騰[7]等提出增強河流剖面特征自動提取河流的神經(jīng)網(wǎng)絡(luò),能夠觀測河流網(wǎng)絡(luò)的動態(tài)變化。其中非監(jiān)督分類憑自然聚類的特性,在圖像尺寸較大、紋理較為豐富的區(qū)域容易檢錯。監(jiān)督學(xué)習(xí)效果較好,但效果和輸入的訓(xùn)練樣本數(shù)量和訓(xùn)練次數(shù)有關(guān)。
綜合現(xiàn)階段的有代表性的研究結(jié)果,基于某單一特征或方法進行特定河流區(qū)域提取時,存在無法避免的局限性,致使提取的結(jié)果不完整或者干擾較大。針對以上的方法局限,本文提出一種基于紋理、光譜和幾何形狀多特征融合的方法。綜合考慮圖像河流區(qū)域所蘊含的多種信息,獲取全面有效的特征描述,大幅提升河流提取的準確率和完整度。
本文采用高分一號拍攝的臺山市遙感影像進行實驗,該數(shù)據(jù)的空間分辨率為2 m,實驗選取的圖像大小為1 500×1 500 像素。圖像包含藍光通道、綠光通道、紅光通道、近紅外通道4 個波段,如圖1所示。藍光波段的水體衰減系數(shù)最小,對水體穿透能力最強,常用于研究河流、海洋水下環(huán)境狀況等;綠光波段對水體有一定的穿透力,常用來反映水下地形、沿岸沙洲等特征;紅光波段位于葉綠素的主要吸收帶,常用來區(qū)分植被生長狀況、覆蓋率等;近紅外波段位于水體的強吸收區(qū),吸收了水體絕大部分的能量[8]。對比4 個通道在河流流域上的成像特點,紅外波段中的水體成像部分與其他地物差異較明顯,并且在計算角二階矩時也能使水體能量保持最大化。因此,本文選取近紅外波段圖作為河流流域提取的處理對象。
圖1 遙感影像四通道圖Fig.1 Four bands images of remote sensing image
首先,基于河流本身具有一定寬度且一致連續(xù)的特點,在一段相對較短的距離中,該段河流的任意兩個像素可以認為具有相似的灰度統(tǒng)計特性。本文通過計算灰度共生矩陣[9](Gray Level Co-occurrence Matrix,GLCM)來反映圖像中的河流紋理信息,選取河流與其他地物對比效果最明顯的角二階矩圖作為下一步的輸入。然后進行OTSU[10]雙閾值分割濾除絕大部分的非河流區(qū)域,但還存在一些小斑點噪聲,通過構(gòu)造幾何特征濾波器(Geometric feature filter,GFF)進行篩選去噪以得到完整的河流流域圖。本文提出的算法流程圖如圖2所示。
圖2 多特征融合算法流程圖Fig.2 Flow chart of multi-feature fusion algorithm
為了將提取過程描述的更清晰,圖3 為每個過程的具體示意圖。(a)是輸入的第四通道紅外波段圖;(b)是通過計算灰度共生矩陣得到的角二階矩特征圖;(c)是OTSU 算法進行雙閾值分割得到的二值圖像;(d)是經(jīng)過連通域框選分組后的結(jié)果圖;(e)為通過幾何特征濾除后的得到的河流效果圖。
圖3 算法過程示意圖Fig.3 Illustration of the algorithm process
基于輸入的紅外波段圖,按照以下步驟進行灰度共生矩陣的計算。
(1)灰度級量化。其函數(shù)表達式為:
(2)特征值計算。以目標像素點為中心,向鄰域的0°、45°、90°、135°四個方向都進行紋理特征計算,最后取得4 個特征值的均值作為最終的結(jié)果以消除旋轉(zhuǎn)噪聲因子。通過計算可得到以下矩陣:
(3)特征選取。計算得到的灰度共生矩陣有多個統(tǒng)計量,包括均值、方差、對比度、角二階矩等。其中選取的角二階矩譜計算公式為:
圖4為各統(tǒng)計量結(jié)果示意圖。
圖4 灰度共生矩陣各統(tǒng)計量示意圖Fig.4 Illustration of GLCM’s statistics
基于得到的角二階矩圖,用OTSU 算法基于下式進行圖像的光譜特征分析。
式中:σ是類間方差;w0前景像素占圖像總像素的比例;u0是前景平均灰度;w1背景像素占圖像總像素的比例;u1是背景平均灰度。
基于得到的二值圖像,先進行連通域標記[11]。每一個單獨的連通域為一個標識的目標塊。進一步可以獲取這些標識塊的質(zhì)心、內(nèi)接圓、外接矩形等幾何參數(shù)。示意圖如圖3(d)所示,每個紅色矩形框選的區(qū)域為一個連通域。
河流在遙感圖像中呈現(xiàn)線性細條狀,且具有一定的寬度,根據(jù)此特征構(gòu)建幾何特征濾波器,濾除圖像中的非河流區(qū)域噪聲。幾何特征濾波器包括連通域長度、連通域矩形度、連通域面積與其外接矩形面積比。
(1)連通域長度l。與其他噪聲相比,河流區(qū)域的l值較大。因此通過設(shè)定濾波器閾值Tl以濾除小塊非河流區(qū)域噪聲。
(2)連通域矩形度η。用來描述河流的矩形特征,設(shè)第i個連通域的矩形度為ηi
式中:Wi,Ll分別為第i個連通域的寬和長;η的取值范圍為(0,1],越接近于0,矩形度越高。認定ηi≤Tη的區(qū)域為河流區(qū)域。
(3)連通域面積與外接連通矩形標記框面積比β。河流具有彎曲細長的特征,連通域矩形框選某一連通域河流時,面積會遠遠大于該矩形框中河流的面積。第i個連通域面積與其外接連通矩形標記框面積比為:
式中:εi為連通域面積;Si為連通域標記框面積,可由Wi和Li相乘得到。
通過設(shè)定Tβ這一閾值來濾除掉不符合該特征的區(qū)域。示意圖如圖5所示。
圖5 連通域與外界矩形面積示意圖Fig.5 Examples of external rectangle area
基于上述特征定義幾何特征濾波器g={l,η,β},對連通域標記后的圖像進行篩選濾除,以得到無噪聲干擾的河流流域圖。
基于高分一號衛(wèi)星獲取的臺山市遙感影像,該影像共有4個波段,空間分辨率為2 m,運用本文設(shè)計的方法進行河流區(qū)域提取并與其他算法進行性能比較和評估。
在幾何特征分析中涉及到的閾值選取對本算法的提取效果至關(guān)重要。這里對幾何特征濾波器各參數(shù)進行討論,尋求最優(yōu)閾值,以獲取最好的提取效果。
河流在連通域中體現(xiàn)為細條狀,由圖6(c)~(f)可知,合理設(shè)置Tl數(shù)值可以有效濾除非河流的小斑點噪聲??紤]到河流受到橫穿公路和橋梁以及周圍面積較大湖泊的影響,因此設(shè)置Tl=100,即連通域長度小于100的將會被當作噪聲濾除。矩形度會濾除因僅考慮連通域長度而忽略掉的方形水田、建筑物等地物。當ηi≥0.6 時能有效濾除方形噪聲且保持河流完整流域,如圖6(g)~(j)所示。連通域面積與外接連通矩形標記框面積比是刻畫連通域在矩形框中的填充度,可以有效濾除彎曲度較小的噪聲,河流連通域在其矩形標記框內(nèi)的所占比一般是一個較小的數(shù)值,βi≥0.35時可以有效濾除山體、矩形水田等地物的干擾,如圖6(k)~(n)所示。
圖6 幾何特征濾波器參數(shù)分析Fig.6 Parameter analysis of Geometric Feature Filter
為了突出本文算法的特點,選取了以下常見方法進行提取結(jié)果對比。包括在遙感影像分割中常用的OTSU 算法、近年來有學(xué)者提出的SWT 算法以及全卷積神經(jīng)網(wǎng)絡(luò)分割方法中的UNet 算法[12]。為了驗證本文算法的普遍適用性,選取了流經(jīng)不同地貌的河流河段。截取的影像大小都為1 500×1 500像素,其中圖1是流經(jīng)林地的河段,河流上方有公路橫穿,公路與河流交接地帶可能對提取產(chǎn)生干擾。圖2 是流經(jīng)城市區(qū)域的河段,此處的樓房依河而建,離河流較近的樓房對河流提取會有一定的干擾。圖3 是流經(jīng)山地區(qū)域的河段,山體陰影對河流提取存在影響。圖4 是流經(jīng)農(nóng)田區(qū)域的河段,水田以及灌溉溝渠對河流提取的影響較大。分別使用的OTSU+GFF、SWT+GFF、U-Net以及本文方法提取對比圖分別如表1的第2~6行所示。
表1 算法提取河流效果對比圖Tab.1 Algorithm to extract river effect comparison
OTSU 結(jié)合GFF 算法能夠提取到完整的河流形狀,但也包含大量的非河流區(qū)域噪聲。將其與幾何濾波器結(jié)合,能夠濾除絕大數(shù)的非河流區(qū)域。但河流在林地區(qū)域的公路、城市區(qū)域的樓房、山地區(qū)域的山體陰影處產(chǎn)生了粘連噪聲,是因為該方法僅考慮了圖像的灰度特征,在有與其灰度相當?shù)匚锏母蓴_時,很難將其分開。
SWT 結(jié)合GFF 算法是依據(jù)圖像中平行的邊緣線進行河流提取的,當截取的河岸一邊有丟失時,會導(dǎo)致該部分的河流無法提取,如表1 第三行第一列流經(jīng)林地區(qū)域的提取圖所示。此外該算法主要依據(jù)的是圖像的邊緣信息,在依河而建的城市區(qū)域以及農(nóng)田區(qū)域,樓房水田、水渠等與河流距離很近,容易產(chǎn)生邊界不明顯的現(xiàn)象,因此很容易出現(xiàn)噪聲。
U-Net 網(wǎng)絡(luò)使用的訓(xùn)練數(shù)據(jù)集是Sentinel II 衛(wèi)星拍攝的位于不同氣候帶的河流影像,包含2982 對400×400 像素的彩色遙感圖像和相應(yīng)的河流標簽,圖像的空間分辨率為10 m。初始學(xué)習(xí)率設(shè)為0.000 01,動量設(shè)為0.9,衰減系數(shù)設(shè)為0.000 000 01,梯度下降法的最小批次設(shè)為2,設(shè)置訓(xùn)練迭代次數(shù)分別為10、50。輸入上述影像對應(yīng)的彩色圖像用得到的訓(xùn)練模型進行分割,結(jié)果顯示當epoch=10 的模型對流經(jīng)林地、城市區(qū)域的河流分割效果較好,河流提取較為完整,但存在少數(shù)粘連噪聲以及少量河岸缺失的現(xiàn)象。耕地區(qū)域的提取結(jié)果中有大量非河流噪聲,而在山地區(qū)域提取失敗。當epoch=50時,流經(jīng)林地、城市區(qū)域的河流出現(xiàn)了過擬合現(xiàn)象,與河流相似地物如湖泊被當作河流提取出來,而此時流經(jīng)山地、耕地區(qū)域的河流得到了近乎完美的提取效果。
本文算法綜合兼顧了遙感影像中河流的紋理、灰度、幾何特征,能夠最大程度的保持河流流域的完整性并能有效抑制其它算法出現(xiàn)的噪聲粘連現(xiàn)象。
在提取到的河流流域圖中自動生成10 000個隨機點,設(shè)N0為河流像元個數(shù),Nr為正確提取的像元個數(shù),Ne為錯誤提取的像元個數(shù),Nl為漏提取像元個數(shù)?;谝陨?個參數(shù),得到兩個定量評價公式。
(1)準確率。
(2)完整度。
根據(jù)上述公式對表1中每一幅圖像分別計算其準確率和完整度,基于隨機點數(shù)的不確定性,進行多次實驗取平均值,結(jié)果如表2所示。
表2 定量分析結(jié)果統(tǒng)計Tab.2 Statistics of quantitative analysis results
從定量分析結(jié)果中可以看出,將本文算法應(yīng)用到四種地形時,無論從準確率還是完整度方面都有明顯的優(yōu)勢。在山地與耕地區(qū)域得到了近乎完美的河流流域,在流經(jīng)林地和城市區(qū)域由于公路和橋梁的影響,導(dǎo)致該方法在斷連處有很小的局部河流信息丟失。OTSU 算法受到灰度近似的橋梁、公路和建筑物的影響,會出現(xiàn)幾個特征濾波器無法濾除的粘連噪聲,因此在林地、城市和山地區(qū)域的準確率不高。而在耕地區(qū)域,OTSU 算法有著不錯的效果,精度和完整度都可達到99%以上。SWT算法受到岸邊水田、灌溉溝渠和樓房的影響,在進行筆畫寬度變換時,與河道構(gòu)建成一個連通域,幾何特征濾波器對該部分噪聲失效,所以該算法在林地、城市和耕地區(qū)域的準確率不高。其中SWT算法在林地區(qū)域的完整度最低,是因為所給圖像缺失了河岸的一邊,而該算法非常依賴邊緣的提取,導(dǎo)致該河段有較多信息丟失。U-Net算法的輸出效果與迭代訓(xùn)練次數(shù)有著密切的聯(lián)系,其中當epoch=10時,流經(jīng)林地、城市的河流都有著不錯的提取效果,但是在山地和耕地區(qū)域的河流提取誤差較大甚至提取失敗。當加大迭代訓(xùn)練次數(shù)后,山地和耕地區(qū)域河流的精確度得到極大的提升,準確率和完整度達到了98%以上。而此時流經(jīng)林地和城市區(qū)域的河流提取結(jié)果中包含了大量湖泊噪聲,致使河流提取的準確率下降。
高分辨率遙感衛(wèi)星圖像中河流有多種特征,本文綜合考慮河流包括紋理、光譜以及幾何3 個方面特征進行驗證分析。選取流經(jīng)不同地貌區(qū)域的河段實驗并進行結(jié)果的定性和定量分析,結(jié)果表明,本文方法是一種適應(yīng)性很強的方法,能夠在不同地貌環(huán)境下準確提取河流。通過與對照組的對比分析,該方法能最大程度減少灰度近似地物以及河岸缺失的影響,有著較好的性能表現(xiàn)。
但是該算法還存在一定的缺陷:一是由于灰度共生矩陣的計算量較大,因此在實驗中的計算速度會比較慢。如何進一步進行圖像預(yù)處理縮減灰度共生矩陣的計算量是下一步要解決的關(guān)鍵問題。二是在幾何特征濾波器的參數(shù)閾值設(shè)定需要人為的干涉與判斷,怎樣自適應(yīng)確定濾波器的參數(shù)是下一步工作的重點。