解全波 劉 榮 張海明 孫國(guó)強(qiáng)
(1. 山東科技大學(xué) 測(cè)繪科學(xué)與工程學(xué)院, 山東 青島 266590; 2. 山東科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 山東 青島 266590; 3. 吉林大學(xué) 地球探測(cè)科學(xué)與技術(shù)學(xué)院, 吉林 長(zhǎng)春 130026)
激光掃描技術(shù)[1]在測(cè)繪、遙感等領(lǐng)域的快速發(fā)展,使得空間數(shù)據(jù)的獲取已經(jīng)由單點(diǎn)、稀疏的數(shù)據(jù)采集模式轉(zhuǎn)變?yōu)檫B續(xù)性強(qiáng)、密集且自動(dòng)的數(shù)據(jù)采集手段,用海量的點(diǎn)云數(shù)據(jù)來(lái)提供更為可靠的測(cè)量數(shù)據(jù)支持,這一變化提高了工作效率和數(shù)據(jù)采集的規(guī)模,同時(shí)使基于點(diǎn)云數(shù)據(jù)的地物分類(lèi)[2]成為點(diǎn)云數(shù)據(jù)精細(xì)化處理[3]和應(yīng)用方面的首要問(wèn)題。
近年來(lái),地物分類(lèi)方法的研究主要集中在對(duì)所獲點(diǎn)云數(shù)據(jù)的分析和提取上,主要的分類(lèi)研究方法有:ELBERINK等[4]基于較為規(guī)則的地表模型高程影像,依據(jù)高程紋理的各項(xiàng)異性特征對(duì)地表上地物進(jìn)行了分類(lèi);為了更好地區(qū)分城市建筑物和植被,通過(guò)對(duì)數(shù)學(xué)形態(tài)理論中的Top-Hat變換得到濾波LiDAR影像進(jìn)行處理實(shí)現(xiàn);楊耘等[5]先將影像按照面向?qū)ο蟮姆指罘椒ǚ殖刹煌难芯繉?duì)象,再利用地表模型和地表信息,基于支持向量機(jī)的分類(lèi)方法完成對(duì)點(diǎn)云的分類(lèi)。董保根[6]提出利用支持向量機(jī)分類(lèi)器和面向?qū)ο蟮姆诸?lèi)方法并提出一種“符合人類(lèi)視覺(jué)”的分類(lèi)精度評(píng)價(jià)標(biāo)準(zhǔn)。劉志青等[7]將信息向量機(jī)、相關(guān)向量機(jī)及支持向量機(jī)分類(lèi)器應(yīng)用到點(diǎn)云數(shù)據(jù)分類(lèi)中,從而達(dá)到分類(lèi)效果。釋小松等[8]利用網(wǎng)格化聚類(lèi)和重采樣方法對(duì)原始點(diǎn)云進(jìn)行壓縮,然后提取多尺度鄰域點(diǎn)云,最后利用改進(jìn)PointNet完成對(duì)點(diǎn)云數(shù)據(jù)的分類(lèi)。
本文將在此基礎(chǔ)上,對(duì)點(diǎn)云數(shù)據(jù)柵格化[9]進(jìn)行研究,利用典型地物分類(lèi)方法和基于支持向量機(jī)的地物分類(lèi)方法對(duì)柵格化后地物進(jìn)行分類(lèi)。通過(guò)對(duì)不同分類(lèi)方法的比較,驗(yàn)證了地物點(diǎn)云數(shù)據(jù)柵格化分類(lèi)的可行性。
由于點(diǎn)云數(shù)據(jù)蘊(yùn)含著豐富的幾何和物理信息,所以確定點(diǎn)云數(shù)據(jù)的某一個(gè)屬性值作為研究對(duì)象,來(lái)分析點(diǎn)云數(shù)據(jù)在不同地物上所呈現(xiàn)出的差異性,并可以基于此確定為柵格影像屬性值。本文通過(guò)對(duì)所獲取點(diǎn)云數(shù)據(jù)的二十余項(xiàng)屬性值,包括全局坐標(biāo)、RGB(紅、綠、藍(lán)三個(gè)顏色,Red、Green、Blue color mode)[10]、反射率[11]、溫度等進(jìn)行分析。研究發(fā)現(xiàn),反射率和RGB值較其他屬性值能夠更好地反映出不同地物的差異。本文通過(guò)對(duì)不同地物、同種地物但顏色不同的兩種情況進(jìn)行反射率和RGB屬性實(shí)驗(yàn),隨機(jī)離散點(diǎn)的兩種指標(biāo)屬性變化趨勢(shì)如圖1(a)、(b)所示。
圖1 兩種指標(biāo)變化趨勢(shì)
從圖1可以直觀(guān)地看出:在不同地物區(qū)域反射率和顏色值都能反映地物的屬性變化,反射率較顏色值對(duì)不同地物的反映更加敏感,區(qū)分得更加明顯。對(duì)于顏色不同的相同地物,顏色值雖然也能反映不同顏色地物之間的差別,但反射率能夠更加細(xì)微地反映出顏色差異。所以本文采用反射率值作為柵格化后柵格影像的屬性指標(biāo)。
柵格數(shù)據(jù)又稱(chēng)為像元結(jié)構(gòu),是一種將地表均勻分為緊密相鄰的網(wǎng)格陣列,將網(wǎng)格作為像素,用行列來(lái)定義同時(shí)具有屬性信息或?qū)傩杂涗浿羔樀臄?shù)據(jù)結(jié)構(gòu)。因此,柵格數(shù)據(jù)具有表示地物或現(xiàn)象的非幾何屬性的優(yōu)勢(shì)。將點(diǎn)要素轉(zhuǎn)換為柵格數(shù)據(jù)后,就可以利用柵格數(shù)據(jù)的特征對(duì)柵格影像加以分類(lèi)和分析。
為了能夠更好地獲得具有較強(qiáng)代表性的地物離散點(diǎn),本文采用等間距法來(lái)獲取標(biāo)準(zhǔn)間距離散點(diǎn)。將所選擇的數(shù)據(jù)按照投影規(guī)則投影到某一個(gè)平面上,本文選擇投影到xoy平面,保留數(shù)據(jù)平面坐標(biāo),即對(duì)數(shù)據(jù)平面化,然后將反射率值作為一項(xiàng)新的屬性值。然后將新生成的點(diǎn)云數(shù)據(jù)即點(diǎn)要素利用ArcGIS轉(zhuǎn)換為柵格數(shù)據(jù),其中將反射率值作為柵格屬性值。柵格化流程如圖2所示。某花壇點(diǎn)云數(shù)據(jù)柵格化后效果如圖3所示,其中地物類(lèi)別為:水泥地面、灰色方磚、花卉。
圖2 柵格化流程圖
圖3 柵格化后數(shù)據(jù)
遙感影像中根據(jù)影像像元的光譜特征差異或空間信息差異實(shí)現(xiàn)對(duì)地物的分類(lèi)方法可主要分為監(jiān)督分類(lèi)[12]和非監(jiān)督分類(lèi)[13]。支持向量機(jī)分類(lèi)[14]算法作為機(jī)器學(xué)習(xí)領(lǐng)域和模式識(shí)別領(lǐng)域的熱門(mén)話(huà)題,因其有效的統(tǒng)計(jì)學(xué)習(xí)方法和小樣本學(xué)習(xí)效率高、推廣性好和抗噪能力強(qiáng)等特點(diǎn)成為遙感影像分析和處理研究方面的熱點(diǎn)。
監(jiān)督分類(lèi)是一種基于先驗(yàn)知識(shí)的分類(lèi)方法,通常又被稱(chēng)為訓(xùn)練場(chǎng)地法。監(jiān)督分類(lèi)是通過(guò)建立辨別函數(shù)來(lái)對(duì)影像進(jìn)行分類(lèi)的,分辨函數(shù)建立的前提是依據(jù)所選取的訓(xùn)練樣本特征確定適宜的分類(lèi)特征參數(shù),使得各類(lèi)樣本的區(qū)分程度盡可能高。監(jiān)督分類(lèi)的方法主要包括馬氏距離法、最大似然法、最小距離法、平行六面體法等。
2.1.1馬氏距離法
馬氏距離法[15]認(rèn)為所研究的不同類(lèi)別地物其協(xié)方差都是相等的,同時(shí)該方法利用了距離分類(lèi)器。距離分類(lèi)器在每個(gè)類(lèi)別統(tǒng)計(jì)信息的方向上非常靈敏。馬氏距離法中的距離定義由于考慮了樣本間的相關(guān)性影響,所以是一種廣義的距離定義方法。由于方差和協(xié)方差已經(jīng)計(jì)算得到,所以?xún)?nèi)部變化較大的類(lèi)產(chǎn)生于內(nèi)部變化較大的聚類(lèi)組。馬氏距離計(jì)算如式(1)所示:
(1)
11月16日,云南電網(wǎng)公司解除了金沙江白格堰塞湖泄洪自然災(zāi)害Ⅱ級(jí)響應(yīng),轉(zhuǎn)入災(zāi)后重建階段。自11月14日金沙江白格堰塞湖潰泄進(jìn)入云南,兩天來(lái),一路氣勢(shì)洶洶,迪慶、麗江遭受重創(chuàng),麗江更是遭遇了有水文記錄以來(lái)的最大洪災(zāi),沿江兩岸數(shù)萬(wàn)名群眾緊急轉(zhuǎn)移安置。
馬氏距離法分類(lèi)的主要步驟可以分為:(1)確定研究區(qū)波段和特征分類(lèi)數(shù),檢查波段和特征分量的位置配準(zhǔn)情況;(2)根據(jù)實(shí)地情況選擇訓(xùn)練區(qū);(3)計(jì)算協(xié)方差矩陣和各類(lèi)均值;(4)確定分類(lèi)半徑,進(jìn)行分類(lèi);(5)將訓(xùn)練區(qū)外像元逐個(gè)帶入計(jì)算公式,根據(jù)分類(lèi)數(shù)確定計(jì)算次數(shù);(6)比較馬氏距離大小,以最大值為準(zhǔn)分出類(lèi)別,終得出分類(lèi)結(jié)果圖;(7)在監(jiān)視器中給各類(lèi)加上不同顏色;(8)結(jié)果檢查,若分類(lèi)錯(cuò)誤較多則重新分類(lèi),直至結(jié)果滿(mǎn)足要求。
2.1.2最大似然法
最大似然法[16]是一種非線(xiàn)性分類(lèi)方法,建立在貝葉斯數(shù)學(xué)準(zhǔn)則之上并假設(shè)影像的各波段類(lèi)別統(tǒng)計(jì)都是正態(tài)分布,它是非線(xiàn)性分類(lèi)方法中錯(cuò)誤率最小的一種分類(lèi)方法。該方法根據(jù)計(jì)算所得的各類(lèi)別的似然度,判斷像素對(duì)于哪類(lèi)似然度最大,從而將該像元分到該類(lèi)。假設(shè)起點(diǎn)訓(xùn)練區(qū)的地物光譜服從正態(tài)分布,根據(jù)樣本數(shù)據(jù)計(jì)算得到各地類(lèi)的方差、均值和協(xié)方差等特征參數(shù),進(jìn)而計(jì)算得到整體的先驗(yàn)概率密度值。最大似然法是建立在數(shù)理統(tǒng)計(jì)學(xué)之上的,利用特征參數(shù)建立辨別規(guī)則函數(shù)集合,根據(jù)函數(shù)集合計(jì)算所研究影像上各類(lèi)像元的歸屬概率。利用最大似然法進(jìn)行地物分類(lèi)基本流程與馬氏距離法相似。
非監(jiān)督分類(lèi)是在假定遙感影像上的同類(lèi)物體在相同條件下具有相同的光譜信息特征下完成的。非監(jiān)督分類(lèi)的方法無(wú)需獲取訓(xùn)練樣本,而是在利用統(tǒng)計(jì)的方法計(jì)算統(tǒng)計(jì)不同地類(lèi)的光譜差異規(guī)律的基礎(chǔ)上實(shí)現(xiàn)對(duì)像元的分類(lèi)。采用聚類(lèi)分析的方法,將影像中的像元按照光譜相似性進(jìn)行分類(lèi),分類(lèi)的規(guī)則是:使屬于同一類(lèi)的像元間的特征距離盡可能小,而屬于不同類(lèi)的像素間的特征距離盡可能大。非監(jiān)督分類(lèi)方法主要包括:K-Means算法和ISODATA算法。
2.2.1 K-Means算法
K-Means算法[17]是一種反復(fù)迭代,最終將像元?dú)w并到附近最為鄰近的地物類(lèi)別中的算法。在計(jì)算獲得初始類(lèi)別值之后,其通過(guò)最小距離準(zhǔn)則的影像所有像素迭代方法,每次迭代都需要利用新的均值來(lái)對(duì)迭代像元進(jìn)行聚類(lèi)。其思路為:任選的K個(gè)初始聚類(lèi)中心,設(shè)定最小距離Di,將每個(gè)樣本按照Di的分配標(biāo)準(zhǔn),分配到K個(gè)聚類(lèi)中的其中之一。然后,逐個(gè)計(jì)算出樣本的均值,并將此均值作為聚類(lèi)的中心,同時(shí)判斷聚類(lèi)是否有變化,若有變化,則重復(fù)以上步驟,直至聚類(lèi)中心穩(wěn)定為止。最后,可以得到聚類(lèi)中心。其計(jì)算公式如下:
Di=min{|x-ci|}i=1,2,3,…,k
(2)
式中,Di為第i個(gè)數(shù)據(jù)集設(shè)定的最小距離,i取自然數(shù),x屬于數(shù)據(jù)集,ci為第i個(gè)數(shù)據(jù)集的聚類(lèi)中心。
2.2.2 ISODATA算法
ISODATA算法[18]是通過(guò)計(jì)算特征空間中均勻分布的類(lèi)別均值,以最小距離為原則將影像中的像元進(jìn)行迭代聚類(lèi)的。每次迭代完成后,需要重新計(jì)算以獲得新的類(lèi)別均值,之后利用新的類(lèi)別均值對(duì)剩余像元進(jìn)行迭代。
支持向量機(jī)分類(lèi)(Support Vector Machines,SVM)算法是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,用來(lái)求解不等式約束下的二次規(guī)劃問(wèn)題,采用結(jié)構(gòu)風(fēng)險(xiǎn)結(jié)構(gòu)最小化(Structural Risk Minimization, SRM)原則,在訓(xùn)練集中構(gòu)造分類(lèi)最優(yōu)超平面。設(shè)分類(lèi)方程為〈Xi·ω〉+b=0,則它要滿(mǎn)足式:
Yi(〈Xi·ω〉+b)-1≥0
(3)
其中Xi,Yi為訓(xùn)練集中任意一點(diǎn)i的平面坐標(biāo)。
由解析幾何可知類(lèi)間隔為D=2/‖ω‖,問(wèn)題轉(zhuǎn)化為φ(ω)=|ω|2/2使函數(shù)最小化,引入拉格朗日函數(shù)求解這一最優(yōu)化問(wèn)題:
(4)
其中αi為拉格朗日乘子,根據(jù)KKT條件,公式(4)中L為訓(xùn)練數(shù)據(jù)集中點(diǎn)到最優(yōu)超平面的距離。這一問(wèn)題的解必須滿(mǎn)足式:
αi{[〈Xi·ω〉+b]Yi-1}=0
(5)
因此所得到判別函數(shù):
(6)
一般情況下,大部分αi將為0,也有一部分不為0,其所對(duì)應(yīng)的樣本就是支持向量,b可由任一支持向量計(jì)算得到。
通常訓(xùn)練樣本集中的支持向量比較少,也就是說(shuō)SVM具有“稀疏性”,因此SVM的分類(lèi)速度較快。SVM的實(shí)質(zhì)在于將輸入空間變換為高維空間,再在高維空間中進(jìn)行線(xiàn)性回歸求取最優(yōu)線(xiàn)性分類(lèi)面,而這種非線(xiàn)性變換是通過(guò)定義適當(dāng)?shù)膬?nèi)積函數(shù)實(shí)現(xiàn)的。
3.1實(shí)驗(yàn)過(guò)程
實(shí)驗(yàn)采用Z+F IMAGER 5010C三維激光掃描儀采集了建筑物墻壁、路面和花壇部分點(diǎn)云數(shù)據(jù),共5個(gè)數(shù)據(jù)集。每個(gè)數(shù)據(jù)集約包含2萬(wàn)點(diǎn),包含方磚、植物等多種地物。掃描儀距離大樓30 m,距離路面、花壇10 m,掃描儀點(diǎn)間距設(shè)為2 cm。
首先將獲取的點(diǎn)云數(shù)據(jù)進(jìn)行去噪處理,去除冗雜點(diǎn)和孤立點(diǎn),保證數(shù)據(jù)質(zhì)量。然后利用等距法獲取標(biāo)準(zhǔn)間距的離散點(diǎn),具體間距的設(shè)置要根據(jù)實(shí)際場(chǎng)景設(shè)置。部分標(biāo)準(zhǔn)間距離散點(diǎn)的選取如圖4所示。
圖4 離散點(diǎn)與參考點(diǎn)點(diǎn)位圖 注:圖中為部分?jǐn)?shù)據(jù)柵格化后點(diǎn)位相對(duì)平面位置圖,橫、縱方向?yàn)閅、X,單位為m
然后將選取的參考點(diǎn)柵格化,生成柵格影像。柵格化后的部分?jǐn)?shù)據(jù)如圖5所示。地物包括巖石背景墻、綠植和陶瓷花盆。
圖5 數(shù)據(jù)柵格化后影像
將生成的柵格影像分別用馬氏距離法、最大似然法、K-Means算法、ISODATA算法、SVM進(jìn)行分類(lèi)。各方法對(duì)場(chǎng)景分類(lèi)后的結(jié)果如圖6所示。
圖6 各方法分類(lèi)后結(jié)果
經(jīng)實(shí)驗(yàn)發(fā)現(xiàn),相比于其他分類(lèi)方法,基于支持向量機(jī)的圖像分類(lèi)方法,其分類(lèi)器結(jié)構(gòu)簡(jiǎn)單、容易訓(xùn)練且分類(lèi)精度高。在選取合適參數(shù)的情況下,最大似然法和馬氏距離法分類(lèi)的精度低于支持向量機(jī)分類(lèi)。對(duì)各分類(lèi)方法的影像分類(lèi)結(jié)果進(jìn)行精度評(píng)價(jià)的方法是通過(guò)混淆矩陣來(lái)表示分類(lèi)的精度?;煜仃囍兴脑u(píng)價(jià)指標(biāo)包括總體分類(lèi)精度、Kappa系數(shù)、錯(cuò)誤分差、錯(cuò)誤分差、制圖精度、用戶(hù)精度六類(lèi),本文通對(duì)比較混淆矩陣中總體分類(lèi)精度和Kappa系數(shù)的值得到分類(lèi)算法之間精度差異。各分類(lèi)方法混淆矩陣如表1所示,各分類(lèi)方法精度對(duì)比如表2所示。
通過(guò)分類(lèi)結(jié)果可以得出,支持向量機(jī)的地物分類(lèi)方法有較高的分類(lèi)精度和訓(xùn)練速度,與傳統(tǒng)分類(lèi)方法相比,支持向量機(jī)的分類(lèi)方法在分類(lèi)精度高的同時(shí)具有適應(yīng)能力強(qiáng)、漏分和錯(cuò)分現(xiàn)象少、穩(wěn)定性好等優(yōu)勢(shì)。通過(guò)實(shí)驗(yàn)可以看出,基于遙感影像的地物分類(lèi)方法同樣適用于點(diǎn)云數(shù)據(jù)柵格化后生成的柵格影像數(shù)據(jù),并且各方法對(duì)柵格影像的分類(lèi)精度較高,具有很強(qiáng)的可行性和適用性。
表1 各分類(lèi)方法混淆矩陣 單位:個(gè)
表2 各分類(lèi)方法精度對(duì)比
本文通過(guò)對(duì)點(diǎn)云數(shù)據(jù)的研究,提出一種利用柵格化后點(diǎn)云數(shù)據(jù)反射率信息進(jìn)行地物分類(lèi)的方法,用于激光點(diǎn)云數(shù)據(jù)的分類(lèi)。通過(guò)研究,將采集的點(diǎn)云數(shù)據(jù)利用等距法獲取標(biāo)準(zhǔn)間距離散點(diǎn),然后將數(shù)據(jù)柵格化,并把點(diǎn)云數(shù)據(jù)的反射率信息作為柵格化后柵格影像的屬性信息。用傳統(tǒng)的分類(lèi)方法和支持向量機(jī)分類(lèi)方法對(duì)柵格化后的數(shù)據(jù)進(jìn)行地物分類(lèi),從實(shí)驗(yàn)中可以看出,適用于遙感影像地物分類(lèi)的方法同樣能夠適用于點(diǎn)云數(shù)據(jù)柵格化后的柵格影像,這為點(diǎn)云數(shù)據(jù)的分類(lèi)提供了一種可行的分類(lèi)新途徑。