梅佳成,劉磊,尹春濤,張群佳,王樂(lè)
1) 長(zhǎng)安大學(xué)地球科學(xué)與資源學(xué)院,西安,710054;2) 自然資源部黃河上游戰(zhàn)略性礦產(chǎn)資源重點(diǎn)實(shí)驗(yàn)室,蘭州,730046
內(nèi)容提要:遙感巖性制圖是地質(zhì)填圖中的重要工作,基于光譜特征的巖性分類易受到色調(diào)、紋理等因素影響導(dǎo)致精度不佳。前人進(jìn)行巖性自動(dòng)分類研究多關(guān)注影像的光譜特征,而忽略空間特征,筆者等基于甘肅北山白峽尼山地區(qū)ASTER影像,將支持向量機(jī)、極限學(xué)習(xí)機(jī)兩種機(jī)器學(xué)習(xí)分類方法與基于空間特征的快速漂移算法相結(jié)合進(jìn)行巖性分類。結(jié)果表明支持向量機(jī)分類總體精度為89.17%;極限學(xué)習(xí)機(jī)不但具有需調(diào)節(jié)參數(shù)少的優(yōu)勢(shì),且分類精度和速度均優(yōu)于支持向量機(jī),分類總體精度達(dá)96.70%;利用快速漂移算法提取的影像空間特征可有效減少錯(cuò)分區(qū),提升巖性分類效果。研究證實(shí)將基于光譜特征的極限學(xué)習(xí)機(jī)和基于空間特征的快速漂移算法結(jié)合的巖性分類方法具有客觀、高效、高精度等優(yōu)勢(shì),可為后續(xù)地質(zhì)填圖和找礦勘查工作提供可靠數(shù)據(jù)支撐,在遙感巖性分類領(lǐng)域具有較高的推廣價(jià)值。
區(qū)域地質(zhì)調(diào)查是地質(zhì)研究的基礎(chǔ)性工作,對(duì)于我國(guó)西北、西南等人跡罕至的戈壁、高原地區(qū),傳統(tǒng)地質(zhì)填圖方法工作難度較大(李雋輝等,2022)。無(wú)人機(jī)可獲得高精度影像,可以滿足大比例尺精細(xì)填圖工作的需要(鄭明等,2022)。
而遙感以其宏觀、高效、多尺度、多層次等優(yōu)勢(shì),在區(qū)域地質(zhì)調(diào)查、礦產(chǎn)資源勘察等方面具有更重要的作用 (鄒鍵等,2022)。
先進(jìn)星載熱輻射與反射輻射計(jì)(Advanced Spaceborne Thermal Emission and Reflection Radiometer, ASTER)具有較高空間分辨率及14個(gè)波段,在巖性、礦物識(shí)別領(lǐng)域具有獨(dú)特的優(yōu)勢(shì),已被用于區(qū)分方解石和白云石(Rowan et al., 2005)、提取矽卡巖化等蝕變異常信息(孟鵬燕等,2016)、識(shí)別與沉積巖有關(guān)鉛鋅礦含礦層位(劉磊等,2022)、解譯鎂鐵—超鎂鐵巖體(Liu Lei et al., 2014)。
機(jī)器學(xué)習(xí)是利用人工智能技術(shù),通過(guò)訓(xùn)練樣本對(duì)數(shù)學(xué)模型進(jìn)行訓(xùn)練,然后用訓(xùn)練完成的模型依據(jù)特征參數(shù)將遙感圖像中的像元點(diǎn)進(jìn)行逐像元分類(Biamonte et al., 2017)。支持向量機(jī)(Support Vector Machines, SVM)、極限學(xué)習(xí)機(jī)(Extreme Learning Machines, ELM)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)等機(jī)器學(xué)習(xí)算法日漸成熟,已被用于遙感巖性分類研究。與最小距離分類法、最大似然分類法、光譜角度制圖等傳統(tǒng)方法進(jìn)行對(duì)比,SVM算法在巖性分類中可獲得較傳統(tǒng)方法更高的精度(馬德鋒等,2008),在印度西北部ASTER數(shù)據(jù)巖性自動(dòng)分類研究表明SVM算法分類精度高、分類效果好(Yu et al., 2012)。SVM具有所需參數(shù)和訓(xùn)練樣本少、分類精度高等優(yōu)勢(shì),但存在參數(shù)確定困難、消耗時(shí)間長(zhǎng)和運(yùn)行效率低等問(wèn)題,而ELM作為一種單層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,在準(zhǔn)確性、學(xué)習(xí)速度和計(jì)算可擴(kuò)展性方面均較SVM更具優(yōu)勢(shì)(Heras et al., 2014; Ayerdi et al., 2015; 牟多鐸等,2019)。以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為基礎(chǔ)提出的具有長(zhǎng)短期記憶的分層空間—光譜特征提取(HSS—LSTM)模型,在內(nèi)華達(dá)州礦區(qū)機(jī)載可見(jiàn)光/紅外成像光譜儀(AVIRIS)收集的高光譜數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,HSS—LSTM的分類準(zhǔn)確性很高,分類效果較好(Zhao Huijie et al., 2020)。簡(jiǎn)單線性迭代聚類卷積神經(jīng)網(wǎng)絡(luò)(SLIC—CNN)算法,在遼寧省興城市無(wú)人機(jī)采集的常規(guī)RGB影像數(shù)據(jù)的分類實(shí)驗(yàn)中表現(xiàn)良好,分類準(zhǔn)確性較高(Sang Xuejia et al., 2020)。
但是,上述遙感巖性分類方法多僅利用巖石的光譜特征,缺少有效融合巖石空間特征和光譜特征的綜合性分析方法。不同巖石在影像上色調(diào)、地貌、紋理、表面粗糙度及密度等均存在明顯差異,將空間特征與光譜特征結(jié)合進(jìn)行遙感巖性分類可有效提高分類結(jié)果精度(王建剛等,2020)。
筆者等以甘肅北山白峽尼山地區(qū)為研究區(qū)(圖1a),以ASTER影像為數(shù)據(jù)源,融合巖性的空間特征和光譜特征,基于機(jī)器學(xué)習(xí)算法對(duì)不同巖性進(jìn)行自動(dòng)分類,形成高效、準(zhǔn)確的巖性分類方法,為西部基巖裸露區(qū)巖性自動(dòng)填圖工作提供技術(shù)支撐。
圖1 甘肅北山地區(qū)位置圖(a) 以及北山白峽尼山地區(qū)地質(zhì)圖(b)(據(jù)1∶50000地質(zhì)圖和遙感影像修編)Fig.1 Location map of the study area(a) and geological map of Baixiani Mountain, Beishan Mountains(b) (revised from 1∶50000 geological map and remote sensing image)Q—第四系沖積、洪積砂礫;P2j—二疊系金塔組玄武巖、安山巖;D3dn—泥盆系墩墩山群灰綠色斜長(zhǎng)流紋巖;奧陶系花牛山群: O1-2hnc-1—上巖組淺色云母石英片巖, O1-2hnc-2—上巖組深色云母石英片巖, O1-2hnb—中巖組片巖夾大理巖、石英巖;—印支期肉紅色花崗巖;印支期磚紅色黑云母花崗巖;γ—印支期黑云母花崗巖蝕變巖;π—華力西期肉紅色似斑狀花崗巖;δ—華力西期花崗閃長(zhǎng)巖;δ—華力西期片麻狀石英閃長(zhǎng)巖、二長(zhǎng)閃長(zhǎng)巖;華力西期閃長(zhǎng)巖;—華力西期淺色輝長(zhǎng)巖;—華力西期深色輝長(zhǎng)巖;γ—加里東期花崗閃長(zhǎng)巖、石英閃長(zhǎng)巖;βμ—輝綠巖脈Q—Quaternary alluvial and diluvial gravel; P2j—Permian basalt and andesite of Jinta Group; D3dn—Devonian gray-green plagioclase rhyolite of Dundunshan Group; Ordovician Huaniushan Group: O1-2hnc-1— light mica quartz schist of Upper Rock Formation, O1-2hnc-2—dark mica quartz schist of Upper Rock Formation, O1-2hnb— schist with marble and quartzite of Middle Rock Formation; granodiorite, quartz diorite; βμ—Diabase dike
北山造山帶位于中亞造山帶南緣及華北板塊、塔里木板塊、西伯利亞板塊的交匯部位,是研究中亞造山帶造山作用和演化的關(guān)鍵部位之一(楊建國(guó)等,2012)。甘肅北山地區(qū)侵入巖出露廣泛,已發(fā)現(xiàn)大小鎂鐵—超鎂鐵巖體70余個(gè),相對(duì)以鎂鐵巖體占優(yōu)勢(shì),超鎂鐵巖類大多與鎂鐵巖呈雜巖體的形式產(chǎn)出(李舢等,2011;劉磊等,2013)。
北山地區(qū)巖漿活動(dòng)頻繁,區(qū)域構(gòu)造演化各階段均有不同規(guī)模、不同類型、不同成因的巖漿巖形成,發(fā)育有大面積的侵入巖體,巖性主要為輝長(zhǎng)巖、閃長(zhǎng)巖、花崗閃長(zhǎng)巖、花崗巖等。已有鋯石年代學(xué)研究表明,北山地區(qū)古生代存在至少兩期基性—中基性巖漿活動(dòng),其中均伴隨著大量的花崗質(zhì)巖漿活動(dòng)(呂新彪等,2012)。區(qū)內(nèi)巖漿巖具有多成因、多期次、復(fù)雜等特征,且?guī)r漿巖分布廣泛,種類眾多。
白峽尼山地區(qū)位于北山地區(qū)西南部,區(qū)內(nèi)地層有奧陶系中下統(tǒng)花牛山群上巖組、奧陶系中下統(tǒng)花牛山群中巖組、泥盆系上統(tǒng)墩墩山群以及第四系全新統(tǒng)(圖1)。區(qū)內(nèi)巖漿巖種類多樣(圖2),主要有印支期磚紅色黑云母花崗巖、肉紅色似斑狀花崗巖、花崗閃長(zhǎng)巖、片麻狀石英閃長(zhǎng)巖、二長(zhǎng)閃長(zhǎng)巖,華力西期閃長(zhǎng)巖、輝長(zhǎng)巖,加里東期花崗閃長(zhǎng)巖、石英閃長(zhǎng)巖。研究區(qū)南部有少量變質(zhì)巖出露,主要為云母石英片巖和片巖夾大理巖、石英巖(圖1)。研究區(qū)內(nèi)構(gòu)造變形強(qiáng)烈,斷層較為發(fā)育,以北西西、北東東向斷層為主。白峽尼山地區(qū)干旱少雨,植被稀少,基巖出露面積大,巖性種類復(fù)雜多樣,是遙感地質(zhì)研究的理想?yún)^(qū)域。
圖2 甘肅北山地區(qū)安山巖與二長(zhǎng)花崗巖界線 (a) 和花崗閃長(zhǎng)巖與閃長(zhǎng)巖界線(b)Fig.2 Boundary between andesite and monzogranite (a) and between granodiorite and diorite (b) in the Beishan Mountains
ASTER影像的優(yōu)勢(shì)在于14個(gè)波段數(shù)的設(shè)置能夠更好的用于地質(zhì)體識(shí)別。其中可見(jiàn)光—近紅外(Near Infrared, VNIR)區(qū)間有3個(gè)波段,空間分辨率為15 m;短波紅外(Shortwave Infrared, SWIR)6個(gè)波段,空間分辨率為30 m;熱紅外(Thermal Infrared, TIR)區(qū)間5個(gè)波段,空間分辨率為90 m(唐淑蘭等,2021)。本研究選取的ASTER數(shù)據(jù)獲取于2003年4月7日,數(shù)據(jù)級(jí)別為L(zhǎng)1B,將ASTER可見(jiàn)光—近紅外和短波紅外9波段數(shù)據(jù)重采樣至15 m。
基于野外實(shí)測(cè)標(biāo)準(zhǔn)地物光譜,采用回歸分析法對(duì)原始影像數(shù)據(jù)進(jìn)行大氣校正,消除大氣和光照所引起的輻射畸變;利用地形圖和野外GPS定位點(diǎn)對(duì)影像進(jìn)行幾何校正并將影像裁剪至研究區(qū)范圍。
根據(jù)地物在不同波段反射或發(fā)射波譜的差異選取合適的波段進(jìn)行比值運(yùn)算,可以增強(qiáng)各巖性間的波譜差異。本研究通過(guò)分析各巖性光譜曲線(圖3),選取1/4、2/5、8/5波段比值組合進(jìn)行假彩色合成,該影像中不同巖性差異明顯,基于該影像開(kāi)展遙感地質(zhì)解譯,獲得了研究區(qū)遙感解譯地質(zhì)圖(圖1),作為后續(xù)分類評(píng)價(jià)的基準(zhǔn)。
圖3 甘肅北山地區(qū)典型巖性光譜曲線Fig.3 Spectral curves of typical lithology in the Beishan Mountains
支持向量機(jī)(SVM)是一種有監(jiān)督的學(xué)習(xí)模型,為解決線性問(wèn)題,SVM會(huì)在特征空間中兩種類別最鄰近的訓(xùn)練樣本之間,找出一個(gè)能使兩種類別邊緣間隔最大化的分離超平面;對(duì)于非線性問(wèn)題,SVM可通過(guò)非線性變換將數(shù)據(jù)投影至高維特征空間中,轉(zhuǎn)化為高維空間的線性支持向量機(jī)求解對(duì)偶問(wèn)題(Ghoddusi et al., 2019; 牟多鐸等,2019)。極限學(xué)習(xí)機(jī)(ELM)是由輸入層、隱藏層和輸出層等簡(jiǎn)單3層結(jié)構(gòu)所構(gòu)成的單隱藏層前饋神經(jīng)網(wǎng)絡(luò),只需要設(shè)置隱藏層節(jié)點(diǎn)的數(shù)量,無(wú)需改變隱藏層的輸入權(quán)值和閾值,最終會(huì)產(chǎn)生一個(gè)最優(yōu)解,因而極限學(xué)習(xí)機(jī)對(duì)新樣本適應(yīng)能力較好,學(xué)習(xí)速度較快(Huang Guangbin et al. 2008)。SVM和ELM已成為目前機(jī)器學(xué)習(xí)算法中應(yīng)用最廣泛的自動(dòng)分類方法(Jordan et al., 2015; 牟多鐸等,2019)。因此,本研究重點(diǎn)利用SVM和ELM開(kāi)展ASTER影像巖性分類對(duì)比,并融合巖性的空間特征和光譜特征,分析空間特征對(duì)巖性分類的作用,最終形成高效、準(zhǔn)確的巖性分類方法。
本研究中空間特征采用快速漂移算法(Quick Shift, QS)獲取,快速漂移算法能夠在影像的空間和光譜聯(lián)合域進(jìn)行分割得到便于后續(xù)處理的超像素。
快速漂移算法的原理是基于一個(gè)迭代的模式搜索,識(shí)別模式中的一組數(shù)據(jù)點(diǎn)。模式被定義為某一特征空間中由所有數(shù)據(jù)點(diǎn)組成的最密集的位置。給定N個(gè)數(shù)據(jù)點(diǎn)x1,x2,...,xN∈X?Rd,快速漂移算法首先計(jì)算Parzen密度估計(jì):
(1)
其中k(x)是核函數(shù),D(xi,xj)是數(shù)據(jù)點(diǎn)xi和xj之間的距離。然后,它將核函數(shù)的中心移動(dòng)到xi的最鄰近處,以便將搜索路徑擴(kuò)展到下一個(gè)數(shù)據(jù)點(diǎn)。在該點(diǎn)處存在遞增的密度P:
(2)
arg minD(xi,xj)表示要找到使得距離函數(shù)D(xi,xj) 取得最小值的(xi,xj)值。當(dāng)所有數(shù)據(jù)點(diǎn)彼此連接時(shí),使用閾值來(lái)分離模式,然后可以分離數(shù)據(jù)點(diǎn)的不同聚類(Zhang Sanxing et al., 2020)。
該算法將所有數(shù)據(jù)點(diǎn)依其概率密度連接為一棵“樹(shù)”,模態(tài)表現(xiàn)為這棵“樹(shù)”上“長(zhǎng)度”(概率密度和距離的函數(shù))超過(guò)閾值τ的“樹(shù)枝”,通過(guò)設(shè)置τ可以控制模態(tài)的選擇(圖4)。σ參數(shù)的選擇可平衡“過(guò)分割”與“欠分割”現(xiàn)象使得模式搜索更加高效(祝鵬飛等,2011; Tariq et al., 2019)。
圖4 Quick Shift算法示意圖Fig.4 Schematic diagram of Quick Shift algorithm
巖性分類基于Linux系統(tǒng)HypeRvieW軟件實(shí)現(xiàn)(Garea et al., 2016),分類過(guò)程如下:①將ASTER多光譜數(shù)據(jù)在MATLAB中轉(zhuǎn)換為三維矩陣形式,導(dǎo)入HypeRvieW中作為待分類數(shù)據(jù);②將訓(xùn)練樣本轉(zhuǎn)換為矩陣形式,導(dǎo)入HypeRvieW中作為訓(xùn)練集;③分別選擇SVM和ELM兩種分類算法進(jìn)行基于光譜特征的巖性自動(dòng)分類;④應(yīng)用快速漂移算法基于空間特征進(jìn)行分類,運(yùn)用最大投票法將基于光譜特征分類和空間特征分類的結(jié)果進(jìn)行結(jié)合;⑤運(yùn)用空間正則化對(duì)分類結(jié)果進(jìn)行平滑處理(Ayerdi et al., 2015);⑥基于驗(yàn)證樣本對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)。
樣本選取是進(jìn)行機(jī)器學(xué)習(xí)巖性分類的前提,需兼顧巖性樣本的代表性、完整性和不同類別間的高可分離度。對(duì)選取的樣本,隨機(jī)選取70%作為訓(xùn)練集以訓(xùn)練判別函數(shù),30%作為驗(yàn)證集對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)(表1)。
利用總體精度(Overall Accuracy,OA)、分配不一致性(Allocation Disagreement,AD)和運(yùn)行時(shí)間對(duì)分類結(jié)果進(jìn)行評(píng)價(jià)。其中,OA是模型在所有類別訓(xùn)練集中預(yù)測(cè)正確的數(shù)量與總數(shù)量間的比值,越接近100%表明分類結(jié)果越精確。AD為參考圖與比較圖之間的分配差異量,這種差異是由類別的空間分配中非最佳匹配造成的(Pontius et al., 2011),數(shù)值越小表明錯(cuò)分越少,分類精度越高。運(yùn)行時(shí)間用來(lái)評(píng)價(jià)模型的運(yùn)行效率,如果模型兼具高精度和高效率,則該分類方法更具應(yīng)用前景。
3.2.1支持向量機(jī)分類實(shí)驗(yàn)
SVM分類需設(shè)置γ值和懲罰參數(shù)C,γ值是高斯徑向基核函數(shù)(Radial Basis Function, RBF)自帶的超參數(shù),表示單個(gè)訓(xùn)練樣本點(diǎn)的影響半徑,懲罰參數(shù)C代表的是軟間隔非線性支持向量機(jī)中對(duì)誤差的寬容程度(Garea et al., 2016),經(jīng)多次實(shí)驗(yàn)對(duì)比研究發(fā)現(xiàn),當(dāng)γ值設(shè)為0.125懲罰參數(shù)設(shè)C為128時(shí),分類效果較好。圖5b為SVM分類結(jié)果,與遙感解譯結(jié)果(圖5a)對(duì)比表明玄武巖與安山巖,片巖夾大理巖與石英巖,磚紅色黑云母花崗巖,片麻狀石英閃長(zhǎng)巖與二長(zhǎng)閃長(zhǎng)巖,淺色輝長(zhǎng)巖以及深色輝長(zhǎng)巖的空間展布與解譯結(jié)果高度吻合;淺色云母石英片巖,深色云母石英片巖,石英閃長(zhǎng)巖,閃長(zhǎng)巖以及肉紅色花崗巖的空間展布與解譯結(jié)果基本吻合,略有差異;花崗閃長(zhǎng)巖與肉紅色似斑狀花崗巖的空間展布則與解譯結(jié)果有較大差異。
圖5 甘肅北山地區(qū)遙感影像及分類結(jié)果圖: (a)遙感影像圖[RGB(1/4、2/5、8/5)],(b)支持向量機(jī)分類結(jié)果圖,(c)極限學(xué)習(xí)機(jī)分類結(jié)果圖,(d)極限學(xué)習(xí)機(jī)+快速漂移算法分類結(jié)果圖Fig.5 Remote sensing image and the classification results of the Beishan Mountains: (a) remote sensing image [RGB(1/4、2/5、8/5)]; (b) support vector machine classification result; (c) extreme learning machine classification result; (d) classification result of extreme learning machine with quick shift drift algorithmQ—第四紀(jì)沖積、洪積砂礫;P2j—二疊系金塔組玄武巖、安山巖;D3dn—泥盆系墩墩山群灰綠色斜長(zhǎng)流紋巖;奧陶系花牛山群: O1-2hnc-1—上巖組淺色云母石英片巖, O1-2hnc-2—上巖組深色云母石英片巖, O1-2hnb—中巖組片巖夾大理巖、石英巖;—印支期肉紅色花崗巖;γ—印支期磚紅色黑云母花崗巖;γ—印支期黑云母花崗巖蝕變巖;π—華力西期肉紅色似斑狀花崗巖;δ—華力西期花崗閃長(zhǎng)巖;δ—華力西期片麻狀石英閃長(zhǎng)巖、二長(zhǎng)閃長(zhǎng)巖;—華力西期閃長(zhǎng)巖;—華力西期淺色輝長(zhǎng)巖;華力西期深色輝長(zhǎng)巖;γ—加里東期花崗閃長(zhǎng)巖、石英閃長(zhǎng)巖;βμ—輝綠巖脈Q—Quaternary alluvial and diluvial gravel; P2j—Permian basalt and andesite of Jinta Group; D3dn—Devonian gray-green plagioclase rhyolite of Dundunshan Group; Ordovician Huaniushan Group: O1-2hnc-1—light mica quartz schist of Upper Rock Formation, O1-2hnc-2—dark mica quartz schist of Upper Rock Formation, O1-2hnb—schist with marble and quartzite of Middle Rock Formation; granodiorite, quartz diorite; βμ—Diabase dike
SVM分類結(jié)果的OA為89.17%,總體而言分類效果較好、分類精度較高,但是也存在一些的問(wèn)題。首先,分類圖中存在非常多的離散點(diǎn)和小斑塊,部分小斑塊會(huì)對(duì)較大且連續(xù)的巖體進(jìn)行切割,使得圖面顯得較為凌亂。其次,對(duì)花崗閃長(zhǎng)巖的分類結(jié)果也不夠理想,以目視解譯結(jié)果相比,支持向量機(jī)將大面積花崗閃長(zhǎng)巖錯(cuò)分為其他類型,可能是由于花崗閃長(zhǎng)巖與云母石英片巖光譜較為相似導(dǎo)致的,如圖6a和圖6b所示。與目視解譯進(jìn)行對(duì)比,支持向量機(jī)對(duì)云母石英片巖、石英閃長(zhǎng)巖和片麻狀石英閃長(zhǎng)巖、二長(zhǎng)閃長(zhǎng)巖的區(qū)分能力較弱,出現(xiàn)較多錯(cuò)分和漏分現(xiàn)象,如圖6d和圖6e所示。最后,支持向量機(jī)分類所需要的時(shí)間也較長(zhǎng),需要128.9410 s。
圖6 分類結(jié)果局部對(duì)比圖(圖例參見(jiàn)圖5): (a) 目視解譯西側(cè)局部圖; (b) SVM西側(cè)局部圖; (c) ELM西側(cè)局部圖; (d) 目視解譯東側(cè)局部圖; (e) SVM東側(cè)局部圖; (f) ELM東側(cè)局部圖Fig.6 Comparison among the geologic map and classification results for local areas (Refer to Fig.5 for the legend): (a) visually interpret the west side partial map; (b) the west side partial map of SVM; (c) the west side partial map of ELM; (d) visually interpret the east side partial map; (e) the east side partial map of SVM; (f) the east side partial map of ELM
3.2.2極限學(xué)習(xí)機(jī)分類實(shí)驗(yàn)
極限學(xué)習(xí)機(jī)算法由Linux系統(tǒng)中的HypeRvieW軟件實(shí)現(xiàn)(Garea et al., 2016),極限學(xué)習(xí)機(jī)只需設(shè)定隱藏層神經(jīng)元的數(shù)目,即可以計(jì)算輸出矩陣和輸出層權(quán)值,得到該情況下分類的最優(yōu)解。為研究隱藏層神經(jīng)元數(shù)目對(duì)分類準(zhǔn)確度的影響,從OA、AD和時(shí)間這3個(gè)不同的角度對(duì)分類結(jié)果進(jìn)行對(duì)比和評(píng)價(jià),其結(jié)果如圖7所示。
圖7 極限學(xué)習(xí)機(jī)參數(shù)尋優(yōu)Fig.7 Parameter optimization of extreme learning machine
圖7為極限學(xué)習(xí)機(jī)參數(shù)尋優(yōu)結(jié)果圖,從圖7中可以看出,當(dāng)隱藏層神經(jīng)元數(shù)目小于120或大于500的時(shí)候,OA較低,而且AD較高,分類精度不理想。當(dāng)隱藏層神經(jīng)元數(shù)目在200到400之間時(shí),OA高于92%,而且AD小于4%,分類精度較為理想。隨著隱藏層神經(jīng)元數(shù)目增加,分類所需要的時(shí)間大致呈線性增加。綜合考慮以上情況,將隱藏層神經(jīng)元數(shù)目選擇為360,既有很高的分類精度,而且分類時(shí)間也較短。
圖5c為ELM分類結(jié)果,與遙感解譯結(jié)果(圖5a)對(duì)比表明二者分類界線輪廓幾乎完全一致,每一個(gè)巖性單元的空間展布極為相似。與支持向量機(jī)相比,極限學(xué)習(xí)機(jī)的分類準(zhǔn)確度提高顯著,如表2所示,OA提高了近8%,AD則下降近5%,顯然極限學(xué)習(xí)機(jī)相對(duì)于支持向量機(jī)而言,具有更高的制圖準(zhǔn)確度。
表2 SVM算法與ELM算法分類結(jié)果對(duì)比表Table 2 Comparison of classification results between SVM algorithm and ELM algorithm
而且,對(duì)于支持向量機(jī)所存在的問(wèn)題,極限學(xué)習(xí)機(jī)都有了不小的改善。首先圖面中的離散點(diǎn)和小斑塊明顯減少。其次,對(duì)于花崗閃長(zhǎng)巖的分類結(jié)果與目視解譯結(jié)果基本一致,錯(cuò)分現(xiàn)象明顯減少(圖6c)。最后,極限學(xué)習(xí)機(jī)分類所需要的時(shí)間更是大大減少,僅僅需要22.78 s,速度提高了將近六倍。但是極限學(xué)習(xí)機(jī)分類結(jié)果圖中的離散點(diǎn)和小斑塊數(shù)量仍然很多,這與實(shí)際不符,而且會(huì)明顯降低圖面的協(xié)調(diào)性和美觀性(圖5c)。
為解決極限學(xué)習(xí)機(jī)存在的問(wèn)題,引入快速漂移算法,利用快速漂移算法對(duì)遙感影像的空間特征進(jìn)行分類??焖倨扑惴ㄓ笑抑岛挺又祪蓚€(gè)參數(shù),增加σ值會(huì)產(chǎn)生較為粗略的分類圖,增加τ值會(huì)增加每個(gè)區(qū)域的平均大小。對(duì)比研究發(fā)現(xiàn),選取σ值為6和τ值為2時(shí),對(duì)影像的分類效果最好。
在完成對(duì)空間特征的分類之后,引入快速漂移算法對(duì)空間特征進(jìn)行分類,并結(jié)合最大投票法將極限學(xué)習(xí)機(jī)分類結(jié)果與之結(jié)合,最終分類的結(jié)果的準(zhǔn)確度稍有下降,但是從整體圖面效果來(lái)看,圖面中的小斑塊減少了很多,圖面更加整潔美觀。而且,快速漂移算法和最大投票法所需時(shí)間僅有小幅度的增加,引入空間特征,即提升了巖性制圖的效果又兼顧了制圖效率。
圖5d為ELM+QS分類結(jié)果,與ELM分類結(jié)果(圖5c)對(duì)比表明二者整體一致,僅僅在小部分區(qū)域有微小差異;將二者與遙感解譯結(jié)果(圖5a)對(duì)比表明ELM+QS分類結(jié)果不僅整體空間展布與解譯結(jié)果極為相似,而且在細(xì)節(jié)方面吻合度更高(圖8),在ELM+QS分類結(jié)果圖中,圖面中的離散點(diǎn)基本消失,小斑塊數(shù)量也顯著減少,與解譯圖相似度更高。如表3所示,ELM+QS分類結(jié)果與ELM分類結(jié)果相比,ELM+QS分類結(jié)果的OA稍有降低,但是整體制圖效果與遙感解譯結(jié)果更為相似,而且總處理時(shí)間只有小幅度增長(zhǎng)。
表3 ELM算法與ELM+QS算法分類結(jié)果對(duì)比表Table 3 Comparison table of classification results between ELM Algorithm and ELM+QS Algorithm
圖8 ELM與ELM+QS局部圖(圖例參見(jiàn)圖5): (a) ELM算法結(jié)果局部; (b) ELM+QS算法結(jié)果局部Fig.8 Partial diagram of classification results of ELM and ELM+QS (See figure 5 for the legend): (a) the result of ELM algorithm is local; (b) the result of ELM+QS algorithm is local
為驗(yàn)證巖性自動(dòng)分類的準(zhǔn)確性,在甘肅北山白峽尼山地區(qū)進(jìn)行實(shí)地驗(yàn)證,對(duì)研究區(qū)內(nèi)22個(gè)典型點(diǎn)位進(jìn)行驗(yàn)證,其中21個(gè)點(diǎn)位的巖性與自動(dòng)分類結(jié)果一致,僅1個(gè)點(diǎn)位巖性與自動(dòng)分類結(jié)果有差別。部分驗(yàn)證點(diǎn)信息如圖9所示,驗(yàn)證點(diǎn)位置見(jiàn)圖6。驗(yàn)證點(diǎn)R4為石英閃長(zhǎng)巖與北側(cè)深色云母石英片巖的界線,實(shí)地照片如圖9a所示;驗(yàn)證點(diǎn)R26被分類為深色云母石英片巖,實(shí)地驗(yàn)證其巖性為云母石英片巖,實(shí)地照片如圖9b所示。驗(yàn)證結(jié)果表明,解譯的地質(zhì)界線是客觀存在的,而且與ELM+QS分類結(jié)果基本一致,基于光譜—空間的自動(dòng)分類方法準(zhǔn)確度較高。
圖9 甘肅北山白峽尼山地區(qū)驗(yàn)證照片: (a) 驗(yàn)證點(diǎn)R4處火成巖與北側(cè)變質(zhì)巖顏色明顯差異;(b)驗(yàn)證點(diǎn)R26處深色石英閃長(zhǎng)巖Fig.9 Field verification photos of Baixiani Mountain, Beishan Mountains: (a) obvious color difference between igneous rock at verification point R4 and metamorphic rock on the north side; (b) dark quartz diorite at verification point R26
為了對(duì)比機(jī)器學(xué)習(xí)方法與傳統(tǒng)分類方法間巖性分類精度的優(yōu)劣,本研究應(yīng)用最大似然分類法、最小距離分類法等傳統(tǒng)方法進(jìn)行巖性分類,并與SVM、ELM分類方法進(jìn)行對(duì)比分析。結(jié)果表明傳統(tǒng)分類方法由于算法較為簡(jiǎn)單,對(duì)云母石英片巖、片巖夾大理巖、花崗閃長(zhǎng)巖、閃長(zhǎng)巖和石英閃長(zhǎng)巖等巖性差異較小的巖性類別區(qū)分能力較弱(圖3),分類準(zhǔn)確性較低。其中最小距離分類法計(jì)算速度快,但是因?yàn)槠渲豢紤]每一類樣本的均值,而忽略類別內(nèi)部的方差,因此分類效果較差,總體分類精度為37.32%,僅對(duì)巖性差別較大的輝長(zhǎng)巖、黑云母花崗巖和玄武巖具有較好分類能力,對(duì)其它巖性分類能力較差。最大似然分類法不僅考慮每一類樣本的均值,而且還考慮方差等參數(shù),因此分類效果相對(duì)較好,總體分類精度可達(dá)84.01%。但是對(duì)云母石英片巖、花崗閃長(zhǎng)巖、石英閃長(zhǎng)巖等巖性差異較小的類別區(qū)分能力較弱。
SVM對(duì)大多數(shù)類別巖性的區(qū)分能力強(qiáng),制圖結(jié)果的準(zhǔn)確度很高,其總體分類精度接近90%,但是對(duì)云母石英片巖、石英閃長(zhǎng)巖等巖性差異較小的類別區(qū)分能力較弱,出現(xiàn)較多錯(cuò)分和漏分現(xiàn)象。ELM表現(xiàn)更優(yōu),不但對(duì)巖性差異較明顯的巖性區(qū)分能力強(qiáng),而且對(duì)巖性差異較小的云母石英片巖、石英閃長(zhǎng)巖等同樣具有很強(qiáng)的區(qū)分能力,分類準(zhǔn)確度更高,其總體分類精度高達(dá)96.70%,與SVM相比,ELM所需要設(shè)置的參數(shù)更少,分類準(zhǔn)確性更高。
但是上述分類方法只考慮影像的光譜特征,忽略了影像的空間特征,所以分類結(jié)果中存在大量錯(cuò)分小斑塊,快速漂移算法會(huì)根據(jù)影像的色調(diào)、紋理、表面粗糙度等空間特征進(jìn)行圖像分類,這使得ELM+QS分類結(jié)果中錯(cuò)分小斑塊幾乎完全消失,各個(gè)類別內(nèi)部均一性較好,分類結(jié)果與目視解譯結(jié)果吻合最優(yōu)。目前,融合空間特征的機(jī)器學(xué)習(xí)分類方法在遙感巖性分類領(lǐng)域應(yīng)用較少,但已有的實(shí)驗(yàn)表明,融合光譜和空間特征的ELM+QS分類模型在遙感巖性分類領(lǐng)域具有很高的可行性和實(shí)用性,且高效、準(zhǔn)確,在西北基巖裸露地區(qū)具有廣闊的應(yīng)用前景。
本研究運(yùn)用極限學(xué)習(xí)機(jī)算法依據(jù)遙感影像的光譜特征進(jìn)行分類,不但對(duì)巖性差異較明顯的片巖夾大理巖、黑云母花崗巖、閃長(zhǎng)巖、輝長(zhǎng)巖等巖性區(qū)分能力強(qiáng),對(duì)巖性差異較小的云母石英片巖、石英閃長(zhǎng)巖、片麻狀石英閃長(zhǎng)巖和二長(zhǎng)閃長(zhǎng)巖同樣具有較強(qiáng)的區(qū)分能力,總體分類精度達(dá)96.70%,分類準(zhǔn)確度很高,但是分類結(jié)果圖中會(huì)存在大量錯(cuò)分小斑塊。引入遙感影像中地物的空間特征,運(yùn)用快速漂移算法對(duì)空間特征進(jìn)行分析和分類,結(jié)合最大投票法,將空間特征與光譜特征結(jié)合,分類結(jié)果圖中錯(cuò)分小斑塊幾乎完全消失,在保證分類準(zhǔn)確性的同時(shí),提高了分類結(jié)果與目視解譯結(jié)果、地質(zhì)圖的一致性,且分類所需時(shí)間僅小幅度增加。
研究表明將基于光譜特征的極限學(xué)習(xí)機(jī)分類與基于空間特征的快速漂移算法結(jié)合,可獲得較高的巖性分類精度,為后續(xù)的精細(xì)填圖和找礦工作提供準(zhǔn)確、客觀和可靠數(shù)據(jù)支撐,在西部基巖出露區(qū)具有較好的應(yīng)用前景。
本研究中采用的ASTER影像空間分辨率為30 m,且在可見(jiàn)光—近紅外范圍內(nèi)只有9個(gè)波段,難以開(kāi)展大比例尺、精細(xì)的巖性制圖工作。后續(xù)可以將本研究中的方法用于空間分辨率和光譜分辨率更高的WorldView-3數(shù)據(jù)及GF-5等高光譜影像,進(jìn)行更加細(xì)致的巖性、礦物分類研究。