肖志強(qiáng), 賀金鑫*, 陳德博, 戰(zhàn) 曄, 逯燕樂
1. 吉林大學(xué)地球科學(xué)學(xué)院, 吉林 長春 130061 2. 空軍航空大學(xué), 吉林 長春 130012
近些年來, 機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展與應(yīng)用深刻影響著各個領(lǐng)域, 也讓不同行業(yè)的從業(yè)者和研究人員享受到了該項技術(shù)帶來的便利性, 高光譜遙感領(lǐng)域也不例外。 通過對高光譜遙感在地質(zhì)應(yīng)用領(lǐng)域的調(diào)研來看, 國內(nèi)外廣大學(xué)者普遍采用機(jī)器學(xué)習(xí)及相關(guān)方法對巖石光譜進(jìn)行分類, 而分類模型可以大致概括為兩大類: 傳統(tǒng)機(jī)器學(xué)習(xí)模型和神經(jīng)網(wǎng)絡(luò)模型。
傳統(tǒng)機(jī)器學(xué)習(xí)模型: 傳統(tǒng)的幾類機(jī)器學(xué)習(xí)方法發(fā)展較為成熟, 受到眾多學(xué)者的青睞, 這一點(diǎn)在巖石光譜分類應(yīng)用研究上也得到了體現(xiàn)。 Pane等[1]使用了K-近鄰(K-nearest neighbors, KNN)、 支持向量機(jī)(support vector machine, SVM)、 決策樹(decision tree, DT)、 隨機(jī)森林(random forest, RF)和多層感知器(multiLayer perceptron, MLP)等五種監(jiān)督學(xué)習(xí)方法生成的模型, 對巖石光譜進(jìn)行分類, 并在SVM方法上取得了最高的分類準(zhǔn)確性。 劉燁等[2]提出一種基于巖石薄片圖像的自動分類方法, 通過支持向量機(jī)方法建立特征空間與巖石類別之間的映射關(guān)系。 韋任等[3]通過二階微分法對煤巖特征進(jìn)行特征提取, 之后再用隨機(jī)森林和支持向量機(jī)算法進(jìn)行模擬, 取得90%以上的分類準(zhǔn)確率。 Crowley等[4]使用最小二乘光譜波段擬合算法對光譜數(shù)據(jù)進(jìn)行光譜繪制比對, 實(shí)現(xiàn)了遠(yuǎn)程識別八種不同的含鹽礦物。
以上學(xué)者使用的都是單一模型, 為了能夠?qū)⒉煌P偷膬?yōu)勢結(jié)合到一起, 賀金鑫[5]等利用硬投票法融合了RF、 KNN與SVM三個機(jī)器學(xué)習(xí)模型, 硬投票法通過對不同模型的分類結(jié)果進(jìn)行投票, 投票最多的分類結(jié)果將作為最終的分類結(jié)果, 最終融合的模型達(dá)到了99.17%的分類準(zhǔn)確率。
神經(jīng)網(wǎng)絡(luò)模型: 早在1994年, Tanabe等[6]構(gòu)建3層前向傳播神經(jīng)網(wǎng)絡(luò)模型, 實(shí)現(xiàn)了對6種近紅外蝕變巖石光譜的識別與分類, 識別準(zhǔn)確率近100%。 2013年, Ishikawa等[7]在此基礎(chǔ)上, 使用拉曼數(shù)據(jù)光譜庫作為訓(xùn)練集, 得到一個人工神經(jīng)網(wǎng)絡(luò)礦物分類器, 并對橄欖石、 石英、 斜長石、 鉀長石、 云母和幾種輝石加以分類, 平均準(zhǔn)確率達(dá)83%。 常項平[8]使用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合像素的光譜和空間信息, 對明礬石、 高嶺石、 蒙脫石和玉髓四種礦石進(jìn)行深度監(jiān)督分類, 取得分類精度達(dá)到90.58%。 Xu等[9]針對巖石光譜數(shù)據(jù)的復(fù)雜性, 基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)提出了一種專門為2D光譜數(shù)據(jù)設(shè)計的新CNN架構(gòu)。 滿文婧等[10]通過Symlets小波變換將巖石光譜數(shù)據(jù)轉(zhuǎn)換為頻譜圖, 作為深度卷積分類模型的基礎(chǔ)數(shù)據(jù), 再利用50層深度殘差網(wǎng)絡(luò)(ResNet50)模型對數(shù)據(jù)進(jìn)行分類。
也有學(xué)者二者兼用, 并做了相關(guān)對比分析。 Liu等[11]建立了基于礦物光譜的卷積神經(jīng)網(wǎng)絡(luò)(CNN)分類模型, 并與SVM模型做對比, 認(rèn)為該神經(jīng)網(wǎng)絡(luò)能夠提取更加豐富的光譜特征, 因此在分類結(jié)果上更具有優(yōu)越性。
總之, 該領(lǐng)域目前的大部分做法是將光譜數(shù)據(jù)進(jìn)行預(yù)處理后利用機(jī)器學(xué)習(xí)方法進(jìn)行巖性分類, 之后再使用大量樣本數(shù)據(jù)來進(jìn)行模型訓(xùn)練; 但若在樣本數(shù)量較少的情況下, 則容易因為訓(xùn)練不充分而導(dǎo)致分類結(jié)果不夠準(zhǔn)確, 或者是出現(xiàn)過擬合現(xiàn)象。 因此, 本文利用遼寧興城地區(qū)的典型巖石光譜數(shù)據(jù), 基于Python編程語言構(gòu)建了孿生網(wǎng)絡(luò)分類模型, 以實(shí)現(xiàn)小樣本情況下巖石光譜的自動分類。
興城市位于遼寧省西部, 地處北溫帶, 屬亞濕潤季風(fēng)氣候, 交通方面由京哈高速公路縱貫全境, 西南方向通往秦皇島市, 東北方向連接葫蘆島和錦州市(圖1)。
興城地區(qū)地層為典型的華北地臺沉積類型, 且地層較為完整, 主要包括太古宇巖石單元、 中、 新元古界, 古生界, 中生界和新生界。 在大地構(gòu)造上, 興城位于下遼河-渤海斷陷盆地和遼西斷陷山地兩大構(gòu)造單元的過渡帶之間。 興城地區(qū)位于華北克拉通, 由于晚古生代末期—中生代受到了古亞洲洋俯沖、 揚(yáng)子克拉通大陸深俯沖、 古太平洋板塊俯沖等作用的影響, 導(dǎo)致巖漿活動強(qiáng)烈, 形成了分布廣泛的巖漿巖。 區(qū)內(nèi)巖漿巖主要分布在臺里海濱、 釣魚臺海濱、 七里坡尖山、 華山鎮(zhèn)、 夾山西、 首山等地區(qū)。 興城地區(qū)主要出露的變質(zhì)巖為接觸變質(zhì)巖和斷裂帶動力變質(zhì)巖, 主要分布在臺里海濱地區(qū)和華山鎮(zhèn)路線。 研究區(qū)出露的沉積巖較為豐富, 以砂巖、 泥巖、 碳酸鹽巖為主, 主要分布在葫蘆島、 月亮山、 團(tuán)山子和夾山等地。 研究區(qū)的巖性分布如圖2所示。
圖2 研究區(qū)巖性分布圖[5]
圖3 總樣品數(shù)據(jù)集的巖石光譜反射率
用于測量巖石光譜的儀器為美國FieldSpec-3型便攜式實(shí)測光譜儀, 所測波長從350 nm的可見光范圍分布到2 500 nm的短波紅外范圍。 可見光的光譜測量間隔為1.4 nm, 分辨率約為3 nm; 短波紅外的間隔為2 nm, 分辨率為6.5~8.5 nm[12]。
目前取得砂巖類、 花崗巖類、 灰?guī)r類三大類巖石光譜數(shù)據(jù)共690條, 經(jīng)過整理后得到細(xì)粒黑云母二長花崗巖10條數(shù)據(jù), 中細(xì)粒二長花崗巖15條數(shù)據(jù), 中粒二長花崗巖15條數(shù)據(jù), 細(xì)粒二長花崗巖30條數(shù)據(jù), 花崗斑巖15條數(shù)據(jù), 含斑黑云角閃二長花崗巖10條數(shù)據(jù), 中粒黑云母二長花崗巖20條數(shù)據(jù), 二長花崗巖20條數(shù)據(jù), 中粗粒黑云二長花崗巖10條數(shù)據(jù), 黑云母二長花崗巖20條數(shù)據(jù), 鮞狀灰?guī)r40條數(shù)據(jù), 灰?guī)r25條數(shù)據(jù), 安山質(zhì)凝灰?guī)r20條數(shù)據(jù), 白云巖15條數(shù)據(jù), 結(jié)晶灰?guī)r20條數(shù)據(jù), 含角礫晶屑巖屑凝灰?guī)r30條數(shù)據(jù), 青灰色白云巖30條數(shù)據(jù), 灰黑色鮞狀灰?guī)r90條數(shù)據(jù), 燧石條帶白云巖40條數(shù)據(jù), 白云質(zhì)灰?guī)r130條數(shù)據(jù), 中粒巖屑長石砂巖25條數(shù)據(jù), 灰白色長石石英砂巖10條數(shù)據(jù), 中粗礫長石石英砂巖10條數(shù)據(jù), 含礫石英砂巖, 20條數(shù)據(jù)灰色中粒長石石英砂巖10條數(shù)據(jù), 長石石英砂巖10條數(shù)據(jù)。
獲得的巖石光譜數(shù)據(jù)具有以下特點(diǎn): 三種巖石在1 900 nm處的光譜中存在強(qiáng)吸收谷, 花崗巖和砂巖在約1 400 nm處存在水蒸氣吸收帶(如圖4和圖6所示); 花崗巖的總體反射率為0~0.5, 石灰?guī)r為0~0.7, 砂巖為0~0.6; 石英砂巖、 白云石和其他巖石在2 200 nm處有一個由羥基吸收引起的吸收谷, 砂巖在900 nm處有鐵離子吸收帶, 灰?guī)r在2 300 nm處產(chǎn)生碳酸根離子的特征吸收[5]。
圖4 花崗巖光譜反射率
圖5 灰?guī)r光譜反射率
圖6 砂巖光譜反射率
1.5.1 原始光譜數(shù)據(jù)轉(zhuǎn)換
在進(jìn)行訓(xùn)練孿生網(wǎng)絡(luò)模型之前, 需要將巖石光譜數(shù)據(jù)轉(zhuǎn)化為類似于圖片的樣本數(shù)據(jù), 以便作為模型訓(xùn)練的輸入。 原始巖石光譜數(shù)據(jù)具有2 154維特征, 將其轉(zhuǎn)化成48×48大小的單通道圖片, 由于是進(jìn)行相似度比較, 將原始的線性特征關(guān)系轉(zhuǎn)換為空間特征關(guān)系之后對結(jié)果并不會造成影響。 轉(zhuǎn)換后的巖石光譜數(shù)據(jù)如圖7所示。
圖7 轉(zhuǎn)換前后的巖石光譜數(shù)據(jù)
將轉(zhuǎn)換后的細(xì)粒二長花崗巖、 中粒巖屑長石砂巖和鮞狀灰?guī)r三類共95條數(shù)據(jù)作為孿生網(wǎng)絡(luò)模型的測試集, 除了這三類之外的白云巖、 灰?guī)r、 二長花崗巖等23類巖石共595條數(shù)據(jù)則作為其訓(xùn)練集。 而對于四種傳統(tǒng)機(jī)器學(xué)習(xí)方法, 則直接使用三類巖石類型的原始光譜數(shù)據(jù), 以6∶4拆分為訓(xùn)練集和測試集, 從而保證測試集的一致性。
1.5.2 孿生網(wǎng)絡(luò)
孿生網(wǎng)絡(luò)是有兩個輸入端的類神經(jīng)網(wǎng)絡(luò)架構(gòu), 與一般學(xué)習(xí)模型只有對一個輸入端進(jìn)行分類有所不同, 孿生網(wǎng)絡(luò)會學(xué)習(xí)兩個輸入端的相似度, 其結(jié)構(gòu)如圖8所示。
圖8 孿生網(wǎng)絡(luò)示意圖
具體的孿生網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示, 孿生網(wǎng)絡(luò)由3個不帶池化層的卷積單元組成, 每個卷積單元又分為4層, 首先通過ReflectionPad2d來對輸入的張量進(jìn)行填充, 之后通過Conv2d二維卷積層進(jìn)行特征提取, 激活函數(shù)選擇ReLU能夠提高網(wǎng)絡(luò)的收斂能力, 最后通過加入批標(biāo)準(zhǔn)化(batch normalization)層使得網(wǎng)絡(luò)更加穩(wěn)定。
圖9 孿生網(wǎng)絡(luò)結(jié)構(gòu)圖
1.5.3 分類模型構(gòu)建
圖10 Triplet Loss計算過程
在結(jié)果精度評估中, 選取了分類準(zhǔn)確率和Kappa系數(shù)作為衡量標(biāo)準(zhǔn), 結(jié)果如表1所示。 從模型在測試集上的預(yù)測準(zhǔn)確率可以看出, 孿生網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率為97.8%, 同時其Kappa系數(shù)為0.96, 分類效果優(yōu)于傳統(tǒng)的決策樹、 隨機(jī)森林、 支持向量機(jī)和K-近鄰四種機(jī)器學(xué)習(xí)模型。 并且與傳統(tǒng)機(jī)器學(xué)習(xí)不同的是, 其訓(xùn)練集使用的是白云巖、 灰?guī)r、 二長花崗巖等23類巖石共595條數(shù)據(jù), 并且是成對輸入, 極大增加了訓(xùn)練集, 有效緩解了模型過擬合問題。 測試集則使用細(xì)粒二長花崗巖、 中粒巖屑長石砂巖和鮞狀灰?guī)r這三類巖石共95條數(shù)據(jù), 相較于四種傳統(tǒng)機(jī)器學(xué)習(xí)方法在其測試集上的表現(xiàn), 孿生網(wǎng)絡(luò)模型在數(shù)據(jù)量更大的測試集上取得了更高的分類準(zhǔn)確率, 體現(xiàn)了孿生網(wǎng)絡(luò)模型在小樣本分類方面的優(yōu)越性。
表1 巖石光譜分類結(jié)果
在遼寧興城地區(qū)實(shí)測的不同巖石反射光譜數(shù)據(jù)特征基礎(chǔ)之上, 分別利用決策樹、 隨機(jī)森林、 支持向量機(jī)和K-近鄰, 以及孿生網(wǎng)絡(luò)模型進(jìn)行了巖石光譜特征自動分類方法研究。 從實(shí)驗結(jié)果可以看出: (1) 將原始光譜數(shù)據(jù)轉(zhuǎn)化為圖片數(shù)據(jù)之后, 并不會影響孿生網(wǎng)絡(luò)模型的分類效果, 進(jìn)而可以將巖石光譜分類問題轉(zhuǎn)化為圖像方面的問題, 使用圖像處理相關(guān)的工具和方法; (2) 在樣本數(shù)量較少的情況下, 孿生神經(jīng)網(wǎng)絡(luò)模型的分類效果顯著優(yōu)于四種傳統(tǒng)機(jī)器學(xué)習(xí)模型; (3) 由于孿生網(wǎng)絡(luò)的訓(xùn)練集可以與測試集不同, 因此能夠?qū)?shù)量更多的其他巖石光譜數(shù)據(jù)用作訓(xùn)練, 并且是成對輸入, 能夠有效緩解因訓(xùn)練樣本不足而導(dǎo)致的過擬合問題。 在后續(xù)研究工作中, 將對相同大類巖石類型下的不同子類巖石光譜做分類, 以期能夠在小樣本情況下取得同等優(yōu)秀的分類效果。