曾烴詳, 劉巖*, 文志剛, 樊云鵬, 馮興強, 季長軍, 史旭凱, 高變變, 武遠哲
(1.油氣地球化學與環(huán)境湖北省重點實驗室/長江大學資源與環(huán)境學院, 武漢 430100;2.中國地質(zhì)科學院地質(zhì)力學研究所, 北京 100081)
有機巖石學是在孢粉學和煤巖學基礎上發(fā)展起來的一門邊緣學科,主要研究地質(zhì)體中沉積有機質(zhì)的成因、產(chǎn)狀、組成、結構和演化等內(nèi)容[1-2]。為了客觀評價烴源巖,其常用手段是應用光學顯微鏡交替使用反射光和熒光觀察研究全巖樣品,對觀察到的組分進行識別、判斷及統(tǒng)計等分析,結果可用于評價烴源巖的有機質(zhì)類型、豐度和成熟度等,還能進一步獲取生烴母質(zhì)、烴類生成和運移等信息[3],而在煤巖學方面,顯微組分不僅關系到煤層氣的生成、賦存、儲集因素,還有利于煤巖的高效利用,因此,實現(xiàn)顯微組分的自動識別與定量具有重要意義[4-6]。隨著深度學習在圖像識別領域發(fā)展,前人運用機器學習技術研究煤巖顯微組分,取得了良好的成果[7-9]。目前,已有不少學者嘗試采用深度學習技術、卷積神經(jīng)網(wǎng)絡對煤巖顯微組分圖像進行分析與識別,Wang等[10]對比經(jīng)典的深度學習分割模型,認為DeepLab V3+網(wǎng)絡在中國煙煤顯微組分的識別具有更高的分割效率和精度。Lei等[11]通過改進U-net網(wǎng)絡,采用ResNet50主干網(wǎng)絡,引入了注意力機制,實現(xiàn)對煤巖顯微組分的精確識別。雖然烴源巖的顯微組分識別方法與煤巖相似,但在客觀上,沉積巖中的顯微組分遠比煤巖中復雜,煤巖的顯微組分和烴源巖中的組分有著明顯區(qū)別,主要體現(xiàn)在組分的類型、組成、形態(tài)及富集程度上,且不同豐度、類型及成熟度的烴源巖在顯微組分構成上也存在差異。此外,根據(jù)中國石油天然氣行業(yè)標準《全巖光片顯微組分鑒定及統(tǒng)計方法》[12],對顯微組分定量計算是判斷烴源巖類型指數(shù)的重要指標之一。謝小敏等[13-14]利用Leica QWin_V3圖像處理軟件,通過對圖片中的特殊區(qū)域進行選取,實現(xiàn)對全巖有機顯微組分進行客觀、快速的統(tǒng)計定量分析,并在近年來應用了綜合礦物分析儀(TESCAN integrated mineral analyzer, TIMA)技術分析了Alum頁巖的有機質(zhì)和黃鐵礦粒度分布特征,為石油地質(zhì)研究者在快捷定量描述有機巖提供了新的思路。
現(xiàn)階段,全巖樣品或干酪根的有機顯微組分識別大多仍然采用人工觀測識別的方式,然后通過計數(shù)器或使用軟件對顯微組分進行統(tǒng)計定量,這類方式存在自動化程度低、結果易受主觀因素影響、人工工作量大等問題。針對這些問題,現(xiàn)以皖涇地1井下三疊統(tǒng)殷坑組烴源巖為研究樣品,設計了一個基于遷移學習的鏡下全巖光片顯微組分識別與定量實驗,實現(xiàn)對全巖顯微組分的自動分類識別,再利用OpenCV圖像處理庫對組分分類結果進行定量統(tǒng)計,以期改進全巖光片顯微組分的識別方式,提高顯微組分定量統(tǒng)計的效率。
U-net網(wǎng)絡在醫(yī)學圖像語義分割應用上有著出色的表現(xiàn),顯微組分的識別需求也同樣類似于醫(yī)學圖像語義分割,不僅需要識別物體類別,也需要精準分割定位。由于烴源巖的多樣性和復雜性,很難使用一種全面且統(tǒng)一的顯微組分分類方案來描述烴源巖特征[15],因此,烴源巖顯微組分的語義分割模型應當針對研究區(qū)顯微組分的整體特點來構建相應的訓練數(shù)據(jù)集,以使模型能夠?qū)ν愋蜔N源巖的組分識別有更好的泛化能力。在構建數(shù)據(jù)集的初期,往往缺乏足夠的訓練數(shù)據(jù),而遷移學習是一種有效的模型改進方式,能夠在小樣本的情況下獲得比較好的訓練結果,從而提升模型的訓練精度和魯棒性能[16-17]。本次實驗首先在細胞分割數(shù)據(jù)集下完成U-net預訓練網(wǎng)絡的訓練,然后將研究區(qū)不同深度的全巖光片顯微組分圖像作為訓練數(shù)據(jù)遷移到預訓練網(wǎng)絡模型中微調(diào)模型的權值,獲得新的分類模型,進而實現(xiàn)對顯微組分圖像中不同組分的識別與分類,最后通過OpenCV圖像處理庫進行定量處理,實驗總體框架如圖1所示。
近年來,中國地質(zhì)科學院地質(zhì)力學研究所在皖南地區(qū)實施的皖涇地1井在下三疊統(tǒng)殷坑組鉆遇良好的油氣顯示,引起了研究人員的重視。皖涇地1井殷坑組主要有灰?guī)r和泥巖、泥灰?guī)r不等厚互層, 總有機碳(total organic carbon, TOC)含量介于0.031%~1.7%,研究區(qū)顯微組分特征如圖2所示,有機顯微組分主要以殼質(zhì)組為主,多發(fā)育富氫強熒光的殼屑體,殼屑體在紫外光激發(fā)下發(fā)黃色、橙色熒光,反射光下呈紅褐色。發(fā)育少量鏡質(zhì)體和惰屑體,熒光下均呈黑色。不同深度的樣品,黃鐵礦的數(shù)量差異較大,且形態(tài)復雜,有無規(guī)則、塊狀分布的黃鐵礦、成團聚集的草莓狀黃鐵礦以及零散分布的近圓形的草莓狀黃鐵礦。
圖1 實驗總體框架示意圖Fig.1 Schematic diagram of the overall framework of the experiment
本次研究采用的數(shù)據(jù)集分為研究區(qū)數(shù)據(jù)集與預訓練數(shù)據(jù)集兩部分。在構建研究區(qū)數(shù)據(jù)集的過程中,為了提高模型對皖涇地1井殷坑組樣品的適應能力,挑選不同深度、TOC的樣品來進行實驗,實驗樣品信息如表1所示。將樣品沿垂直層理切割至合適大小,用環(huán)氧樹脂粘結固化,再經(jīng)粗磨、細磨、拋光處理形成塊光片,將光片置于光學顯微鏡下,配制50倍油浸物鏡拍攝,交替切換反射光與熒光光源采集圖像。在采集研究區(qū)數(shù)據(jù)集圖像的過程中,注意保持拍攝像機的曝光值、感光度、白平衡等攝影參數(shù)一致,收集高質(zhì)量的訓練樣本圖片。將采集到的圖像各分為訓練集、驗證集、測試集。訓練集用于匹配一系列參數(shù)來建立一個分類器,用于模型擬合數(shù)據(jù)樣本;驗證集用于調(diào)整模型的超參數(shù)和用于對模型的能力進行初步評估;測試集則用于檢驗最終選擇最優(yōu)的模型的性能[18]。研究區(qū)數(shù)據(jù)集包含反射光及熒光圖像共490張,其中訓練集樣本272張,驗證集68張,5個測試集樣品各30張圖像作為測試集樣本,所有樣本圖像分辨率均為2 752像素×2 208像素。預訓練數(shù)據(jù)集采用生物醫(yī)學成像國際研討會(International Symposium on Biomedical Imaging, ISBI)醫(yī)學細胞分割數(shù)據(jù)集[19],該數(shù)據(jù)集包含訓練圖像及標注圖像各30張,分辨率為512像素×512像素。
由經(jīng)驗豐富的有機巖石學學者使用LabelMe圖像標注工具[20]對圖像的各種顯微組分進行組分的鑒定及標注。根據(jù)研究區(qū)樣品的整體特點,標注分別為鏡質(zhì)體、惰屑體、殼屑體、草莓狀黃鐵礦,對部分特征難以分辨及實驗中不關注的組分劃分為礦物背景,如圖3所示。值得注意的是,不同深度的樣品,黃鐵礦的數(shù)量和形態(tài)差異較大,故本次實驗統(tǒng)一選取顆粒狀明顯的圓形草莓狀黃鐵礦進行標注。
表1 實驗樣品信息Table 1 Experimental samples information
訓練集和驗證集圖像的質(zhì)量及數(shù)量都會對語義分割模型的性能和泛化能力產(chǎn)生巨大的影響[21-22]。為了防止模型過擬合,增強模型的訓練精度和泛化能力,對研究區(qū)訓練樣本圖像進行了更改亮度、翻轉(zhuǎn)、旋轉(zhuǎn)、小范圍局部變形等圖像數(shù)據(jù)增強處理(圖4),對應的標注圖像也隨著形狀及位置的改變而改變,對部分過度增強或信息缺失的圖像進行剔除。增強后,訓練集擴充至4 563幅,驗證集擴充至1 141幅。
圖3 人工標注示意圖Fig.3 Schematic diagram of manual annotation
圖4 數(shù)據(jù)增強處理示例Fig.4 Examples of data enhancement processing
U-net是一個優(yōu)秀的語義分割模型,其包含編解碼兩個模塊,整體呈“U”形,通過跳躍連接的方式將特征圖進行維度拼接,能夠保留更多的位置和特征信息,在小樣本數(shù)據(jù)集上分割性能優(yōu)于其他網(wǎng)絡結構,且適合處理小尺寸物體的語義分割任務[23]。U-net左半部分為主干特提取網(wǎng)絡,右半部分則是對提取的特征進行上采樣。視覺幾何組(visual geometry group, VGG)網(wǎng)絡[24]結構清晰,特征提取能力強,在遷移學習中的泛化性能好。如王培珍[25]在ImageNet數(shù)據(jù)集基礎上,使用VGG16網(wǎng)絡完成預訓練網(wǎng)絡訓練,結合煤巖殼質(zhì)組樣本對模型進行遷移學習,實現(xiàn)對殼質(zhì)組組分高精度的識別。本次實驗采用VGG16網(wǎng)絡的作為U-net模型的主干特征提取網(wǎng)絡,該網(wǎng)絡結構及參數(shù)如圖5所示。
實驗采用的服務器硬件配置為: CPU 12th Gen Intel(R) Core(TM) i5-12600K 3.69 GHz; GPU Nvidia GeForce GTX 3060; Ram 32.0 GB; 軟件環(huán)境為Windows 10 1909,使用Python語言開發(fā),將Tensorflow作為本次深度學習框架,版本為2.4.1。在訓練過程中,采用Adam優(yōu)化器進行優(yōu)化,采用Dice_loss損失函數(shù)完成網(wǎng)絡參數(shù)優(yōu)化,模型訓練參數(shù)如表2所示。
圖5 特征提取網(wǎng)絡結構及參數(shù)Fig.5 Feature extraction network structure and parameters
表2 模型訓練參數(shù)Table 2 Model training parameters
Dice系數(shù)是一種集合相似度度量函數(shù),一般用于計算兩個樣本的相似度[26]。Dice_loss損失函數(shù)計算公式為
(1)
式(1)中:X為預測值像素點集;Y為真實值像素點集。
將研究區(qū)數(shù)據(jù)集遷移到以細胞分割數(shù)據(jù)集完成的預訓練網(wǎng)絡模型中進行訓練,模型的損失值曲線如圖6所示。隨著訓練次數(shù)的增加,模型的損失值在不斷減小,在經(jīng)過100個批處理后,loss值基本穩(wěn)定,模型訓練結束。
如表3所示,混淆矩陣指在表中分別統(tǒng)計分類模型的分類情況,用于計算各種分類評價指標。
像素準確率(pixel accuracy, PA)、平均交并比(mean intersection over union, MIoU)、類別平均像素準確率(mean pixel accuracy, MPA)是語義分割模型中中常用的評價指標,其中PA表示預測類別正確的像素數(shù)占總像素數(shù)的比例,表達式為
表3 混淆矩陣
圖6 模型損失值曲線Fig.6 Loss curves of the model
圖7 分類結果比較Fig.7 Comparison of classification results
(2)
MIoU表示每一類預測的結果和真實值的交集與并集的比值,求和再平均的結果,表達式為
(3)
MPA表示對每一個類被正確分類像素數(shù)的比例累加求平均,表達式為
(4)
式中:C為總的分類數(shù);M為樣品總數(shù);pmii表示第m個樣本中屬于TP的像素數(shù);pmij、pmji分別表示第m個樣本中屬于FN和FP的像素。
將5個樣品,共150張測試集照片輸入實驗模型中進行自動識別與分類,模型各評價指標如表4、表5所示,部分分類結果對比如圖7所示??梢钥吹?,測試集在本次模型中的PA、MIoU和MPA分別為99.74%、74.81%和84.65%,表明實驗模型有著較好的分割性能。從混淆矩陣的分類識別概率表可以看出,整體分類識別率為84.32%,其中鏡質(zhì)體和惰屑體識別率較高,分別有89%和87.7%。因為在反射光中,這兩種組分邊緣界限清晰,與周圍的礦物背景有很好的區(qū)分,且整體光照明亮,成像效果好,因此識別率高。殼屑體識別率為79.2%,稍低于鏡質(zhì)體和惰屑體,一方面,殼屑體在較多透明礦物的環(huán)境下,熒光會產(chǎn)生不同程度的光暈;另一方面,熒光下,光源較暗,攝像機成像受一定影響,二者均會影響識別結果。草莓狀黃鐵礦識別率較低,僅有65.8%,主要因為在研究區(qū)的樣品中,草莓狀黃鐵礦多聚集成團,容易出現(xiàn)粘連現(xiàn)象,且塊礦類似,會干擾草莓狀黃鐵礦的識別。此外,被錯誤劃分或漏分的組分都大多劃分到礦物背景,說明模型對顯微組分具有良好的特征提取能力。
表4 模型的分類性能評價Table 4 Classification performance evaluation of the model
表5 各顯微組分分類識別混淆矩陣Table 5 Confusion matrix of maceral groups
OpenCV作為功能強大的開源計算機視覺和機器學習軟件庫,實現(xiàn)了很多圖像處理和計算機視覺等方面的算法,能有效提升開發(fā)效率[27]。首先,對每一類組分的分類結果進行二值化處理,調(diào)用OpenCV中的findContours( )函數(shù)建立目標輪廓,然后調(diào)用contourArea( )函數(shù)對每一類組分遍歷統(tǒng)計輪廓的面積并調(diào)用putText()和rectangle()將每個組分所占像素直觀地顯示在圖片上,最后在后臺統(tǒng)計各組分像素與總視域圖像像素的比值作為顯微組分的百分比,定量統(tǒng)計流程如圖8所示。通過該方法統(tǒng)計5個測試樣品的分類結果,與人工數(shù)點統(tǒng)計定量的結果相比,結果如圖9所示,可以看出,本次通過OpenCV統(tǒng)計的有機顯微組分體積百分比與人工數(shù)點統(tǒng)計的結果相近。150張測試集圖像從模型分類識別到定量僅需數(shù)分鐘,相較于傳統(tǒng)人工識別與定量,顯著地提高了工作效率。
以皖涇地1井下三疊統(tǒng)殷坑組烴源巖的顯微組分圖像為訓練數(shù)據(jù),構建了一個基于遷移學習的U-net語義分割模型,開展了顯微組分自動識別與定量的實驗,得出以下結論。
(1)以VGG16網(wǎng)絡為主干特征提取網(wǎng)絡,構建基于遷移學習的U-net語義分割模型,該模型對研究區(qū)數(shù)據(jù)集的整體分類識別準確率可達84.32%,可以滿足對研究區(qū)烴源巖顯微組分進行客觀、快速地識別與分類的需求。
(2)OpenCV圖像處理庫能對模型的分類結果的進行定量統(tǒng)計,統(tǒng)計結果與人工數(shù)點統(tǒng)計結果較為接近。
(3)本方法可以在短時間內(nèi)對大量與研究區(qū)類型相近的烴源巖顯微組分圖片進行識別和定量,減輕了人工工作量,顯著提高了全巖光片的鑒定及統(tǒng)計效率。
圖8 定量統(tǒng)計流程示意圖Fig.8 Schematic diagram of quantitative statistical process