田宵, 汪明軍, 張雄, 王向騰, 盛書中, 呂堅(jiān)
1 東華理工大學(xué)地球物理與測(cè)控技術(shù)學(xué)院, 南昌 330013 2 江西省地震局, 南昌 330039
近年來,由人類活動(dòng)引起的人工爆破的頻度逐年增加.例如,用于工業(yè)生產(chǎn)的化學(xué)爆破(Ma et al., 2021), 2006年至2017年六次朝鮮地下核試驗(yàn) (謝小碧和趙連鋒, 2018) 和事故性爆炸如2015年天津爆炸、2019年江蘇響水爆炸(江文彬等,2020)和2020年黎巴嫩爆炸等.如果不能及時(shí)地進(jìn)行識(shí)別分類,人工爆破事件可能被誤認(rèn)為天然地震,從而增加地震的誤觸發(fā)率,影響地震預(yù)警、地震速報(bào)以及地震應(yīng)急的時(shí)效性和準(zhǔn)確性(和雪松等,2006;Astiz et al., 2014).因此,發(fā)展天然地震與爆破事件的自動(dòng)識(shí)別方法對(duì)安全生產(chǎn)以及國(guó)家防震減災(zāi)事業(yè)具有重要意義.
天然地震與人工爆破的震源性質(zhì)不同,天然地震多發(fā)生在地殼深部,震源為非對(duì)稱剪切源;而人工爆破多發(fā)生在淺層地表附近,為對(duì)稱膨脹源(黃漢明等,2010).然而,天然地震和爆破事件引起的地面震動(dòng),在臺(tái)站記錄上均顯示為波動(dòng)的曲線,需要一定的經(jīng)驗(yàn)才能將其區(qū)分開來.一直以來,地震臺(tái)網(wǎng)的工作人員主要是手動(dòng)識(shí)別天然地震和爆破事件,手動(dòng)識(shí)別事件性質(zhì)不僅需要持續(xù)的觀測(cè)和分析,識(shí)別效率較低,而且要求地震工作者具有豐富的經(jīng)驗(yàn),否則容易造成事件性質(zhì)判斷不準(zhǔn)確,混淆地震目錄,對(duì)后續(xù)的科研和防震減災(zāi)工作造成較大的影響.
早在20世紀(jì)50年代初,國(guó)內(nèi)外很多地震學(xué)家便開始對(duì)天然地震和人工爆破的識(shí)別進(jìn)行了廣泛的研究.經(jīng)過近五十年的研究積累,地震學(xué)家基于地震波的輻射圖形、地震波譜分析和震相特征提出了多種識(shí)別天然地震和人工爆破的判斷依據(jù),主要包括P波初動(dòng)符號(hào)(王婷婷和邊銀菊,2011;劉莎等,2012)、振幅比值(邊銀菊等,2010;Yavuz et al., 2019;Koper et al., 2016)、頻譜分布范圍(Kiszely,2001;Kekovalet al., 2012;靳玉貞等,2015)等分析方法.另外,小波算法、遺傳算法等也被廣泛用于天然地震和人工爆破事件的識(shí)別中.例如,和雪松等(2006)利用小波包識(shí)別天然地震和礦震,通過小波包對(duì)信號(hào)進(jìn)行變換,并利用奇異值分解提取不同的信號(hào)特征,從而進(jìn)行分類.黃漢明等(2010)利用波形記錄的小波特征對(duì)天然地震和人工爆破事件進(jìn)行識(shí)別;Beccar-Varela等(2016)運(yùn)用小波分析對(duì)采礦爆破監(jiān)測(cè)的地震波形與該區(qū)域的天然地震進(jìn)行識(shí)別.Orlic和Loncaric等(2010)利用遺傳算法進(jìn)行天然地震和爆破事件識(shí)別,分類精度為85%.這些方法在一定程度上能夠作為區(qū)分爆破事件和天然地震的依據(jù),但大多數(shù)方法局限于使用單一的輸入?yún)?shù),不僅識(shí)別速度較慢,而且準(zhǔn)確率相對(duì)較低.
近年來,隨著計(jì)算機(jī)領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計(jì)算機(jī)視覺、自然語(yǔ)言處理等多個(gè)領(lǐng)域取得了巨大的成功(Hinton et al., 2012).深度學(xué)習(xí)算法也被廣泛地應(yīng)用在地震學(xué)領(lǐng)域,包括地震信號(hào)的檢測(cè)與拾取(Zhu and Beroza, 2019;于子葉等,2018;趙明等,2019; Duan and Zhang, 2020;Zheng et al., 2020; Wong et al., 2021; Zhou et al., 2021)、震源定位(Perol et al., 2018; Zhang et al., 2020)等.人工智能的發(fā)展也為天然地震和爆破事件的自動(dòng)識(shí)別提供了新的研究思路.王軍(2018)利用支持向量機(jī)對(duì)上海周邊區(qū)域的天然地震和人工爆破進(jìn)行識(shí)別,識(shí)別精度高達(dá)85%.陳潤(rùn)航等(2018)利用梅爾頻率倒譜系數(shù)圖作為樣本,利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行天然地震和爆破事件分類,正確識(shí)別率約為97.1%; 任濤等(2019)利用Bagging機(jī)器學(xué)習(xí)算法對(duì)天然地震和非天然地震的事件性質(zhì)進(jìn)行區(qū)分,測(cè)試數(shù)據(jù)的準(zhǔn)確度可達(dá)85%以上.Linville等(2019)分別使用卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)對(duì)美國(guó)猶他州近五年的采石場(chǎng)爆破事件和天然地震事件識(shí)別,使用時(shí)頻圖作為輸入數(shù)據(jù)的準(zhǔn)確度高達(dá)98%.隗永剛等(2019)利用殘差網(wǎng)絡(luò)模型對(duì)河北三河采石場(chǎng)的爆破事件和天然地震進(jìn)行分類.Kim等(2020)使用波形信息作為輸入樣本,并利用支持向量機(jī)進(jìn)行爆破和天然地震事件識(shí)別.毛世榕等(2020)結(jié)合RBF 神經(jīng)網(wǎng)絡(luò)技術(shù),利用天然地震震源和人工爆破震源之間信號(hào)能量分布的差異進(jìn)行分類,識(shí)別率高達(dá)88.1%.
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種非常著名的深度學(xué)習(xí)方法,具有強(qiáng)大的圖像識(shí)別能力(Krizhevsky et al., 2012).相比于傳統(tǒng)的天然地震和爆破事件檢測(cè)方法,CNN不需要提前給出定性化的指標(biāo)或特征,而是通過大量已標(biāo)定事件性質(zhì)樣本的訓(xùn)練,使計(jì)算機(jī)從輸入的樣本中自動(dòng)學(xué)習(xí)爆破和天然地震特征,從而實(shí)現(xiàn)對(duì)新的輸入樣本進(jìn)行預(yù)測(cè).目前,已有的基于深度學(xué)習(xí)的事件屬性識(shí)別網(wǎng)絡(luò)大都采用單一的樣本信息,即輸入樣本多為單個(gè)臺(tái)站記錄的波形(Kim et al., 2020)或時(shí)頻數(shù)據(jù)(Linville et al., 2019).Tian等(2020)利用多道數(shù)據(jù)的P波初至信息進(jìn)行地面微地震極性預(yù)測(cè),相比單道數(shù)據(jù)精度顯著增加.因此,我們提出使用混合數(shù)據(jù)作為訓(xùn)練樣本的多輸入卷積神經(jīng)網(wǎng)絡(luò)模型.混合樣本包括單道波形的時(shí)頻數(shù)據(jù)和同一事件多個(gè)臺(tái)站的波形記錄,使神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到天然地震和爆破事件的時(shí)頻、波形和極性特征.本文的研究數(shù)據(jù)為猶他州的天然地震和采石場(chǎng)爆炸事件,先使用2012年的數(shù)據(jù)作為樣本訓(xùn)練網(wǎng)絡(luò)模型,然后將該區(qū)域2013—2016年的監(jiān)測(cè)數(shù)據(jù)用于網(wǎng)絡(luò)模型驗(yàn)證.
以美國(guó)猶他州及其周邊地區(qū)為研究區(qū)域(114°W—109°W,37°N—42°N),本文根據(jù)Linville等(2019)提供的地震目錄,從IRIS上下載了2012—2016年猶他州大學(xué)地震臺(tái)站(University of Utah Seismograph Stations,簡(jiǎn)稱UUSS)記錄的1471個(gè)局部的天然地震事件(Local earthquake,簡(jiǎn)稱le)和1426個(gè)采石場(chǎng)爆破(Quarry blast,簡(jiǎn)稱qb)事件.震級(jí)范圍為ML-0.8~3.7,震中距范圍為0.1~432 km,信噪比范圍為0.2~6.研究區(qū)域有167個(gè)監(jiān)測(cè)臺(tái)站,最后得到11756個(gè)天然地震震相和11714個(gè)爆破事件震相.圖1為研究區(qū)域的地震臺(tái)站、天然地震和爆破事件的分布圖.其中,三角形為臺(tái)站,紅色點(diǎn)為爆破事件,藍(lán)色點(diǎn)為天然地震事件.利用地震目錄中拾取的P波到時(shí),截取P波到時(shí)的前10 s和后70 s的波形為研究數(shù)據(jù).首先對(duì)原始波形進(jìn)行100 Hz重采樣、去儀器響應(yīng)和均值傾向,然后對(duì)數(shù)據(jù)進(jìn)行1~20 Hz帶通濾波.
圖1 臺(tái)站(黑色三角形)、天然地震(藍(lán)色點(diǎn))與 爆破事件(紅色點(diǎn))分布Fig.1 Map of stations (black triangles), earthquakes (blue dots), and quarry blasts (red dots)
由于震源性質(zhì)不同,時(shí)域波形和頻譜是常用的區(qū)分天然地震和爆破事件的有效工具.考慮到頻域分析只適用于穩(wěn)態(tài)數(shù)據(jù),不能反映頻率隨時(shí)間的變化.而地震數(shù)據(jù)屬于非穩(wěn)態(tài)數(shù)據(jù),因此時(shí)頻分析能夠更好地分析地震信號(hào)的時(shí)頻特性.Linville等(2019)利用時(shí)頻數(shù)據(jù)作為輸入樣本進(jìn)行爆破事件和天然地震事件識(shí)別.根據(jù)地震目錄中給出的標(biāo)定結(jié)果,圖2畫出了一個(gè)天然地震事件的波形數(shù)據(jù)和時(shí)頻圖,波形數(shù)據(jù)長(zhǎng)度為80s,每個(gè)臺(tái)站的波形均歸一化到[0,1]區(qū)間.時(shí)頻圖的橫坐標(biāo)是時(shí)間,縱坐標(biāo)為頻率,時(shí)頻數(shù)據(jù)也歸一化到[0,1]區(qū)間.
波形圖和時(shí)頻圖包含了天然地震和爆破事件的震相能量、頻率分布等絕大多數(shù)信息,但是P波初至極性特征(爆破事件的P波初動(dòng)方向一般向上,而天然地震的P波初動(dòng)方向?yàn)樗南笙薹植?很難在單臺(tái)站記錄中體現(xiàn).例如,當(dāng)單臺(tái)的P波初至向上時(shí),無法通過極性判斷天然地震還是爆破事件.本文提出采用多臺(tái)站波形作為輸入樣本,不僅有助于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到天然地震和爆破事件的極性特征,相鄰臺(tái)站的記錄組合更有利于特征提取.圖3給出了2012—2016年的天然地震和爆破事件的臺(tái)站記錄個(gè)數(shù)直方圖.據(jù)統(tǒng)計(jì),接近90%的事件同時(shí)被4個(gè)以上的臺(tái)站記錄到.因此,本文采用某臺(tái)站和其相鄰的三個(gè)臺(tái)站的波形作為輸入樣本,如圖4所示.測(cè)試結(jié)果表明,多臺(tái)站波形只使用30s的波形數(shù)據(jù)便可以得到較好的精度,同時(shí)可縮短訓(xùn)練時(shí)間.
波形數(shù)據(jù)、時(shí)頻數(shù)據(jù)和多臺(tái)站波形數(shù)據(jù)均可作為訓(xùn)練樣本,并采用相同的標(biāo)簽:天然地震樣本標(biāo)定為0,爆破事件樣本標(biāo)定為1.本文采用UUSS在2012年記錄的數(shù)據(jù)進(jìn)行模型訓(xùn)練,共有5529個(gè)天然地震震相和4358個(gè)爆破事件震相.將所有樣本分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練樣本集和測(cè)試樣本集分別占3/4和1/4,兩個(gè)樣本集的樣本互不重疊.
圖2 天然地震的(a)波形圖和(b)時(shí)頻圖Fig.2 The waveform (a) and spectrogram (b) of an earthquake
圖3 天然地震和爆破事件的記錄臺(tái)站數(shù)直方圖Fig.3 Histogram of the number of recorded stations for natural earthquakes and quarry blasts
CNN是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò).CNN每個(gè)卷積層由一組濾波器組成,這些濾波器對(duì)前一層的輸出結(jié)果進(jìn)行卷積計(jì)算,以此來提取數(shù)據(jù)集的屬性特征從而用于天然地震和爆破事件識(shí)別.一般通過優(yōu)化學(xué)習(xí)過程和網(wǎng)絡(luò)結(jié)構(gòu),微調(diào)整個(gè)網(wǎng)絡(luò)的權(quán)重和偏差可以最大限度地提取這些特征.本文基于Keras平臺(tái)分別設(shè)計(jì)了單輸入CNN模型和多輸入CNN模型進(jìn)行天然地震和爆破事件分類.
圖4 天然地震和爆破事件的多臺(tái)波形數(shù)據(jù)Fig.4 Multi-waveforms of earthquake and quarry blast
CNN的輸入層可以處理多維數(shù)據(jù),可以是一維數(shù)組,也可以是二維或三維數(shù)組.根據(jù)單道波形、時(shí)頻圖和多道波形數(shù)組維度的區(qū)別,可分為以下三種CNN模型:
(1)基于波形的單輸入CNN模型(簡(jiǎn)稱CNN-waveform):截取80s的波形記錄作為輸入樣本,大小為1×8000的向量,其中1代表道數(shù),8000為時(shí)間域采樣點(diǎn)的個(gè)數(shù).
(2)基于時(shí)頻的單輸入CNN模型(簡(jiǎn)稱CNN-spectrogram):對(duì)波形數(shù)據(jù)進(jìn)行短時(shí)傅里葉變換,得到的時(shí)頻信息作為輸入樣本,大小為39×48.其中39為采樣時(shí)間個(gè)數(shù),48為采樣頻率個(gè)數(shù).
(3)基于多道波形的單輸入CNN模型(簡(jiǎn)稱CNN-multi-waveform)利用同一事件在多個(gè)臺(tái)站的波形記錄作為輸入層,大小為4×3000,其中4個(gè)臺(tái)站個(gè)數(shù),3000為時(shí)間域采樣點(diǎn)的個(gè)數(shù).
輸入樣本經(jīng)過若干個(gè)相互交替的卷積層、池化層提取極性特征后,再經(jīng)過一個(gè)或一個(gè)以上的全連接層,最后由Softmax分類器輸出兩個(gè)值,分別對(duì)應(yīng)輸入樣本為天然地震和爆破事件的概率值,其中最大概率值所對(duì)應(yīng)的類別即為該網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果.分類問題一般采用交叉熵?fù)p失函數(shù)來優(yōu)化網(wǎng)絡(luò)參數(shù),交叉熵通常用于衡量輸入(真實(shí))概率分布p和預(yù)測(cè)概率分布q之間的差異:
(1)
公式(1)中,N是訓(xùn)練數(shù)據(jù)集的大小.損失函數(shù)可使用隨機(jī)梯度下降算法迭代求解,每次迭代后,卷積核和權(quán)重將會(huì)被更新.在訓(xùn)練過程中,損失值(‘loss’)和準(zhǔn)確度(‘a(chǎn)ccuracy’)為判斷CNN模型的性能指標(biāo).
圖5 多輸入卷積神經(jīng)網(wǎng)絡(luò)框架示意圖. 該模型 具有兩個(gè)輸入分支,最終合并產(chǎn)生一個(gè)輸出Fig.5 Diagrammatic sketch of the multi-input convolutional neural network. This model has two input branches that ultimately merge and produce one output
以上三種單輸入CNN模型不能夠同時(shí)利用波形和頻率信息.多輸入CNN利用Keras的函數(shù)式API構(gòu)建,網(wǎng)絡(luò)框架示意圖如圖5所示.經(jīng)過測(cè)試,采用時(shí)頻數(shù)據(jù)和多道波形作為神經(jīng)網(wǎng)絡(luò)的輸入得到的模型精度較高.因此,多輸入CNN包括時(shí)頻和多道波形兩個(gè)輸入分支,先各自經(jīng)過卷積層、池化層、激活函數(shù)、全連接層的處理,分別提取天然地震和爆破事件的時(shí)頻特征和波形特征,然后進(jìn)行模型融合,再通過一個(gè)或一個(gè)以上的全連接層,最后由Softmax分類器輸出為天然地震和爆破事件的概率.
利用美國(guó)猶他州2012年監(jiān)測(cè)數(shù)據(jù)分別訓(xùn)練三個(gè)單輸入CNN模型和一個(gè)多輸入CNN模型.在喂入神經(jīng)網(wǎng)絡(luò)前,所有輸入樣本均進(jìn)行歸一化處理.四種網(wǎng)絡(luò)模型均使用四組卷積層,每組卷積層包含卷積層,最大池化層和Dropout層.其中卷積操作通過ReLu激活函數(shù)實(shí)現(xiàn)從輸入數(shù)據(jù)中提取特征.在卷積層之后緊跟著是最大池化層,主要功能為降維、對(duì)特征進(jìn)行壓縮、簡(jiǎn)化網(wǎng)絡(luò)復(fù)雜度等.Dropout層是指按照一定概率將神經(jīng)元從網(wǎng)絡(luò)中丟棄,從而降低模型的過擬合風(fēng)險(xiǎn).CNN的最后一層是全連接層,用于連接所有的輸出,并用Softmax激活函數(shù)計(jì)算分類概率.基于波形的CNN網(wǎng)絡(luò)在全連接層加入L2正則化以減小過擬合問題.三個(gè)單輸入CNN模型的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1、表2和表3所示.多輸入CNN的兩個(gè)分支仍采用表2和表3的參數(shù),只是在128通道的全連接層后進(jìn)行模型融合,然后利用Softmax實(shí)現(xiàn)分類.所有的CNN網(wǎng)絡(luò)均采用隨機(jī)梯度下降優(yōu)化方法進(jìn)行訓(xùn)練,學(xué)習(xí)率設(shè)定為0.01.基于波形數(shù)據(jù)的CNN模型的批量大小為8,迭代次數(shù)為200,另外三種CNN模型的批量大小為16,迭代次數(shù)為100.
表1 CNN-waveform網(wǎng)絡(luò)參數(shù)Table 1 The architecture parameters of CNN-waveform
表2 CNN-spectrogram網(wǎng)絡(luò)參數(shù)Table 2 The architecture parameters of CNN-spectrogram
表3 CNN-multi-waveform網(wǎng)絡(luò)參數(shù)Table 3 The architecture parameters of CNN-multi-waveform
四個(gè)CNN模型訓(xùn)練都是在英偉達(dá)(NVlDIA)GTX1080圖像處理單元上進(jìn)行的.基于波形、時(shí)頻和多道波形的CNN模型的訓(xùn)練時(shí)間分別為0.57、0.24和0.45 h,多輸入CNN模型的訓(xùn)練時(shí)間為0.52 h.四個(gè)CNN模型的準(zhǔn)確度-損失曲線如圖6所示.經(jīng)過多次迭代,訓(xùn)練集和測(cè)試集的準(zhǔn)確度-損失曲線均得到收斂.四個(gè)模型的訓(xùn)練數(shù)據(jù)集準(zhǔn)確度均接近99%.基于波形、時(shí)頻和多道波形的CNN模型的測(cè)試集準(zhǔn)確度分別為90.07%、94.13%和97.08%;基于時(shí)頻和多道波形的多輸入CNN模型的測(cè)試集準(zhǔn)確度為97.41%.
圖6 四種網(wǎng)絡(luò)訓(xùn)練過程的準(zhǔn)確度和損失曲線Fig.6 The training accuracy and cross-entropy loss function curves for four CNNs
支持向量機(jī)(Support Vector Machine, SVM)是機(jī)器學(xué)習(xí)領(lǐng)域中常見的分類算法,也被廣泛用于爆破事件和天然地震識(shí)別.相比于SVM,CNN的優(yōu)勢(shì)在于能夠直接從已標(biāo)定樣本中自動(dòng)學(xué)習(xí)特征,不需要提前提取爆破事件和天然地震的數(shù)據(jù)特征.表4分別對(duì)比了卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)基于波形、時(shí)頻和多道波形數(shù)據(jù)作為訓(xùn)練樣本的測(cè)試集準(zhǔn)確度.結(jié)果表明,當(dāng)SVM直接采用波形數(shù)據(jù)(單道波形或多道波形)作為樣本特征時(shí),SVM的準(zhǔn)確度遠(yuǎn)遠(yuǎn)低于CNN.而當(dāng)SVM使用時(shí)頻數(shù)據(jù)作為訓(xùn)練樣本時(shí),即采用頻譜作為數(shù)據(jù)特征,此時(shí)的測(cè)試集準(zhǔn)確度高達(dá)90%,但仍低于CNN模型的準(zhǔn)確度(94%).由此可以看出,CNN在沒有預(yù)先提取數(shù)據(jù)特征的情況下,具有較高的準(zhǔn)確度.
表4 卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的測(cè)試集準(zhǔn)確度對(duì)比Table 4 Comparison of test accuracy between CNN and SVM
將訓(xùn)練好的四個(gè)CNN模型對(duì)猶他州2013—2016年發(fā)生的天然地震和爆破事件進(jìn)行分類.本文選用的事件分為:2013年的217個(gè)天然地震、2014年544個(gè)天然地震、2013年283個(gè)爆破事件、2014年158個(gè)爆破事件、2015年224個(gè)爆破事件以及2016年363個(gè)爆破事件.首先,對(duì)預(yù)測(cè)數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,分別產(chǎn)生波形數(shù)據(jù)、時(shí)頻數(shù)據(jù)和多道波形數(shù)據(jù).然后,根據(jù)預(yù)測(cè)結(jié)果與地震目錄中標(biāo)簽的差異評(píng)價(jià)網(wǎng)絡(luò)模型的準(zhǔn)確度.
首先,以每個(gè)測(cè)試樣本(臺(tái)站記錄)識(shí)別的正確率作為衡量標(biāo)準(zhǔn),簡(jiǎn)稱為基于臺(tái)站的識(shí)別率.圖7和表5為基于波形、時(shí)頻以及多道波形樣本的單輸入CNN模型以及多輸入CNN模型對(duì)猶他州2013—2016年記錄數(shù)據(jù)的預(yù)測(cè)結(jié)果與地震目錄標(biāo)簽的差異.對(duì)比不同的CNN模型可以發(fā)現(xiàn),基于波形的CNN模型的識(shí)別率最低,而基于多道波形數(shù)據(jù)的CNN模型的識(shí)別率在大多數(shù)情況下優(yōu)于基于時(shí)頻數(shù)據(jù)的CNN模型.此外,對(duì)比圖7的三角形和正方形線段,可以發(fā)現(xiàn)采用時(shí)頻數(shù)據(jù)和多道波形數(shù)據(jù)作為訓(xùn)練樣本時(shí),能夠有效提高爆破事件的識(shí)別率.從數(shù)據(jù)類型上來看,天然地震(le2013,le2014)的識(shí)別率要普遍高于爆破事件(qb2013,qb2014,qb2015,qb2016).
圖7 基于臺(tái)站的識(shí)別率對(duì)比Fig.7 Comparison of station-based discrimination rate
表5 基于臺(tái)站的識(shí)別率對(duì)比Table 5 The comparison of discrimination accuracy based on station records
然后,以每個(gè)事件被識(shí)別的正確率作為衡量標(biāo)準(zhǔn),簡(jiǎn)稱為基于事件的識(shí)別率.圖8為基于波形(圖8a)、時(shí)頻(圖8b)、多道波形的單輸入CNN模型(圖8c)以及多輸入CNN模型(圖8d)對(duì)猶他州2013—2016年記錄事件的識(shí)別率.圖8中的橫坐標(biāo)為事件被所記錄臺(tái)站識(shí)別的正確率,0代表所有臺(tái)站記錄均識(shí)別錯(cuò)誤,1代表所有臺(tái)站記錄均識(shí)別正確.從圖8中能夠明顯看出,采用多道波形作為輸入樣本(圖8c和圖8d),事件的臺(tái)站識(shí)別率得到了大幅度的增加.表6和表7分別給出了四種網(wǎng)絡(luò)基于50%記錄被正確判別的識(shí)別率和基于90%記錄被正確判別的識(shí)別率.通過對(duì)比基于50%記錄被正確判別的識(shí)別率可以發(fā)現(xiàn),使用多道波形數(shù)據(jù)樣本并沒有優(yōu)勢(shì),但是基于90%的臺(tái)站記錄的識(shí)別率得到了很大的提高.結(jié)合圖8分析可知,利用多道波形數(shù)據(jù)作為輸入樣本,使CNN能夠結(jié)合多個(gè)臺(tái)站記錄一起判斷事件屬性,提高識(shí)別率.
圖8 基于事件的識(shí)別率對(duì)比 (a) 基于波形樣本的CNN; (b) 基于時(shí)頻樣本的CNN; (c) 基于多道波形樣本的CNN; (d) 基于時(shí)頻數(shù)據(jù)和多道波形數(shù)據(jù)的多輸入CNN.Fig.8 Comparison of event-based discrimination rate (a) CNN-waveform; (b) CNN-spectrogram; (c) CNN-multi-waveform; (d) CNN-mixed.
表6 4種網(wǎng)絡(luò)基于事件的50%識(shí)別率對(duì)比Table 6 Comparison of the four networks with 50% event-based discrimination accuracy
表7 4種網(wǎng)絡(luò)基于事件的90%識(shí)別率對(duì)比Table 7 Comparison of the four networks with 90% event-based discrimination accuracy
最后,分析了事件的震級(jí)和信噪比對(duì)多輸入CNN模型的準(zhǔn)確度的影響.圖9a為波形信噪比與識(shí)別準(zhǔn)確度的關(guān)系,可以看出當(dāng)信噪比較低時(shí)(0.2~0.6),多輸入CNN模型的準(zhǔn)確度只有72%.隨著信噪比的增加,準(zhǔn)確度逐漸增加到90%左右,當(dāng)信噪比大于1時(shí),準(zhǔn)確度趨于穩(wěn)定.由此可以看出,多輸入CNN模型具有較強(qiáng)的抗噪能力.圖9b為不同的震級(jí)對(duì)應(yīng)的事件100%識(shí)別率,圖中可以明顯看出,隨著震級(jí)的增加,地震事件和爆破事件的識(shí)別率線性增加,當(dāng)震級(jí)大于2時(shí),識(shí)別率基本上穩(wěn)定在74%左右.卷積神經(jīng)網(wǎng)絡(luò)是基于數(shù)據(jù)驅(qū)動(dòng)的算法,樣本標(biāo)簽的準(zhǔn)確度會(huì)直接影響模型的檢測(cè)能力.當(dāng)數(shù)據(jù)信噪比較低、震級(jí)較小時(shí),人工給定的數(shù)據(jù)標(biāo)簽的正確率也會(huì)降低,從而導(dǎo)致事件誤識(shí)別率增加.
圖9 波形數(shù)據(jù)的信噪比(a)和事件震級(jí)(b)對(duì)多輸入CNN模型準(zhǔn)確度的影響 Fig.9 The effect of the signal-to-noise ratio (a) and event magnitude (b) of the recorded data on the discrimination accuracy of the multi-input CNN
本文將卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到美國(guó)猶他州的天然地震和爆破事件識(shí)別中.不同于傳統(tǒng)的機(jī)器學(xué)習(xí)算法,卷積神經(jīng)網(wǎng)絡(luò)不需要手動(dòng)提取特征數(shù)據(jù),而是直接從輸入樣本中自動(dòng)提取天然地震和爆破事件的特征.因此,輸入樣本所包含的特征信息對(duì)卷積神經(jīng)網(wǎng)絡(luò)算法至關(guān)重要.通過比較天然地震和爆破事件屬性識(shí)別的四種CNN分類網(wǎng)絡(luò):基于波形、時(shí)頻數(shù)據(jù)、多道波形的單輸入網(wǎng)絡(luò)和基于時(shí)頻數(shù)據(jù)和多道波形的多輸入網(wǎng)絡(luò),我們發(fā)現(xiàn)以時(shí)頻數(shù)據(jù)作為訓(xùn)練樣本的單輸入CNN模型精度遠(yuǎn)高于以波形數(shù)據(jù)為樣本的模型.多輸入CNN模型不僅能夠?qū)W習(xí)到波形、時(shí)頻和極性信息,還可以通過多臺(tái)站的相互約束提高網(wǎng)絡(luò)模型的精度.根據(jù)美國(guó)猶他州2012年已知事件屬性標(biāo)簽的地震資料,對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并將此模型應(yīng)用于2013—2016年間的數(shù)據(jù),驗(yàn)證了多輸入CNN模型的有效性.
本文訓(xùn)練的多輸入CNN模型的不足之處在于限制了事件的臺(tái)站數(shù),只有臺(tái)站數(shù)大于等于4的事件才能夠利用該模型進(jìn)行屬性識(shí)別.在實(shí)際應(yīng)用中,可根據(jù)研究區(qū)域的臺(tái)站分布訓(xùn)練出不同臺(tái)站數(shù)的多輸入CNN模型,當(dāng)事件的臺(tái)站數(shù)不滿足模型要求時(shí),可使用基于時(shí)頻數(shù)據(jù)的單輸入CNN模型進(jìn)行預(yù)測(cè).此外,文中訓(xùn)練的多輸入CNN模型能夠用于美國(guó)猶他州未來的天然地震和爆破事件識(shí)別,但對(duì)其泛化能力還有待測(cè)試研究.本文提出的基于時(shí)頻數(shù)據(jù)和多道波形的多輸入CNN網(wǎng)絡(luò)算法對(duì)于其他區(qū)域的事件屬性識(shí)別,包括天然地震、爆破和塌陷事件的分類具有一定的參考意義.
致謝感謝IRIS網(wǎng)站提供的地震數(shù)據(jù)(https:∥www.iris.edu)以及審稿人提出的寶貴意見.