尹欣欣, 蔡 潤(rùn), 陳文凱, 彭立順, 李少華
(1. 甘肅省地震局, 甘肅 蘭州 730000; 2.中冶成都勘察研究總院有限公司, 四川 成都 610063;3. 廣東省建筑科學(xué)研究院集團(tuán)股份有限公司, 廣東 廣州 510500)
地震事件可以根據(jù)其產(chǎn)生機(jī)理分為天然地震以及非天然地震兩類,人工爆破以及塌陷地震屬于非天然地震中較常見的地震事件[1-2]。甘肅省測(cè)震臺(tái)網(wǎng)記錄到的甘肅華亭地區(qū)塌陷地震[3-4],給我們的研究提供了一定量的數(shù)據(jù)基礎(chǔ)。利用甘肅數(shù)字地震臺(tái)網(wǎng)所紀(jì)錄的地震觀測(cè)資料,深入研究主要礦區(qū)塌陷地震發(fā)生的規(guī)律,不但可以減輕塌陷地震所引起的各種災(zāi)害及損失,為甘肅省防震減災(zāi)工作提供決策依據(jù),同時(shí)還可以探索和建立一種適合甘肅地區(qū)能源開發(fā)、治理和保護(hù)的方案,建立健全礦山生態(tài)環(huán)境保護(hù)長(zhǎng)效監(jiān)管機(jī)制,保證甘肅地區(qū)經(jīng)濟(jì)社會(huì)健康發(fā)展,人與自然和諧相處。然而,塌陷地震與天然地震的波形具有較高的相似性,圖1(a)波形為典型天然地震事件,圖1(b)波形為典型的平?jīng)鏊莸卣鹗录?直觀上看二者在頻率周期以及能量分布上有一定差別,但實(shí)際上在日常工作中碰到的波形比圖中展示的更為復(fù)雜,分析人員根據(jù)經(jīng)驗(yàn)和波形特征進(jìn)行識(shí)別要花費(fèi)時(shí)間較多,缺乏時(shí)效性,因此亟需研究一種能夠及時(shí)準(zhǔn)確地識(shí)別天然地震與塌陷地震事件的方法,建立準(zhǔn)確的事件目錄,為快速開展塌陷災(zāi)害防治工作提供重要科技支撐,為地方經(jīng)濟(jì)發(fā)展、國(guó)土資源規(guī)劃提供依據(jù),對(duì)開展地震學(xué)研究等也具有重要意義。
圖1 典型天然地震與典型塌陷地震事件波形能量特征對(duì)比Fig.1 Comparison between waveform energy characteristics of typical natural earthquakes and collapse earthquakes
現(xiàn)階段對(duì)于地震與礦區(qū)或是巖溶塌陷事件識(shí)別的研究主要是基于地震波形特征來區(qū)分的,如林懷存等[5]利用魯中南臺(tái)網(wǎng)所記錄到的地震資料,從地震初動(dòng)、波速、頻率、振幅衰減以及Q值幾個(gè)方面對(duì)構(gòu)造地震和塌陷地震兩類地震進(jìn)行了區(qū)分;毛世榕等[6]以近年來廣西地震臺(tái)網(wǎng)中心記錄的天然地震和巖溶塌陷為例,嘗試?yán)没谛〔ò姆中魏蛷较蚧瘮?shù)神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)這兩類事件的波形進(jìn)行識(shí)別,結(jié)果表明,基于小波包分形與神經(jīng)網(wǎng)絡(luò)相結(jié)合的事件識(shí)別方法對(duì)天然地震和巖溶塌陷事件的識(shí)別率高達(dá)89.5%,可作為識(shí)別天然地震與巖溶塌陷的一個(gè)有效方法;陳潤(rùn)航等[7]從震源波形中提取梅爾頻率倒譜系數(shù)(MFCC)圖,然后采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行地震波形信號(hào)的震源類型—天然地震和爆破事件—分類識(shí)別,最終得到了97.1%的正確識(shí)別率。從上述方法中不難看出卷積神經(jīng)網(wǎng)絡(luò)方法識(shí)別率較高,卷積神經(jīng)網(wǎng)絡(luò)方法是計(jì)算機(jī)模式識(shí)別領(lǐng)域很常見的圖像識(shí)別方法,本文嘗試?yán)迷摲椒ㄖ苯右缘卣鸩ㄐ巫鳛檠芯繑?shù)據(jù)來識(shí)別塌陷波形,直接利用波形進(jìn)行計(jì)算可以使實(shí)時(shí)地震監(jiān)測(cè)中非天然地震的識(shí)別更效率。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),是深度學(xué)習(xí)(deep learning)的代表算法之一。對(duì)卷積神經(jīng)網(wǎng)絡(luò)的研究始于20世紀(jì)80至90年代,時(shí)間延遲網(wǎng)絡(luò)和LeNet-5是最早出現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)算法;在21世紀(jì)后,隨著深度學(xué)習(xí)理論的提出和數(shù)值計(jì)算設(shè)備的改進(jìn),卷積神經(jīng)網(wǎng)絡(luò)得到了快速發(fā)展,并被大量應(yīng)用于計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)長(zhǎng)期以來是圖像識(shí)別領(lǐng)域的核心算法之一,并在大量學(xué)習(xí)數(shù)據(jù)時(shí)有穩(wěn)定的表現(xiàn)。通常,一個(gè)卷積網(wǎng)絡(luò)架構(gòu)由多個(gè)階段組成,前幾個(gè)階段包含有卷積層和池化層。圖2為基本的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structural diagram of convolutional neural network
在卷積層中,主要是使用可學(xué)習(xí)的卷積核與上一層輸出的特征圖進(jìn)行卷積運(yùn)算,然后通過一個(gè)激活函數(shù)傳遞給下一層。卷積層中各輸出特征圖的[8]計(jì)算公式為
池化層也稱降采樣層,計(jì)算某一位置相鄰域的統(tǒng)計(jì)特征作為輸出。降采樣層實(shí)質(zhì)是對(duì)輸入的特征圖進(jìn)行降采樣操作,例如最大池化函數(shù)給出相鄰矩形區(qū)域內(nèi)的最大值。降采樣層的各輸出特征圖的計(jì)算公式為
預(yù)測(cè)值與真實(shí)值之間總是會(huì)存在誤差的,而反向傳播就是通過計(jì)算這些誤差,進(jìn)而更新各層的權(quán)值,使得實(shí)際的網(wǎng)絡(luò)輸出更加準(zhǔn)確。如使用交叉熵作為代價(jià)函數(shù),計(jì)算公式為
式中:y表示目標(biāo)向量;a表示輸出向量;nclass表示類別數(shù),需要強(qiáng)調(diào)的是a為卷積神經(jīng)網(wǎng)絡(luò)最后一層的輸出向量經(jīng)過Softmax函數(shù)計(jì)算后得到的向量。
本文研究數(shù)據(jù)選取甘肅測(cè)震臺(tái)網(wǎng)監(jiān)測(cè)到的甘東南地區(qū)34°~37°N,104°~107°E范圍內(nèi)的100個(gè)地震事件,其空間分布見圖3。該地區(qū)是甘肅地區(qū)內(nèi)地震頻發(fā)的區(qū)域,其中包括典型天然地震事件與塌陷地震事件各50個(gè),圖中綠色圓圈代表的天然地震事件,紅色圓圈代表的塌陷地震事件,事件波形記錄臺(tái)站平均10個(gè)左右,每個(gè)臺(tái)站具有3個(gè)通道,即天然地震事件與塌陷地震事件樣本數(shù)據(jù)各為1 500條,總樣本數(shù)為3 000。塌陷地震選取甘肅華亭地區(qū)ML1.0以上地震事件,天然地震事件選取該地區(qū)附近地震事件,為使兩者在計(jì)算機(jī)進(jìn)行深度學(xué)習(xí)時(shí)迭代次數(shù)接近,故選取同樣數(shù)量級(jí)的樣本數(shù)據(jù)。波形數(shù)據(jù)選取,P波到時(shí)前10 s到最大面波振幅出現(xiàn)后1分鐘內(nèi)。為消除噪聲對(duì)信號(hào)的干擾,本研究所有數(shù)據(jù)均采用數(shù)字濾波器濾除頻率低于1 Hz的信號(hào)。待測(cè)數(shù)據(jù)為天然地震事件與塌陷地震事件各15個(gè),為保持統(tǒng)一性,同樣采用數(shù)字濾波器濾除頻率低于1 Hz的信號(hào)。
圖3 樣本地震事件分布圖Fig.3 Distribution map of sample seismic events
卷積網(wǎng)絡(luò)框架中各層采用的激活函數(shù)為ReLU函數(shù),使用交叉熵作為卷積網(wǎng)絡(luò)的損失函數(shù),Adam算法[9]作為優(yōu)化方法。網(wǎng)絡(luò)輸出為二維的浮點(diǎn)型向量,通過Softmax函數(shù)計(jì)算后,將該二維向量中的最大值置為1,最小值置為0,將震源波形特征對(duì)應(yīng)的輸出向量與該震源波形的標(biāo)簽進(jìn)行比較,如果相同,則認(rèn)為是識(shí)別正確,否則認(rèn)為是識(shí)別錯(cuò)誤。為了確定卷積網(wǎng)絡(luò)各卷積層和其對(duì)應(yīng)輸出特征圖的最優(yōu)個(gè)數(shù),在實(shí)驗(yàn)中,使用多種結(jié)構(gòu)的卷積網(wǎng)絡(luò)進(jìn)行測(cè)試,結(jié)果表明:卷積層為8層,池化層為7層,經(jīng)過各卷積層后最終輸出特征圖個(gè)數(shù)為128,且卷積網(wǎng)絡(luò)的平均識(shí)別率較好(圖4)。
具體過程為:首先從樣本地震事件中挑選有效波形并進(jìn)行預(yù)處理操作,該過程中為兩種事件類型的各波形分量添加標(biāo)簽(塌陷地震用0表示,天然地震用1表示)。之后使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到一個(gè)天然地震事件震動(dòng)波形與塌陷事件震動(dòng)波形分類器。對(duì)測(cè)試事件采取同樣的預(yù)處理操作后再利用訓(xùn)練好的波形分類器對(duì)測(cè)試數(shù)據(jù)逐個(gè)以波形通道為單元進(jìn)行分類識(shí)別,設(shè)定波形通道總數(shù)80%為地震事件分類閾值,即超過80%的波形通道為“0”或“1”即判定該待測(cè)事件為對(duì)應(yīng)的事件類型。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 Structure diagram of convolutional neural network
根據(jù)圖5波形通道總數(shù)80%為地震事件分類閾值,最終準(zhǔn)確識(shí)別地震個(gè)數(shù)分別為塌陷地震13個(gè),天然地震為14個(gè),即對(duì)應(yīng)的最終分類準(zhǔn)確識(shí)別率為86.7%,準(zhǔn)確識(shí)別率為93.3%。具體分量識(shí)別詳細(xì)結(jié)果列于表1。
圖5 兩類地震事件識(shí)別錯(cuò)誤率Fig.5 Recognition error rate of two types of seismic events
表1 識(shí)別結(jié)果
卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別上具有明顯的優(yōu)勢(shì),本文為了區(qū)分天然地震和塌陷地震,將地震事件作為原始圖像,然后對(duì)輸入圖像進(jìn)行初始化,卷積層的卷積核對(duì)初始化的圖像進(jìn)行卷積,提取圖像中最具代表性特征點(diǎn);接著提取圖像特征進(jìn)入池化層后池化層會(huì)對(duì)圖像特征點(diǎn)進(jìn)行歸類壓縮,提取最具代表性的圖像特征,最終經(jīng)過8層卷積過程最終得到128個(gè)特征值從而對(duì)圖像進(jìn)行識(shí)別,最后輸出識(shí)別圖像。對(duì)應(yīng)的塌陷地震最終分類準(zhǔn)確識(shí)別率為86.7%,天然地震準(zhǔn)確識(shí)別率為93.3%,總識(shí)別率為90%,具有很好的識(shí)別率,為今后平?jīng)龅貐^(qū)塌陷地震事件類別識(shí)別工作提供了可靠的參考價(jià)值。
在地震事件分類閾值設(shè)定過程中是個(gè)值得注意的問題,閾值太高,會(huì)降低識(shí)別率,閾值過低又將導(dǎo)致結(jié)果準(zhǔn)確度不可靠,本文靠多年震相分析積累結(jié)果設(shè)定的閾值還將在今后研究中進(jìn)一步驗(yàn)證,另外,區(qū)域地質(zhì)背景以及傳播路徑等方面差異會(huì)造成地震記錄波形特征不同。因此,本研究獲得的指標(biāo)僅是在甘肅華亭地區(qū)地震類型識(shí)別中具有一定參考價(jià)值,不一定適用于其它地區(qū)。本文研究樣本為已知類型事件,今后將收集更多的事件樣本,進(jìn)行更廣泛的識(shí)別訓(xùn)練和研究,不斷地完善和驗(yàn)證判定指標(biāo)的普適性。