劉方斌 曲均浩 張志慧
(山東省地震局 山東 濟南 250102)
在實際地震監(jiān)測和分析中,分析人員根據(jù)實際積累的經(jīng)驗和資料,從波形的整體特征定性判斷,能夠識別天然地震和礦震。然而有些波形信號僅靠定性判斷很難加以識別,且主觀因素較大,山東地區(qū)曾經(jīng)發(fā)生過幾次天然地震與礦震識別困難的有感事件,一度引起省、市兩級政府的高度重視,因而找出一種切實可行的識別天然地震和礦震的定量方法顯得尤為重要。
目前,國內(nèi)外在天然與非天然地震識別方面進行了廣泛研究,并提出了多種識別方法。如:P波初動[1]、震源深度、體波震級和面波震級之比[2]、P波初動振幅與P波最大振幅比、P波與S波譜振幅比[3]、P波譜振幅與勒夫波譜振幅比[4]、最大振幅與尾波持續(xù)時間比[5]等。另外,小波算法、人工神經(jīng)網(wǎng)絡、遺傳算法等方法也被用于對天然與非天然地震的識別研究中[6-7]。
近年來,利用BP神經(jīng)網(wǎng)絡對地震事件進行分類識別已有很多科研成果,例如邊銀菊等[7]對北京及周邊地區(qū)的73次地震和9次爆破事件的P波和S波的頻譜進行計算,并在0.1~10 Hz頻率范圍內(nèi)采用對數(shù)采樣的方式分別得到P波和S波的對數(shù)譜振幅值,然后將獲得的對數(shù)譜振幅值標準化后再進行網(wǎng)絡識別;張帆等[8]通過提取地震事件的時空參數(shù)和小波能量比,對內(nèi)蒙古阿拉善地區(qū)的天然地震和爆破事件進行自動識別;曲均浩等[9]采用Morlet小波的時頻分布方法來確定地震波信號主周期窗長,并以此為輸入元進行網(wǎng)絡識別。盡管上述方法識別效果良好,但是提取特征值時相對繁瑣,并且耗時耗力,無法在地震速報規(guī)定內(nèi)(10分鐘以內(nèi))完成地震事件的識別及報送。因此,有必要選擇其他典型的特征值來快速高效地識別地震事件。
本文基于BP神經(jīng)網(wǎng)絡方法,對山東臺網(wǎng)記錄的天然與非天然地震進行深度學習,抓住二者典型的量化特征(P波初動方向、P波初動振幅與S波最大振幅比以及P波最大振幅與S波最大振幅比),快速開展天然與非天然地震事件的識別研究,為區(qū)域天然和非天然地震模式識別提供了新的理論依據(jù)。
BP神經(jīng)網(wǎng)絡,又稱反向傳播網(wǎng)絡,是目前應用最為流行的人工神經(jīng)網(wǎng)絡模型之一[9]。該網(wǎng)絡主要由輸入層、隱含層和輸出層組成,結(jié)構(gòu)如圖1所示。其核心主要分為前期的網(wǎng)絡學習和后期的預測過程兩個階段,前者是通過對訓練樣本的持續(xù)學習,不斷調(diào)整網(wǎng)絡節(jié)點和閾值,使得輸出的誤差值達到最??;后者則是將訓練好的預測結(jié)果輸出,然后通過擬對預測結(jié)果和期望輸出進行擬合分析,根據(jù)相關(guān)系數(shù)判斷網(wǎng)絡性能的好壞,從而達到預期效果。
圖1 BP神經(jīng)網(wǎng)絡結(jié)構(gòu)圖
第一階段的學習過程主要分為信息正向傳播和誤差的反向傳播兩方面。當信息正向傳播時,信息從輸入層經(jīng)隱含層逐層進行計算,并將處理結(jié)果傳向輸出層,然后由輸出層向外界輸出。當實際結(jié)果與期望值不符時,則將誤差信號值沿原路進行反向傳播,并逐一改變網(wǎng)絡權(quán)值和閾值,直至達到預期結(jié)果。
BP網(wǎng)絡的學習過程的學習算法屬于δ算法,它是一種監(jiān)督訓練多層網(wǎng)絡的算法。主要是通過不斷的學習,使輸出結(jié)果的誤差平方和達到最小值。具體如下:
假設(shè)輸入向量為X,輸出向量為Y,中間含有一層隱含層,相鄰兩層之間以Sigmoid函數(shù)作為傳遞函數(shù)進行計算,即:
(1)
(2)
式中:O為輸入層經(jīng)過權(quán)值ωij和閾值a到隱含層所輸出的值,S則為隱含層經(jīng)過權(quán)值ωjp和閾值b所計算的輸出預測值。然后根據(jù)網(wǎng)絡預測輸出S和期望輸出Y,計算網(wǎng)絡預測誤差e,即:
ep=Yp-Sp
(3)
最后對網(wǎng)絡權(quán)重與神經(jīng)元偏置調(diào)整,即:
(4)
ωjp=ωjp+ηOjep
(5)
(6)
bp=bp+ep
(7)
式中:η為學習速率。
當學習完成以后,需要對神經(jīng)網(wǎng)絡的預測結(jié)果進行檢驗,即將學習訓練好的結(jié)果以非線性函數(shù)的方式輸出,并通過預測輸出和期望輸出分析其擬合能力,從而判斷網(wǎng)絡性能的好壞。為了獲得較好的網(wǎng)絡性能,首先學習樣本必須達到一定的數(shù)據(jù)量,并且所選取的數(shù)據(jù)具有一定的代表性,其次是測試樣本要與學習樣本不同[10]。
天然和非天然地震(爆破、塌陷)事件發(fā)生時均會釋放出大量的能量,其中絕大部分能量以彈性波形式從震源區(qū)向外射出,并以數(shù)字地震波的形式被地震儀記到[11]。但由于其震源物理機制不同,相應產(chǎn)生的地震波亦有不同特征(圖2),這種特征是區(qū)分天然地震、爆破及塌陷的最直接方法。前人研究表明,P波初動方向、振幅比是識別天然與非天然地震的2個最主要判據(jù)[1]。根據(jù)先前地震目錄統(tǒng)計發(fā)現(xiàn),山東地區(qū)的各類地震事件主要集中在某特定區(qū)域,如天然地震集中在斷裂附近(乳山、墾利、長島、黃海等地),非天然地震主要發(fā)生在省內(nèi)的各大礦區(qū)內(nèi)(如鄒城、曲阜、泰安、嶧城等地),并且同一地區(qū)的相近震級的地震波形幾乎一致。因此,本文選取山東地區(qū)近幾年的地震事件的波形記錄,為了保證檢測結(jié)果的可靠性,隨機選擇不同區(qū)域不同震級大小的地震事件100個作為研究對象,其中選擇30個天然地震、20個爆破事件和20個塌陷事件作為訓練樣本,剩下每類10個作為測試樣本。上述樣本長度足以涵蓋所有震區(qū)的不同級別的地震事件,具有一定的樣品代表性,滿足實驗需求。
圖2 不同地震事件波形圖
由于山東地區(qū)地震監(jiān)測臺網(wǎng)密度相對較大,其中固定的測震臺站128個,強震臺站146個,科學臺陣96個,因此某一地震事件往往可以被多個臺站所記錄到。實驗過程中,為保證一定的信噪比,在選擇的地震事件中擇取記錄清晰、信噪比高的臺站(即選擇地震波與地脈動易于人工辨別的臺站波形,如圖2),從而用于提取P波初動方向、P波初動振幅(Pc)、最大振幅(Pm)以及S波最大振幅(Sm)等特征值,各類參數(shù)值如圖3所示。由于爆破事件屬于膨脹源,P波初動以向上為主,因此比例幾乎均在100%;天然地震在地震臺站屬于四象限分布,P波初動既有向上的也有向下的方向;而塌陷事件屬于壓縮源,P波初動主要以向下為主(圖3(a))。圖3(b)是P波初動振幅(Pc)與S波最大振幅(Sm)之比,我們發(fā)現(xiàn)人工爆破與塌陷地震的Pc/Sm大致以0.4為臨界值,大于0.4的為爆破,小于0.4的為塌陷,而天然地震則分布閾相對寬闊。另外,P波最大振幅(Pm)以及S波最大振幅(Sm)比圖中(圖3(c)),爆破和塌陷地震均位于0.5~1.0之間,而天然地震同樣分散分布其中。綜上,選擇P波初動方向、振幅比作為特征值來識別天然與非天然地震是可取的。
注:叉號為地震,圓點為爆破,菱形為塌陷圖3 P波初動百分比、P波初動振幅、最大 振幅與S波最大振幅比
模型的構(gòu)建主要包括確定BP網(wǎng)絡模型的層數(shù)、各層的神經(jīng)元個數(shù),選取激活函數(shù)、初始權(quán)值、學習速率等方面。對于BP神經(jīng)網(wǎng)絡模型,輸入層選擇P波初動值(1表示向上,0表示向下)、Pc/Sm、Pm/Sm作為神經(jīng)元,輸出層的神經(jīng)元為天然地震(1,0,0)、爆破(0,1,0)和塌陷(0,0,1),隱含層則根據(jù)訓練情況選擇單層10個神經(jīng)元。對上述70個地震事件共計255條數(shù)據(jù)進行學習、反復訓練,最后得到所需的各權(quán)值和權(quán)重動量(本文選擇0.8)。學習速率影響系統(tǒng)學習過程的穩(wěn)定性。過大的學習速率可能使網(wǎng)絡權(quán)值的修正量過大,導致系統(tǒng)不穩(wěn)定;過小的學習速率會導致訓練時間過長,收斂速度較慢。因此,一般傾向于選取較小的學習速率以保證學習過程的收斂性及系統(tǒng)的穩(wěn)定性,通常學習速率的選取范圍為0.01~0.8,本文選擇0.15。選用的傳遞函數(shù)為Sigmoid函數(shù)。
將70個訓練樣本代入建立好的神經(jīng)網(wǎng)絡模型中對網(wǎng)絡進行訓練,直至輸出誤差滿足收斂準則。然后將30個預測樣本代入訓練好的網(wǎng)絡中,經(jīng)過多次迭代,目標誤差達到最小。表1列出了各測試樣本的震級實際事件類型、BP網(wǎng)絡輸出結(jié)果及最終判定結(jié)果等相關(guān)信息。從表中可以發(fā)現(xiàn),參與測試的30個樣本中僅有21號樣本輸出結(jié)果錯誤,其預測正確率達到96.67%,預測結(jié)果非常理想。究其錯誤原因主要是由于該地震事件震級較小,記錄到的地震波形的臺站僅有1個,且P波初動的方向向下,另外該地區(qū)發(fā)生地震的次數(shù)相對較少,缺乏一定的訓練樣本,無法對類似事件進行反復學習,使得預測結(jié)果出現(xiàn)偏差。
表1 BP神經(jīng)網(wǎng)絡檢驗結(jié)果
續(xù)表1
本文采用BP神經(jīng)網(wǎng)絡方法對山東地區(qū)記錄到的天然與非天然地震事件進行深度學習,提取天然與非天然地震之間的特征值,開展天然與非天然地震事件的識別研究,得到了以下結(jié)論:
(1) 天然與非天然地震(爆破和塌陷)的震源性質(zhì)是不相同的。天然地震源是非對稱剪切源、爆破源是對稱膨脹源,而塌陷則是壓縮源。因此,根據(jù)其特性選擇P波初動方向、振幅比等特征值來識別天然地震和非天然地震是可行的。
(2) 神經(jīng)網(wǎng)絡具有高度的非線性映射功能,使用BP神經(jīng)網(wǎng)絡對山東地區(qū)的天然地震與非天然地震進行自動識別,測試結(jié)果表明在本文構(gòu)建的神經(jīng)網(wǎng)絡模型合理,具有較高的識別率。
(3) 為減少預測結(jié)果的錯誤性,訓練過程中應盡量選擇足夠多的訓練樣本,并且選擇的樣本要具有代表性,從而提高系統(tǒng)的泛化能力和正確識別率。