王自法, 廖吉安, 王延偉, 位棟梁, 趙登科
1 中國(guó)地震局工程力學(xué)研究所, 哈爾濱 150080 2 中震科建(廣東)防災(zāi)減災(zāi)研究院有限公司, 廣東韶關(guān) 512026 3 河南大學(xué)土木建筑學(xué)院, 河南開封 475004 4 桂林理工大學(xué)廣西巖土力學(xué)與工程重點(diǎn)實(shí)驗(yàn)室, 桂林 541004
目前,地震預(yù)報(bào)仍然是難以解決的世界性難題,而在地震發(fā)生后,越快速確定地震信息就越有利于減輕地震災(zāi)害.地震預(yù)警系統(tǒng)是在地震發(fā)生后,在破壞性地震波到達(dá)目標(biāo)區(qū)域前,利用初始幾秒的地震波確定地震信息(地震位置、震級(jí)、預(yù)測(cè)地震動(dòng)等),并向目標(biāo)區(qū)域發(fā)出警報(bào)信息,使得目標(biāo)區(qū)域能夠有幾秒至幾十秒的反應(yīng)時(shí)間.盡管應(yīng)急反應(yīng)時(shí)間是秒級(jí)的,但這對(duì)震時(shí)的避險(xiǎn)逃生極為重要,尤其是對(duì)于很多重大工程的緊急處置也非常重要,例如高速鐵路、核電站、燃?xì)夤镜?Allen and Melgar, 2019)的緊急處置.震級(jí)作為地震預(yù)警系統(tǒng)的關(guān)鍵參數(shù),其準(zhǔn)確性直接關(guān)系到地震預(yù)警的成敗,如何在盡量短的時(shí)間內(nèi)準(zhǔn)確地確定震級(jí)是地震預(yù)警的關(guān)鍵科學(xué)問題之一,也是地球物理領(lǐng)域和地震工程領(lǐng)域研究的熱點(diǎn)課題.
深度學(xué)習(xí)是近幾年興起的一種可以從數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征的機(jī)器學(xué)習(xí)方法,在諸多領(lǐng)域取得了巨大的成功(Lecun et al., 2015),如圖像識(shí)別、語音識(shí)別、機(jī)器翻譯等.受這些領(lǐng)域的研究啟發(fā),深度學(xué)習(xí)方法開始被用于解決地震領(lǐng)域的問題,包括余震預(yù)測(cè)(DeVries et al., 2018)、震相撿拾(Perol et al., 2018; Ross et al., 2018; Wang et al., 2021; 張逸倫等, 2021)、事件判別(Li et al.,2018)、接受函數(shù)的挑選(甘露等, 2021)、高分辨率地震目錄生成(蘇金波等, 2021)等,并且同樣取得了顯著的成果.也有學(xué)者利用深度學(xué)習(xí)估算震級(jí),Lomax等將50 s三分向地震波作為CNN(Deep Convolutional Neural Networks)方法的輸入,估算4~9級(jí)地震的震級(jí)(Lomax et al.,2019).Mousavi和Beroza(2020)將完整的三分向地震波作為卷積-循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)了-0.3~5.7級(jí)地震的震級(jí)估算.Van Den Ende和Ampuero(2020)利用完整的三分向地震波作為CNN方法的輸入,實(shí)現(xiàn)了3~6級(jí)地震的震級(jí)估算.Zhang等(2021)將初至4 s以上的三分向地震波作為CNN方法的輸入,實(shí)現(xiàn)了6級(jí)以下地震的震級(jí)估算.從前述研究可以看出,深度學(xué)習(xí)方法可以從地震波中自動(dòng)提取特征實(shí)現(xiàn)震級(jí)估算,避免了人為干預(yù),但這些研究所提方法的不足在于,需要輸入較長(zhǎng)的地震波或者僅能估算較小地震的震級(jí)(6級(jí)以下),因此,這些方法不適用于地震預(yù)警系統(tǒng)的震級(jí)估算.
本文提出了一種CNN方法,該方法以端到端的形式,實(shí)現(xiàn)了利用單臺(tái)站的初至3~10 s豎向地震波估算震級(jí).利用日本和智利的約17萬條強(qiáng)震記錄(震級(jí)4~9)對(duì)CNN方法進(jìn)行訓(xùn)練、驗(yàn)證和測(cè)試,利用美國(guó)和新西蘭的地震記錄對(duì)CNN方法進(jìn)行泛化能力測(cè)試,并與Pd方法進(jìn)行對(duì)比,結(jié)果表明所提CNN方法的震級(jí)估算效果顯著優(yōu)于Pd方法,可以為地震預(yù)警提供更好的震級(jí)估算.
本文以日本KiK-Net(Kiban Kyoshin Network)和K-Net(Kyoshin Network)以及智利SIBER-RISK(Simulation Based Earthquake Risk and Resilience of Interdependent Systems and Networks)的地面強(qiáng)震動(dòng)記錄作為算法研究數(shù)據(jù)集.數(shù)據(jù)篩選條件和處理方法:(1)為保證地震記錄至少具有初至3 s的P波,以及盡量包括近海的大地震事件,震源距取25~200 km,震級(jí)(MW)取4~9級(jí);(2)記錄所屬監(jiān)測(cè)臺(tái)站的場(chǎng)地?cái)?shù)據(jù)中有Vs30(地下30 m深度的平均剪切波速);(3)每條地震記錄的三分向合成峰值加速度大于等于2 Gal(Cheng et al., 2014),且信噪比大于20 dB(Nazeri et al., 2017);(4)對(duì)于200 Hz采樣頻率的記錄降采樣為100 Hz;(5)利用STA/LTA(short-time-average through long-time-average trigger)方法(Allen, 1978, 1982)自動(dòng)撿拾每條記錄的P波到時(shí),并人工進(jìn)行檢查和修正P波到時(shí);(6)對(duì)于存在基線漂移的記錄,用去均值的方法(減去震前部分的平均值)修正基線;(7)加速度記錄經(jīng)過兩次積分得到位移記錄,為避免積分造成基線漂移,在每次積分之后對(duì)記錄進(jìn)行0.075 Hz的高通濾波(Wu and Zhao, 2006).最終,用于算法研究的數(shù)據(jù)集共有170324條豎向強(qiáng)震動(dòng)記錄,其中,日本164735條記錄(3755次地震事件),智利5589條記錄(1275次地震事件).在此數(shù)據(jù)集中,以記錄產(chǎn)生時(shí)間的先后順序組成訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集和測(cè)試數(shù)據(jù)集(圖1所示):98257條記錄作為訓(xùn)練數(shù)據(jù)集(包括日本1997—2011年的95503條記錄和智利1985—2015年的2754條記錄),約占總數(shù)據(jù)集的58%,用于訓(xùn)練CNN方法;31429條記錄作為驗(yàn)證數(shù)據(jù)集(包括日本2012—2014年的29476條記錄和智利2016—2017年的1953條記錄),約占總數(shù)據(jù)集的18%,用于優(yōu)化CNN方法的模型參數(shù);40638條記錄作為測(cè)試數(shù)據(jù)集(包括日本2015—2019年的39756條記錄和智利2018—2021年的882條記錄),約占總數(shù)據(jù)集的24%,用于檢驗(yàn)和對(duì)比CNN方法估算震級(jí)的效果,此外,為了探究CNN方法對(duì)于8和9級(jí)特大地震震級(jí)估算的能力,將2003年8級(jí)地震記錄和2011年9級(jí)地震記錄劃分至測(cè)試數(shù)據(jù)集,用以測(cè)試CNN方法預(yù)測(cè)特大地震震級(jí)的能力.
圖1 地震數(shù)據(jù)的分布和數(shù)量統(tǒng)計(jì)(藍(lán)色三角形為監(jiān)測(cè)臺(tái)站;黑色圓圈為地震事件)
為測(cè)試CNN方法在日本和智利之外地區(qū)的震級(jí)估算效果(泛化能力測(cè)試),按前述數(shù)據(jù)篩選和處理方法,建立泛化測(cè)試數(shù)據(jù)集(表1):從美國(guó)CESMD(Center for Engineering Strong Motion Data)隨機(jī)下載了加利福尼亞州的14次4~7.1級(jí)地震的140條豎向加速度記錄;不限定最大震源距,從新西蘭GeoNet(Geological Hazard Information for New Zealand) 隨機(jī)下載了14次4~7.8級(jí)地震的620條豎向加速度記錄(其中震源距25~200 km的記錄502條,200 km以上的118條).
表1 泛化測(cè)試數(shù)據(jù)集
CNN方法是一種基于卷積計(jì)算的多層前饋神經(jīng)網(wǎng)絡(luò),是當(dāng)前應(yīng)用最為廣泛的一種深度學(xué)習(xí)方法.關(guān)于CNN方法的基本原理,在文獻(xiàn)(吳易智等,2021)中可以找到詳細(xì)的描述,這里就不再介紹.需要通過訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集的反復(fù)計(jì)算依據(jù)經(jīng)驗(yàn)確定.本研究中CNN方法的層級(jí)架構(gòu)如圖2所示,包括主輸入層、隱藏層、輔助輸入層、全連接層和輸出層.主輸入層為一維數(shù)組結(jié)構(gòu),用于接收單個(gè)臺(tái)站的豎向初至地震波(加速度數(shù)據(jù)).隱藏層共有10層,每層由卷積層、激活函數(shù)層、批量歸一化和池化層組成,用于從初至地震波中提取與震級(jí)最為相關(guān)的特征.在各隱藏層中:卷積層的卷積核個(gè)數(shù)如表2所示,卷積核大小為1×2,卷積運(yùn)算步長(zhǎng)為2,填充模式為“same”;激活函數(shù)層采用ELU函數(shù)(Clevert et al., 2015);隱藏層的批量歸一化采用z-score法(標(biāo)準(zhǔn)分?jǐn)?shù)法),以避免過擬合的情況(Ioffe and Szegedy, 2015);批樣本大小影響模型的訓(xùn)練效果和速度,批樣本越大需要的GPU內(nèi)存越大,根據(jù)多次試算結(jié)果以及GPU計(jì)算效率(NVIDIA RTX2080Ti 11G),最終選擇批樣本為256(批樣本取32、64、128和256時(shí),驗(yàn)證數(shù)據(jù)集的震級(jí)估算效果對(duì)比,如圖3所示);池化層的設(shè)置如表2所示,平均池化方法(有利于保留全局波形特征)和最大值池化方法(有利于保留局部波形特征),兩種池化層的步長(zhǎng)均為2,池化核大小均為2,填充模式為“same”.輔助輸入層為隱藏層自動(dòng)提取的特征和輔助信息,輔助信息包括震中距、震源深度以及Vs30,用于考慮地震波在傳播過程中受傳播路徑和場(chǎng)地條件的影響(B?se et al., 2012).全連接層是一個(gè)列向量,用于實(shí)現(xiàn)特征和輔助信息的回歸計(jì)算;輸出層為全連接層的回歸結(jié)果(數(shù)值),即最終預(yù)測(cè)的震級(jí).訓(xùn)練模型的損失函數(shù)定義為預(yù)測(cè)震級(jí)與真實(shí)震級(jí)的均方誤差函數(shù),采用Adam優(yōu)化器(Kingma and Ba, 2014)進(jìn)行優(yōu)化訓(xùn)練,學(xué)習(xí)速率為0.001.
圖2 CNN方法的架構(gòu)和超參數(shù)
表2 卷積核和池化方法
圖3 不同批樣本大小時(shí)估算震級(jí)的誤差標(biāo)準(zhǔn)差對(duì)比(訓(xùn)練數(shù)據(jù)集)
在CNN方法的訓(xùn)練過程中,將損失函數(shù)不在下降時(shí)的訓(xùn)練結(jié)果作為最終結(jié)果,例如,在輸入為初至3 s 和10 s地震波時(shí),訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集的損失函數(shù)隨迭代次數(shù)的增加不斷變化(圖4),在前3次迭代損失函數(shù)下降幅度最大,隨后損失函數(shù)變化微小,不再下降,達(dá)到穩(wěn)定狀態(tài),此時(shí),完成CNN方法的訓(xùn)練.
圖4 初至3 s和10 s地震波時(shí)CNN迭代訓(xùn)練的損失函數(shù)值
利用測(cè)試數(shù)據(jù)集和泛化數(shù)據(jù)集對(duì)CNN方法的震級(jí)估算效果進(jìn)行測(cè)試,并與Pd方法進(jìn)行對(duì)比.鑒于,在地震預(yù)警系統(tǒng)的處理流程中,會(huì)先利用P波到時(shí)和P波速度模型自動(dòng)確定震中位置和震源深度(Claudio et al., 2011),再估算震級(jí),例如我國(guó)福建地震預(yù)警系統(tǒng)(Zhang et al., 2016)和美國(guó)地震預(yù)警系統(tǒng)(Serdar et al., 2014),因此,在測(cè)試中認(rèn)為震源距是已知的.選用Pd方法的原因是,多數(shù)研究表明Pd方法估算震級(jí)的準(zhǔn)確性明顯優(yōu)于其他參數(shù)方法(Li et al., 2017; Nazeri et al., 2017; Leyton et al., 2018; 王延偉等, 2020),并且已被廣泛應(yīng)用于地震預(yù)警系統(tǒng)(Hsiao et al., 2009; Zhang et al.,2016; Kohler et al.,2018).Pd方法估算震級(jí)的經(jīng)驗(yàn)公式如下:
Mag=algPd+blgΔ+c,
(1)
其中Mag是震級(jí),Pd是初至P波的位移幅值,Δ是震源距,a、b、c是擬合系數(shù).
地震預(yù)警的震級(jí)估算是一個(gè)隨著初至地震波時(shí)長(zhǎng)增加不斷更新的過程,一般要求P波到達(dá)3 s后,隨著初至地震波時(shí)長(zhǎng)的持續(xù)增加,不斷更新估算震級(jí)(Wu and Zhao, 2006; Kanamori, 2005; Peng et al., 2017).初至3~10 s地震波時(shí),Pd與震級(jí)的經(jīng)驗(yàn)公式(1)由訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)共同得到,如表3所示.
表3 初至3~10 s地震波時(shí)擬合系數(shù)表
鑒于多數(shù)研究(Wu and Zhao, 2006; Kanamori, 2005; Peng et al., 2017)和已建地震預(yù)警系統(tǒng)(Hsiao et al., 2009; Cuéllar et al., 2014; Zhang et al.,2016; Parolai et al.,2017)表明利用初至3 s 的P波估算震級(jí)可以較好地兼顧地震預(yù)警的時(shí)效性和準(zhǔn)確性,因此,需要著重分析初至3 s 的P波時(shí),CNN方法和Pd方法估算震級(jí)的結(jié)果.圖5是CNN方法和Pd方法估算震級(jí)的誤差分布,圖中的散點(diǎn)表示每條記錄估算震級(jí)的誤差,紅色虛線表示±0.5個(gè)單位震級(jí),準(zhǔn)確率定義為誤差在[-0.5,+0.5]的記錄數(shù)與記錄總數(shù)的比.從誤差的定性分布看:無論是日本地震記錄還是智利地震記錄,CNN方法估算震級(jí)的誤差都比Pd方法更明顯地集中在零值附近,且更多地分布在[-0.5,+0.5]之內(nèi);在日本地震記錄的誤差分布中(圖5a和圖5b),CNN方法和Pd方法都表現(xiàn)出對(duì)約6.5級(jí)以上地震的震級(jí)估算偏小,對(duì)9級(jí)地震的估算偏小尤為明顯,這使得6.5~9級(jí)范圍內(nèi)的準(zhǔn)確率遠(yuǎn)小于4~6.4級(jí)范圍內(nèi)的準(zhǔn)確率,這種偏小的情況與多數(shù)研究的震級(jí)飽和問題(利用初至3 s P波估算6.5級(jí)以上地震的震級(jí)偏小)是相一致的(Kanamori, 2005; Wu and Zhao, 2006; Zollo et al., 2006; 王延偉等,2020);在智利地震記錄的誤差分布中(圖5c和圖5d),由于6.5級(jí)以上的地震事件只有2次(6.7級(jí)和7.0級(jí)),無法判斷震級(jí)飽和的情況.從誤差的定量結(jié)果看:在日本地震記錄的誤差分布中(圖5a和圖5b),CNN估算震級(jí)的誤差均值和誤差標(biāo)準(zhǔn)差均遠(yuǎn)小于Pd(CNN方法分別為0.0861和0.3516,Pd方法分別為-0.0977和0.579),在4~6.4級(jí)范圍內(nèi),CNN方法估算震級(jí)的準(zhǔn)確率是Pd的1.5倍(CNN方法為90.27%,Pd方法為62.26%);在6.5~9級(jí)范圍內(nèi),即便出現(xiàn)震級(jí)飽和問題,CNN方法估算震級(jí)的準(zhǔn)確率仍是Pd方法的1.2倍(CNN方法為48.11%,Pd方法為42.51%);在智利地震記錄的誤差分布中(圖5c和圖5d)),CNN方法估算震級(jí)的誤差均值和誤差標(biāo)準(zhǔn)差均遠(yuǎn)小于Pd方法,在4~6.4級(jí)范圍內(nèi),CNN方法估算震級(jí)的準(zhǔn)確率是Pd的1.5倍(CNN方法為87.69%,Pd方法為60.67%).前述日本地震記錄和智利地震記錄的測(cè)試結(jié)果一致表明,CNN方法估算震級(jí)的誤差均值、誤差標(biāo)準(zhǔn)差和準(zhǔn)確率均大幅優(yōu)于Pd方法.
圖5 初至3 s 的P波時(shí)估算震級(jí)的誤差分布
當(dāng)初至地震波時(shí)長(zhǎng)從3 s增加到10 s時(shí),測(cè)試CNN方法和Pd方法持續(xù)估算震級(jí)的效果.圖5為CNN方法和Pd方法估算震級(jí)的誤差標(biāo)準(zhǔn)差隨初至地震波時(shí)長(zhǎng)的變化:在日本地震記錄的結(jié)果中(圖6a),隨著初至地震波時(shí)長(zhǎng)的增加,CNN方法的誤差標(biāo)準(zhǔn)差逐步減小且始終明顯小于Pd方法的誤差標(biāo)準(zhǔn)差,值得注意的是,CNN方法在3 s時(shí)的誤差標(biāo)準(zhǔn)差(0.3516)仍小于Pd方法在10 s時(shí)的誤差標(biāo)準(zhǔn)差(0.4118);在智利地震記錄的結(jié)果中(圖6b),隨初至地震波時(shí)長(zhǎng)的增加,CNN方法的誤差標(biāo)準(zhǔn)差表現(xiàn)出與日本地震記錄(圖6a) 相似的變化趨勢(shì),始終遠(yuǎn)小于Pd方法,并且在3 s時(shí)的值(0.378)小于Pd方法在10 s時(shí)的值(0.522).
圖7為CNN方法和Pd方法估算震級(jí)的準(zhǔn)確率隨初至地震波時(shí)長(zhǎng)的變化.日本地震記錄的結(jié)果中:在4~6.4級(jí)范圍內(nèi)(圖7a),隨著地震波時(shí)長(zhǎng)的增加,CNN方法的準(zhǔn)確率由90.27%提高到94.51%,Pd方法的準(zhǔn)確率由62.26%提高到76.60%,CNN方法的準(zhǔn)確率始終是Pd方法的1.2~1.4倍,特別是CNN方法在3 s時(shí)的準(zhǔn)確率(90.27%)甚至遠(yuǎn)高于Pd方法在10 s時(shí)的準(zhǔn)確率(76.60%);在6.5~9級(jí)范圍內(nèi)(圖7b),CNN方法的準(zhǔn)確率由48.11%提高到78.31%,Pd方法的準(zhǔn)確率由42.51%提高到69.62%,CNN方法的準(zhǔn)確率在各時(shí)刻始終比Pd高約7%.智利地震記錄結(jié)果中:在4~6.4級(jí)范圍內(nèi)(圖7c),隨著地震波時(shí)長(zhǎng)的增加,CNN方法的準(zhǔn)確率由87.69%提高到90.82%,Pd方法的準(zhǔn)確率由60.67%提高到71.35%,CNN方法的準(zhǔn)確率始終是Pd方法的1.3~1.4倍,CNN方法在3 s時(shí)的準(zhǔn)確率(87.69%)遠(yuǎn)高于Pd方法在10 s時(shí)的準(zhǔn)確率(71.35%).
從誤差的分布可以看出(圖8,以4 s, 6 s, 8 s, 10 s的結(jié)果為例),隨著地震波時(shí)長(zhǎng)的增加,CNN方法和Pd方法都改善了6.5級(jí)以上地震的震級(jí)飽和問題.當(dāng)初至地震波時(shí)長(zhǎng)在6 s以上時(shí),二者都較好地估算了4~7.4級(jí)地震,僅對(duì)7級(jí)、8級(jí)和9級(jí)地震的震級(jí)估算明顯偏小.結(jié)合6.5級(jí)以上地震的準(zhǔn)確率來看,CNN方法對(duì)震級(jí)飽和問題的改善優(yōu)于Pd方法.
在前述測(cè)試中,測(cè)試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集都是采用同一個(gè)國(guó)家的地震記錄,而泛化數(shù)據(jù)集是由美國(guó)加利福尼亞州地區(qū)和新西蘭的強(qiáng)震記錄組成,這兩個(gè)區(qū)域的地震記錄沒有用于訓(xùn)練CNN方法,也未被用于擬合Pd方法的經(jīng)驗(yàn)公式(1).考慮到誤差隨震級(jí)的分布可以最為詳細(xì)地展示震級(jí)估算結(jié)果,這里僅給出CNN方法和Pd方法的誤差分布圖(圖9,以3,4,6,10 s的結(jié)果為例).從圖9中可以看出:CNN方法估算震級(jí)的誤差均值、誤差標(biāo)準(zhǔn)差和準(zhǔn)確率遠(yuǎn)好于Pd方法的結(jié)果,比測(cè)試數(shù)據(jù)集(圖5和圖6)的結(jié)果略差;從6.5~7.8級(jí)的誤差分布和準(zhǔn)確率來看,CNN方法的震級(jí)飽和現(xiàn)象沒有Pd方法明顯.
圖6 初至3~10 s地震波時(shí)CNN和Pd估算震級(jí)的誤差標(biāo)準(zhǔn)差對(duì)比
圖7 初至3~10 s時(shí)CNN和Pd方法準(zhǔn)確率隨時(shí)間變化趨勢(shì)對(duì)比
圖8 初至4, 6, 8, 10 s時(shí)估算震級(jí)的誤差分布(藍(lán)色為日本記錄;黑色為智利記錄;誤差均值、誤差標(biāo)準(zhǔn)差和準(zhǔn)確率是由日本地震記錄和智利地震記錄共同計(jì)算得到)
圖9 初至3, 4, 6, 10 s時(shí)估算震級(jí)的誤差分布
地震預(yù)警系統(tǒng)越快速準(zhǔn)確地確定震級(jí),就可以為預(yù)警區(qū)域爭(zhēng)取到越多的應(yīng)急反應(yīng)時(shí)間,因此,最先觸發(fā)的少數(shù)幾個(gè)監(jiān)測(cè)臺(tái)站的震級(jí)估算效果極為關(guān)鍵.為此,需要進(jìn)一步對(duì)比距離震中最近的2個(gè)、3個(gè)和 4個(gè)監(jiān)測(cè)臺(tái)站的震級(jí)估算效果.取最先觸發(fā)的2個(gè)、3個(gè)和 4個(gè)監(jiān)測(cè)臺(tái)站估算震級(jí)的平均值作為估算震級(jí),對(duì)比估算震級(jí)的準(zhǔn)確率(圖10)和誤差分布(圖11),可以看出:隨著初至地震波時(shí)長(zhǎng)的增加,CNN方法的準(zhǔn)確率不斷增大(誤差分布大多在±0.5個(gè)單位震級(jí)內(nèi)),而Pd方法的準(zhǔn)確率比較不穩(wěn)定(誤差分布總體偏大或者偏小);在相同初至地震波時(shí)長(zhǎng)輸入時(shí),CNN方法的準(zhǔn)確率始終高于Pd方法,即便2個(gè)監(jiān)測(cè)臺(tái)站采用CNN方法的準(zhǔn)確率也總體好于3個(gè)和4個(gè)臺(tái)站的Pd方法;無論是CNN方法還是Pd方法,3個(gè)和4個(gè)監(jiān)測(cè)臺(tái)站的準(zhǔn)確率較為接近,并且總體好于2個(gè)監(jiān)測(cè)臺(tái)站.
圖10 最先觸發(fā)的2個(gè)、3個(gè)和4個(gè)臺(tái)站估算震級(jí)準(zhǔn)確率
圖11 最先觸發(fā)的2個(gè)、3個(gè)和4個(gè)臺(tái)站估算震級(jí)的誤差分布
前述測(cè)試結(jié)果表明,無論是在初至3 s的P波時(shí),還是在初至地震波從3 s持續(xù)增加到10 s的過程中,CNN方法估算震級(jí)的誤差均值、誤差標(biāo)準(zhǔn)差和準(zhǔn)確率始終顯著優(yōu)于Pd方法.CNN方法優(yōu)于Pd方法的主要原因在于:Pd方法是根據(jù)人的經(jīng)驗(yàn)和認(rèn)識(shí)得到的,即在同一觀測(cè)點(diǎn)震級(jí)越大地表變形越大(相同震源距時(shí)),Pd僅能代表初至地震波中與震級(jí)相關(guān)的某一方面特征;CNN方法將初至地震波作為輸入,將震級(jí)作為輸出,以端到端(“黑箱”)方式,避免了人的主觀因素對(duì)特征提取的干預(yù),最大化地保留了與震級(jí)相關(guān)的重要特征.
與目前已有的基于深度學(xué)習(xí)方法相比(Lomax et al.,2019; Mousavi and Beroza, 2020; Van Den Ende and Ampuero, 2020; Zhang et al., 2021),本文的CNN方法在4個(gè)方面表現(xiàn)出了優(yōu)勢(shì):(1)利用了更短的初至地震波,實(shí)現(xiàn)了更大震級(jí)范圍的估算,可以滿足地震預(yù)警時(shí)效性和準(zhǔn)確性的要求;(2)更簡(jiǎn)化的輸入數(shù)據(jù),本文僅利用了初至豎向地震波,且未對(duì)數(shù)據(jù)進(jìn)行任何濾波處理,而已有深度學(xué)習(xí)方法都采用了濾波后的初至三個(gè)分向地震波作為輸入,濾波參數(shù)選擇不當(dāng)往往會(huì)引起信息的丟失,例如Mousavi和Beroza(2020)采用1.0~40.0 Hz帶通濾波,Van Den Ende和Ampuero(2020)采用0.1~8 Hz帶通濾波,Zhang等(2021)采用0.5~9 Hz帶通濾波,此外,初至幾秒的豎向地震波比兩個(gè)水平向地震波具有更好的信噪比,在數(shù)據(jù)質(zhì)量上更有優(yōu)勢(shì);(3)考慮了場(chǎng)地條件,在本文CNN模型的隱藏層中設(shè)計(jì)了輔助輸入層,通過該層可以引入場(chǎng)地條件參數(shù),已有深度學(xué)習(xí)方法并不能利用場(chǎng)地條件的信息;(4)更合理的神經(jīng)網(wǎng)絡(luò)模型,本文設(shè)計(jì)的CNN模型將震級(jí)估算作為回歸問題來解決,輸出是震級(jí)數(shù)值,而已有深度學(xué)習(xí)方法將震級(jí)估算作為分類問題(Lomax et al.,2019; Van Den Ende and Ampuero, 2020; Zhang et al., 2021),輸出是不同震級(jí)的概率,需要根據(jù)概率閾值來確定震級(jí),閾值設(shè)置會(huì)影響震級(jí)估算效果.
(圖11續(xù))
在泛化數(shù)據(jù)集的測(cè)試中,CNN方法表現(xiàn)出了較好的震級(jí)估算效果,但并未達(dá)到測(cè)試數(shù)據(jù)集的測(cè)試效果.其原因在于,訓(xùn)練數(shù)據(jù)集中沒有泛化數(shù)據(jù)集所屬區(qū)域的數(shù)據(jù).這說明CNN方法在估算震級(jí)時(shí)具有一定的區(qū)域特性,這種區(qū)域特性也普遍存在于傳統(tǒng)震級(jí)估算方法中(金星等,2012;彭朝勇等,2013;Li et al., 2017;王延偉等, 2020),不同的是,CNN方法因?yàn)樽詣?dòng)提取到了與震級(jí)更為相關(guān)的特征,而比傳統(tǒng)震級(jí)估算方法受區(qū)域特性影響小.CNN方法的區(qū)域特性,可以通過在訓(xùn)練數(shù)據(jù)集中增加本地區(qū)的地震記錄來解決,這一點(diǎn)可由智利地震記錄的測(cè)試結(jié)果證明.
本文提出的CNN方法以端到端的方式實(shí)現(xiàn)了震級(jí)的估算,其關(guān)鍵優(yōu)勢(shì)是特征提取的過程避免了人的主觀因素干預(yù),但同時(shí)也帶來3個(gè)疑問值得深入研究:(1)CNN方法的層級(jí)架構(gòu)和超參數(shù)決定了CNN方法的特征提取能力,然而,二者的設(shè)置并沒有明確的規(guī)律和依據(jù),只能通過反復(fù)試算憑經(jīng)驗(yàn)來設(shè)置,是否存在有效的優(yōu)化規(guī)律?(2)CNN方法從初至地震波中自動(dòng)提取到的特征是未知的,這些特征能否像圖像識(shí)別領(lǐng)域(Zeiler et al., 2011)進(jìn)行解析?(3)小地震的記錄在數(shù)量上遠(yuǎn)多于大地震記錄,通過對(duì)大地震的記錄進(jìn)行數(shù)據(jù)增強(qiáng)(Shorten and Khoshgoftaar, 2019),是否可以解決震級(jí)飽和問題?未來的研究希望聚焦于這三個(gè)問題,從而進(jìn)一步改善CNN方法估算震級(jí)的效果.
為改善地震預(yù)警中的震級(jí)估算效果,避免人為因素對(duì)初至地震波特征提取的影響,提出具有10層隱藏層架構(gòu)的“端到端”CNN方法.該方法將單臺(tái)站的初至豎向地震波作為主輸入,震中距、震源深度和Vs30作為輔助輸入,震級(jí)作為輸出,通過從初至地震波中自動(dòng)提取與震級(jí)相關(guān)的特征實(shí)現(xiàn)震級(jí)估算.從日本和智利收集約17萬豎向強(qiáng)震動(dòng)記錄,建立了訓(xùn)練數(shù)據(jù)集,驗(yàn)證數(shù)據(jù)集和測(cè)試數(shù)據(jù)集.通過反復(fù)的訓(xùn)練和驗(yàn)證確定了CNN的架構(gòu)和超參數(shù)設(shè)置.利用測(cè)試數(shù)據(jù)集檢驗(yàn)CNN方法的震級(jí)估算效果,利用美國(guó)和新西蘭的28次地震事件測(cè)試CNN方法泛化能力,并與當(dāng)前廣泛使用的Pd方法進(jìn)行對(duì)比.結(jié)果表明,當(dāng)初至3 s至10 s地震波時(shí),CNN方法比Pd方法可以更快更準(zhǔn)地估算震級(jí),并且受區(qū)域特性影響更小.CNN方法極大地提高了震級(jí)估算的準(zhǔn)確性和時(shí)效性,其從初至地震波中提取與震級(jí)相關(guān)特征的能力遠(yuǎn)高于人工方式,這種特征提取能力對(duì)于地震預(yù)警和地震學(xué)其它問題研究具有重要的參考價(jià)值.
致謝審稿專家為本文提出了寶貴的意見,在此衷心感謝!感謝本文編輯認(rèn)真、辛勤的付出!感謝日本防災(zāi)科學(xué)技術(shù)研究所(NIED)、智利SIBER-RISK、美國(guó)CESMD和新西蘭GeoNet為本文研究提供強(qiáng)震動(dòng)數(shù)據(jù),以及NIED F-net和Global CMT提供矩震級(jí).