• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于AdaBoost集成學(xué)習(xí)的強震動觀測抗干擾技術(shù)研究

      2020-12-24 01:50:56廖成旺
      四川地震 2020年4期
      關(guān)鍵詞:強震震動決策樹

      龐 聰,江 勇,廖成旺,吳 濤,丁 煒,王 磊

      (1.中國地震局地震研究所 中國地震局地震大地測量重點實驗室,湖北 武漢 430071;2.湖北省地震局地震預(yù)警湖北省重點實驗室,湖北 武漢 430071)

      強震儀是指由加速度計、數(shù)據(jù)記錄器、對時系統(tǒng)、存儲系統(tǒng)等組成的地球物理觀測儀器,在建筑物震害分析、結(jié)構(gòu)模態(tài)分析、結(jié)構(gòu)損傷識別、常規(guī)譜分析中應(yīng)用較廣(王雷等,2011;宋金龍,2012;榮立爽,2008;趙懷山等,2017;周綺鳳等,2012;王文才等,2018)。但是,強震儀在各類監(jiān)測場地(野外監(jiān)測臺網(wǎng)、超高層建筑物、水電站、大壩、核電站等)布設(shè)后常常遇到高頻低能量、寬頻帶大能量等振動特征相差較大的噪聲,這些含噪強震動記錄如果不加以處理與識別,易造成地震事件錯誤收集、預(yù)警事件誤觸發(fā)等異常情況。因此,基于強震動監(jiān)測數(shù)據(jù)的抗干擾或防誤觸技術(shù)研究開始受到相關(guān)研究人員的重視。傳統(tǒng)的強震儀系統(tǒng)抗干擾技術(shù)多以儀器失真校正技術(shù)、信號負反饋技術(shù)、觸發(fā)控制技術(shù)等基于內(nèi)干擾源的抗干擾技術(shù)為主,以區(qū)分電磁干擾信號、溫變信號、誤觸操作等,技術(shù)主要應(yīng)用在儀器硬件結(jié)構(gòu)內(nèi)部,且研究應(yīng)用難度較大。例如,趙松年等(1987)設(shè)計幅度特征—窗口比較器觸發(fā)電路,減小強震儀誤觸與漏觸概率,提高觸發(fā)器的抗干擾能力。于海英等(2006)對未校正記錄做低通濾波后運用近似理想微分器做兩次微分得到校正加速度記錄,以校正儀器響應(yīng)失真。傳統(tǒng)強震儀抗干擾技術(shù)較多集中在內(nèi)部信號干擾、誤操作等領(lǐng)域,研究較為豐富,而專門針對外環(huán)境激勵源的抗干擾研究較少,這也給強震儀在防災(zāi)減災(zāi)領(lǐng)域的應(yīng)用推廣造成了較大阻礙。

      隨著計算機技術(shù)和人工智能科學(xué)的發(fā)展,基于分類、決策的機器學(xué)習(xí)方法越來越受到各行各業(yè)專家學(xué)者的重視,同時一些學(xué)者嘗試將該機器學(xué)習(xí)方法應(yīng)用于強震儀外環(huán)境干擾源(風(fēng)致振動、機械施工、起重機工作、人為走動等激勵)抗干擾技術(shù)研究,但是仍處于研究的起步階段。比如江汶鄉(xiāng)等(2015a,2015b)基于決策樹原理設(shè)計強震動單陣抗干擾算法,通過提取強震動記錄和干擾記錄觸發(fā)事件后3s內(nèi)數(shù)據(jù)的多個特征值建立決策樹學(xué)習(xí)樣本數(shù)據(jù)集,有效區(qū)分出地震動振動源與其它干擾源。趙剛等(2017)基于AdaBoost集成學(xué)習(xí)方法和BP神經(jīng)網(wǎng)絡(luò)對天然地震動事件和人工爆破事件進行波形特征識別,結(jié)果表明集成學(xué)習(xí)方法識別效率較高,不易過擬合。雖然基于決策樹的強震儀抗干擾技術(shù)解決了強震儀在外干擾源環(huán)境下的抗干擾辦法,但是采用的決策樹方法存在過擬合、分類不準(zhǔn)確的缺陷;基于集成學(xué)習(xí)的adaboost學(xué)習(xí)算法克服了決策樹的部分缺點,是一個效果較好的特征識別方法。

      本文采用機器學(xué)習(xí)中的AdaBoost集成學(xué)習(xí)方法以克服決策樹的上述缺點,設(shè)計一種針對外干擾源的強震動數(shù)據(jù)抗干擾算法,有效區(qū)分天然地震動事件與人工干擾事件,以提高強震監(jiān)測時的抗干擾水平,推動強震觀測系統(tǒng)的智能化和自動化,對防震減災(zāi)工程技術(shù)的發(fā)展和應(yīng)用具有一定意義。

      1 強震儀抗干擾算法

      1.1 決策樹原理

      決策樹(decision tree)是一類常見的、較為簡單的機器學(xué)習(xí)方法,其目的是根據(jù)損失函數(shù)最小化的原則產(chǎn)生一棵泛化能力強,即處理未見示例能力強的決策樹(龐聰?shù)龋?019;趙剛等,2017)。決策樹按照分支時的屬性選擇方法不同可分為ID3、CART、C4.5等類型。ID3決策樹基于信息增益量(Information Gain)進行屬性選擇;C4.5決策樹從ID3法發(fā)展而來,依靠信息增益率進行屬性選擇;CART決策樹又叫分類回歸樹,利用GINI指數(shù)增益作為屬性選擇依據(jù)。本文采用CART法。因為決策樹方法具有計算速度較快、分類規(guī)則易理解等特點,一些研究人員將其大量應(yīng)用于地震預(yù)警、震后損失評估、地質(zhì)災(zāi)害評價等諸多防震減災(zāi)領(lǐng)域。決策樹在處理大樣本數(shù)據(jù)時存在易過擬合、分類準(zhǔn)確度不高等問題,易過擬合的問題采取剪枝的方式對決策樹進行處理。按照剪枝操作出現(xiàn)的時間順序不同,分為預(yù)剪枝(Pre-Pruning)和后剪枝(Post-Pruning):預(yù)剪枝發(fā)生在決策樹算法過程中,后剪枝則出現(xiàn)在決策樹算法執(zhí)行完畢以后。由于預(yù)剪枝一定概率上會導(dǎo)致決策樹生長過早停止,而后剪枝操作較為麻煩,采用機器學(xué)習(xí)中的集成學(xué)習(xí)方法以解決決策樹存在的各種問題,集成學(xué)習(xí)方法是指利用多個單一的機器學(xué)習(xí)方法(弱學(xué)習(xí)器)實現(xiàn)某一個強學(xué)習(xí)任務(wù)的方法,其在數(shù)據(jù)挖掘和機器學(xué)習(xí)領(lǐng)域應(yīng)用較為廣泛。

      1.2 AdaBoost算法

      AdaBoost(Adaptive Boosting)算法由Yoav Freund和Robert Schapire于1995年提出,作為一種同質(zhì)集成學(xué)習(xí)方法(同質(zhì)集成方法是指每一個子學(xué)習(xí)器都屬于同一類,例如CART決策樹、人工神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法),其基本思想為:通過構(gòu)建多個弱學(xué)習(xí)器,根據(jù)前一個學(xué)習(xí)期的錯誤率更新下一個訓(xùn)練樣本的權(quán)重,直至滿足指定最高錯誤率或最大迭代次數(shù)等限制條件,從而形成一個強學(xué)習(xí)器(Guo H,2016;Spenger M,2017)。AdaBoost算法的一般數(shù)學(xué)計算過程如下:

      (1)初始化樣本訓(xùn)練數(shù)據(jù)集:設(shè)定原始訓(xùn)練數(shù)據(jù)集為T={(x11,x12,…,x1n),(x21,x22,…,x2n),…,(xN1,xN2,…,xNn)},設(shè)定每一個訓(xùn)練樣本在算法開始時都被賦予相同的權(quán)值ω1i,即ω1i=1/N;權(quán)值向量D1=(ω11,ω12,…,…,ω1i,…,ω1N),其中,i=1,2,…,N。

      (3)更新訓(xùn)練集的權(quán)值分布向量:Dm=(ωm+1,1,ωm+1,2,…,ωm+1,i,…,ωm+1,N);

      1.3 強震儀環(huán)境干擾與加速度記錄特征參量研究

      近些年來,強震儀在防災(zāi)減災(zāi)的諸多領(lǐng)域得到大量應(yīng)用,如超高層建筑物結(jié)構(gòu)健康監(jiān)測、大跨度橋梁振動監(jiān)測、水電站結(jié)構(gòu)損傷識別、重要建筑安全防護及地震預(yù)警等(江汶鄉(xiāng)等,2015b;榮立爽,2008;宋金龍,2012;趙懷山等,2017;周綺鳳等,2012),并在實際監(jiān)測中容易受到風(fēng)致振動、列車高速行駛、采礦爆破、夯實機工作、外部電磁干擾、人為跑跳等諸多干擾激勵(如表1),不同干擾類型的強震動記錄波形特征或數(shù)據(jù)統(tǒng)計特征差異性較大。因此,利用波形特征和數(shù)據(jù)統(tǒng)計特征進行正常地震動事件與異常干擾事件的辨別是可行的。

      表1 強震儀常見外界激勵

      部分學(xué)者在此基礎(chǔ)上提出或應(yīng)用以下一系列強震儀數(shù)據(jù)特征參量(如表2):記錄持時、波形對稱度、卓越頻率、波形稀疏度、波形集中度、波形峰值總數(shù)、相鄰最高增速等特征參量進行強震儀抗干擾技術(shù)的研究(江汶鄉(xiāng)等2015b;龐聰?shù)龋?020)。這些參量主要從基于加速度波形特征的角度提出,對強震儀在外界環(huán)境激勵下的振動特征描述較為全面,但是仍存在計算量過大、實際應(yīng)用時參量過多等問題。根據(jù)應(yīng)用較便捷、特征描述準(zhǔn)確的原則,對上述特征參量進行簡化處理,選擇部分參量作為研究基礎(chǔ)。

      表2 強震動加速度記錄數(shù)據(jù)振動特征表(龐聰?shù)龋?020)

      表2中,持時(end)表示振動事件的有效持續(xù)時間,不同振動事件的時長判斷閾值為3.0 s,持時在此閾值內(nèi)的事件記為環(huán)境干擾事件,持時判斷方法為Allen零交法(于海英等,2009;趙懷山等,2017),且事件在閾值內(nèi)結(jié)束end記作1,否則記為0;對稱性(sym)表示振動波形的對稱特性,利用天然地震動波形的對稱特性可以用來區(qū)分天然地震和部分異常振動,其公式為:sym=ssmall/sbig,其中ssmall和sbig分別表示波形在直線y=0上、下兩側(cè)面積中較小的面積和較大的面積;卓越頻率(ZY)屬于加速度的頻域特征,即快速傅里葉變換中幅值最高成分對應(yīng)的頻率,其能有效區(qū)分復(fù)雜振動事件和地震的區(qū)別,ZY在文中的閾值區(qū)間設(shè)定為[0.5,100] Hz;波形稀疏度(sparse)屬于波形特征范疇,表示在峰值分布直方圖中峰值數(shù)為零的直方數(shù)在全部直方數(shù)中的占比程度,其中直方圖的組數(shù)一般設(shè)為20,組距基于加速度記錄的統(tǒng)計學(xué)極差來確定,組距=極差/組數(shù);波形集中度(pration)表示在峰值分布直方圖中最高頻度直方峰值數(shù)在波形圖全部峰值數(shù)(ptotal)中的占比程度;最大增長速度(MaxSpeed)為相鄰采樣點的幅值增加最大值與采樣率之比,可作為幅值變化較小的振動干擾事件與幅值突變型振動事件的鑒別特征,例如爆破事件與人類活動干擾事件,其計算公式為:MaxSpeed=MaxGrow/sprate。

      1.4 算法設(shè)計

      強震儀系統(tǒng)抗干擾算法本質(zhì)上屬于一種學(xué)習(xí)、推薦行為,其在算法框架上屬于AdaBoost法,算法計算核心是決策樹算法。強震儀抗干擾算法在進入主要計算階段之前必須采用一定的數(shù)據(jù)預(yù)處理手段進行異常點剔除、基線校正、濾波處理,然后進行相應(yīng)地初始化操作,設(shè)定弱分類器個數(shù)(迭代次數(shù));經(jīng)過k次訓(xùn)練集權(quán)值分布的循環(huán)迭代,持續(xù)降低分類錯誤率,得到最終的強分類器,從而提高干擾信號的識別精度(算法流程圖如圖1)。

      圖1 強震動數(shù)據(jù)抗干擾算法流程

      2 實驗結(jié)果與分析

      本次實驗采用國家強震動臺網(wǎng)中心(www.csmnc.net)和中國地震局工程力學(xué)研究所的天然強震動記錄與人工干擾數(shù)據(jù)來測試本文提出的方法。天然地震動記錄包括:汶川地震、蘆山地震、集集地震等,人工干擾記錄包括:采石爆破、儀器電磁干擾、重型機械作業(yè)、列車行駛等。為了充分了解AdaBoost方法的優(yōu)勢,將決策樹算法的數(shù)據(jù)抗干擾結(jié)果與AdaBoost方法進行對比,并按照實際訓(xùn)練樣本占比10%、20%、40%、60%、80%,對兩者的算法抗干擾準(zhǔn)確率進行對比分析。

      基于單純決策樹原理的強震動數(shù)據(jù)抗干擾算法識別結(jié)果如表3所示,其中決策樹方法的分支類型為CART。決策樹方法的抗干擾結(jié)果準(zhǔn)確率總體與實際訓(xùn)練樣本量的比例呈正相關(guān):隨著訓(xùn)練比例的增大,識別錯誤數(shù)有所減小,識別準(zhǔn)確率逐漸提高,最終接近98%。但是,當(dāng)訓(xùn)練樣本比例低于40%時,識別準(zhǔn)確性不太理想,小于90%,這也符合決策樹算法易過擬合的特點。因此,基于單純決策樹的強震動數(shù)據(jù)抗干擾方法識別效果基本取決于決策樹算法的關(guān)鍵參數(shù),對實際樣本訓(xùn)練比例較為敏感。在針對超大數(shù)據(jù)量的應(yīng)用環(huán)境中,算法性能較差,應(yīng)用價值值得商榷。

      表3 基于決策樹原理的強震動數(shù)據(jù)抗干擾算法識別結(jié)果

      由圖2,該決策樹將ZY(卓越頻率)、Sym(波形對稱性)、End(事件結(jié)束否)等3個參數(shù)作為決策特征參數(shù),并沒有將最大增長速度最大增長速度(speed)與峰值數(shù)(ptotal)等參量作為決策特征參數(shù),是因為某些大地震的瞬時速度增長與人工爆破等事件的結(jié)果相近,同時天然地震動的波形早期特征與人工事件可能相似,較為稀疏、不規(guī)則。

      圖2 基于決策樹原理得到的決策樹

      基于AdaBoost的強震動數(shù)據(jù)抗干擾算法識別結(jié)果如表4所示,其中弱學(xué)習(xí)器為CART決策樹。抗干擾準(zhǔn)確率總體與實際訓(xùn)練樣本量的比例沒有明顯的關(guān)聯(lián):訓(xùn)練比例依次從10%到80%,該算法的識別準(zhǔn)確率整體都在90%以上;識別結(jié)果與訓(xùn)練比例相關(guān)性不大,具有較強的魯棒性與適應(yīng)性。在數(shù)據(jù)量不確定或極大、極小的實際應(yīng)用環(huán)境中,該算法都有一定的識別準(zhǔn)確性保證,具有較好的實際應(yīng)用價值。

      表4 基于AdaBoost的強震動數(shù)據(jù)抗干擾算法識別結(jié)果

      由圖3、圖4可知,采用80%訓(xùn)練比例的AdaBoost法進行異常數(shù)據(jù)識別時,算法不斷通過學(xué)習(xí)強化自身,并在第14次循環(huán)訓(xùn)練后完成訓(xùn)練目標(biāo),即通過14次弱學(xué)習(xí)器的強化學(xué)習(xí)得到一個強學(xué)習(xí)器(圖3),該學(xué)習(xí)器將Sym(波形對稱度)作為決策特征參數(shù),識別誤差率為0,而波形對稱性確實反映了天然地震動事件與人工干擾事件的波形特征差異,Sym較大時,天然地震動的可能性也較大,反之,人工干擾事件的可能性就較大。

      圖3 基于AdaBoost原理得到的最終決策樹

      圖4 80%訓(xùn)練量的AdaBoost算法訓(xùn)練過程誤差變化

      3 結(jié)論

      本文采用AdaBoost技術(shù)、決策樹學(xué)習(xí)器及集成機器學(xué)習(xí)理念設(shè)計一種新的強震動數(shù)據(jù)抗干擾算法,可有效識別、區(qū)分地震動事件與其它干擾事件,相對基于單純決策樹的強震儀抗干擾算法,識別準(zhǔn)確度有了一定提高,算法穩(wěn)健性更好,對強震儀的智能化發(fā)展與推廣應(yīng)用具有一定的積極意義。

      致謝:感謝國家強震動臺網(wǎng)中心、國家地震科學(xué)數(shù)據(jù)共享中心、中國地震局工程力學(xué)研究所提供了大量的強震記錄和實驗數(shù)據(jù)。

      猜你喜歡
      強震震動決策樹
      7.0級強震襲擊菲律賓
      震動減脂儀可以減肥?
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      水電工程場地地震動確定方法
      花蓮強震!
      振動攪拌 震動創(chuàng)新
      中國公路(2017年18期)2018-01-23 03:00:38
      強震的威力
      基于決策樹的出租車乘客出行目的識別
      2013年前郭M5.8級強震群序列特征分析
      交城县| 胶南市| 景谷| 赤壁市| 遵化市| 萨迦县| 镇康县| 六盘水市| 乐昌市| 永安市| 大邑县| 东兰县| 石泉县| 玛曲县| 舟曲县| 铁岭市| 盘山县| 建德市| 黔西县| 溧水县| 普宁市| 长子县| 江油市| 木里| 常熟市| 资源县| 东光县| 九龙坡区| 无为县| 白朗县| 饶阳县| 南昌县| 德州市| 潮安县| 宁都县| 明光市| 剑河县| 崇阳县| 太仆寺旗| 玉树县| 镇江市|