楊 沖 程文明 彭奇慧
1西南交通大學機械工程學院 成都 610031 2軌道交通運維技術與裝備四川省重點實驗室 成都 610031
隨著鐵路、港口以及交通運輸業(yè)的不斷發(fā)展,門式起重機作為主要的貨物裝卸設備發(fā)揮著越來越重要作用,對起重機運輸性能的要求也越來越高[1]。為了實現(xiàn)物料搬運的機械化,各種大跨度、大起重量的起重機械應運而生,極大地提高了各國各地區(qū)之間的經(jīng)濟貿易水平,但同時也對其抵御自然災害的能力提出了更加嚴苛的要求。因此,對震后起重機損壞狀態(tài)的評估預測是非常重要的,只有正確地評估起重機的損壞狀態(tài),才能判斷該起重機是否能夠用于震后救援和災區(qū)重建等工作。
近年來,隨著機器學習算法的發(fā)展與成熟,其在地震工程中的應用也成為當今研究的熱點。機器學習屬于人工智能的子領域,是數(shù)據(jù)科學與計算機科學相關的交叉學科[2],其目標是從已有數(shù)據(jù)中通過一定的學習算法獲取知識和規(guī)律,從而對未發(fā)生的事件進行預測。楊強[3]提出了基于支持向量機和隨機森林的RC框架結構震后安全狀態(tài)評估方法;Mangalathu S等[4]提出了一種基于機器學習算法技術快速評估橋梁損傷狀態(tài)的方法,其準確率可達73%~82%;魯冠亞等[5]提出由隨機森林模型建立橋墩地震易損性的方法;Luo H等[6]使用支持向量機算法研究了鋼筋混凝土框架結構的地震易損性。綜上可知,機器學習算法已經(jīng)應用于結構地震易損性分析領域,且在鋼框架和橋梁結構應用較廣。
機器學習算法的準確率在一定程度上依賴于數(shù)據(jù)集的大小以及特征參數(shù)的選擇,為了得到大量的結構地震響應數(shù)據(jù),本文采用增量動力分析(Incremental Dynamic Analysis,IDA)方法[7],該方法是一種用于評價結構抗震性能的動力參數(shù)分析方法[8],其基本做法是將每一條地震動記錄都按一定的比例系數(shù)調整為多重強度水平,再對結構施加調整后的地震動記錄,分別在每一強度水平下進行時程分析。
機器學習大量地應用于建筑與橋梁等結構的抗震研究中,但在起重機抗震領域的研究較少。隨機森林分為分類和回歸2種方法,分類是將結果歸為一個個的類別,然后判定預測的類別,而回歸則是直接預測值,相較于分類得到的結果更直觀,故本文選擇了隨機森林回歸這種有監(jiān)督的機器學習方法。
本文以門式起重機為例,通過Ansys建立有限元模型,利用Ansys的瞬態(tài)動力學分析模塊對門式起重機進行地震分析,并選擇合適的特征參數(shù),建立機器學習需要的數(shù)據(jù)集。然后,建立隨機森林回歸模型,通過模型來對起重機結構震后狀態(tài)進行預測,可準確地預測結構在不同地震強度下的結構損傷狀態(tài),避免人為經(jīng)驗判斷的局限性。本文通過對機器學習模型的調參,不斷地完善模型。此外,還研究了特征參數(shù)對于機器學習模型準確率的相對重要性。最后將預測易損性曲線和實際易損性曲線對比研究。
隨機森林(Random Forest Regressor)屬于Bagging類算法,而Bagging又屬于集成學習方法的一種[9]。隨機森林回歸是在生成眾多回歸樹的過程中,通過對建模數(shù)據(jù)集的樣本觀測和特征變量分別進行隨機抽樣,每次抽樣結果均生成一棵樹,且每棵樹都會生成符合自身屬性的規(guī)則和判斷值,隨機森林回歸則是集成所有回歸樹的規(guī)則和判斷值,實現(xiàn)隨機森林算法的回歸。簡單來說,隨機森林回歸就是多個決策回歸樹的綜合結果。
決策回歸樹是一種非參數(shù)的有監(jiān)督學習方法,回歸樹就是用樹模型做回歸問題,主要用于連續(xù)型變量。假設X、Y分別為輸入和輸出變量,且Y是連續(xù)變量。給定訓練數(shù)據(jù)集D= {(x1,y1),(x2,y2),…,(xn,yn)},其中yi是一個m維的向量,即yi含有m個特征?;貧w問題的目標就是構造一個函數(shù)f(x)能夠擬合數(shù)據(jù)集D中的元素,使均方誤差(Mean Square Error,MSE)最小,即
式中:N為樣本數(shù)量;i是每一個數(shù)據(jù)樣本,是模型回歸輸出的數(shù)值,是樣本點實際的數(shù)值。
由此可知,MSE的本質就是樣本真實數(shù)據(jù)與回歸結果的差異,本文采用回歸樹的接口Score返回的R2作為衡量回歸樹回歸質量的指標。R2的定義為
式中:u為殘差平方和MSE*N,v為總平方和,N為樣本數(shù)量,i為每一個數(shù)據(jù)樣本,f(xi)為模型回歸出的數(shù)值,yi為樣本點i實際的數(shù)值,為真實數(shù)值標簽的平均數(shù)。
根據(jù)隨機森林回歸與單一的決策回歸樹關系可知,隨機森林回歸的接口Score返回的值仍為R2作為衡量隨機森林回歸的回歸質量指標。隨機森林回歸相對于單一的決策回歸樹,由于采用了隨機抽樣,訓練出的模型方差較小,泛化能力強;節(jié)點劃分特征可以隨機抽取,且模型的訓練并行化,能大大提高模型的訓練效率。
門式起重機主要結構由門架、起升機構、小車架、大車行走機構以及電氣設備等組成,本文主要研究的是門架結構在震后的損傷狀態(tài),門架結構的主要參數(shù)見表1。
表1 門架結構主要參數(shù)表
利用Ansys建立有限元模型,如圖1所示。為了充分考慮地震動對于門架金屬結構的影響,選取合適的地震動記錄在地震分析過程中非常重要。本文依據(jù)GB 50011—2010《建筑抗震設計規(guī)范》[10]和起重機結構所在場地生成標準反應譜,從太平洋地震工程研究中心(PEER)篩選出110條與標準反應譜擬合程度較好的地震動記錄。
圖1 門式起重機有限元模型
在IDA分析中,地震動強度指標選用地震動峰值加速度(PGA)并對PGA進行等距調幅,PGA從0.1g增至1.0g,步長為0.1,共10種情況(0.1g、0.2g、0.3g、0.4g、0.5g、0.6g、0.7g、0.8g、0.9g、1.0g)。此外,本文將起重機主梁的下?lián)现底鳛槠鹬貦C損傷狀態(tài)的評估指標,再利用Ansys瞬態(tài)動力學分析模塊得到1 100組起重機地震作用下的損傷數(shù)據(jù)。
特征參數(shù)的選擇是機器學習中至關重要的環(huán)節(jié),有的特征對于預測結果的影響微乎其微,而有的特征對于機器學習模型的預測結果起著關鍵性的作用,故本文將對輸入特征的相關重要性進行分析。利用Ansys對模型進行模態(tài)分析,得到前10階模態(tài)頻率,求得周期值。此外,根據(jù)相關研究以及本文的研究實際選擇了6個特定周期值,最終選擇了16個特定周期(T=0.1 s、0.14 s、0.18 s、0.2 s、0.27 s、0.4 s、0.46 s、0.57 s、0.75 s、1 s、1.5 s、2 s、3 s、4 s、5 s、6 s)對應的反應譜加速度值、平均反應譜(Savg)、以及20個地震動特征,共計37個特征,其中20個地震動特征見表2。
表2 地震動特征表
為了提高隨機森林回歸模型的性能,需要對初始數(shù)據(jù)集的數(shù)據(jù)進行預處理;為了減少數(shù)據(jù)的非線性,需要對數(shù)據(jù)進行對數(shù)化。此外,不同特征參數(shù)的數(shù)據(jù)具有不同的數(shù)量級,2個不同特征參數(shù)的數(shù)值可能達到了3個甚至3個以上的數(shù)量級差,這樣就有可能會導致機器學習方法對個別特征的敏感度降低[11]。為了避免這類問題發(fā)生,還需要標準化數(shù)據(jù)集,使特征參數(shù)服從正態(tài)分布,經(jīng)過預處理的數(shù)據(jù)輸入到隨機森林回歸模型中即可達到更好的效果。
對于隨機林回歸模型,還需要對模型的相關參數(shù)進行調優(yōu)??梢哉{優(yōu)的參數(shù)有基決策樹的個數(shù)、樹的深度(Max_Depth)、葉子節(jié)點最少樣本數(shù)和節(jié)點再劃分所需最小樣本數(shù)等。一般只需要調整基決策樹和樹的深度2個參數(shù),其他參數(shù)的調整對模型的效果不明顯。
本文通過學習曲線來確定使模型達到最優(yōu)解時參數(shù)的取值。首先將基決策樹個數(shù)的取值通過學習曲線遍歷了1~191、間隔為10的所有取值,其結果如圖2所示。由圖2可知,當基決策樹的取值大于50,隨著基決策樹個數(shù)的增加,學習曲線的變化不明顯,甚至還會有下降的趨勢。
圖2 基決策樹取值(1~191)曲線圖
圖2是取間隔為10,遍歷1~191的值得到的結果,故需取間隔為1。再次遍歷10~50的所有取值,可得到模型最優(yōu)解是的具體參數(shù)取值,其結果如圖3所示。由圖3可知,當基決策樹個數(shù)取31時,隨機森林回歸模型評價指標R2可取最大值,最大值為0.852。
圖3 基決策樹取值(10~50)曲線圖
同理,再次通過學習曲線對參數(shù)Max_Depth調優(yōu)。本次選擇遍歷1~35的所有取值,其結果如圖4所示。由圖4可知,當參數(shù)取值23時,模型可得到的最大R2值為0.854。通過對Max_Depth的調參,R2的值提高了0.002。在機器學習調參過程中,R2提高0.002應是較好調優(yōu)結果。
圖4 Max_Depth取值(1~35)曲線圖
隨機森林回歸模型是基于均方誤差(MSE)評估特征重要性,即如果特征參數(shù)使得均方誤差越小,則說明此特征參數(shù)越重要。通過對特征重要性的評估,可以更好地驗證模型的準確性,還可以通過重點關注重要特征參數(shù)來改進模型,可以刪除無關緊要的特征,以減少計算工作量。圖5列舉了隨機森林回歸模型中排前10的特征參數(shù)及其權重值。
圖5 排前10的特征重要性曲線圖
由圖5可知,排在第1位的是累計絕對速度(CAV),其相對重要性達到了17.8%,排在第2~第4位的是TPGV、TPGA和T=1 s時的反應譜加速度值,其相對重要性分別為11.83%、9.57%和6.9%。從總體上看,除了排在第1的CAV相對于其他特征占有較小優(yōu)勢,其他特征的相對重要性并未出現(xiàn)較大落差。在排名前10的特征參數(shù)中,峰值速度、峰值加速度和峰值位移對應的時刻均在其中,且TPGV和TPGA排在前列,而與反應譜加速度相關的有3個。值得注意的是,前10位特征參數(shù)的重要性之和達到了70.82%,說明未列舉出的其余27個特征參數(shù)相對重要性只有29.18%。說明相對于靠前的特征參數(shù)來說,靠后的特征參數(shù)對于模型的影響微乎其微。
地震易損性分析是一種物理分析方法,指結構易于受到地震作用下的破壞、傷害或損傷的可能性,即結構在地震不同等級下的失效概率。門式起重機結構的地震易損性函數(shù)表達式為
式中:D為地震需求反應,C為結構抗震能力,IM為地震動強度參數(shù)。
根據(jù)文獻[12]可得到基于IDA分析的地震易損性函數(shù)表達式為
式中:MC為門式起重機結構損傷指標,MD、βD為結構地震需求函數(shù)D在條件地震動參數(shù)為IM的地震動作用下的條件中位值和條件對數(shù)標準差。
由前述可知,本文地震動強度參數(shù)為PGA,將在地震作用下門式起重機是否能達到A7工作級別作為結構的地震需求參數(shù)[13]。由GB/T 3811—2008《起重機設計規(guī)范》[14]可知,A7級別的起重機在滿載工況下的主梁下?lián)现礷需滿足f≤L/1 000,L為主梁跨度。已知主梁跨度為35 m,在不同地震動強度作用下,當起重機主梁下?lián)现党^35 mm時,起重機不能滿足A7工作級別[15]。易損性曲線如圖6所示。
圖6 預測易損性曲線與實際易損性曲線圖
由圖6可知,當PGA小于0.4g時,預測概率曲線和實際概率曲線的重合度很高;而PGA在0.4g~0.7g時,隨機森林預測概率和實際概率擬合較差,且在此強度范圍下,2條曲線上升坡度較大;當PGA大于0.7g后,實際概率曲線和預測概率曲線也表現(xiàn)出良好的擬合度??傮w上看,2條曲線擬合程度較好,在上升區(qū)段有較為明顯的差異。
1)隨機森林回歸模型的效果較好。在對重要參數(shù)調優(yōu)后,隨機森林回歸模型的R2值達到了0.854,可利用此模型進行后續(xù)研究。
2)峰值速度、峰值加速度和峰值位移對應時刻的相對重要性排名均在前10,且排名靠前。除此之外,特征周期T=1 s、0.2 s、0.18 s時的反應譜加速度值也在其中。由此可知,峰值時刻和特征周期對應的反應譜加速度值對于模型的預測結果影響較大。
3)從總體上看,隨機森林回歸模型很好地預測了易損性曲線,與實際易損性曲線的擬合度較高。雖然在易損性曲線上升區(qū)段擬合較差,但在可接受范圍內。