陳向俊,傅軍平,陳棟棟,李 科,李黎蘋,呂林鋒
(1.浙江省特種設(shè)備科學(xué)研究院,浙江 杭州 310020;2.浙江省特種設(shè)備檢驗(yàn)技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310053)
截至2020年12月,我國國內(nèi)電梯總量將達(dá)到了850萬臺(tái),中國的電梯產(chǎn)銷量和電梯數(shù)總量在世界上依舊保持第一。但隨著電梯市場和需求的日益擴(kuò)大,電梯的安全問題越來越嚴(yán)峻[1]。
電梯鋼絲繩是關(guān)系到電梯正常運(yùn)行的重要部件之一,易發(fā)生腐蝕磨損和疲勞斷裂。2019年7月14日,上海市嘉定區(qū)某電梯維護(hù)作業(yè)人員徐某在進(jìn)行電梯鋼絲繩更換作業(yè)時(shí),在剛更換了一根鋼絲繩后,其余所有的鋼絲繩(6根)全部斷裂,徐某被上方脫落的鏈條打中。后經(jīng)調(diào)查發(fā)現(xiàn),該電梯的鋼絲繩已經(jīng)嚴(yán)重磨損,處于一碰即斷的臨界點(diǎn),從而引發(fā)了此次安全事故。
隨著電梯曳引鋼絲繩的廣泛使用,鋼絲繩的安全防護(hù)問題非常值得關(guān)注,除了要經(jīng)常對其進(jìn)行潤滑之外,對曳引輪槽表面磨損情況、輪槽尺寸都需要進(jìn)行定期檢查,以保證電梯的安全運(yùn)行[2]。因此,鋼絲繩磨損量的預(yù)測對于提高鋼絲繩的使用壽命和電梯安全性能是非常重要的。
通過文獻(xiàn)檢索發(fā)現(xiàn),國內(nèi)現(xiàn)有針對電梯鋼絲繩磨損的研究并不多見。陳海龍[3]在對起重機(jī)鋼絲繩磨損進(jìn)行了研究,結(jié)果表明,直徑的減少是起重機(jī)鋼絲繩磨損報(bào)廢的直接原因,并提出了一種通過測量鋼絲繩直徑的減少來值判斷鋼絲繩磨損量的方法;但他的研究中,實(shí)驗(yàn)的樣本量太少,且其研究僅針對鋼絲繩直徑對磨損量的影響,不夠全面。王平等人[4]應(yīng)用繩索振動(dòng)理論結(jié)合BP(back propagation)神經(jīng)網(wǎng)絡(luò)的方法,對鋼絲繩磨損與張力偏差之間的關(guān)系進(jìn)行了研究,并設(shè)計(jì)了實(shí)驗(yàn)對該方法的實(shí)用性進(jìn)行了驗(yàn)證;但是其研究也僅針對張力與磨損量的關(guān)系,同樣不夠全面。王曄[5]研究了不同因素對鋼絲繩磨損量的影響,但是他僅從理論方面進(jìn)行了闡述,并未用實(shí)驗(yàn)對此進(jìn)行驗(yàn)證。任潔[6]分析了鋼絲繩實(shí)際磨損的圖片,并得到結(jié)論,即多數(shù)鋼絲繩磨損為人為安裝因素引起,不涉及到鋼絲繩自身的因素。
因此,目前對電梯鋼絲繩磨損量預(yù)測的研究存在明顯的局限和不足。
為了解決這個(gè)問題,筆者以梯度提升回歸(gradient boosting regression,GBR)算法為基礎(chǔ),圍繞影響鋼絲繩磨損的4個(gè)主要因素[7]采集實(shí)驗(yàn)數(shù)據(jù),利用經(jīng)過貝葉斯優(yōu)化的極端梯度提升模型(BO-XGBoost)進(jìn)行訓(xùn)練和驗(yàn)證,預(yù)測鋼絲繩在不同情況下的磨損量,并將其與實(shí)際磨損量進(jìn)行比較。
梯度提升算法本質(zhì)上是一種監(jiān)督學(xué)習(xí)方法。對于許多復(fù)雜的數(shù)據(jù)集而言,它是一種非常可靠的方法[8,9]。GBR就是一種弱學(xué)習(xí)器的回歸算法,最后得到強(qiáng)學(xué)習(xí)器,它可以用于回歸和分類的問題。在梯度提升過程中,先找到一個(gè)預(yù)測準(zhǔn)確性比較弱的模型Fm(x),得到其預(yù)測值與實(shí)際y值之間的差異,即殘差R(x)。
GBR不會(huì)改變Fm(x),而是通過增加估計(jì)器h(x)構(gòu)建新的模型,逐步減小殘差。當(dāng)滿足下式時(shí),效果最好:
h(x)=y-Fm(x)
(1)
極端梯度提升算法是以梯度提升算法為基礎(chǔ)的一種優(yōu)化算法[10,11],沿用了梯度提升的框架,因此同樣是一種監(jiān)督算法。XGBoost在目標(biāo)函數(shù)的損失函數(shù)中新加入一個(gè)正則化項(xiàng),它能過渡最終學(xué)習(xí)到的權(quán)重比,防止過擬合現(xiàn)象。
接下來筆者介紹XGBoost的理論框架。
(2)
式中:?!貧w樹空間;K—回歸樹的數(shù)量;xi—樣本i對應(yīng)的特征。
目標(biāo)函數(shù)是機(jī)器學(xué)習(xí)問題中最基本的表達(dá)方式[12],其提升的過程會(huì)一直進(jìn)行,直到目標(biāo)函數(shù)變得最簡且最優(yōu)。筆者將模型中采用的函數(shù)集做近似化處理,并定義正則化的目標(biāo)函數(shù)為:
(3)
(4)
由于需要在損失函數(shù)中優(yōu)化目標(biāo),筆者在此處將式(4)按二階泰勒展開做近似處理,即:
(5)
式中:gi—損失函數(shù)的一階梯度統(tǒng)計(jì)量;hi—損失函數(shù)的二階梯度統(tǒng)計(jì)量。
gi的具體表達(dá)式如下式所示:
(6)
hi的具體表達(dá)式如下式所示:
(7)
在迭代過程步驟k中去除掉常數(shù)項(xiàng),得到以下近似目標(biāo)值:
(8)
用葉子的分?jǐn)?shù)向量和樣本映射到葉子j的索引映射函數(shù)來定義樹,這個(gè)過程可以表示為:
(9)
同時(shí)式(8)可以改寫為:
(10)
(11)
(12)
式(12)可以看作是一個(gè)評估函數(shù),用于衡量給定的葉子評分向量的合適程度,其值越小越好。為了避免陷入無盡的樹結(jié)構(gòu),在實(shí)際應(yīng)用中,筆者采用貪心算法來尋找最優(yōu)的樹結(jié)構(gòu)。
超參數(shù)是指在機(jī)器學(xué)習(xí)過程中需要提前設(shè)置值的參數(shù),超參數(shù)對模型的預(yù)測準(zhǔn)確性有顯著影響。在機(jī)器學(xué)習(xí)實(shí)踐中調(diào)整超參數(shù)通常采用網(wǎng)格搜索(grid search,GS)和隨機(jī)搜索(random search,RS)方法。由于GS容易受到維數(shù)約束的影響,維數(shù)越多則花費(fèi)時(shí)間指數(shù)增長,這已被證明對于XGBoost是不可行的方法[13,14]。RS通過嘗試超參數(shù)的隨機(jī)組合來選擇最佳超參數(shù)配置的方法,但RS的缺點(diǎn)在于不必要的高方差。
貝葉斯優(yōu)化(Bayesian optimization,BO)通過目標(biāo)以前的評估結(jié)果重新構(gòu)建概率模型[15,16],尋得最小化目標(biāo)函數(shù)的值,被廣泛應(yīng)用于機(jī)器學(xué)習(xí)超參數(shù)調(diào)優(yōu)。貝葉斯超參數(shù)優(yōu)化是一種為序列模式模型提供的求全局優(yōu)化的方法[17],序列化模型全局優(yōu)化(sequential model-based optimization,SMBO)是把貝葉斯優(yōu)化的一個(gè)形式化的定義。
SMBO偽代碼流程如表1所示。
表1 SMBO偽代碼
整個(gè)循環(huán)一共需要進(jìn)行T次。首先每次先根據(jù)已有的歷史試驗(yàn)集合找出一個(gè)更可能擁有更小損失函數(shù)的超參數(shù)集合λ,之后計(jì)算實(shí)際的損失函數(shù)L的值,加入歷史集合后更新S。
由于貝葉斯優(yōu)化是優(yōu)化目標(biāo)函數(shù)的首選,筆者提出的基于貝葉斯超參數(shù)優(yōu)化的極端梯度提升算法(BO-XGBoost)對應(yīng)的流程如圖1所示。
圖1 BO-XGBoost算法流程
為了準(zhǔn)確地研究電梯鋼絲繩在使用過程中的磨損情況,筆者采用自制的疲勞試驗(yàn)機(jī)來對鋼絲繩的磨損過程進(jìn)行實(shí)驗(yàn)?zāi)M。模擬過程為先將鋼絲繩繞在曳引輪和導(dǎo)向輪上,并張緊(兩輪間相對位置可調(diào),以適應(yīng)不同的包角);加載模式為氣壓加載,通過電控并給定其一定的頻率,使其來回反復(fù)運(yùn)動(dòng)。
疲勞試驗(yàn)機(jī)的設(shè)計(jì)圖和實(shí)物圖如圖2所示。
圖2 疲勞試驗(yàn)機(jī)設(shè)計(jì)圖1—反折輪導(dǎo)向裝置;2—反折輪;3—試驗(yàn)輪驅(qū)動(dòng)裝置;4—繩頭夾具計(jì)數(shù)裝置;5—包角調(diào)節(jié)裝置;6—控制系統(tǒng);7—導(dǎo)向輪
疲勞試驗(yàn)機(jī)分為機(jī)械部分和電控部分:(1)機(jī)械部分。由伺服電機(jī)帶動(dòng)試驗(yàn)輪正反轉(zhuǎn)運(yùn)行,以此來拖動(dòng)鋼絲繩進(jìn)行疲勞壽命試驗(yàn)。實(shí)驗(yàn)輪和導(dǎo)向輪為可拆卸結(jié)構(gòu),用來測試不同直徑的鋼絲繩,載荷力通過加載輪來調(diào)節(jié)其大小;(2)電控部分。主要為人機(jī)界面,在設(shè)定試驗(yàn)頻率、試驗(yàn)次數(shù)以及包角等參數(shù)后,即開始進(jìn)行疲勞試驗(yàn)。
整個(gè)試驗(yàn)在曳引比1:1的情況下進(jìn)行。當(dāng)PLC通訊正常時(shí),系統(tǒng)會(huì)跳轉(zhuǎn)到參數(shù)設(shè)置界面來設(shè)置相關(guān)實(shí)驗(yàn)參數(shù)。參數(shù)設(shè)置界面如圖3所示。
圖3 參數(shù)設(shè)置界面
目前一般以鋼絲繩直徑的磨損率來考察鋼絲繩的失效程度。磨損率涉及到的因素較多,鋼絲繩的磨損率主要受載荷力、曳引輪直徑、運(yùn)動(dòng)頻率、包角的影響較大。筆者將上述4個(gè)因素作為實(shí)驗(yàn)考察的因素,將數(shù)據(jù)實(shí)驗(yàn)測得的磨損率記錄下來,用于創(chuàng)建機(jī)器學(xué)習(xí)模型。
由于鋼絲繩疲勞實(shí)驗(yàn)流程很長,筆者采用130組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù);且模型訓(xùn)練完畢后,再用20組新數(shù)據(jù)作為測試之用,故總共采集150組數(shù)據(jù)。測試模型的數(shù)據(jù)如表2所示。
筆者在MATLAB上編寫4種模型的程序,并導(dǎo)入表2中的數(shù)據(jù),分別運(yùn)行后得到模型的建模結(jié)果分析圖和回歸效果分析圖。各模型的預(yù)測結(jié)果如圖4所示。
表2 測試模型試驗(yàn)數(shù)據(jù)集
圖4 不同模型預(yù)測結(jié)果曲線
由圖4(a~h)可以發(fā)現(xiàn),BO-XGBoost模型的預(yù)測值與目標(biāo)值更接近。因此,不難看出BO-XGBoost模型的模擬效果最好,RF和SVM模型其次,MLR模型最差。
在算法原理上,RF對異常值不敏感,且對訓(xùn)練集一視同仁,且每棵樹分裂特征隨機(jī);采用MLR算法處理復(fù)雜問題時(shí),存在較大的局限性;SVM雖然有一定的泛化能力,但核函數(shù)的選取非常困難,同時(shí)對缺失數(shù)據(jù)也很敏感;BO-XGBoost對代價(jià)函數(shù)進(jìn)行了二階泰勒展開,同時(shí)考慮一階與二階導(dǎo)數(shù),支持自定義代價(jià)函數(shù)(二階可導(dǎo)),在超參數(shù)問題上加以貝葉斯優(yōu)化后,其優(yōu)勢很大。
為了評估預(yù)測模型的可靠度,筆者計(jì)算每個(gè)模型結(jié)果的平均絕對誤差(MAE)、均方根誤差(RMSE)和決定系數(shù)(R2)。MAE是評估回歸模型預(yù)測誤差的最常用方法之一,它是方程中給出的預(yù)測誤差的平均絕對值,如下式所示:
(13)
式中:PM—預(yù)測的磨損量;AM—實(shí)際的磨損量;
對于預(yù)測誤差,筆者利用RMSE來驗(yàn)證預(yù)測的有效性,即:
(14)
評估參數(shù)R2被廣泛稱為確定系數(shù),用于確定預(yù)測值與實(shí)際值的接近程度,即:
R2=
(15)
如前所述,MAE和RMSE的值越低表示該模型的效率越高,R2值在0~1之間,且越接近1表示模型的預(yù)測精度越好。
4種模型的MAE、RMSE、R2值如表3所示。
表3 鋼絲繩磨損結(jié)果預(yù)測
通過表3,并結(jié)合前文的圖4可以看出:在此次試驗(yàn)中,BO-XGBoost模型比其他3個(gè)模型效果都要好;具體表現(xiàn)為BO-XGBoost的MAE與RMSE均要小于MLR、SVM和RF,且BO-XGBoost的R2值較高,達(dá)到了0.991,與圖4反映的結(jié)果類似,即MLR顯示的預(yù)測性能最低,RF和SVM其次,BO-XGBoost的預(yù)測效果最優(yōu)。
針對目前對電梯鋼絲繩磨損量預(yù)測的不足,筆者采用基于極端梯度提升(XGBoost)算法的機(jī)器學(xué)習(xí)方法,對電梯鋼絲繩磨損率的預(yù)測進(jìn)行了研究。筆者基于自制的鋼絲繩疲勞試驗(yàn)機(jī),對鋼絲繩磨損的4個(gè)主要因素的數(shù)據(jù)進(jìn)行采集,并用基于貝葉斯超參數(shù)優(yōu)化的極端梯度提升回歸算法BO-XGBoost來預(yù)測鋼絲繩疲勞磨損率;同時(shí)將BO-XGBoost與多元線性回歸(MLR)、隨機(jī)森林(RF)以及支持向量機(jī)(SVM)算法進(jìn)行了比較。
研究結(jié)果表明:
(1)BO-XGBoost模型對多因素影響下鋼絲繩磨損率的預(yù)測效果最佳,模型的泛化能力最好,其預(yù)測可靠度優(yōu)于MLR、RF、SVM等模型;
(2)對于電梯鋼絲繩磨損,采用基于極端梯度提升回歸模型算法,其預(yù)測精度達(dá)到了99%以上,預(yù)測值基本等于實(shí)際磨損值;將其用于鋼絲繩磨損程度的參考,在不同工況下選擇合適的曳引輪直徑、載荷力、頻率和包角,有利于降低鋼絲繩的磨損率,提高特種設(shè)備的安全。
在后續(xù)的工作中,筆者將研究鋼絲繩的磨損量與其使用壽命之間的規(guī)律,以進(jìn)一步提高鋼絲繩使用的安全性。