鐘燕華
(上海震旦職業(yè)學院, 上海 201908)
目前,我國正在進行世界上規(guī)模最大的基礎(chǔ)設(shè)施建設(shè),建筑業(yè)已成為國民經(jīng)濟發(fā)展的支柱產(chǎn)業(yè)之一,對經(jīng)濟可持續(xù)發(fā)展發(fā)揮著重大作用。國家每年對基本建設(shè)的投入約占國民生產(chǎn)總值的15%左右,建筑業(yè)從業(yè)人數(shù)約占全國總從業(yè)人數(shù)的1/3[1]。由于作業(yè)條件復雜、高空作業(yè)多等特點,建筑業(yè)是僅次于礦業(yè)的高危行業(yè)。因此,做好建筑業(yè)的安全管理工作越來越緊迫。建筑施工事故預測可為企業(yè)制定安全生產(chǎn)目標和安監(jiān)部門宏觀決策提供依據(jù),是加強安全管理工作的有效途徑[2]。
傳統(tǒng)的施工事故預測方法有灰色預測方法、神經(jīng)網(wǎng)絡(luò)及其改進算法等[3-5]?;疑A測法對呈指數(shù)變化趨勢的原始樣本擬合較好,但是對于數(shù)值波動比較大的樣本無能為力。神經(jīng)網(wǎng)絡(luò)由于存在網(wǎng)絡(luò)結(jié)構(gòu)難以確定、過擬合等問題,給實際應用帶來一定困難。最小二乘支持向量機(least squares support vector machine,LSSVM)能夠避免神經(jīng)網(wǎng)絡(luò)過擬合和標準支持向量機訓練耗時長的問題,泛化能力強[6-9]。LSSVM建模中,模型參數(shù)對預測精度有很大影響。粒子群算法(particle swarm optimization,PSO)是一種智能隨機優(yōu)化算法,具有很強的全局搜索能力,非常適合于LSSVM參數(shù)優(yōu)化。
本文采用PSO算法優(yōu)化LSSVM向量參數(shù),在此基礎(chǔ)上構(gòu)建建筑施工事故預測的PSO-LSSVM模型,并通過仿真實驗對模型進行驗證。
對一組訓練樣本集D={(xk,yk)|k=1,2,…,N},其中xk∈Rn,yk∈R,xk表示輸入向量,yk表示輸出數(shù)據(jù),n為訓練樣本數(shù)。在特征空間中LSSVM模型可表示為[10-11]:
y=wTφ(x)+b
(1)
式中:φ(·)表示非線性映射函數(shù);w表示特征空間的權(quán)向量;b表示偏置量。
根據(jù)結(jié)構(gòu)風險最小化原則,最小二乘支持向量機的函數(shù)估計問題可描述為:
(2)
約束條件為:
yk=wTφ(xk)+b+ek
(3)
構(gòu)建非線性映射函數(shù)的目的是提取原始空間的特征,將原始空間中的樣本映射到高維空間,從而解決原始空間中的線性不可分問題。根據(jù)式(2),可定義拉格朗日函數(shù)如下:
L(w,b,e;α)=J(w,e)-
(4)
式中αk表示拉格朗日乘子,αk∈R。
根據(jù)KKT條件,對式(4)進行優(yōu)化,即:
(5)
(6)
其中:
y=[y1,y2,…,yN],α=[α1,α2,…,αN]
lv=[1,1,…,1],Ω=φT(xk)φ(xl)
(l=1,2,…,N)
根據(jù)Mercer條件,存在映射φ和核函數(shù)K(·,·),使:
K(xk,xl)=φT(xk)φ(xl)
(7)
由式(6)和式(7)聯(lián)立求出α和b后,得到LSSVM回歸算法的函數(shù)估計式:
(8)
式(8)取不同的核函數(shù)生成不同的支持向量,主要有B樣條核函數(shù)、多項式核函數(shù)和徑向基核函數(shù)(RBF)等。為了獲得最優(yōu)的核函數(shù)參數(shù)σ和誤差懲罰參數(shù)γ,減少主觀經(jīng)驗選取參數(shù)的盲目性和重復性,本文采用PSO算法確定最優(yōu)的σ和γ。
PSO算法是由鳥類群體行為啟發(fā)而提出的一種全局優(yōu)化算法。PSO通過個體之間的協(xié)作尋求最優(yōu)解,尤其善于解決連續(xù)域優(yōu)化問題[12-17]。
PSO初始化為一群隨機粒子,通過多次迭代搜索最優(yōu)解,粒子優(yōu)劣由適應度函數(shù)決定。每個粒子代表一個可能的解向量,通過跟蹤2個最優(yōu)解(個體最優(yōu)解、全局最優(yōu)解)來更新自己的位置和速度,實現(xiàn)全局尋優(yōu)。設(shè)粒子的位置和運動速度為別為X和V,d為決策變量的維數(shù),則第i個粒子的參數(shù)可表示為:
Xi=(xi1,xi2,…,xid)
Vi=(vi1,vi2,…,vid)
更新策略為:
(9)
(10)
(11)
用PSO算法優(yōu)化LSSVM參數(shù),流程如圖1所示,基本步驟如下:
步驟1 初始化PSO算法的參數(shù):群體規(guī)模、學習因子、最大迭代次數(shù)、粒子的初始位置和速度等。
步驟2 用每個粒子對LSSVM訓練樣本進行學習,得到各粒子當前位置的訓練誤差,作為各粒子的適應度值。將各粒子的當前適應度值與該粒子的最優(yōu)適應度值進行對比,如果更優(yōu),則將當前位置作為該粒子的最優(yōu)位置。
步驟3 用式(11)計算慣性權(quán)重,用式(9)、式(10)更新粒子的速度和位置。
步驟4 判斷是否滿足尋優(yōu)終止條件(設(shè)定的最大迭代次數(shù)或精度),如果滿足則求出最優(yōu)解,如果不滿足則轉(zhuǎn)至步驟2。
圖1 PSO優(yōu)化LSSVM參數(shù)的基本流程
LSSVM對0到1之間的數(shù)據(jù)學習效果最佳,為此,在進行機器學習之前首先將原始樣本用下式進行歸一化處理:
(12)
式中:xi表示原始樣本;ximax、ximin分別為原始樣本的最大值和最小值,
最后,對建筑施工事故預測結(jié)果進行反歸一化處理,即:
(13)
對于一組給定的樣本序列:
{x1,x2,…,xN}
假定已知x(t),預測x(t+1),可建立映射函數(shù):
f∶Rm→R
于是
(14)
LSSVM預測器的拓撲結(jié)構(gòu)如圖2所示。
LSSVM預測器的待優(yōu)化參數(shù)為γ、σ,即:
(15)
參數(shù)優(yōu)化的目的是提高預測精度,構(gòu)建訓練樣本的適應度函數(shù):
(16)
圖2 LSSVM預測器的拓撲結(jié)構(gòu)
通常表征預測結(jié)果精度的指標有:平均絕對值相對誤差(MAPE)、均方根誤差(RMSE)和相對誤差(RE)等。本文采用預測結(jié)果的MAPE作為預測精度評價指標[18]:
(17)
本文預測樣本來源于文獻[4]建筑施工事故數(shù)據(jù)。選擇嵌入維數(shù)為5,將原始樣本分為11組。前9組為訓練樣本,用于構(gòu)建LSSVM預測器,后2組為預測樣本,用于檢驗PSO-LSSVM預測能力。
選取核函數(shù)為RBF核函數(shù),用LSSVM將重構(gòu)的建筑施工事故訓練樣本進行訓練。
PSO參數(shù)設(shè)置為:種群數(shù)N=30,最大迭代次數(shù)為Gmax=100,學習因子c1=1.5,c2=1.5,慣性權(quán)重ω=0.7。在Matlab R2011a環(huán)境下優(yōu)化PSO-LSSVM模型,得到最優(yōu)的寬度參數(shù)σ2=0.34,誤差懲罰參數(shù)γ=151。
PSO對LSSVM參數(shù)的尋優(yōu)過程如圖3所示。從圖3中可以看出:PSO對LSSVM的尋優(yōu)速度很快,經(jīng)過不到20次迭代基本能夠得到最優(yōu)的LSSVM參數(shù)。
圖3 PSO參數(shù)尋優(yōu)過程
得到最優(yōu)的模型參數(shù)后,對建筑施工事故訓練樣本進行訓練,結(jié)果如圖4所示。從圖4中可以看出:PSO-LSSVM輸出值和真實值基本重合,說明建模精度非常高。
圖4 建筑施工事故的PSO-LSSVM訓練結(jié)果
用訓練好的PSO-LSSVM模型對建筑施工事故進行預測,同時與文獻[4]進行對比,結(jié)果見表1。
表1 建筑施工事故的PSO-LSSVM預測結(jié)果
從表1可以看出:PSO-LSSVM對2008年、2009年的預測結(jié)果相對誤差均小于5%,能夠滿足工程精度要求,計算得MAPE(PSO-LSSVM)=2.99%,相比同類文獻算法MAPE(灰色馬爾可夫)=4.62%而言,PSO-LSSVM對建筑施工事故預測的精度更高,更具先進性。
1) 建筑施工事故具有影響因素錯綜復雜、少樣本、隨機波動大的特點,用傳統(tǒng)預測方法很難進行準確建模,并且計算較為復雜。
2) LSSVM對隨機波動較大的樣本具有較大優(yōu)勢、泛化能力強。粒子群算法能夠運用于LSSVM參數(shù)尋優(yōu)中,并且計算簡單、運算速度快,仿真案例驗證了2種算法的綜合優(yōu)勢。
3) 預測結(jié)果表明,采用PSO-LSSVM的平均絕對值相對誤差為2.99%,并且每年的預測相對誤差都低于5%,能夠滿足工程應用要求,充分說明了本文所提方法的有效性。
4) 本文借用同類文獻的數(shù)據(jù),時效性稍差,但不影響說明所建預測模型的正確性和所用方法的先進性。