白金花,劉 勇,2,3,程智慧,向前前,施星宇
(1.湖南科技大學(xué) 資源環(huán)境與安全工程學(xué)院,湖南 湘潭 411201;2.湖南科技大學(xué) 煤礦安全開采技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 湘潭 411201;3.湖南科技大學(xué) 南方煤礦瓦斯與頂板災(zāi)害預(yù)防控制安全生產(chǎn)重點(diǎn)實(shí)驗(yàn)室,湖南 湘潭 411201;4.長沙理工大學(xué) 電氣與信息工程學(xué)院,湖南 長沙 410114)
危險(xiǎn)化學(xué)品(文中簡稱“危險(xiǎn)品”)的道路運(yùn)輸環(huán)節(jié)是化工產(chǎn)業(yè)鏈條的重要一環(huán)[1]。我國每年通過道路運(yùn)輸?shù)奈kU(xiǎn)品超過10億噸,占危險(xiǎn)品運(yùn)輸總量的70%以上,占道路年運(yùn)輸總量的30%以上,且呈上升趨勢[2]。危險(xiǎn)品運(yùn)輸途中因駕駛員操作不當(dāng)、危險(xiǎn)品防護(hù)不到位或地理環(huán)境差等因素容易發(fā)生碰撞、側(cè)翻、追尾等交通事故,進(jìn)而導(dǎo)致危險(xiǎn)品泄漏事故的發(fā)生[3]。2013—2018年,全國危險(xiǎn)品道路泄漏事故共發(fā)生1600余起,約占全年事故總量的84.77%[4]。危險(xiǎn)品道路運(yùn)輸泄漏事故已成為制約化工行業(yè)發(fā)展的重要因素之一,嚴(yán)重威脅人民生命財(cái)產(chǎn)安全。開展危險(xiǎn)品道路運(yùn)輸泄漏事故預(yù)測研究,可為事故預(yù)防與應(yīng)急處置提供參考[5],對于公共交通安全以及經(jīng)濟(jì)社會和諧發(fā)展具有重要意義。
時間序列預(yù)測模型被廣泛應(yīng)用到預(yù)測領(lǐng)域。Steven等[6]將時間序列模型應(yīng)用于道路交通的預(yù)測領(lǐng)域。Ayad等[7]驗(yàn)證了時間序列模型對交通事故死亡人數(shù)預(yù)測的有效性。Li等[8]建立運(yùn)輸事故時間序列和自回歸滑動平均(ARMA)模型對2020年第一季度危險(xiǎn)品泄漏事故數(shù)量進(jìn)行預(yù)測。以上研究說明時間序列ARMA模型對于預(yù)測具有較強(qiáng)適用性,ARMA模型描述線性規(guī)律的能力較強(qiáng),數(shù)據(jù)中的非線性規(guī)律則以殘差的形式體現(xiàn),理想情況下殘差序列的自相關(guān)系數(shù)均為零,但在實(shí)際中這一要求往往無法達(dá)到。
SSESM屬于指數(shù)平滑模型中的1種,是由美國學(xué)者布朗(Robert G.Brown)于1960年提出的[9]。馬浩凡[10]為確定影響二手車進(jìn)口的因素,并分析二手車對環(huán)境的影響,采用簡單季節(jié)指數(shù)平滑、多元回歸和相關(guān)分析方法對二手車進(jìn)口趨勢進(jìn)行數(shù)據(jù)分析和解釋預(yù)測結(jié)果。石明珠[11]基于內(nèi)部因素的填充方法主要是根據(jù)各監(jiān)測站點(diǎn)按小時收集的PM2.5濃度數(shù)據(jù),使用反距離加權(quán)法和簡單季節(jié)指數(shù)平滑法分別從全局空間和時間上進(jìn)行填充。Moiseev[12]應(yīng)用簡單季節(jié)指數(shù)平滑預(yù)測2015年—2019年危機(jī)期間沿世界海洋6條不同石油運(yùn)輸路線的油輪平均定期租船價(jià)值。SSESM模型能將非線性時間數(shù)據(jù)序列的數(shù)量差異抽象化,對序列進(jìn)行修勻從而消除不規(guī)則和隨機(jī)擾動,顯示出預(yù)測對象變動的基本趨勢,但對預(yù)測精度較難達(dá)到全局最優(yōu)。
Bates等[13]在1969年首次提出組合預(yù)測的理論和方法,將不同的預(yù)測方法進(jìn)行組合,以求產(chǎn)生較好的預(yù)測效果。上述2種單一模型在預(yù)測中有著各自的優(yōu)勢,又都存在一定的局限性。ARMA-SSESM組合模型獲取的信息更加全面,削弱了ARMA模型對于殘差中信息的缺失以及SSESM模型預(yù)測精度的局限,得到的預(yù)測值有更理想的預(yù)測效果。魏杏[14]基于指數(shù)平滑法和ARIMA組合預(yù)測模型應(yīng)用于交通量預(yù)測,通過實(shí)例驗(yàn)證組合預(yù)測效果良好。陳云浩等[15]人通過對時間序列的研究分析,提出基于ARMA模型和Holt-Winters指數(shù)平滑模型進(jìn)行企業(yè)用電量預(yù)測的方法,二者組合應(yīng)用具有較高的可行性和推廣價(jià)值。以上研究表明指數(shù)平滑模型和ARMA組合模型實(shí)用性較強(qiáng),但ARMA-SSESM組合模型目前在危險(xiǎn)品道路運(yùn)輸領(lǐng)域涉及較少。
本文根據(jù)2013—2020年道路運(yùn)輸過程中危險(xiǎn)品泄漏事故信息,運(yùn)用時間序列方法分析數(shù)據(jù),建立ARMA事故預(yù)測模型和SSESM(simple seasonal exponential smoothing method)模型組合模型,并對比分析3種方法的預(yù)測精度,從而驗(yàn)證組合預(yù)測模型在危險(xiǎn)品道路運(yùn)輸泄漏事故預(yù)測中的優(yōu)越性。
2013—2020年危險(xiǎn)品道路運(yùn)輸事故數(shù)據(jù)來源于石化事故分析與數(shù)據(jù)解讀平臺(petrochemical accident analysis platform,PAAP)[8]。通過人工核對與數(shù)據(jù)清洗,最終獲得2 216起有效數(shù)據(jù)。事故原始數(shù)據(jù)序列如圖1所示。
圖1 2013—2020年事故原始數(shù)據(jù)序列Fig.1 Time series of accident raw data from 2013 to 2020
ARMA模型屬于混合模型,一般的ARMA(p,q)模型的基本形式如式(1)所示:
(1)
式中:Xt為回歸值;p與q是非負(fù)整數(shù);ut為干擾項(xiàng);φi為自回歸系數(shù);θj為滑動平均系數(shù)。
AR模型與MA模型是ARMA的特殊情況,當(dāng)q=0時,成為自回歸模型AR(p);當(dāng)p=0時,則是移動平均模型MA(q)。
運(yùn)用Eviews軟件對時間序列進(jìn)行帶截距項(xiàng)的模型檢驗(yàn),得到檢驗(yàn)結(jié)果如表1所示。
表1 時間序列單位根檢驗(yàn)結(jié)果Table 1 Unit root test results of time series
由表1可知,統(tǒng)計(jì)量T值的絕對值大于其在1%,5%,10%檢驗(yàn)水平下的臨界值。即拒絕序列有單位根的原假設(shè),該檢驗(yàn)序列不具有單位根,是平穩(wěn)序列,即所研究序列為平穩(wěn)非白噪音時間序列。
在對時間序列運(yùn)用B-J方法建模時,應(yīng)當(dāng)運(yùn)用序列的自相關(guān)函數(shù)(autocorrelation function,ACF)與偏自相關(guān)函數(shù)(partial autocorrelation function,PACF)對序列適合的模型類型進(jìn)行識別。
其中自相關(guān)函數(shù)的定義如式(2)所示:
(2)
ARMA(p,q)模型的k階自相關(guān)函數(shù)(ACF)定義如式(3)所示:
ρk=φ1ρk-1+…+φpρk-p,k≥(q+1)
(3)
偏自相關(guān)函數(shù)(PACF)是ARMA模型的另一個統(tǒng)計(jì)特征,其定義如式(4)所示:
(4)
式中:k代表滯后量;φkj=φk-1,j-φkkφk-1,k-j,j=1,2,…,s-1。
服從ARMA(p,q)模型的時間序列具有明顯的統(tǒng)計(jì)特征,因此可以通過其自相關(guān)或者偏自相關(guān)的拖尾或者截尾現(xiàn)象來確定模型形式。
當(dāng)時間序列ACF與PACF均未出現(xiàn)拖尾,難以進(jìn)行判斷。因此根據(jù)不同模型變量對應(yīng)的調(diào)整R2值(adjusted r-squared)、赤池信息準(zhǔn)則(akaike information criterion,AIC)與施瓦茲準(zhǔn)則(schwarz criterion,SC)作為選擇模型的重要標(biāo)準(zhǔn)[16]。
PACF在滯后3階出現(xiàn)截尾,可以判斷模型自回歸過程可能為3階。自相關(guān)系數(shù)在滯后2階后均落在隨機(jī)區(qū)間內(nèi)部。因此經(jīng)過初步判斷可能適合的模型有AR(3)、MA(2)與ARMA(3,2)。分別計(jì)算AR(3)、MA(2)與ARMA(3,2)3組模型的調(diào)整值R2、AIC值與SC值。結(jié)果如表2所示。
表2 模型參數(shù)對照Table 2 Comparison of model parameters
對比3組模型的調(diào)整值R2、AIC值與SC值,數(shù)據(jù)顯示出ARMA(3,2)模型的調(diào)整值最大,同時AIC值與SC值均最小,因此確定ARMA(3,2)為危險(xiǎn)品道路運(yùn)輸泄漏事故預(yù)測最佳模型。
利用最小二乘估計(jì)方法估計(jì)模型中未知參數(shù)的值,確定模型的最小二乘估計(jì)結(jié)果如式(5)所示:
(5)
誤差項(xiàng)方差的估計(jì)值如式(6)所示:
(6)
運(yùn)用Eviews軟件對殘差序列進(jìn)行χ2檢驗(yàn),輸出結(jié)果如表3所示。
由表3可知,殘差序列自相關(guān)系數(shù)都落入隨機(jī)區(qū)間,自相關(guān)系數(shù)(AC)絕對值幾乎都小于0.1,與0無明顯差異,表明殘差序列是純隨機(jī)的。即表明模型ARMA(3,2)對時間序列擬合效果較好。
在對2021年事故數(shù)據(jù)進(jìn)行預(yù)測之前,先對樣本內(nèi)2019—2020年危險(xiǎn)品道路運(yùn)輸各月份事故數(shù)量進(jìn)行預(yù)測,并將預(yù)測結(jié)果與2019—2020年實(shí)際觀測值對比,以此檢驗(yàn)?zāi)P皖A(yù)測精度。
運(yùn)用ARMA(3,2)模型對2019—2020年各月份事故數(shù)量進(jìn)行預(yù)測,得到預(yù)測值與實(shí)驗(yàn)值如圖2所示。
圖2 2019與2020年事故數(shù)量預(yù)測值與實(shí)驗(yàn)值對比Fig.2 Comparison on predicted and experimental values of accident numbers in 2019 and 2020
2019年事故數(shù)量實(shí)驗(yàn)值與預(yù)測值平均值分別為23.00,23.30,標(biāo)準(zhǔn)差分別為7.01,4.83。2020年事故數(shù)量實(shí)驗(yàn)值與預(yù)測值平均值分別為25.40,23.80,標(biāo)準(zhǔn)差分別為7.72,4.62。2019年與2020年事故數(shù)量實(shí)驗(yàn)值與預(yù)測值平均值和標(biāo)準(zhǔn)差基本一致,所建立的ARMA模型可適用于危險(xiǎn)品道路運(yùn)輸泄漏事故數(shù)量的預(yù)測。
SSESM是對時間序列由近及遠(yuǎn)采取具有逐步衰減性質(zhì)的加權(quán)處理,是移動平均法的改進(jìn)型。該方法假定,未來預(yù)測值與過去已知數(shù)據(jù)有一定關(guān)系,近期數(shù)據(jù)對預(yù)測值的影響較大,遠(yuǎn)期數(shù)據(jù)對預(yù)測值的影響較小[17]。一般的SSESM模型的基本形式如式(7)所示:
St=αXt+(1-α)St-1
(7)
式中:St為第t周期的指數(shù)平滑值;Xt為第t周期的實(shí)驗(yàn)值;St-1為第t-1周期的指數(shù)平滑值;α為平滑系數(shù),即權(quán)數(shù)(0≤α≤1);t為周期數(shù)(t=1,2,3,…)。由此可見,SSESM就是用第t期的指數(shù)平滑值作為時間序列{Xt}的第t+1期預(yù)測值。
預(yù)測的精度與平滑系數(shù)α值的選擇關(guān)系較大。當(dāng)序列呈較穩(wěn)定的水平趨勢,或者雖有波動,但長期趨勢變化不大時,α宜取小值[0.1,0.3],以充分發(fā)揮歷史數(shù)據(jù)的作用;當(dāng)數(shù)列波動較大,長期趨勢變化幅度較大時,α宜取大值[0.5,0.9],以跟蹤近期數(shù)據(jù)的變化[18]。由圖1可知,數(shù)據(jù)雖有波動,但長期趨勢變化不大,平滑系數(shù)分別取0.10,0.20,0.30,對危險(xiǎn)品道路運(yùn)輸泄漏事故的歷史數(shù)據(jù)進(jìn)行預(yù)測,分別計(jì)算其指數(shù)平滑值及平均絕對誤差(MAE)如式(8)所示:
(8)
經(jīng)式(8)計(jì)算得平滑系數(shù)α取0.10,0.20,0.30的平均絕對誤差分別為1.730,2.885,3.861,平滑系數(shù)α取0.10的平均絕對誤差最小,擬合效果更好,當(dāng)平滑系數(shù)α取0.10時,2013—2020年危險(xiǎn)品道路運(yùn)輸泄漏事故實(shí)驗(yàn)值與預(yù)測值擬合情況如圖3所示。
圖3 a=0.1 SSESM模型2013—2020年泄漏事故數(shù)量實(shí)驗(yàn)值和預(yù)測值擬合Fig.3 Fitting on experimental and predicted values of leakage accident numbers from 2013 to 2020 by SSESM model at a=0.1
由圖1可知,危險(xiǎn)品道路運(yùn)輸泄漏事故具有季節(jié)性趨勢,選用SSESM模型進(jìn)行預(yù)測。用均方根誤差(RMSE)如式(9)所示、平均絕對百分誤差(MAPE)如式(10)所示、平均絕對誤差(MAE)來驗(yàn)證SSESM模型預(yù)測精度。
(9)
(10)
由表4所示,簡單季節(jié)性模型均方根誤差(RMSE)、平均絕對百分誤差(MAPE)、平均絕對誤差(MAE)的擬合參數(shù)值較小,SSESM模型的平穩(wěn)R2和R2更大,分別是0.713,0.332,說明簡單季節(jié)性指數(shù)平滑模型滿足預(yù)測精度要求。
表4 SSESM模型相關(guān)參數(shù)Table 4 Related parameters of SSESM model
用SSESM模型對2019—2020年各月份危險(xiǎn)品道路運(yùn)輸泄漏事故數(shù)量進(jìn)行預(yù)測,得到預(yù)測值與實(shí)驗(yàn)值如圖4所示。
由圖4可知,2019年—2020年事故數(shù)量預(yù)測值與實(shí)驗(yàn)值走勢基本吻合,所建立的SSESM模型可用于危險(xiǎn)品道路運(yùn)輸泄漏事故數(shù)量預(yù)測。
為提高預(yù)測精度,組合預(yù)測法需要將2種或者2種以上的預(yù)測方法進(jìn)行組合預(yù)測[19]。ARMA模型綜合考慮了時間序列的趨勢、周期的變化及隨機(jī)干擾等情況,能較好地反映時間序列的趨勢和變化;而SSESM模型按均方誤差最小的原則確定平滑系數(shù),根據(jù)數(shù)據(jù)的遠(yuǎn)近依次給予大小不等的權(quán)重。ARMA模型和SSESM模型都是通過揭示歷史數(shù)據(jù)隨時間變化規(guī)律,并將這種規(guī)律外延進(jìn)行預(yù)測,適用于短期預(yù)測。
根據(jù)等權(quán)組合預(yù)測[20]的方法,對2個模型預(yù)測的結(jié)果進(jìn)行加權(quán)計(jì)算出ARMA-SSESM組合預(yù)測值,并取該值為最后的預(yù)測值,權(quán)重取值如式(11)所示:
(11)
式中:ω為權(quán)重;σ為預(yù)測值標(biāo)準(zhǔn)差。
根據(jù)預(yù)測結(jié)果,計(jì)算出各自的標(biāo)準(zhǔn)差。得到結(jié)果為:ARMA模型預(yù)測標(biāo)準(zhǔn)差為3.096,SSESM預(yù)測標(biāo)準(zhǔn)差為2.734,可以確定ARMA模型權(quán)重為0.530,指數(shù)平滑權(quán)重為0.470,因此,可得基于ARMA-SSESM組合預(yù)測公式如式(12)所示:
y*=ω1y1*+ω2y2*=0.53y1*+0.47y2*
(12)
式中:y*為組合預(yù)測值;y1*為ARMA模型預(yù)測值;y2*為SSESM模型預(yù)測值。
運(yùn)用ARMA(3,2)模型、SSESM模型和ARMA-SSESM組合模型對2021年1月—2021年6月危險(xiǎn)品道路運(yùn)輸事故數(shù)量進(jìn)行預(yù)測,并獲取2021年1月—2021年6月危險(xiǎn)品泄漏事故的實(shí)驗(yàn)值數(shù)據(jù),將預(yù)測值與實(shí)驗(yàn)值進(jìn)行相對誤差分析。獲得結(jié)果如表5所示。
表5 3種預(yù)測模型2021年1月—2021年6月危險(xiǎn)品泄漏事故實(shí)驗(yàn)值與預(yù)測值對比Table 5 Comparison on experimental and predicted values of hazardous chemicals leakage accidents from January to June in 2021 by three prediction models
由表5可知,ARMA-SSESM組合模型預(yù)測值與實(shí)驗(yàn)值的相對誤差值較小,預(yù)測效果較為理想。
利用3種模型分別預(yù)測2021年1月—2021年6月事故數(shù)量,比較3種模型的預(yù)測精度,由表6可知,組合模型預(yù)測效果最佳,ARMA模型預(yù)測效果次之,SSESM模型在3種模型中預(yù)測效果最差。3組數(shù)據(jù)表明組合模型預(yù)測精度較高,符合預(yù)測要求。
表6 3種預(yù)測模型的預(yù)測效果比較Table 6 Comparison on prediction effect of three prediction models
2021年3月的危險(xiǎn)品道路運(yùn)輸泄漏事故數(shù)據(jù)較其他月份波動較大,是由于危險(xiǎn)貨物春運(yùn)政策的影響。我國春運(yùn)期間(一般是春節(jié)前后20 d)不允許危險(xiǎn)品運(yùn)輸車輛上高速。為了應(yīng)對春運(yùn)期間危險(xiǎn)品物流受限的影響,1月往往會增加貨運(yùn)量;3月會出現(xiàn)危險(xiǎn)品貨運(yùn)量的報(bào)復(fù)性反彈,從而危險(xiǎn)品道路運(yùn)輸泄漏事故數(shù)量出現(xiàn)增長。為有效預(yù)防危險(xiǎn)品道路運(yùn)輸泄漏事故發(fā)生,危險(xiǎn)品道路運(yùn)輸企業(yè)要在春運(yùn)前后加強(qiáng)危險(xiǎn)品駕押人員安全意識教育與培訓(xùn),道路交通運(yùn)輸和交警部門應(yīng)在春運(yùn)前后加強(qiáng)危險(xiǎn)品道路運(yùn)輸?shù)陌踩O(jiān)管與執(zhí)法檢查工作。
1)本文統(tǒng)計(jì)分析了2013—2020年中國危險(xiǎn)品道路運(yùn)輸月度泄漏事故,建立的ARMA(3,2)模型及指數(shù)平滑系數(shù)α=0.1的SSESM預(yù)測模型,根據(jù)預(yù)測值標(biāo)準(zhǔn)差確定ARMA模型和SSESM模型權(quán)重,確定組合預(yù)測公式。
2)建立的ARMA-SSESM組合預(yù)測模型的預(yù)測效果在3種模型中最佳,具有良好的預(yù)測精度,能夠提高事故預(yù)測的準(zhǔn)確性,采用組合預(yù)測模型,可以減小模型預(yù)測產(chǎn)生的誤差。
3)事故預(yù)測結(jié)果為危險(xiǎn)品道路運(yùn)輸企業(yè)和監(jiān)管部門提出了對策建議,可為危險(xiǎn)品運(yùn)輸泄漏事故預(yù)防提供參考依據(jù)。在后續(xù)的研究中,需考慮多種方法的結(jié)合,進(jìn)一步提高模型的預(yù)測精度。
中國安全生產(chǎn)科學(xué)技術(shù)2023年10期