■ 景海波 南京信息工程大學(xué)
隨著我國(guó)經(jīng)濟(jì)的高速發(fā)展,城市空間環(huán)境的復(fù)雜性急劇上升,各種事故災(zāi)害頻發(fā),安全風(fēng)險(xiǎn)不斷增大,消防救援隊(duì)伍的任務(wù)也越多。新時(shí)代的消防業(yè)務(wù)已經(jīng)不僅僅局限于火災(zāi)的防范和撲滅,在各種災(zāi)難或事故現(xiàn)場(chǎng)都有消防隊(duì)員的出現(xiàn)[1]。消防隊(duì)員所承擔(dān)的任務(wù)呈現(xiàn)出多樣化、復(fù)雜化的趨勢(shì)。
ARIMA 季節(jié)性時(shí)間序列模型適用于短期預(yù)測(cè)[2],是用于單變量時(shí)間序列數(shù)據(jù)預(yù)測(cè)的最廣泛使用方法之一,模型十分簡(jiǎn)單,只需要內(nèi)生變量而不需要借助其他外生變量。
多項(xiàng)式回歸的最大優(yōu)點(diǎn)就是可以通過(guò)增加x 的高次項(xiàng)對(duì)實(shí)測(cè)點(diǎn)進(jìn)行逼近,直至滿意為止。事實(shí)上,多項(xiàng)式回歸可以處理相當(dāng)一類非線性問(wèn)題,它在回歸分析中占有重要的地位,因?yàn)槿我缓瘮?shù)都可以分段用多項(xiàng)式來(lái)逼近。但是當(dāng)x 的次數(shù)越高時(shí),擬合出來(lái)的方程就越復(fù)雜,可能導(dǎo)致往后預(yù)測(cè)的結(jié)果產(chǎn)生較大的誤差。
把數(shù)據(jù)看作時(shí)間序列,用Box-Jenkins 方法中的ARIMA(差分整合移動(dòng)平均自回歸模型)模型,對(duì)出警次數(shù)每月、每年的變化趨勢(shì)總體進(jìn)行預(yù)測(cè)。已知由季節(jié)性因素或其他周期因素引起的周期性變化的時(shí)間序列,稱為季節(jié)性時(shí)間序列,對(duì)應(yīng)本題即指出警次數(shù)按照12個(gè)月有季節(jié)性變化,符合此種情況,周期s=12。
設(shè)本題所給出警次數(shù)數(shù)據(jù)序列Xt, 使用ARIMA(p,d,q) 模型[3],表示為:
Step1. 計(jì)算自相關(guān)系數(shù)與偏相關(guān)系數(shù),檢驗(yàn)時(shí)間序列的平穩(wěn)性
如果發(fā)現(xiàn)圖形有多于1 個(gè)不是截尾或拖尾,則說(shuō)明Xt 不是平穩(wěn)的,需要做差分運(yùn)算[4]。
Step2. 進(jìn)行差分運(yùn)算,確保原序列變?yōu)槠椒€(wěn)時(shí)間序列;
Step3. 進(jìn)行模型定階,由差分后的自相關(guān)圖與偏自相關(guān)數(shù)據(jù)圖可知:自相關(guān)系數(shù)在滯后1 階后就快速地減為0,偏自相關(guān)系數(shù)同自相關(guān)系數(shù),所以p=1,q=1;
Step4.擬合,估計(jì)模型參數(shù);
Step5.用標(biāo)準(zhǔn)化殘差進(jìn)行模型驗(yàn)證。
首先統(tǒng)計(jì)出2016—2020 年5 年內(nèi)每個(gè)月7 類事件發(fā)生的次數(shù),并取不同月份各類事件發(fā)生的年平均次數(shù),初步判斷出第3 類、第7 類事件發(fā)生的頻率較高且具有一定的周期性。
接著使用最近鄰法對(duì)7 種事件數(shù)據(jù)作層次分析,得到事件歷年各月的系統(tǒng)樹(shù)圖。根據(jù)各類事件的系統(tǒng)樹(shù)圖,以最大標(biāo)準(zhǔn)距離的1/2 作為聚類的判斷標(biāo)準(zhǔn),認(rèn)為4 類族群以下的事件在發(fā)生次數(shù)上存在周期性變化,5 類族群以上的事件的發(fā)生次數(shù)受不同月份,即發(fā)生時(shí)間的影響較小,呈隨機(jī)分布。結(jié)果表明,周期性變化事件1、3、5、7,非周期性變化事件2、4、6。
為了確保模型建立的可靠性,選擇2016—2019 年的數(shù)據(jù)作為依據(jù)樣本,2020 年的數(shù)據(jù)用以檢驗(yàn)擬合度,作為模型擬合效果的評(píng)價(jià)標(biāo)準(zhǔn)。
1.周期性事件1、3、5、7 的四種模型
(1)因?yàn)榇嬖谥芷谛宰兓录臄?shù)據(jù)結(jié)構(gòu)相對(duì)簡(jiǎn)單,首先選用多項(xiàng)式回歸的方式進(jìn)行擬合,鑒于當(dāng)多項(xiàng)式次數(shù)達(dá)到11 時(shí)擬合曲線便與樣本曲線完全重合,在1—11 次多項(xiàng)式擬合中遍歷搜索擬合程度最優(yōu)的多項(xiàng)式,發(fā)現(xiàn)10 次多項(xiàng)式的擬合程度最優(yōu),即與2020 年各月真實(shí)值的誤差平方和最小,為248。然而實(shí)際作出曲線后,顯然多項(xiàng)式無(wú)法較好地反映出各月次數(shù)的變化趨勢(shì)。
(2)于是我們針對(duì)第一類存在周期性特點(diǎn)的事件,建立一個(gè)新的反映數(shù)據(jù)周期性變化的模型。分別取2016 年—2019 年中每年相鄰兩月的事件發(fā)生次數(shù)變化率、各月結(jié)果的均值作為預(yù)測(cè)模型中相鄰兩月的變化率。對(duì)于模型中初始值,即一月事件次數(shù),以五年間一月事件次數(shù)的最大最小值為上下限,在其中隨機(jī)取值。
為了尋找此模型對(duì)本題數(shù)據(jù)擬合的最優(yōu)解,使用遍歷搜索方法找出模型的最優(yōu)初值,使得與2020 年各月真實(shí)值的誤差平方和最小,其中誤差平方和為217,初值為14。得到圖像顯示擬合的效果仍不夠理想。
(3)考慮到前兩個(gè)模型是基于2016-2019 四年四組數(shù)據(jù)處理成的一組數(shù)據(jù)進(jìn)行分析,必然在經(jīng)歷數(shù)據(jù)壓縮處理后出現(xiàn)部分信息丟失的情況,為了避免這一情況,采用ARIMA 季節(jié)性時(shí)間序列模型,這既考慮到存在周期性影響因素,又利用2016—2019 年的全部數(shù)據(jù)對(duì)2020年12 個(gè)月的事件數(shù)據(jù)進(jìn)行了預(yù)測(cè)。其擬合度相較于前兩種模型有較大提升,其誤差平方和為132,初值為8,然而這一模型依然存在部分?jǐn)?shù)值與實(shí)際數(shù)值相差過(guò)大的情況。思考后認(rèn)為這是由于建立ARIMA 模型所依據(jù)的數(shù)據(jù)量仍然太小,部分年份的周期變化中帶有的隨機(jī)干擾(白噪聲)被放大了,從而干擾了模型對(duì)數(shù)據(jù)變化周期的計(jì)算。
(4)對(duì)模型2 進(jìn)行改進(jìn),以2016 年—2019 年4 組數(shù)據(jù)作相同月份的橫向?qū)Ρ龋瑢⒔^對(duì)值大于同月份數(shù)據(jù)均值的絕對(duì)值的數(shù)值視為存在較明顯的白噪聲干擾,為了盡可能減輕影響,最大程度保留數(shù)據(jù)的變化趨勢(shì),將此項(xiàng)數(shù)據(jù)高過(guò)均值的部分保留1/2。
模型改進(jìn)后的擬合度比ARIMA 模型稍有增高,其誤差平方和為127,初值為12。但是由圖1 可觀察到預(yù)測(cè)數(shù)值與實(shí)際數(shù)值相差過(guò)大的情況顯著減少。
圖1 四種模型擬合效果對(duì)比
結(jié)果表示:1 類事件,改進(jìn)后的周期模型擬合程度最好。
3 類事件,四種模型的誤差分別為820、1118、1232×10^4、1118。在擬合時(shí)發(fā)現(xiàn)2020 年的數(shù)據(jù)未體現(xiàn)出2017-2019 年間的數(shù)據(jù)特征,但是與2016 年的數(shù)據(jù)特征存在相似性,結(jié)合3 類事件是季節(jié)性事件,推測(cè)2016 年與2020 年未體現(xiàn)數(shù)據(jù)特征的原因在于這兩年是存在較強(qiáng)異常氣候現(xiàn)象的厄爾尼諾年[5],導(dǎo)致年內(nèi)應(yīng)出現(xiàn)的周期性氣候被干擾,災(zāi)害增多,救援出警次數(shù)的數(shù)據(jù)特征減弱。
5 類事件,四種模型的誤差分別為7、37、19、16。結(jié)果表明使用改進(jìn)的周期模型可以較好擬合數(shù)據(jù),但是多項(xiàng)式擬合結(jié)果的數(shù)值誤差平方和要稍小于改進(jìn)的周期模型,但是無(wú)法體現(xiàn)數(shù)據(jù)的周期性特點(diǎn)。
7 類事件,建立的四種模型對(duì)2020 年的擬合效果都不佳,誤差分別為290、246、648、382。通過(guò)觀察發(fā)現(xiàn)2020 年數(shù)據(jù)的變化趨勢(shì)符合模型擬合出的趨勢(shì),但是變化幅度相對(duì)較小,認(rèn)為此事件也受到2020 年厄爾尼諾現(xiàn)象影響,出現(xiàn)數(shù)據(jù)特征減弱的情況。
2.非周期性事件2、4、6 的兩種模型
(1)對(duì)于非周期性變化事件2、4、6,首先考慮多項(xiàng)式擬合,由于數(shù)據(jù)分布的隨機(jī)性,擬合趨向于一條直線。
(2)考慮非周期性變化事件的隨機(jī)分布,先以歷年數(shù)據(jù)的最小最大值為下上限,模擬事件次數(shù)在此區(qū)間的隨機(jī)分布。再基于2016 年—2019 年數(shù)據(jù)擬合分布系數(shù),得到此類事件的隨機(jī)分布模型,在進(jìn)行多次計(jì)算后選取誤差平方和小于多項(xiàng)式擬合的一組數(shù)據(jù),作為此模型計(jì)算2020 年各月份事件次數(shù)的結(jié)果。
以2016—2019 年四組數(shù)據(jù)的平均數(shù)作為模型的均值,將極小概率出現(xiàn)的過(guò)大或過(guò)小數(shù)值賦以歷年數(shù)據(jù)中的最大或最小值,確保隨機(jī)分布模型給出的計(jì)算數(shù)據(jù)在合理范圍。
結(jié)果表示,2 類事件(1)和(2)兩模型的誤差分別為27、24。4 類事件(1)和(2)兩模型的誤差分別為137、123。而對(duì)于6 類事件,隨機(jī)分布模型的擬合效果始終無(wú)法優(yōu)于多項(xiàng)式擬合,表明6 類事件也隨月份存在周期性變化,則使用周期性模型對(duì)數(shù)據(jù)進(jìn)行擬合,得到四種模型的誤差分別為290、246、648、382。
根據(jù)文獻(xiàn)[6],消防出警事件可分為火情,搶險(xiǎn)救援,社會(huì)救助。
對(duì)于數(shù)量接近一半的7 號(hào)事件,考慮到其具有周期性且于2 月( 春節(jié)煙花爆竹) 與6 月( 夏季炎熱干燥)出現(xiàn)高峰,推測(cè)此事件為火情。2、4 為隨機(jī)發(fā)生的無(wú)周期事件,則認(rèn)為其為開(kāi)門取鑰匙,救助貓狗這類的社會(huì)救助類。其余1、3、5、6 類事件可定性為搶險(xiǎn)救援,其中5 類事件由于其顯著的周期性特征,即事件發(fā)生集中于5—8 月,因此可推測(cè)是抗洪搶險(xiǎn)事件。
本文以某地為例,分析了各類火警救援事件與時(shí)間的關(guān)系,從事件是否有周期性角度出發(fā),對(duì)不同類型救援事件次數(shù)與時(shí)間進(jìn)行了擬合預(yù)測(cè),驗(yàn)證了自新的潮汐模型應(yīng)用于周期性事件擬合預(yù)測(cè)和消防救援出警次數(shù)統(tǒng)計(jì)分析是可行的。以上研究能夠幫助消防隊(duì)對(duì)其救援的事件有更深入的了解,提前做好培訓(xùn)工作并制定更加有效的應(yīng)對(duì)方案,還對(duì)政府實(shí)施社區(qū)宣傳預(yù)防措施有一定的參考價(jià)值。