岳劉杰,齊慶杰
(1.國能神東煤炭集團(tuán)烏蘭木倫煤礦,內(nèi)蒙古 鄂爾多斯 017205;2.遼寧工程技術(shù)大學(xué) 礦業(yè)學(xué)院,遼寧 阜新 123000;3.中國煤炭科工集團(tuán)應(yīng)急科學(xué)研究院,北京 100013)
瓦斯災(zāi)害是煤礦災(zāi)害中最為嚴(yán)重的一種,其破壞性、危害性極大。因此,加強瓦斯災(zāi)害預(yù)測預(yù)警技術(shù)的研究對提高瓦斯災(zāi)害預(yù)測控制能力和發(fā)展數(shù)字煤礦具有重要意義[1]。近年來,對于瓦斯?jié)舛鹊念A(yù)測多采用時間序列的動態(tài)預(yù)測方法,而礦井瓦斯?jié)舛葦?shù)據(jù)是非線性的,并且受許多環(huán)境因素和采礦技術(shù)的影響,時間序列方法不能將這些因素納入考慮,具有一定的局限性[2]。隨著理論的完善發(fā)展,遺傳算法[3]、模糊數(shù)學(xué)[4]、混沌理論[5]、支持向量[6]、灰色理論[7-8]、神經(jīng)網(wǎng)絡(luò)[9-10]等算法被用于識別或估算瓦斯的異常情況,并取得很好的預(yù)測效果。但神經(jīng)網(wǎng)絡(luò)、遺傳算法及模糊數(shù)學(xué)等算法基于大樣本數(shù)據(jù),并不斷進(jìn)行學(xué)習(xí)和迭代計算,建模時間較長等,導(dǎo)致不能實時預(yù)測瓦斯?jié)舛萚11]。
上述列出的預(yù)測方法均基于多個影響因素去預(yù)估所研究的因變量,而各個影響因素間可能存在某種相關(guān)性或函數(shù)關(guān)系,即多重共線性問題。這些方法不能很好地避免或者解決各個因素間的多重共線問題。鑒于此,基于傳統(tǒng)的多元線性回歸分析方法,驗證多元回歸分析預(yù)測瓦斯?jié)舛鹊目尚行?,并診斷各個自變量間是否存在多重共線性問題,采用嶺回歸分析方法解決可能出現(xiàn)的共線問題,分析各個影響因素對瓦斯?jié)舛鹊挠绊懶源笮。M(jìn)而準(zhǔn)確預(yù)測瓦斯?jié)舛取?/p>
瓦斯災(zāi)害是由地殼應(yīng)力、高瓦斯、煤構(gòu)造性能、地質(zhì)構(gòu)造、煤層厚度、煤體構(gòu)造和圍巖特征等多種因素決定的[12]。在上覆壓力作用下,煤層越深瓦斯越不易逸出,同一煤層,煤層越厚,瓦斯含量越高,隨著開采推進(jìn),瓦斯涌出量增加。在同一斷面下,風(fēng)速越大、風(fēng)流中瓦斯?jié)舛仍叫 kS著開采技術(shù)的發(fā)展,煤日產(chǎn)量不斷增加,這些因素均會影響瓦斯?jié)舛却笮?。因此,選取煤層深度、厚度、瓦斯含量、井下風(fēng)速和煤日產(chǎn)量5個影響因素分析預(yù)測瓦斯?jié)舛取+@得習(xí)水富泓煤礦11202綜采面的瓦斯?jié)舛燃?個影響因素的實測數(shù)據(jù),經(jīng)過拆除異常值,得到10組數(shù)據(jù)樣本,見表1。
表1 樣本數(shù)據(jù)Table 1 Sample data
針對多因素組合模型,回歸分析是一種較好的方法,多元線性回歸分析則是最基本、簡單的回歸分析方法。瓦斯?jié)舛仁芏鄠€因素影響,因此,在理論上,可以用多元線性回歸方法分析瓦斯?jié)舛扰c影響因素間的關(guān)系,篩選出最優(yōu)組合去預(yù)估因變量,并建立預(yù)測模型。其回歸模型見式(1)[13]。
Y=a0+a1x1+a2x2+…+aixn
(1)
式中,Y為因變量;xn為n個自變量;ai為各個自變量對應(yīng)的回歸系數(shù)。
利用SPSS軟件對瓦斯?jié)舛群透鱾€影響因素進(jìn)行多元線性回歸分析,選用輸入回歸模型、輸入瓦斯?jié)舛葹橐蜃兞?,煤層深度、厚度、斷面風(fēng)速、瓦斯含量、煤日產(chǎn)量為自變量。分析結(jié)果見表2和表3。
表2 模型匯總Table 2 Model summary
表3 模型參數(shù)Table 3 Model parameters
由表2可知,模型的相關(guān)系數(shù)R=0.999,調(diào)整后的相關(guān)系數(shù)R2=0.996,表明此模型有意義,該模型擬合程度較高,各個因素整體與瓦斯?jié)舛染哂休^好的線性相關(guān)性,多元線性回歸模型可用于瓦斯?jié)舛阮A(yù)測。在模型計算時檢驗了殘差項的自相關(guān)性,即D-W(Durbin-Watson)檢驗。其值接近0或者4時,表明殘差有自相關(guān)性,而D-W值與2非常接近時,表明不存在(一階)自相關(guān),模型設(shè)計越好。表2中的D-W值為1.665,自相關(guān)性較弱。
根據(jù)表3中多元線性偏回歸系數(shù),可得多元線性回歸預(yù)測方程為
Y=-0.214+0.000 1x1+0.086x2+0.021x3+
0.002x4-0.06x5
(2)
式中,x1為煤層深度;x2為煤層厚度;x3為瓦斯含量;x4為日產(chǎn)量;x5為井下風(fēng)速;Y為瓦斯?jié)舛取?/p>
5個影響因素整體與瓦斯?jié)舛鹊南嚓P(guān)性顯著,但不表示每個自變量都與因變量關(guān)系顯著,各個影響因素間可能存在某種函數(shù)關(guān)系,可能造成模型誤差[14],因此,需要檢驗5個影響因素間的共線性問題。一般以方差膨脹因子(VIF)為共線性診斷指標(biāo),以小于10為判斷依據(jù),VIF值越大,則共線性問題越明顯。從表3模型參數(shù)可知,煤層厚度、日產(chǎn)量和井下風(fēng)速的VIF值分別為72.151,44.876,26.304,遠(yuǎn)大于10,這3個影響因素存在嚴(yán)重的多重共線性問題,對模型造成干擾,因此,要了解每個影響因素對瓦斯?jié)舛鹊膯渭冃?yīng),則需解決這3個影響因素間的多重共線性問題。常用的解決方法有3種,即主成分回歸、嶺回歸和偏最小二乘回歸[15]。主成分回歸分析獲得的主成分對其他自變量具有較強的概括性,可能減弱對因變量Y的解釋能力。嶺回歸分析基于改良后的最小二乘估計法,是一種主要解決共線性數(shù)據(jù)和“病態(tài)”數(shù)據(jù)的有偏性回歸方法。偏最小二乘回歸分析則不會削弱對Y的解釋能力,并自動排除沒有意義的信息。煤層厚度、日產(chǎn)量和井下風(fēng)速3個因素均存在嚴(yán)重的多重共線性問題,因此,選用嶺回歸分析解決自變量間的共線問題,并建立瓦斯?jié)舛阮A(yù)測模型。
3.1.1 求解嶺回歸系數(shù)的步驟
采用Matlab軟件進(jìn)行嶺回歸分析,設(shè)因變量為Y,有m個自變量x1,x2,…,xm,進(jìn)行n次統(tǒng)計得到的數(shù)據(jù)矩陣為Xm×n,Yn×1。k為嶺參數(shù),求解嶺回歸系數(shù)的步驟主要分為5步[16]。
步驟1:將樣本數(shù)據(jù)X,Y進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化后的平均值為0,標(biāo)準(zhǔn)差為1。矩陣X,Y分別變換為Z,Y。
步驟3:添加偽樣本將變換后的Z,Y矩陣變?yōu)閆plus(n+m)×m,Yplus(n+m)×1。
步驟4:利用Regress函數(shù)進(jìn)行回歸分析,得到嶺回歸系數(shù)βi(k)(i=1,2,3…m)。
步驟5:用Plot畫圖語句進(jìn)行作圖,繪制出βi(k)隨k的變化趨勢,選擇穩(wěn)定的嶺回歸系數(shù)。
3.1.2 嶺回歸系數(shù)
對分析結(jié)果數(shù)據(jù)進(jìn)行處理,得到圖1及表4、5。
圖1 嶺回歸參數(shù)的估計Fig.1 Estimation of ridge regression parameters
表4 嶺參數(shù)對應(yīng)的統(tǒng)計參數(shù)
圖1為嶺跡圖,表示5個影響因素隨嶺參數(shù)變化的參數(shù)估計值,根據(jù)嶺跡法確定嶺參數(shù),從圖中看出,k≥0.3時,軌跡趨于穩(wěn)定。從表4也可知,嶺參數(shù)k≤0.3時,相關(guān)系數(shù)R2均大于0.9,且隨著嶺參數(shù)的增大,模型擬合度越來越差,因此,嶺參數(shù)k取0.3。選取表5中k=0.3時對應(yīng)的嶺回歸系數(shù),所得標(biāo)準(zhǔn)化嶺回歸預(yù)測方程為
表5 不同嶺參數(shù)下的各個自變量嶺回歸系數(shù)Table 5 Regression coefficients of each independent variable under different ridge parameters
Y=-0.043 5x1+0.260 1x2+0.210 9x3+0.276 9x4-0.243 9x5
轉(zhuǎn)化為非標(biāo)準(zhǔn)化的嶺回歸預(yù)測模型為
Y=-0.000 7x1+0.170 2x2+0.019 6x3+0.001 1x4-0.080 6x5+0.036 8
嶺回歸系數(shù)絕對值大小體現(xiàn)了自變量對因變量的影響性大小,其值越大,影響作用越大。由此可以判斷各個因素對瓦斯?jié)舛扔绊懶源笮∫来螢閤2(煤層厚度)、x5(斷面風(fēng)速)、x3(瓦斯含量)、x4(煤日產(chǎn)量)、x1(煤層深度),煤層深度的影響程度最小,在對瓦斯?jié)舛冗M(jìn)行評估時,可以不納入考慮。
利用上述得到的多元線性回歸預(yù)測模型和嶺回歸預(yù)測模型對瓦斯?jié)舛冗M(jìn)行預(yù)測,并與實測瓦斯?jié)舛葦?shù)據(jù)進(jìn)行對比,見表6。多元線性回歸的相對誤差較高,其平均相對誤差為19.85%;而嶺回歸分相對誤差較低,平均相對誤差為2.45%,精度提高了17.4%。圖2更好地反映了2種方法得到的預(yù)測值與實測值的接近程度,嶺回歸分析所得的預(yù)測值更接近實測值,擬合度較好。進(jìn)而反映出由于瓦斯?jié)舛鹊挠绊懸蛩亻g存在多重共線性問題,單一使用多元線性回歸分析會降低預(yù)測精度,造成較大誤差;結(jié)合嶺回歸分析方法,解決了影響因素間的共線性問題,提高了預(yù)測瓦斯?jié)舛鹊木珳?zhǔn)度。
表6 模型預(yù)測值與實測值的比較Table 6 Comparison of model predicted values and measured values 單位:%
圖2 瓦斯?jié)舛鹊膶崪y值和預(yù)測值Fig.2 Measured value and predicted value of gas concentration
(1)多元線性回歸分析得出5個影響因素整體與瓦斯?jié)舛汝P(guān)系顯著,煤層厚度、日產(chǎn)量和井下風(fēng)速3個因素存在多重共線性問題,對模型造成干擾,造成預(yù)測精度較低。
(2)利用嶺回歸模型解決了自變量間的共線問題,得到嶺回歸預(yù)測模型,根據(jù)嶺回歸系數(shù)大小判斷5個因素對瓦斯?jié)舛扔绊懗潭却笮∫来螢椋好簩雍穸?,斷面風(fēng)速,瓦斯含量,煤日產(chǎn)量,煤層深度。
(3)相比多元線性回歸預(yù)測模型,嶺回歸分析預(yù)測效果更好,精度提高了17.4%。2種分析方法結(jié)合更具有實用性。