皮子坤,賈寶山*,賈廷貴,李 銳,李宗翔
(1.遼寧工程技術(shù)大學(xué)安全科學(xué)與工程學(xué)院,遼寧阜新123000;2.礦山熱動(dòng)力災(zāi)害與防治教育部重點(diǎn)實(shí)驗(yàn)室,遼寧阜新123000)
我國(guó)是產(chǎn)煤大國(guó),煤炭在我國(guó)能源消耗中占一次性能源的70%左右[1]。隨著我國(guó)煤礦開(kāi)采深度和生產(chǎn)能力不斷加強(qiáng),礦井瓦斯問(wèn)題成為嚴(yán)重制約煤礦安全生產(chǎn)的重要因素之一[2]。對(duì)礦井絕對(duì)瓦斯涌出量進(jìn)行精準(zhǔn)預(yù)測(cè),提前采取必要的防治措施是預(yù)防煤礦瓦斯災(zāi)害事故和減少人員與財(cái)產(chǎn)損失的關(guān)鍵。國(guó)內(nèi)外許多學(xué)者對(duì)煤礦瓦斯涌出量預(yù)測(cè)進(jìn)行了大量研究。肖鵬、李樹(shù)剛等運(yùn)用灰色理論對(duì)煤礦瓦斯涌出量進(jìn)行建模及其預(yù)測(cè)研究[3];張淑玲、崔洪慶等運(yùn)用灰色關(guān)聯(lián)理論對(duì)礦井瓦斯涌出災(zāi)害進(jìn)行預(yù)測(cè)研究[4];呂伏、梁冰等采用主成分回歸分析法對(duì)回采工作面瓦斯涌出量進(jìn)行預(yù)測(cè)[5];羅景峰、許開(kāi)立運(yùn)用模糊數(shù)學(xué)理論,采用可變模糊組合方法對(duì)瓦斯涌出量進(jìn)行預(yù)測(cè)[6];朱紅青、常文杰等運(yùn)用BP神經(jīng)網(wǎng)絡(luò),結(jié)合分源預(yù)測(cè)法對(duì)回采工作面瓦斯涌出量進(jìn)行預(yù)測(cè)[7];何利文、施式亮等運(yùn)用時(shí)間序列與混沌理論,對(duì)回采工作面瓦斯涌出預(yù)測(cè)方法研究[8]。這寫(xiě)方法及其預(yù)測(cè)模型各具特點(diǎn),但在預(yù)測(cè)精度方面,相對(duì)誤差較大,存在一定的局限性。煤礦瓦斯涌出受到煤礦本身地質(zhì)條件、所采取的開(kāi)采工藝技術(shù)等諸多因素共同作用,直接導(dǎo)致煤礦瓦斯涌出量精確預(yù)測(cè)方面難度加大。近些年興起的人工神經(jīng)網(wǎng)絡(luò)[9-10]在非線性擬合方面取得了一定的成果,但在收斂性及泛化能力上都存在一定的缺陷,如訓(xùn)練速度過(guò)慢,容易陷入局部最小值等。
鑒于此,筆者提出建立基于PCA-MFOA-GRNN相耦合的預(yù)測(cè)模型,對(duì)回采工作面的瓦斯涌出量進(jìn)行預(yù)測(cè)。
運(yùn)用PCA算法,對(duì)影響礦井瓦斯涌出的影響因素進(jìn)行前期處理,這些因素之間存在的相關(guān)性會(huì)給模型帶入很多冗雜因子信息,致使模型的預(yù)測(cè)準(zhǔn)確度和泛化能力都較低,而主成分分析法的降維技術(shù)可以減小模型變量,最大程度消除變量間的冗雜信息。提高了預(yù)測(cè)模型的準(zhǔn)確率與穩(wěn)定性。
對(duì)果蠅算法中的Si函數(shù)增加一個(gè)跳脫參數(shù)B進(jìn)行改進(jìn),避免了局部最優(yōu)因子對(duì)預(yù)測(cè)模型的干擾,再將MFOA算法對(duì)GRNN的平滑因子σ進(jìn)行優(yōu)化;將PCA結(jié)果作為模型的輸入,建立了PCA-MFOAGRNN的耦合預(yù)測(cè)模型,并應(yīng)用于實(shí)際煤礦當(dāng)中,驗(yàn)證了該模型瓦斯涌出預(yù)測(cè)的精確性與可靠性。
主成分分析(PCA)是利用降維的思想,在力保數(shù)據(jù)信息損失最少的原則下,把多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)的一種對(duì)多變量數(shù)據(jù)進(jìn)行最佳綜合簡(jiǎn)化的多元統(tǒng)計(jì)方法。
假設(shè)有n個(gè)樣本,每個(gè)樣本觀測(cè)p個(gè)指標(biāo),記為X=(x1,x2,…,xp)′。變量X的均值為μ,協(xié)方差矩陣為Σ。則:
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)是一監(jiān)督式的學(xué)習(xí)方式網(wǎng)絡(luò)。1991年,Donald F.Specht提出了這個(gè)學(xué)習(xí)算法[11],GRNN算法是由機(jī)率類(lèi)神經(jīng)網(wǎng)絡(luò)所演變而來(lái),不需要像傳統(tǒng)回歸分析一樣先假設(shè)一個(gè)明確函數(shù)形式,只需要以機(jī)率密度函數(shù)的方式呈現(xiàn)。這個(gè)算法不只可以做分類(lèi)問(wèn)題,也可以用來(lái)學(xué)習(xí)動(dòng)態(tài)模式并做預(yù)測(cè)或控制,而且對(duì)于線性或非線性的回歸問(wèn)題都有很好的處理能力。GRNN由于人為調(diào)節(jié)參數(shù)很少,只有一個(gè)閾值,網(wǎng)絡(luò)的學(xué)習(xí)全部依賴(lài)數(shù)據(jù)樣本,從而得以最大程度地避免了人為主觀假定對(duì)預(yù)測(cè)結(jié)果的影響。
GRNN神經(jīng)網(wǎng)絡(luò)的創(chuàng)建需要將所有數(shù)據(jù)劃分為輸入向量、輸出向量、訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),如圖1所示。
圖1 GRNN結(jié)構(gòu)示意圖
設(shè)自變量為x,因變量為y,定義x、y的聯(lián)合概率密度為f(x,y),條件概率密度為:
則得到x的條件平均值y(也稱(chēng)為y在x上的回歸)
聯(lián)合概率密度函數(shù)滿(mǎn)足高斯分布
式中:xi和yi是訓(xùn)練集內(nèi)的輸入和輸出,σ為寬度函數(shù),σ滿(mǎn)足下列趨勢(shì):
將(6)式代入(4)式整理后得,
對(duì)于多因變量的問(wèn)題,假設(shè)每個(gè)因變量均與自變量滿(mǎn)足高斯分布,則每個(gè)因變量均可用式(7)計(jì)算出來(lái)。
果蠅優(yōu)化算法(FOA)是臺(tái)灣學(xué)者潘文超提出的,是一種基于果蠅覓食行為尋求全局優(yōu)化的新算法[12-13]。果蠅能靈敏的嗅到40 km以外食物飄散在空氣中的氣味,通過(guò)估計(jì)周?chē)兜罎舛?,隨后朝著味道濃度極值方向飛去,重復(fù)迭代味道濃度尋求目標(biāo)函數(shù)的最優(yōu)解[14-15]。由于FOA算法容易陷于局部極值,無(wú)法找尋到全局極值,筆者將Si函數(shù)增加一個(gè)跳脫參數(shù)B,以此對(duì)果蠅算法進(jìn)行修正,得到修正的果蠅算法(MFOA),如式(8)所示。通過(guò)增加該參數(shù),使整個(gè)算法不但能跳脫局部極小值找到全局極值,F(xiàn)itness function函數(shù)也能夠取到負(fù)值,避免算法無(wú)法取負(fù)值的缺陷。
修正的FOA算法(MFOA)具體運(yùn)算步驟如下:
①果蠅群體初始化,果蠅隨機(jī)初始位置為(X_axis,Y_axis),種群規(guī)模為sizepop=10,迭代次數(shù)為maxgen=100;②對(duì)果蠅個(gè)體隨機(jī)賦值(方向和距離),Xi=X_axis+rand,Yi=Y_axis+rand;③剛開(kāi)始果蠅不知道目標(biāo)具體位置,因而先估計(jì)果蠅個(gè)體與原點(diǎn)的距離D,同時(shí)計(jì)算味道濃度判定值S,;④計(jì)算出果蠅個(gè)體在該處的味道濃度值,smell(i)=F(Si);⑤尋找出果蠅群體中味道濃度最大值[best Smell best index]=max(Smell);⑥保留最佳味道濃度值與該果蠅坐標(biāo),Smell best=bestSmell,X_axis=Xbestindex,Y_axis=Ybestindex;⑦進(jìn)入迭代尋優(yōu),重復(fù)②~⑤,并判斷味道濃度是否優(yōu)于前一迭代味道濃度,若是,則執(zhí)行步驟⑥,否則繼續(xù)下一次迭代循環(huán),直到達(dá)到最大循環(huán)次數(shù)時(shí)才停止。
具體運(yùn)算流程如圖2所示。
圖2 FCA-MFOA優(yōu)化GRNN流程圖
筆者選取文獻(xiàn)[10]提供的瓦斯涌出相關(guān)數(shù)據(jù)來(lái)進(jìn)行建模及預(yù)測(cè),煤層瓦斯含量X1,m3/t、煤層埋藏深度X2,m、煤層厚度X3,m、煤層傾角X4,°、采高X5,m、采煤工作面長(zhǎng)度X6,m、推進(jìn)速度X7,m/d、采出率X8,%、臨近層瓦斯含量X9,m3/t、臨近層厚度X10,m、臨近層層間距X11,m、層間巖性X12、開(kāi)采強(qiáng)度X13,t/d、頂板管理方式X14,X1~X14為影響工作面瓦斯涌出量Y的主要因素,選取表1中1~15組數(shù)據(jù)作為訓(xùn)練集樣本,16~18組作為測(cè)試集樣本,如表1所示。
在影響瓦斯涌出量的因素中,煤層厚度與采高一致,故在主成分分析中,只選因素X3,而工作面頂板的管理方式均相同,對(duì)分析結(jié)果沒(méi)影響,所以不考慮X14因素。運(yùn)用SPSS 21.0軟件對(duì)表1數(shù)據(jù)進(jìn)行主成分分析,分析結(jié)果如表2所示。
表1 回采工作面瓦斯涌出量影響因素?cái)?shù)據(jù)統(tǒng)計(jì)
表2 主成分分析方差貢獻(xiàn)表
由表2可得,主成分分析結(jié)果的前4個(gè)主成分累計(jì)方差貢獻(xiàn)率為92.613%,說(shuō)明這4個(gè)主成分已經(jīng)包含了這13個(gè)影響因素中的絕大部分有效信息。為了保證預(yù)測(cè)模型的精確度,筆者選取前5個(gè)主成分,累計(jì)方差貢獻(xiàn)率為96.153%,作為預(yù)測(cè)模型的輸入。這5個(gè)主成分的得分系數(shù)如表3所示,由表3數(shù)據(jù)計(jì)算得這5個(gè)主成分,結(jié)果如表4所示。
表3 前5個(gè)主成分得分系數(shù)
表4 前5個(gè)主成分
對(duì)瓦斯涌出量影響因素進(jìn)行PCA降維處理,提出特征信息,有效減少了瓦斯涌出因素變量的數(shù)量,簡(jiǎn)化了各變量之間的關(guān)系。將5個(gè)瓦斯涌出綜合影響因素作為預(yù)測(cè)模型的變量,避免了各因素間復(fù)雜的非線性問(wèn)題對(duì)模型的干擾。
運(yùn)用Matlab軟件,將表4中P1~P5作為輸入向量,Y為輸出向量,建立PCA-MFOA-GRNN綜采工作面瓦斯涌出動(dòng)態(tài)預(yù)測(cè)模型。選取表1中1~15組數(shù)據(jù)為預(yù)測(cè)模型的訓(xùn)練集,16~18組數(shù)據(jù)作為檢驗(yàn)?zāi)P退惴ㄐ阅艿臄?shù)據(jù)集。
在廣義回歸神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,平滑參數(shù)σ,即Spread參數(shù)值與神經(jīng)元數(shù)、訓(xùn)練樣本有關(guān)。合理的優(yōu)化Spread參數(shù)值,直接影響模型的預(yù)測(cè)性能。文中應(yīng)用MFOA算法對(duì)GRNN的Spread參數(shù)值進(jìn)行合理調(diào)整優(yōu)化。經(jīng)由MFOA的100次迭代動(dòng)態(tài)調(diào)整GRNN后RMSE收斂情況,如圖3所示,在迭代優(yōu)化過(guò)程中RMSE在第62個(gè)世代收斂,RMSE=0.056 69,計(jì)算對(duì)應(yīng)的最佳Spread參數(shù)值為0.057 6。
圖3 MSE收斂情況
運(yùn)用前面所訓(xùn)練好的預(yù)測(cè)模型將測(cè)試集樣本輸入向量輸入該模型,進(jìn)行預(yù)測(cè)運(yùn)算,如圖4所示。圖4為預(yù)測(cè)模型的預(yù)測(cè)值與實(shí)測(cè)值對(duì)比圖。
圖4 PCA-MFOA-GRNN模型測(cè)試數(shù)據(jù)預(yù)測(cè)結(jié)果對(duì)比
為了檢驗(yàn)PCA-MFOA-GRNN動(dòng)態(tài)預(yù)測(cè)模型的預(yù)測(cè)性能的可靠性,本文運(yùn)用未修正的FOA-GRNN算法、CIPSO-ENN算法、BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)、Elman網(wǎng)絡(luò)預(yù)測(cè),這4種算法的預(yù)測(cè)結(jié)果與之對(duì)比,結(jié)果如表5所示。
表5 五種預(yù)測(cè)模型預(yù)測(cè)效果對(duì)比
由表2可知,PCA-MFOA-GRNN預(yù)測(cè)模型的預(yù)測(cè)值分別為:4.067 5、4.857 7、7.829 6,相對(duì)誤差分別為:0.185%、1.267%、2.617%,平均相對(duì)誤差為1.357%,相比其他四種算法所計(jì)算出的預(yù)測(cè)值,PCA-MFOA-GRNN預(yù)測(cè)模型平均相對(duì)誤差均小于其最小,達(dá)到理想的預(yù)測(cè)效果。
①提出了基于主成分分析(PCA)與修正的果蠅算法(MFOA)優(yōu)化GRNN算法的煤礦綜采工作面瓦斯涌出動(dòng)態(tài)預(yù)測(cè)模型(PCA-MFOA-GRNN)。運(yùn)用主成分分析對(duì)影響瓦斯涌出因素進(jìn)行降維處理,得出的5個(gè)主成分作為預(yù)測(cè)模型的輸入,同時(shí)對(duì)FOA算法Si函數(shù)增加一個(gè)跳脫參數(shù)B,避免了局部最優(yōu)因子對(duì)預(yù)測(cè)模型的干擾,提高了預(yù)測(cè)模型的穩(wěn)定性與預(yù)測(cè)精確度。
②利用該模型的預(yù)測(cè)結(jié)果與其他4算法的預(yù)測(cè)結(jié)果相比較,該模型預(yù)測(cè)精度最高,為煤礦瓦斯涌出量預(yù)測(cè)提供一個(gè)有效的方法。
③影響煤礦綜采工作面瓦斯涌出量的因素很多,本文僅收集了14個(gè)方面的數(shù)據(jù)進(jìn)行計(jì)算分析,從科學(xué)嚴(yán)謹(jǐn)與廣泛推廣的角度,應(yīng)該采集更加全面的影響因素?cái)?shù)據(jù),使本模型更具普遍使用意義。
[1]王濤,王洋洋,郭長(zhǎng)娜,等.QGA-RBF神經(jīng)網(wǎng)絡(luò)在礦井瓦斯涌出量預(yù)測(cè)中的應(yīng)用[J].傳感技術(shù)學(xué)報(bào),2012,25(1):119-123.
[2]付華,劉雨竹,李海霞,等.煤礦瓦斯?jié)舛鹊腃APSO-ENN短期預(yù)測(cè)模型[J].傳感技術(shù)學(xué)報(bào),2015,28(5):717-722.
[3]肖鵬,李樹(shù)剛,宋瑩,等.瓦斯涌出量的灰色建模及其預(yù)測(cè)[J].采礦與安全工程學(xué)報(bào),2009,26(3):318-321.
[4]張淑玲,崔洪慶,劉國(guó)興,等.灰色關(guān)聯(lián)理論在礦井瓦斯涌出災(zāi)害預(yù)測(cè)中的應(yīng)用[J].煤炭技術(shù),2008,27(3):67-69.
[5]呂伏,梁冰,孫維吉,等.基于主成分回歸分析法的回采工作面瓦斯涌出量預(yù)測(cè)[J].煤炭學(xué)報(bào),2012,37(1):113-116.
[6]羅景峰,許開(kāi)立.基于可變模糊組合方法的瓦斯涌出量預(yù)測(cè)[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2011,7(6):29-32.
[7]朱紅青,常文杰,張彬.回采工作面瓦斯涌出BP神經(jīng)網(wǎng)絡(luò)分源預(yù)測(cè)模型及應(yīng)用[J].煤炭學(xué)報(bào),2007,32(5):504-508.
[8]何利文,施式亮,宋譯,等.基于支持向量機(jī)(SVM)的回采工作面瓦斯涌出混沌預(yù)測(cè)方法研究[J].中國(guó)安全科學(xué)學(xué)報(bào),2009,19(9):42-46.
[9]曲健,陳紅巖,劉文貞,等.基于改進(jìn)網(wǎng)格搜索法的支持向量機(jī)在氣體定量分析中的應(yīng)用[J].傳感技術(shù)學(xué)報(bào),2015,28(5):774-778.
[10]付華,姜偉,單欣欣.基于耦合算法的煤礦瓦斯涌出量預(yù)測(cè)模型研究[J].煤炭學(xué)報(bào),2012,37(4):654-658.
[11]付華,王馨蕊,王志軍,等.基于PCA和PSO-ELM的煤與瓦斯突出軟測(cè)量研究[J].傳感技術(shù)學(xué)報(bào),2014,27(12):1710-1715.
[12]張宏偉,朱志潔,霍丙杰,等.基于改進(jìn)的FOA-SVM導(dǎo)水裂隙帶高度預(yù)測(cè)研究[J].中國(guó)安全科學(xué)學(xué)報(bào),2013,23(10):9-14.
[13]王欣,杜康,秦斌,等.基于果蠅優(yōu)化算法的LSSVR干燥速率建模[J].控制工程,2012,19(4):630-638.
[14]韓俊英,劉成忠.基于細(xì)菌趨化的果蠅優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用,2013,33(4):964-966.
[15]范良,趙國(guó)忱,蘇運(yùn)強(qiáng).果蠅算法優(yōu)化的廣義回歸神經(jīng)網(wǎng)絡(luò)在變形監(jiān)測(cè)預(yù)報(bào)中的應(yīng)用[J].測(cè)繪通報(bào),2013,(11):87-92.