曹超凡
(西安建筑科技大學(xué),陜西 西安 710055)
基于深度神經(jīng)網(wǎng)絡(luò)的煤礦突水水源判別分析
曹超凡
(西安建筑科技大學(xué),陜西 西安 710055)
通過研究已有突水水源判別方法,發(fā)現(xiàn)其存在收斂速度慢和目標(biāo)函數(shù)存在局部極小點(diǎn)的問題,導(dǎo)致判別準(zhǔn)確率較低。為了提高突水水源判別的準(zhǔn)確率,文章提出使用深度神經(jīng)網(wǎng)絡(luò)判別煤礦突水水源,選擇突水水化學(xué)數(shù)據(jù)、礦化度、總硬度、碳酸硬度、非碳酸硬度、負(fù)硬度、總堿度和總酸度等指標(biāo)屬性作為判別因子,建立水源判別模型。通過對(duì)比實(shí)驗(yàn),結(jié)果表明,DNN模型可以有效提高突水水源識(shí)別的準(zhǔn)確率。
煤礦突水;水源判別;DNN
煤礦的突水災(zāi)害是僅次于瓦斯災(zāi)害的第二大災(zāi)害,給煤礦安全生產(chǎn)和煤礦工作者的生命帶來了嚴(yán)重的威脅。突水事故發(fā)生時(shí),及時(shí)判識(shí)突水水源,為突水事故的分析處理和水災(zāi)預(yù)防處理的決策提供技術(shù)支持。國內(nèi)外學(xué)者針對(duì)突水水源判識(shí)提出了很多理論,從水化學(xué)特征分析,到聚類分析、灰色關(guān)聯(lián)分析、貝葉斯判別法。通過分析已有方法和判識(shí)指標(biāo),針對(duì)其存在的問題,提出采用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)模型判識(shí)突水水源,并與已有方法作對(duì)比,驗(yàn)證模型的有效性。
1.1 Piper三線圖法
Piper 三線圖是一種常用的水化學(xué)離子成分圖示法,通過分析不同水源的水化學(xué)特判別水源,以3組陽離子Mg2+,Ca2+,Na++K+和3組陰離子SO42-,Cl-,HCO3-+CO3
2-作為分析指標(biāo),將6組離子每升毫克當(dāng)量的百分比投影到Piper三線圖上,確定各含水層的水質(zhì)類型,然后取突水點(diǎn)的水樣進(jìn)行水質(zhì)對(duì)比,突水點(diǎn)的水質(zhì)與哪個(gè)含水層水質(zhì)相近,即可判斷為突水水源。此方法主要適用于水質(zhì)差別較大的單層充水水源。
1.2 聚類分析法
聚類分析法聚類就是按照某個(gè)特定的標(biāo)準(zhǔn)把所選取的一定數(shù)量的樣本數(shù)據(jù)分割成不同的類別組,利用代表點(diǎn)聚類(Clustering Using Representative,CURE)是一種新穎的層次聚類算法,將所有礦井突水層水樣樣本(包括標(biāo)準(zhǔn)數(shù)據(jù)樣本和待檢測樣本)各自作為一類,并規(guī)定樣本之間的距離和類與類之間的距離,然后將聚類最近的兩個(gè)類合并成一個(gè)新的類,計(jì)算新類與其他類之間的距離,重復(fù)執(zhí)行此操作,每次減少一個(gè)類,直到所有樣本合并為n個(gè)類,n為水樣類別總數(shù)。
1.3 灰色關(guān)聯(lián)分析法
灰色關(guān)聯(lián)分析方法是分析灰色系統(tǒng)中各個(gè)因素間關(guān)聯(lián)程度的一種量化方法,它的基本思想是根據(jù)礦井水樣樣本(包括標(biāo)準(zhǔn)水樣與待判水樣)序列曲線幾何形狀的相似程度來判斷待判水樣與標(biāo)準(zhǔn)水樣聯(lián)系是否緊密,曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度就越大,反之就越小。
在灰色關(guān)聯(lián)分析中,設(shè)Xi為系統(tǒng)因素,其在序號(hào)p上的觀測數(shù)據(jù)為:
xi(p),p=1,2,…,n
則稱Xi=(xi(1),xi(2),…,xi(n))為因素Xi的行為序列。其中p為指標(biāo)序號(hào),xi(p)為因素Xi關(guān)于第p個(gè)指標(biāo)的觀測數(shù)據(jù)。
1.4 貝葉斯判別方法
貝葉斯判別是用一個(gè)先驗(yàn)概率描述對(duì)研究對(duì)象已有的認(rèn)知,然后通過樣本數(shù)據(jù)修正先驗(yàn)概率,得到后驗(yàn)概率,并給予后驗(yàn)概率識(shí)別水源類別。對(duì)于識(shí)別6類水源的貝葉斯判別公式為:
其中,Gj是已知的6個(gè)水源類別;X是需要進(jìn)行分類的待判突水水樣;P(X|Gj)表示某一類Gj成立時(shí)待判水樣X的概率;P(Gj)代表待判水樣在判別之前擁有的初始概率,即Gj的先驗(yàn)概率,其計(jì)算方法如下:
由貝葉斯公式直接計(jì)算得到的結(jié)果P(Gj|X)就是突水待判水樣屬于某一類別的后驗(yàn)概率。
1.5 深度學(xué)習(xí)方法
深度學(xué)習(xí)(Deep Learning,DL)源自于人工神經(jīng)網(wǎng)絡(luò)的研究,是DNN等一系列機(jī)器學(xué)習(xí)方法的總稱,例如,含有多個(gè)隱藏層的多層感知機(jī),就是其較為簡單的一種結(jié)構(gòu)形式。最近幾年,DL在NLP和語音識(shí)別等眾多領(lǐng)域都取得了非常不錯(cuò)的突破。它有大規(guī)模的并行處理和分布式的信息存儲(chǔ)能力,良好的自適應(yīng)性、自組織性和很強(qiáng)的學(xué)習(xí)、聯(lián)想、容錯(cuò)及抗干擾能力.在判別這類具有模糊性的問題上有明顯的優(yōu)勢。
2.1 DNN模型結(jié)構(gòu)
深度神經(jīng)網(wǎng)絡(luò)一般由輸入層、隱層和輸出層組成。輸入層神經(jīng)元的個(gè)數(shù)為輸入信號(hào)的維數(shù),本文設(shè)置為22,隱藏層個(gè)數(shù)以及隱藏層節(jié)點(diǎn)的個(gè)數(shù)一般首先取經(jīng)驗(yàn)值,然后通過實(shí)驗(yàn)確定最優(yōu)參數(shù),由于本文所處理的問題規(guī)模不是非常大,所以隱藏層不宜過深,優(yōu)先考慮1~3個(gè)隱藏層的網(wǎng)絡(luò)結(jié)構(gòu)。隱層節(jié)點(diǎn)數(shù)確定的最基本原則是:大于1且小于樣本數(shù),隱藏層節(jié)點(diǎn)數(shù)過少時(shí)模型無法學(xué)習(xí)到有效特征,過大時(shí)容易過擬合,因此,在滿足精度要求的前提下取盡可能緊湊的結(jié)構(gòu),即取盡可能少的隱層節(jié)點(diǎn)數(shù)。輸出層神經(jīng)元個(gè)數(shù)為輸出信號(hào)的維數(shù),本文的判別類型為6類,因此,對(duì)輸出做one-hot編碼后的輸出維數(shù)是6,最后將輸出向量解碼就可以獲得對(duì)應(yīng)的水源類別。
如圖1所示,輸入向量為X=(x1,x2,x3,…,x22),第一個(gè)隱藏層的向量值為Y1,第二個(gè)隱藏層的向量值為Y2,模型的輸出為O。輸入層與第一個(gè)隱藏層的權(quán)重矩陣為V,兩個(gè)隱藏層之間的權(quán)重矩陣為W,第二個(gè)隱藏層與輸出層之間的權(quán)重矩陣為U,則有:
公式中矩陣V大小為n×m,m為輸入向量維數(shù)22,n為第一層隱藏層節(jié)點(diǎn)個(gè)數(shù),矩陣W大小為k×n,k為第二個(gè)隱藏層節(jié)點(diǎn)數(shù),矩陣U大小為l×k,l為輸出層維數(shù)6。
隱藏層的激活函數(shù)f(x)選擇ReLU(Rectified Linear Unit),ReLU是一個(gè)分段函數(shù),能有效解決深度神經(jīng)網(wǎng)絡(luò)梯度消失問題。其函數(shù)表達(dá)式為:
2.2 煤礦突水水源判別因子
煤礦中各含水層由于其所處的地質(zhì)環(huán)境不同,形成了各自不同的水化學(xué)特征,根據(jù)出水點(diǎn)的水化學(xué)特征分析結(jié)果可以初步判定突水水源。判定水源的過程中,評(píng)價(jià)指標(biāo)的選擇與含水層及評(píng)價(jià)的目的有密切的關(guān)系,一般選擇含水層中的主要因素作為評(píng)價(jià)因子。
本文所研究的礦井突水水源主要分為6種,分別為:K2灰?guī)r、奧灰水、采空區(qū)水、地表水、第四系、砂巖裂隙水。通過測量與分析煤礦突水含水層水樣,綜合考慮建立指標(biāo)體系的科學(xué)性、系統(tǒng)性、可操作性、定性與定量相結(jié)合等原則,結(jié)合礦井水質(zhì)的基本概念,在礦井水質(zhì)中選擇pH值、游離 CO2、鉀離子、鈉離子、鈣離子、鎂離子、三價(jià)鐵、二價(jià)鐵、銨離子、氯離子、硫酸根、碳酸根、碳酸氫根、硝酸根、亞硝酸根、礦化度(Z1)、總硬度(Z2)、碳酸硬度(Z3)、非碳酸硬度(Z4)、負(fù)硬度(Z5)、總堿度(Z6)、總酸度(Z7)等22個(gè)評(píng)價(jià)因素作為分類標(biāo)示指標(biāo),單位均為mg/ L,總共分為6種類別(T),1代表K2灰?guī)r水,2代表奧灰水,3代表采空區(qū)水,4代表地表水,5代表第四系水,6代表砂巖裂隙水,判別突水水源類型效果良好,部分?jǐn)?shù)據(jù)如表1—2所示。
2.3 DNN突水水源判別模型的應(yīng)用于評(píng)價(jià)
本文采用62條樣本數(shù)據(jù)作為訓(xùn)練集,每條輸入數(shù)據(jù)包含22維,對(duì)20條待判樣本數(shù)據(jù)進(jìn)行分析,判定每一個(gè)水樣所屬的水源類型。
本文采用權(quán)重初始化采用MSRA方法,隱藏層激活函數(shù)選取ReLU函數(shù),輸出層激活函數(shù)選擇Softmax,由于是二分類算法,選擇交叉熵?fù)p失函數(shù)categorical_crossentropy,即logloss。DropOut可以有效防止模型過擬合,提升模型性能,一般設(shè)置為0.5,訓(xùn)練算法采用目前最好的Adam算法。batch_size選擇12,隱藏層節(jié)點(diǎn)數(shù)為32。
圖1 雙隱藏層的DNN模型
表1 部分?jǐn)?shù)據(jù)
表2 部分?jǐn)?shù)據(jù)
圖2 模型訓(xùn)練精度和損失變化
本文構(gòu)建了雙隱藏層的DNN網(wǎng)絡(luò)用于處理突水水源判識(shí)問題,模型精度明顯高于聚類分析和灰色關(guān)聯(lián)分析以及Bayes方法,判識(shí)結(jié)果如表3所示,且DNN的預(yù)測精度會(huì)隨著訓(xùn)練樣本的增加而提高。
表3 實(shí)驗(yàn)結(jié)果精度對(duì)比
本文首先總結(jié)并分析了常用的水源判別方法,針對(duì)已有方法存在的缺點(diǎn),提出采用DNN模型判別突水水源,選擇水化學(xué)指標(biāo)、pH值等22項(xiàng)指標(biāo)作為模型輸入,使用62個(gè)樣本數(shù)據(jù)訓(xùn)練模型,20個(gè)樣本做測試集,并與聚類分析、灰色關(guān)聯(lián)分析和貝葉斯模型的分類精度作對(duì)比,驗(yàn)證了DNN模型在突水水源識(shí)別上的準(zhǔn)確性。
[1]HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006(7):1527-1554.
[2]NAIR V, HINTON G E.Rectified linear units improve restricted boltzmann machines[C].International Conference on Machine Learning, 2010:807-814.
[3]李燕,徐志敏,劉勇.礦井突水水源判別方法概述[J].煤炭技術(shù),2010(11):87-89.
[4]衛(wèi)文學(xué),盧新明,施龍青.礦井出水點(diǎn)多水源判別方法[J].煤炭學(xué)報(bào),2010(5):811-815.
[5]朱衍利,石磊,李萬業(yè),等.水化學(xué)特征分析法在突水水源判別中的應(yīng)用[J].山東煤炭科技,2010(1):189-190.
Source Identification of coal mine water inrush based on deep neural network
Cao Chaofan
(Xi’an University of Architecture and Technology, Xi’an 710055, China)
By studying the existing method of water inrush, it is found that there is a problem that the convergence rate is slow and the local function has a local minimum point, resulting in a lower accuracy. In order to improve the accuracy of water source identification, the paper proposes to use the Deep Neural Network (DNN) to determine the water inrush from coal mine. The water source identification model is established by using the index attributes such as chemical data, salinity, total hardness, carbonic acid hardness, non-carbonic acid hardness, negative hardness, total alkalinity and total acidity as the discriminant factors. Through the comparison experiment, the results show that DNN model can effectively improve the accuracy of waterfront identification.
coal mine water inrush; water source identification; DNN
曹超凡(1992— ),男,陜西西安。