• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于信息增益優(yōu)化支持向量機模型的煤礦瓦斯爆炸風險預測

    2021-04-29 08:55:08齊金平
    科學技術與工程 2021年9期
    關鍵詞:超平面正確率瓦斯

    萬 宇, 齊金平, 張 儒, 閆 森

    (蘭州交通大學機電技術研究所, 蘭州 730070)

    目前,隨著社會經(jīng)濟的蓬勃發(fā)展,中國已成為世界上最大的煤炭生產(chǎn)、消費國,安全生產(chǎn)已經(jīng)成為一個重要現(xiàn)實問題[1]。煤炭行業(yè)是典型的高危行業(yè),其事故主要包括瓦斯、頂板、底板、放炮、機電、火災、水害、運輸以及其他事故,其中瓦斯事故一般被認為是威脅性最大的災害事故。中國高瓦斯礦井數(shù)占到了接近總量的一半,每年因瓦斯事故帶來的傷亡人數(shù)不計其數(shù),而其中瓦斯和煤塵爆炸事故占大多數(shù)[2]。煤炭的安全開采是經(jīng)濟增長的重要保障,“十三五”規(guī)劃中國家也對能源安全和綠色生產(chǎn)提出了明確的要求。因此,為了響應國家號召,應將未來的工作重心從事后響應轉(zhuǎn)移到預控預防,做到從根源上遏制安全事故的發(fā)生,減少人員傷亡率。

    瓦斯爆炸是瓦斯事故中典型的一種,傳統(tǒng)預測方法主要依賴專家判斷,具有較強的主觀性,預測精度不能達到分析任務的要求,近年來隨著計算機技術的進步與發(fā)展,機器學習算法的引入極大地推動了風險預測領域的進步,田水承等[3]利用反向傳播神經(jīng)網(wǎng)絡(back propagation neural network, BPNN)對掘進面瓦斯爆炸危險進行了安全評價,李潤求等[4]構(gòu)建了基于區(qū)間層次分析法和功效系數(shù)法結(jié)合(interval analytic hierarchy process-efficacy coefficient method, IAHP-ECM)的瓦斯爆炸災害風險評估模型,邵良杉等[5]針對數(shù)據(jù)缺失問題將隨機森林算法引入對瓦斯災害進行預測,李爽等[6]將極限學習機與貝葉斯網(wǎng)絡結(jié)合對風險進行預測。上述方法從不同角度對瓦斯爆炸風險預測進行了研究,機器學習的應用很大程度上提升了預測的精準度,除了各種算法上的進步,改變優(yōu)化特征向量的輸入也是提升速度精度的一大方向。

    現(xiàn)將本質(zhì)安全理念引入評價指標集的構(gòu)建,從人、機、管理、環(huán)境四個角度構(gòu)建了28個指標,并針對煤礦瓦斯爆炸災害的特點,選取支持向量機(support vector machine,SVM)模型來進行分類預測,在此基礎上選擇信息增益法(information gain,IG)根據(jù)熵值優(yōu)化輸入變量,組成了IG-SVM的組合模型,以期能夠?qū)崿F(xiàn)對瓦斯爆炸風險的快速、高精預測。

    1 分類預測模型的構(gòu)建

    1.1 支持向量機

    支持向量機是一種基于VC維(Vapnik-Chervonenkis dimension)理論和結(jié)構(gòu)風險最小化準則的監(jiān)督學習算法[7],最早起源于分類、回歸領域,Vapnik[8]引入核理論,將原始低維數(shù)據(jù)映射到高維空間,在維數(shù)足夠高的空間中利用超平面來進行分類,在數(shù)學上可歸結(jié)為求解一個二次規(guī)劃問題。SVM在面對非線性、小樣本等問題時表現(xiàn)出色,計算復雜度取決于支持向量的數(shù)目,從而避免了“維數(shù)災難”,并且具有良好的魯棒性和泛化性能[9]。目前已廣泛應用于計算機視覺、時間序列預測、人工智能等領域。

    設樣本數(shù)據(jù)集(xi,yi)(i=1,2,…,l),xi∈Rn,yi∈{-1,+1},l為訓練樣本總數(shù),n為空間的維數(shù),xi為待分類數(shù)據(jù),yi為標記類別,對線性可分的樣本,存在一個超平面H能夠?qū)⒉煌惖臉颖痉珠_,用法向量表示其方向,H1、H2分別表示過兩類樣本點中與超平面H距離最近的平行平面,其間的距離稱為分類間隔,在保證能夠正確分類的前提下分類間隔最大的平面稱為最優(yōu)超平面。超平面方程為wx+b=0,d維空間中的線性判別函數(shù)為g(x)=wx+b,其中w∈Rn,w為參數(shù)向量,即超平面的法向量,b∈R為分類閾值。

    歸一化使|g(x)|≥1,離分類面最近的樣本的|g(x)|=1,此時分類間隔為2/‖w‖,要求分類間隔最大,即要求‖w‖最小,要求所有樣本分類正確,則需要滿足:

    yi[(wxi+b)]≥1,i=1,2,…,l

    (1)

    上述條件可以轉(zhuǎn)化為下面帶約束條件的優(yōu)化問題進行求解:

    (2)

    樣本線性可分的情況下,求解即可得到最優(yōu)分類超平面,對于線性不可分的情況,存在一定的訓練誤差,一部分無法滿足式(1)的樣本數(shù)據(jù)將被視為噪聲,為了給這樣的噪聲數(shù)據(jù)引入容錯性需要在表達式中增加一個松弛變量ξi(ξi≥0),則式(1)變成

    yi[(wxi+b)]≥1-ξi,i=1,2,…,l

    (3)

    (4)

    由此可以得到線性不可分時的最優(yōu)分類超平面,稱為廣義分類超平面,可以表示為

    (5)

    (6)

    式(6)中:αi為拉格朗日乘子。在處理非線性問題時,低維空間中樣本數(shù)據(jù)的離群點數(shù)量非常多,引入松弛變量也無法取得較好的分類效果。根據(jù)泛函理論,只要一種核函數(shù)K=(xi,xj)滿足Mercer條件,就可以代替原空間中的內(nèi)積。本文擬采用的核函數(shù)有雙曲正切(Sigmoid)核函數(shù)、徑向基核函數(shù)(radial basis function, RBF)、線性核函數(shù)(linear kernel function, LKF)以及多項式核函數(shù)(polynomial function, PF)。利用核函數(shù)技巧后的最優(yōu)分類函數(shù)為

    (7)

    1.2 信息增益

    信息增益是一種優(yōu)化特征選取的方法[10]。信息量是對信息的度量,信息的大小與隨機事件的概率有關,概率越小產(chǎn)生的信息量越大,設離散隨機變量X的概率分布為P(X=xi)=pi(i=1,2,…,n)。信息熵代表所有可能發(fā)生事件信息量的期望,也可以理解為離散隨機變量的復雜度,表達式為

    (8)

    設有隨機變量(X,Y),其聯(lián)合概率分布為P(X=xi,Y=yi)=Pij(i=1,2,…,n,j=1,2,…,m)。條件熵H(Y/X)代表在已知隨機變量X的條件下隨機變量Y的不確定性,表達式為

    (9)

    信息增益代表了在X已知的條件下,信息復雜度減少的程度,即信息熵與條件熵的差值,特征T對訓練數(shù)據(jù)集D所帶來的信息增益為

    g(D,T)=H(D)-H(D|T)

    (10)

    某個特征的信息增益值越大,也就是說根據(jù)這個特征所做決定的不確定度減少越多。用這種方法可以考量特征信息對整個系統(tǒng)的貢獻,貢獻越大說明這個特征對分類決策的影響越深。

    1.3 IG-SVM模型

    IG-SVM模型流程如圖1所示。

    圖1 IG-SVM模型流程示意圖Fig.1 Flow diagram of IG-SVM model

    模型運行步驟如下:

    步驟1基于本質(zhì)安全理論從人、機器、管理、環(huán)境4個方面構(gòu)建瓦斯爆炸事故風險評價指標體系。

    步驟2通過實際調(diào)查煤礦監(jiān)控系統(tǒng)以及問卷調(diào)查法獲取大量現(xiàn)場數(shù)據(jù)(包括實時數(shù)據(jù)與非實時數(shù)據(jù)),組成原始數(shù)據(jù)集{D1,D2,…,Dm}。

    步驟3將步驟2所得的原始數(shù)據(jù)集進行信息增益處理,可以獲得各指標的增益值排序,選擇最優(yōu)指標組成新的數(shù)據(jù)集{I1,I2,…,Im}。

    步驟4用mapminmax函數(shù)對數(shù)據(jù)進行歸一化處理,將原始數(shù)據(jù)映射到[0,1]區(qū)間內(nèi),這樣可以避免量綱不同對分類結(jié)果的影響,得到的新數(shù)據(jù)集為{G1,G2,…,Gm},用新實驗數(shù)據(jù)集訓練SVM模型,重復訓練優(yōu)化參數(shù)后可以得到分類預測模型f(Ii)。

    步驟5將未知風險的數(shù)據(jù)集導入模型訓練,獲得預測結(jié)果。

    2 實驗分析

    2.1 樣本的采集

    瓦斯爆炸事故是煤礦特有的極其嚴重的一種災害,利用事故發(fā)生與否在指標上的差異化表現(xiàn)可以對瓦斯爆炸風險進行預測,對事故的預控預防具有指導意義。以甘肅、山西、內(nèi)蒙古自治區(qū)等地區(qū)100家中小煤礦企業(yè)為研究對象,收集他們的瓦斯爆炸事故數(shù)據(jù),定性指標以問卷調(diào)查法獲取,調(diào)查問卷向目標企業(yè)相關部門的管理人員發(fā)放。此次研究共發(fā)放問卷170份,收回141份,有效問卷為110份。對數(shù)據(jù)進行統(tǒng)計整理,共獲得110個樣本點,包括20個有風險樣本(事故樣本),90個無風險樣本。在此基礎上,還需要對用于訓練和測試的樣本數(shù)據(jù)集進行劃分,本文選取訓練和測試的樣本數(shù)量比例為8∶2,分別在有風險和無風險的樣本中按比例隨機抽取共88個作為預測模型的訓練樣本,剩下22個作為檢驗模型預測效果的測試樣本,如表1所示。

    表1 實驗樣本分布情況Table 1 Distribution of experimental samples

    2.2 風險評價指標

    本質(zhì)安全是一種以事故致因論為基礎的科學全面的安全理論,完全符合國家安全生產(chǎn)的法律法規(guī)以及“十三五”發(fā)展規(guī)劃,其核心理念是從人、機器、管理、環(huán)境四個要素的角度,做到各方面協(xié)調(diào)統(tǒng)一,消除不安全因素,建立本質(zhì)安全型企業(yè)。本文將本質(zhì)安全理念結(jié)合煤礦生產(chǎn)的實際情況,建立了一套較為全面的指標體系,如表2所示。為達到簡化SVM模型提高預測正確率的目的,通過IG模型分析輸入變量,提取對瓦斯爆炸風險分類結(jié)果有顯著影響的指標,影響程度以信息增益值表示,信息增益的排序結(jié)果如表3所示,本文選擇信息增益值大于0.015所對應的14個特征變量組成新數(shù)據(jù)集合。

    表2 瓦斯爆炸風險指標體系

    表3 特征指標信息增益排序表

    2.3 參數(shù)設置及核函數(shù)的選取

    本文建立的預測模型由Windows系統(tǒng)下的MATLAB19.0實現(xiàn),采用MATLAB中的mapminmax對原始數(shù)據(jù)進行歸一化,得到的新數(shù)據(jù)集與原數(shù)據(jù)集具有高度緊密性。SVM中核函數(shù)的選取對特征空間起著決定性的作用,目前還沒有算法用于選取最適合核函數(shù)的方法,一般采取試湊法,本文選取最常用的4種核函數(shù)分別是:Sigmoid核函數(shù)、LKF、PF、RBF,對分類結(jié)果進行對比,選取最優(yōu)的核函數(shù),其中LKF沒有需要專門設置的參數(shù),其余參數(shù)如表4所示。

    表4 核函數(shù)參數(shù)情況Table 4 Parameters of kernel function

    瓦斯爆炸事故風險實際上是一個二元分類問題,即將煤礦開采區(qū)域分為兩類有風險、無風險,采用混淆矩陣來評價分類模型的性能,如表5所示。

    表5 混淆矩陣

    P/N(positive/negative)表示預測對象的所屬類別,T/F(true/false)表示分類的正確與否,例如TP即將實際有風險的煤礦預測為有風險的樣本數(shù)量,利用混淆矩陣可以計算出一些評價模型性能的指標如:正確率Acc=(TP+TN)/(TP+TN+FP+FN)、準確率Precision=TP/(TP+FP)、召回率Recall=TP/(TP+FN)等[11]。以上指標雖然能夠一定程度上的評價模型性能,但是應用于本文的分類器模型評價中大致有兩方面的問題:一是煤礦瓦斯事故屬于低概率事件,那么在收集數(shù)據(jù)時極大可能發(fā)生正負樣本數(shù)量懸殊,例如事故樣本數(shù)量占總量1%時,分類器只需將所有樣本判定為無風險,則準確率也可達到99%,這顯然是不合理的。其次風險的發(fā)生雖然是一個二元分類問題,但是所選對象歸屬類別的程度不同,簡單地用0或1概括會導致一些信息丟失。

    ROC(receiver operating characteristic)曲線也稱受試者工作特性曲線,其橫縱坐標分別是假陽性率(false positive rate,F(xiàn)PR)和真陽性率(true positive rate,TPR),坐標(0,1)對應的是理想的分類模型,用曲線下的面積(area under curve,AUC)來表示分類器的性能,AUC的大小一般在0.5~1,越靠近1表示越接近理想分類模型。選擇ROC曲線不僅能夠解決前文提出的兩方面問題,而且能直觀地反映不同核函數(shù)模型分類情況的優(yōu)劣。

    將數(shù)據(jù)代入不同核函數(shù)的模型,ROC曲線如圖2所示,ROC曲線越靠近左上角表示分類效果越好,為了更加準確地描述可以計算曲線下面積,即AUC值,如表6所示。

    圖2 模型輸出的ROC曲線Fig.2 ROC curve of model output

    表6 不同核函數(shù)AUC比較Table 6 Comparison of AUC values of different kernel functions

    由表6可知使用RBF核函數(shù)構(gòu)造的模型輸出的AUC最高,而使用Sigmoid核函數(shù)、PF、LKF的構(gòu)造的模型輸出的AUC都在0.7~0.8,效果不甚理想且相互之間差別不大。LKF作為RBF的一種特殊形式,在實驗過程中發(fā)現(xiàn)兩種核函數(shù)差距較大,推測可能是由于煤礦瓦斯爆炸風險并不是線性可分的。Sigmoid核函數(shù)可能在某些參數(shù)下是無效的,因此給參數(shù)選取帶來困難。PF的支持向量較多分布于邊界處,可能對分類預測產(chǎn)生干擾。此外,RBF有很強的映射復雜非線性關系的能力,且學習規(guī)則簡單、調(diào)試參數(shù)迅速,魯棒性強。綜上所述,本文選用RBF作為核函數(shù)建立預測模型。

    2.4 結(jié)果與討論

    為了體現(xiàn)本文選用的IG-SVM模型的效能,將該模型的預測結(jié)果與一些常用的分類器在同樣的樣本條件下進行比較,為了簡化比較結(jié)果,僅對預測結(jié)果作二元分類(+1表示有風險,-1表示無風險),結(jié)果以樣本的分類正確率表示,如表7所示。

    表7 各模型分類預測結(jié)果對比Table 7 Comparison of prediction results of different models

    實驗結(jié)果表明:在4種單一分類模型中,SVM對訓練樣本的分類正確率為85.23%,略低于決策樹(decision tree, DT)模型和隨機梯度下降(stochastic gradient descent, SGD)模型,而對測試樣本的分類正確率最高,達到了86.36%,而本文建模分類的目的是預測瓦斯爆炸風險,顯然測試樣本的結(jié)果更加重要,在有風險樣本和無風險樣本中,SVM的表現(xiàn)要優(yōu)于3種其他模型。比較使用了IG優(yōu)化后的各種模型,4種分類正確率均有所提高,例如IG-SVM模型相對于SVM模型4種正確率分別提高了12.5%、9.09%、5%、7.78%,說明了經(jīng)過IG特征提取后的模型分類性能有所提高。此外,實驗還使用了核主成分分析法(kernel principal component analysis, KPCA)進行特征選取優(yōu)化作為對比,可以看出,經(jīng)過KPCA優(yōu)化后的模型,雖然整體水平也有所提升,但普遍低于IG優(yōu)化后的模型,充分說明了IG在特征選取優(yōu)化方面的表現(xiàn)十分優(yōu)異。

    3 結(jié)論

    依據(jù)本質(zhì)安全理念建立了指標集,研究了IG-SVM在處理煤礦瓦斯爆炸風險預測上的表現(xiàn),具體結(jié)論如下:

    (1)針對煤礦瓦斯爆炸風險問題,使用SVM進行分類預測取得了不錯的效果,但是過于龐大的指標體系在一定程度上形成了特征信息的冗余,從而影響計算機仿真的速度與正確率。因此,優(yōu)化評價指標體系是十分必要的。

    (2) IG通過對信息增益值進行排序精簡指標體系,刪除了不必要的冗余信息,降低了模型整體的運算維度,從而優(yōu)化了模型的速度與正確率,并通過實驗證明IG與SVM的組合在解決本文問題時要優(yōu)于其他模型,最終測試樣本的正確率達到了95.45%,在防控災害上有很好的應用價值。

    猜你喜歡
    超平面正確率瓦斯
    全純曲線的例外超平面
    涉及分擔超平面的正規(guī)定則
    門診分診服務態(tài)度與正確率對護患關系的影響
    11采區(qū)永久避難硐室控制瓦斯涌出、防止瓦斯積聚和煤層自燃措施
    以較低截斷重數(shù)分擔超平面的亞純映射的唯一性問題
    生意
    品管圈活動在提高介入手術安全核查正確率中的應用
    天津護理(2016年3期)2016-12-01 05:40:01
    高瓦斯礦井防治瓦斯異常涌出措施的應用
    生意
    故事會(2016年15期)2016-08-23 13:48:41
    瓦斯探鉆鉆頭的一種改進
    依兰县| 潼南县| 和平县| 和静县| 广南县| 岫岩| 大新县| 平遥县| 河曲县| 乌兰察布市| 怀集县| 疏勒县| 教育| 互助| 六盘水市| 永登县| 石屏县| 富顺县| 万盛区| 阳西县| 从江县| 子洲县| 鲁甸县| 潼南县| 乌兰察布市| 陇南市| 海口市| 广平县| 景泰县| 德昌县| 即墨市| 手游| 汕头市| 万载县| 阜康市| 扎兰屯市| 兴仁县| 塔河县| 临湘市| 仪征市| 重庆市|