• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      加權(quán)樸素貝葉斯算法在消防檢測(cè)中的應(yīng)用

      2019-03-08 10:39:54黃啟萍
      關(guān)鍵詞:樸素貝葉斯建筑物

      童 威,黃啟萍

      (1.安徽文達(dá)信息工程學(xué)院 計(jì)算機(jī)工程學(xué)院,安徽 合肥 231201;2.安徽電氣工程職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)工程學(xué)院,安徽 合肥 230051)

      0 引 言

      隨著社會(huì)經(jīng)濟(jì)的迅速發(fā)展,傳統(tǒng)的消防安全體系問(wèn)題越來(lái)越突出。據(jù)公安部消防局公布數(shù)據(jù),2017年全國(guó)共接報(bào)火災(zāi)25.9萬(wàn)起,已核直接財(cái)產(chǎn)損失31.2億元[1]。其中,建筑物火災(zāi)相對(duì)多發(fā),傷亡人數(shù)最多。解決城鎮(zhèn)建筑物的消防安全問(wèn)題,一方面通過(guò)公安消防部門的現(xiàn)場(chǎng)勘查,發(fā)現(xiàn)火災(zāi)安全隱患問(wèn)題,另一方面通過(guò)市民投訴電話來(lái)隨機(jī)檢查非法建筑物。這2種做法都存在缺陷,前一種做法成本太高,后一種做法效率低下[2]。

      文獻(xiàn)[3]提出一種基于視頻圖像的煙霧特征提取方法,利用該方法可以準(zhǔn)確探測(cè)出火災(zāi)煙霧,并根據(jù)煙霧進(jìn)行火災(zāi)檢測(cè),該方法具有較高的檢測(cè)效果,但是憑借煙霧濃度進(jìn)行火災(zāi)檢測(cè),無(wú)法有效實(shí)現(xiàn)災(zāi)害發(fā)生前的火災(zāi)消防預(yù)測(cè),其安全性能較差;文獻(xiàn)[4]提出了一種基于光流法和紋理特征的火災(zāi)煙霧檢測(cè)算法,可用于火災(zāi)早期報(bào)警,通過(guò)建立皮拉米德圖像,并利用LBP和LBPV提取不同層次的靜態(tài)紋理特征。由于煙霧運(yùn)動(dòng)的湍流特性,煙霧方向是一致的,采用光流矢量分析判斷可疑區(qū)域輪廓的運(yùn)動(dòng)方向,降低了計(jì)算復(fù)雜度,最后,利用支持向量機(jī)識(shí)別煙霧圖像的紋理特征,仿真結(jié)果表明,該算法能夠保證算法的及時(shí)性,但其準(zhǔn)確性有待提高。

      判斷一棟建筑物可能發(fā)生火災(zāi)的相關(guān)常見因素包括:建筑物的類型、高度、施工材料、建筑的新舊程度、建筑物位置、年份等。對(duì)某建筑物可能發(fā)生火災(zāi)的預(yù)測(cè),大多以貝葉斯算法為主,但現(xiàn)有的樸素貝葉斯算法在針對(duì)分類預(yù)測(cè)研究時(shí),最大的缺陷在于各特征屬性之間相互獨(dú)立,沒有考慮到每個(gè)屬性的權(quán)重問(wèn)題,從而影響了分類預(yù)測(cè)的性能[5]。本文基于樸素貝葉斯算法,對(duì)每一個(gè)特征屬性附加權(quán)重系數(shù),以此提高預(yù)測(cè)的正確率。通過(guò)本文的研究,將建筑物信息與違法改建相關(guān)因素進(jìn)行聯(lián)系,希望可以作為設(shè)計(jì)消防檢測(cè)系統(tǒng)的基礎(chǔ),將某地區(qū)的建筑劃分為多個(gè)風(fēng)險(xiǎn)等級(jí),以幫助消防監(jiān)察單位決定每次的常規(guī)檢查路線和重點(diǎn)檢查單位。

      1 樸素貝葉斯算法

      貝葉斯學(xué)習(xí)方法通過(guò)概率規(guī)則進(jìn)行理論學(xué)習(xí)和推導(dǎo),采用概率來(lái)表示所有結(jié)論的不確定性,表示出對(duì)不同結(jié)論可能性的信任程度,其概率的計(jì)算過(guò)程極為復(fù)雜。樸素貝葉斯算法簡(jiǎn)化了貝葉斯學(xué)習(xí)方法所需要的計(jì)算,在某些特定的領(lǐng)域,其性能可以比得上機(jī)器學(xué)習(xí)中的其他高級(jí)算法,如:神經(jīng)網(wǎng)絡(luò)[6]、決策樹[7]等。但該算法更容易使用,并且速度較快[8]。

      將給定的全概率事件劃分m個(gè)類C1,C2,…,Cm。通過(guò)輸入不確定分類的訓(xùn)練樣本Y,該算法輸出Y屬于具有最高后驗(yàn)概率的類[9],即樸素貝葉斯算法預(yù)測(cè)Y屬于類Ci,令

      P(Ci|Y)>P(Cj|Y),1≤i,j≤m,j≠i

      (1)

      式中:P表示先驗(yàn)概率。這樣,最大化P(Ci|Y)。其P(Ci|Y)最大的類Ci稱為最大后驗(yàn)假設(shè)。

      樸素貝葉斯模型假設(shè)數(shù)據(jù)的所有特征屬性之間是獨(dú)立的[10],這樣可以降低計(jì)算的復(fù)雜度和難度[11]。在多維向量情況下,聯(lián)合概率正好是每個(gè)單獨(dú)特征概率的乘積,因此可以得出貝葉斯分類器的分類過(guò)程為[12]

      (2)

      但是,樸素貝葉斯算法的缺點(diǎn)也顯而易見,就是特征屬性之間是相互獨(dú)立的,沒有關(guān)聯(lián)。在所設(shè)計(jì)的消防檢測(cè)框架中,各特征屬性之間必然會(huì)存在一定的關(guān)聯(lián),如建筑物所處的位置與建筑物的年份,區(qū)域居民經(jīng)濟(jì)收入和建筑物年份等的強(qiáng)弱關(guān)聯(lián)。因此,如果不考慮特征屬性量化權(quán)重的問(wèn)題,樸素貝葉斯算法對(duì)于此類問(wèn)題的預(yù)測(cè)效果是不理想的。

      2 屬性加權(quán)樸素貝葉斯算法

      對(duì)樸素貝葉斯算法進(jìn)行改進(jìn),根據(jù)每個(gè)特征屬性對(duì)類別變量影響的關(guān)聯(lián)度來(lái)量化相應(yīng)的權(quán)重值,以此來(lái)提高樸素貝葉斯算法的性能。

      設(shè)權(quán)重系數(shù)向量W=(W1,W2,…,Wm),其中m為樣本特征屬性。加權(quán)的樸素貝葉斯算法的核心問(wèn)題就是特征屬性權(quán)重系數(shù)Wm的計(jì)算[13-14]。本文采用信息增益算法來(lái)量化每個(gè)特征屬性的權(quán)重系數(shù)[15-16]。信息增益是計(jì)算特征屬性與類別屬性之間的不確定度,當(dāng)信息增益值越大,則這個(gè)特征屬性對(duì)分類的信息量就越大,相應(yīng)的權(quán)重系數(shù)也就越大,反之亦然[17-18]。權(quán)重系數(shù)Wm對(duì)應(yīng)特征屬性集合A=(A1,A2,…,Am)的計(jì)算公式為

      (3)

      式中:G(Ak)是第k個(gè)特征屬性與類別屬性之間的信息增益值。

      利用屬性加權(quán)的信息增益算法,計(jì)算出每個(gè)特征屬性與類別之間的信息增益[19],然后利用式(3)進(jìn)行歸一化處理,計(jì)算過(guò)程如下。

      輸入:樣本集S=(S1,S2,…,Sn),n為樣本個(gè)數(shù)。

      (2) 計(jì)算特征屬性信息熵E(Ak)。

      (3) 計(jì)算特征屬性與類別屬性的信息增益G(Ak)=I(C1,C2,…,Ck)-E(Ak)。

      (4) 利用式(3)計(jì)算權(quán)重向量W=(W1,W2,…,Wm),其中,m為特征屬性個(gè)數(shù)。

      輸出:權(quán)重向量W=(W1,W2,…,Wm)。

      有了屬性權(quán)重系數(shù)以后,根據(jù)式(2)對(duì)樸素貝葉斯模型進(jìn)行擴(kuò)展得出加權(quán)樸素貝葉斯分類模型:

      (4)

      式中:Xk代表特征屬性。

      運(yùn)用加權(quán)樸素貝葉斯算法,建立分類模型[20],模型的創(chuàng)建步驟如下。

      (1)數(shù)據(jù)預(yù)處理。將訓(xùn)練樣本和待分類樣本中的缺失數(shù)據(jù)利用數(shù)據(jù)平滑、同類樣本平均值等方法進(jìn)行補(bǔ)齊,連續(xù)型數(shù)據(jù)通過(guò)等深劃分、區(qū)間法、聚類法進(jìn)行離散化。

      (2) 加權(quán)計(jì)算。掃描所有訓(xùn)練樣本數(shù)據(jù),設(shè)置一個(gè)G(Ak)閾值(0.2)。分別計(jì)算各個(gè)特征屬性的信息增益,刪除所有小于預(yù)定閾值的特征屬性,保留滿足閾值的信息增益的屬性。按照上文的特征屬性權(quán)重定義方法計(jì)算每個(gè)屬性X的權(quán)值Wm。

      (3) 計(jì)算概率。根據(jù)訓(xùn)練數(shù)據(jù)集S,針對(duì)每個(gè)屬性X的屬性值,每個(gè)類別Ck,計(jì)算所有的先驗(yàn)概率P(Xk|Ck),即類別Ck出現(xiàn)的概率和在類別Ck下屬性Xk出現(xiàn)的概率。

      (4) 分類器構(gòu)造。生成經(jīng)加權(quán)的樸素貝葉斯概率表及屬性權(quán)值列表。

      (5) 分類。調(diào)用概率表和屬性權(quán)值列表,得出分類結(jié)果。

      3 實(shí)驗(yàn)與分析

      為了驗(yàn)證基于改進(jìn)樸素貝葉斯算法在消防檢測(cè)中的有效性,提取了UCI的10個(gè)數(shù)據(jù)集,該數(shù)據(jù)集包含了模擬建筑物的特征信息。其中屬性最多的數(shù)據(jù)集有24個(gè)特征屬性,14個(gè)離散屬性,10個(gè)連續(xù)屬性。所有數(shù)據(jù)集共20 470條數(shù)據(jù),分別利用K最近鄰(KNN,K-NearestNeighbor)分類算法、決策樹算法(采用C4.5算法)、支持向量機(jī)(SVM,support vector machine)算法、樸素貝葉斯算法和加權(quán)樸素貝葉斯算法對(duì)建筑物的火災(zāi)隱患進(jìn)行檢測(cè),將檢測(cè)的準(zhǔn)確率進(jìn)行對(duì)比。所有實(shí)驗(yàn)均在Weka平臺(tái)上完成。將每個(gè)數(shù)據(jù)集分成10份,其中訓(xùn)練數(shù)據(jù)有9份,測(cè)試數(shù)據(jù)有1份,依次進(jìn)行測(cè)試實(shí)驗(yàn)。每次實(shí)驗(yàn)得出各種分類算法相應(yīng)的準(zhǔn)確率,10次結(jié)果的平均值作為對(duì)算法精度的估計(jì),實(shí)驗(yàn)結(jié)果如表1所示。

      表 1 不同算法的消防隱患檢測(cè)準(zhǔn)確率

      根據(jù)表1的實(shí)驗(yàn)結(jié)果,對(duì)加權(quán)樸素貝葉斯算法做如下分析。

      (1) 在表1中的10個(gè)UCI數(shù)據(jù)集中,本文的加權(quán)樸素貝葉斯算法準(zhǔn)確率高于其他算法的有9個(gè),從數(shù)據(jù)集的特點(diǎn)來(lái)看,本文加權(quán)樸素貝葉斯算法更適合處理特征屬性較多,且屬性間依賴關(guān)系較強(qiáng)的數(shù)據(jù)集。對(duì)于符合這些特點(diǎn)的數(shù)據(jù)集,它的分類效果更好。

      (2) 在公用建筑數(shù)據(jù)集上,特征屬性間的依賴關(guān)系較弱,依照本文的屬性加權(quán)算法得到的特征屬性與分類屬性間的相關(guān)度差異較小,導(dǎo)致各個(gè)特征屬性的權(quán)重系數(shù)基本相同。故改進(jìn)后的分類效果與樸素貝葉斯算法的準(zhǔn)確率大致相同,且低于SVM分類算法的分類準(zhǔn)確率。

      (3) 從實(shí)驗(yàn)數(shù)據(jù)可以看出,大部分情況下,加權(quán)樸素貝葉斯算法的準(zhǔn)確率要高于SVM算法,這充分說(shuō)明了在消防檢測(cè)系統(tǒng)中,針對(duì)建筑物的特征屬性加權(quán)問(wèn)題非常重要,對(duì)分類效果的影響很大。它避免了特征屬性對(duì)分類屬性貢獻(xiàn)相同的弊端。因此,在樸素貝葉斯算法的基礎(chǔ)上增加特征屬性權(quán)重,以提高分類準(zhǔn)確率是非常必要的。

      4 結(jié) 語(yǔ)

      特征屬性的獨(dú)立性假設(shè),在很大程度上限制了樸素貝葉斯算法在分析處理多特征屬性相互依賴問(wèn)題的預(yù)測(cè)準(zhǔn)確率。本文給出一種屬性加權(quán)的樸素貝葉斯分類器,用于實(shí)現(xiàn)建筑物消防檢測(cè)框架。利用原有的建筑物特征屬性信息,通過(guò)信息增益算法增加每個(gè)特征屬性的權(quán)重,以此替代傳統(tǒng)的樸素貝葉斯算法。通過(guò)實(shí)驗(yàn)表明,對(duì)比樸素貝葉斯算法、KNN算法、C4.5算法、SVM算法等常用分類算法,加權(quán)樸素貝葉斯算法提高了樸素貝葉斯算法的分類性能,從而證明此算法在消防檢測(cè)系統(tǒng)中的有效性和可行性。今后,改進(jìn)加權(quán)方法和完善消防檢測(cè)系統(tǒng)將是一個(gè)重要的研究方向。

      猜你喜歡
      樸素貝葉斯建筑物
      隔離樸素
      鄰近既有建筑物全套管回轉(zhuǎn)鉆機(jī)拔樁技術(shù)
      樸素的安慰(組詩(shī))
      他是那樣“笨拙”和樸素——30多年后,我們?yōu)槭裁催€需要讀路遙?
      描寫建筑物的詞語(yǔ)
      最神奇最樸素的兩本書
      貝葉斯公式及其應(yīng)用
      基于貝葉斯估計(jì)的軌道占用識(shí)別方法
      一種基于貝葉斯壓縮感知的說(shuō)話人識(shí)別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      火柴游戲
      桐柏县| 元氏县| 陕西省| 含山县| 木里| 苍山县| 娱乐| 哈密市| 桐庐县| 临朐县| 长白| 怀来县| 图们市| 龙州县| 台南县| 黄浦区| 青川县| 来凤县| 金沙县| 会东县| 临清市| 沐川县| 濮阳市| 天峻县| 阿克| 边坝县| 平远县| 南澳县| 梁山县| 分宜县| 巴林左旗| 石阡县| 库尔勒市| 防城港市| 特克斯县| 礼泉县| 泾川县| 清水河县| 东台市| 正镶白旗| 汉源县|