李振明 柴冰
摘要:貝葉斯網(wǎng)絡(luò)算法是基于事件發(fā)生的一種概率信度計(jì)算。為了準(zhǔn)確判斷各個事件發(fā)生的概率,提高判斷的精度與準(zhǔn)確度,提出了一種貝葉斯網(wǎng)絡(luò)的分層推理算法。這種方法將貝葉斯網(wǎng)絡(luò)進(jìn)行結(jié)構(gòu)化處理,對于節(jié)點(diǎn)集進(jìn)行分析,更精準(zhǔn)的去推測事件的概率。分層推理是在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上,結(jié)合貝葉斯網(wǎng)絡(luò)的推理算法提出算法的基本思想,再在理論上進(jìn)行推理驗(yàn)證,最后進(jìn)行仿真試驗(yàn)驗(yàn)證該算法的準(zhǔn)確性與可實(shí)施性。
關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);信息分類;分層推理
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)08-0164-05
1引言
貝葉斯網(wǎng)絡(luò)是一種研究不確定性問題的重要的方法之一,貝葉斯網(wǎng)絡(luò)技術(shù)依賴于概率和統(tǒng)計(jì)的理論,掌握貝葉斯網(wǎng)絡(luò)技術(shù)需要有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。它具有自然的表達(dá)方式以及強(qiáng)大的推理能力還有靈活的決策機(jī)制等優(yōu)點(diǎn)。本文在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)理論的框架之上研究貝葉斯網(wǎng)絡(luò)的分層推理,并將貝葉斯網(wǎng)絡(luò)信息層次結(jié)構(gòu)化處理,能夠更靈活地去處理信息,使得得到的結(jié)果更加準(zhǔn)確和具有實(shí)用性。
同時隨著互聯(lián)網(wǎng)的應(yīng)用的不斷推廣,大量的信息可以很容易的獲得,利弊相依,在獲得大量數(shù)據(jù)的同時對應(yīng)于數(shù)據(jù)的處理分析與應(yīng)用也有著很多的困難,如何去準(zhǔn)確地把握數(shù)據(jù)是一件值得挑戰(zhàn)的事情。最常用的手段就是把不同的信息文本進(jìn)行分類,再獲取信息的時候就可以在與其相對應(yīng)的類別中去查找特定的信息。這樣不僅可以提高獲得結(jié)果的速率,也可以保證結(jié)果的準(zhǔn)確性。由于數(shù)據(jù)網(wǎng)的龐大與相關(guān)聯(lián)性,所以層次結(jié)構(gòu)分析是不可以去忽略的。
貝葉斯方法對于信息的挖掘有著很靈活的應(yīng)用,已經(jīng)有很多的學(xué)者在研究這一貝葉斯網(wǎng)絡(luò)的信息分類以及應(yīng)用的問題。在實(shí)踐中已經(jīng)有很多種的方法在研究,處理有著大量的類別的信息,但是這些算法在樣本數(shù)據(jù)較少的情況的時候效果又不太明顯。本文主要是基于信息主題,提出的一種高效的貝葉斯網(wǎng)絡(luò)分層推理的算法:算法主要是通過信息的相關(guān)性來強(qiáng)化關(guān)鍵詞的作用,將貝葉斯分類器的精度提高,從而提高所得結(jié)果的準(zhǔn)確性。即使在獲取的信息樣本數(shù)比較少的情況之下,也可以獲得比較實(shí)用的分類精度。在推理算法研究方面,對靜態(tài)貝葉斯網(wǎng)絡(luò)推理研究得比較多,成果也比較多,主要有消息傳遞算法、條件算法、連接樹算法、符號概率推理算法、弧反向,節(jié)點(diǎn)縮減算法、隨機(jī)抽樣算法等。
2貝葉斯網(wǎng)絡(luò)分層推理算法
2.1模型建立
分層推理的結(jié)構(gòu)圖如上圖所示。x為隱藏節(jié)點(diǎn),Y11n-Yn1n為觀測節(jié)點(diǎn)Y11n-1-Yn-11n-1為觀測節(jié)點(diǎn)的隱節(jié)點(diǎn)。根據(jù)貝葉斯算法,與所得到的先驗(yàn)條件求出隱節(jié)點(diǎn)的概率,將所得的結(jié)果作為觀測數(shù)據(jù),對上一層次進(jìn)行推理,縮小模型結(jié)構(gòu),最終的出隱節(jié)點(diǎn)X的概率。
對于單個節(jié)點(diǎn)的模型,每個結(jié)點(diǎn)的變量都有很多觀測節(jié)點(diǎn),根據(jù)所觀測的節(jié)點(diǎn)概率以及條件概率去計(jì)算它的后驗(yàn)最大概率。
2.2基本思想
在研究對象發(fā)生故障之后,根據(jù)獲得的證據(jù)信息和所有的先驗(yàn)概率推理得到第一個層次的精確推理結(jié)果最后得到發(fā)生故障的類型。然后根據(jù)所得到的結(jié)果的層次分類中進(jìn)行計(jì)算。把第一次推算出來的結(jié)果作為證據(jù)信息再根據(jù)已知先驗(yàn)概率推理精確的數(shù)據(jù)最終得到所研究對象故障類型的真正原因。
2.3算法描述
貝葉斯網(wǎng)絡(luò)分層推理的算法推理的過程主要分為三步驟進(jìn)行:第一步,對研究的事件發(fā)生可能性進(jìn)行層次分類,不同的事件可根據(jù)不同的原則進(jìn)行分類,才可以進(jìn)行層次化研究,不斷地縮小事件發(fā)生因素的范圍。第二步,通過第一步的層次劃分之后,根據(jù)所持有的證據(jù)信息以及先驗(yàn)概率進(jìn)行精確的概率推算,利用貝葉斯網(wǎng)絡(luò)推理算法,得出事件發(fā)生因素的后驗(yàn)概率,從而縮小了研究的范圍,使得最終得出的結(jié)果更為精確。第三步,就是把第二步所得出的結(jié)果作為證據(jù)信息然后根據(jù)引起這個證據(jù)信息發(fā)生因素的先驗(yàn)概率進(jìn)行推算,得出更為準(zhǔn)確的結(jié)果,分析出故障發(fā)生的因素。如果層次的分類更加細(xì)致的化,只需要重復(fù)步驟,不斷地去細(xì)化研究。
分層推理就是先把事件發(fā)生的因素范圍縮小這樣更方便去研究去總結(jié),能夠更加準(zhǔn)確無誤的找出事件發(fā)生的原因。把得到的數(shù)據(jù)帶人到下一個層次的計(jì)算,這樣就可以計(jì)算出這個事件發(fā)生的主要因素,這也是對確定性證據(jù)的一種研究,如果層次比較多,需要不斷迭代計(jì)算,去縮小事件發(fā)生的范圍,層次越多越為復(fù)雜,但是相對于其他的算法而言,能夠提高效率以及準(zhǔn)確性。
2.4貝葉斯網(wǎng)絡(luò)分層推理的計(jì)算步驟
對于證據(jù)的處理,必須考慮其子節(jié)點(diǎn)Z與父節(jié)點(diǎn)X的影響。對于子節(jié)點(diǎn)與父節(jié)點(diǎn)信息的傳遞必須要以不同的方式。假設(shè)節(jié)點(diǎn)Y具有變量(Y1,Y2,…,Yn),父節(jié)點(diǎn)為A,B,子節(jié)點(diǎn)為C,D。