張燕
摘 要 本文主要是對貝葉斯網(wǎng)絡(luò)的起源、發(fā)展、定義及分類等做一個簡單介紹,使得有更加清晰的認(rèn)識。
關(guān)鍵詞 貝葉斯網(wǎng)絡(luò) 概述
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A
1貝葉斯網(wǎng)絡(luò)的起源和發(fā)展
貝葉斯理論起源于Reverend Thomas Bayes發(fā)表的論文“關(guān)于幾率性問題求解的評論”。20世紀(jì)50年代,以Robbins為代表提出了將經(jīng)驗貝葉斯方法和經(jīng)典方法相結(jié)合,這引起統(tǒng)計界的廣泛關(guān)注。1958年英國歷史最悠久的統(tǒng)計學(xué)雜志Biometrika又一次全文刊登了Bayes的論文。20世紀(jì)80年代,Pearl等提出了貝葉斯網(wǎng)絡(luò),并且將貝葉斯網(wǎng)絡(luò)應(yīng)用到人工智能方面進(jìn)行概率推理,在此基礎(chǔ)上并將貝葉斯網(wǎng)絡(luò)成功應(yīng)用于專家系統(tǒng)等領(lǐng)域,使得貝葉斯網(wǎng)絡(luò)成為不確定專家知識和推理的重要方法之一,這是十多年來在這些領(lǐng)域的一個研究熱點。20世紀(jì)90年代,貝葉斯方法成為數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)、用戶智能交互、信息重獲、醫(yī)療診斷等的一個重要研究方向。
貝葉斯網(wǎng)絡(luò)的發(fā)展經(jīng)歷了以下幾個階段:20世紀(jì)90年代之前,建立了貝葉斯網(wǎng)絡(luò)的基礎(chǔ)理論知識體系和對不確定性推理的研究;20世紀(jì)90年代,研究了如何根據(jù)數(shù)據(jù)以及專家知識建立貝葉斯網(wǎng)絡(luò)的問題,并研究出許多經(jīng)典的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法;21世紀(jì)人們將許多領(lǐng)域的實際問題引入到貝葉斯網(wǎng)絡(luò)中.目前,貝葉斯網(wǎng)絡(luò)已經(jīng)被廣泛地用于解決許多領(lǐng)域的大量實際問題中,并且取得了較好的效果。概括而言,貝葉斯網(wǎng)絡(luò)主要被運用于以下幾個方面:故障診斷、專家系統(tǒng)、
規(guī)劃、分類與聚類。
近年來國內(nèi)出現(xiàn)了許多關(guān)于使用貝葉斯網(wǎng)絡(luò)來解決實際問題的研究。曹冬明等利用貝葉斯網(wǎng)絡(luò)技術(shù)進(jìn)行故障定位;李偉生等將貝葉斯網(wǎng)絡(luò)用于規(guī)劃識別;鄧勇等將貝葉斯網(wǎng)絡(luò)用于模型診斷;李明等將貝葉斯網(wǎng)絡(luò)用于模型診斷串行譯碼;戴芹等利用貝葉斯網(wǎng)絡(luò)對遙感數(shù)據(jù)進(jìn)行分類等。
2貝葉斯網(wǎng)絡(luò)的定義及舉例
貝葉斯網(wǎng)絡(luò)又稱為貝葉斯置信網(wǎng),概率網(wǎng)絡(luò)知識圖等,貝葉斯網(wǎng)絡(luò)是一種基于概率推理的有向無環(huán)圖的模型,我們可以將具體問題中的復(fù)雜變量關(guān)系在一個網(wǎng)絡(luò)結(jié)構(gòu)中表示,并通過網(wǎng)絡(luò)模型反映問題領(lǐng)域中變量之間的依賴關(guān)系,適用于不確定性知識的表達(dá)和推理問題研究。
貝葉斯網(wǎng)絡(luò):一個貝葉斯網(wǎng)絡(luò)是表示變量之間概率依賴關(guān)系的有向無環(huán)圖,由代表變量的結(jié)點以及連接這些結(jié)點的有向邊組成,而且每個結(jié)點都標(biāo)注了定量的概率信息。這里表示為有向無環(huán)圖,每個結(jié)點n屬于Z表示變量,每條邊e屬于E表示變量之間的概率依賴關(guān)系,同時對每個結(jié)點都對應(yīng)著一個條件概率分布表,該條件概率表指明了該變量與父結(jié)點之間概率依賴的數(shù)量關(guān)系。
貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)即結(jié)點與有向邊之間的集合用一種簡單明了的方式描述了在域中成立的條件獨立關(guān)系,且它提供了一種把聯(lián)合概率分布分解為局部分布的方法:即它的圖形結(jié)構(gòu)編碼了變量之間的概率依賴關(guān)系,具有清晰的語義特征,這種獨立性的語義指明了如何組合這些局部分布來計算變量間聯(lián)合分布的方法。變量用來代表感興趣或者有意義的狀態(tài)或?qū)傩?,可以是任何問題的抽象,有實際意義和應(yīng)用價值。有向邊用來表示變量間的因果關(guān)系,箭頭表示因果關(guān)系影響的方向性(由父結(jié)點指向子結(jié)點),結(jié)點之間如果無連接邊則表示該結(jié)點所對應(yīng)的變量之間是條件獨立的,這是一種定性描述。條件概率表列出了每個結(jié)點相對于其父結(jié)點的條件概率,這是一種定量描述。網(wǎng)絡(luò)的定量部分給出了變量間不確定性的數(shù)值度量。
在貝葉斯網(wǎng)絡(luò)中,結(jié)點是條件獨立于給定父結(jié)點集時的其他任意非子結(jié)點的,正是由于這種條件獨立性的假設(shè),從而大大簡化了貝葉斯網(wǎng)絡(luò)中的計算復(fù)雜度,使得貝葉斯網(wǎng)絡(luò)推理更加方便,操作上更加簡潔和可行。
根據(jù)貝葉斯網(wǎng)絡(luò)的結(jié)點類型可以將貝葉斯網(wǎng)絡(luò)分為:離散型貝葉斯網(wǎng)絡(luò)、連續(xù)型貝葉斯網(wǎng)絡(luò)、混合型貝葉斯網(wǎng)絡(luò)。
3貝葉斯網(wǎng)絡(luò)的特點
隨著理論學(xué)習(xí)研究的不斷深入和應(yīng)用水平的不斷提高,貝葉斯網(wǎng)絡(luò)通過圖形化的方法來表示和運用概率知識,它克服了基于規(guī)則的系統(tǒng)所具有的許多概念以及計算上的困難,這已經(jīng)得到了學(xué)術(shù)界的普遍認(rèn)可和重視。主要有以下幾個特點:堅實的理論基礎(chǔ)、靈活的學(xué)習(xí)機(jī)制和強(qiáng)大的知識表達(dá)以及推理能力、應(yīng)用模型的多樣性。
參考文獻(xiàn)
[1] Wagner,A.How to Reconstruct a Large Genetic Network from n Gene Perturbations in Fewer than n2 Easy Steps[J]. Bioinformatics. 2001(17): 1183-1197.
[2] Robbins,H.&S.A.Monro.Stochatic Approximation Method[J]. Annals of Mathematical Statistics, 1951(22): 400-407.
[3] Pearl,J.Probabilistic Reasoning in Intelligent Systems[J].Morgan Kaufinann, 1988:1-86.
[4] 胡春玲.貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)算法研究[D].合肥:合肥工業(yè)大學(xué), 2006.
[5] 曹冬明,張伯明,鄧佑滿,田田. 一種新型故障定位方法的研究[J].電力系統(tǒng)自動化,1999,23(07): 12-14.
[6] 李偉生,王寶樹.實現(xiàn)規(guī)劃識別的一種貝葉斯網(wǎng)絡(luò). 西安電子科技大學(xué)學(xué)報(自然科學(xué)版),2002, 29(06): 741-744.
[7] 鄧勇施,文康,陳良州.基于模型診斷的貝葉斯解釋及應(yīng)用[J].上海交通大學(xué)學(xué)報, 2003,37(01): 5-8.
[8] 李明,鄧家梅,曹家麟.基于貝葉斯網(wǎng)絡(luò)的串行譯碼方法[J].通信技術(shù), 2001, 115 (04):38-40.endprint