林燕清,傅仰耿
(福州大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建 福州 350116)
專家系統(tǒng)[1]作為一種人工智能系統(tǒng),已經(jīng)被廣泛應(yīng)用于圖像處理、醫(yī)療檢測(cè)、地質(zhì)勘探、石油化工等領(lǐng)域。利用專家系統(tǒng)進(jìn)行決策時(shí),需要先將有用的信息表示成知識(shí),知識(shí)的表示形式有很多種,其中應(yīng)用最廣泛的是產(chǎn)生式規(guī)則,即IF-THEN規(guī)則。置信規(guī)則(belief rule)是在傳統(tǒng)IF-THEN規(guī)則的結(jié)果部分加入置信分布轉(zhuǎn)化而來的,由一組置信規(guī)則組成的集合稱為置信規(guī)則庫(kù)(belief rule base, BRB)。置信規(guī)則對(duì)應(yīng)的是系統(tǒng)的輸入信息,而實(shí)際工程中包含的信息既可能是定性知識(shí)也可能是定量數(shù)據(jù),同時(shí),信息中往往存在著含糊或模糊不確定性、不精確性以及不完整性。為了能夠有效利用帶有這些不確定性的信息,Yang等[2]于2006年在D-S證據(jù)理論[3-4]、決策理論[5]、模糊理論[6]和傳統(tǒng)的IFTHEN規(guī)則庫(kù)基礎(chǔ)上提出了基于證據(jù)理論的置信規(guī)則庫(kù)推理方法(belief rule-base inference methodology using the evidential reasoning approach,RIMER)。RIMER方法作為BRB系統(tǒng)的核心,能夠?qū)哂芯€性或非線性關(guān)系的輸入和輸出進(jìn)行建模,具有處理各種不確定性的能力。目前,BRB系統(tǒng)已被廣泛應(yīng)用到輸油管道泄漏[7-8]、石墨成分檢測(cè)[9]、消費(fèi)者偏好預(yù)測(cè)[10]、軍事能力評(píng)估[11]和出租車乘車概率預(yù)測(cè)[12]等領(lǐng)域。
利用BRB系統(tǒng)對(duì)實(shí)際問題進(jìn)行建模時(shí),要先確定其內(nèi)部參數(shù)的取值,各個(gè)參數(shù)的不同取值會(huì)對(duì)BRB系統(tǒng)的推理能力造成一定的影響,傳統(tǒng)的參數(shù)取值確定方法是專家根據(jù)經(jīng)驗(yàn)給定其值,但當(dāng)參數(shù)個(gè)數(shù)較多或系統(tǒng)較復(fù)雜時(shí),專家很難確定參數(shù)取值。鑒于此,Yang等[10]最先提出一種通用的BRB參數(shù)學(xué)習(xí)模型,該模型以滿足各個(gè)參數(shù)約束條件為基礎(chǔ),通過最小化由置信規(guī)則庫(kù)推理得出的模擬輸出值和真實(shí)數(shù)據(jù)的輸出值二者的差值來訓(xùn)練BRB參數(shù)。在Yang的基礎(chǔ)上,Chen等[13]提出了包括前提屬性參考值在內(nèi)的全局參數(shù)學(xué)習(xí)方法。不過以上兩種參數(shù)學(xué)習(xí)方法均是建立在MATLAB工具自帶的FMINCON函數(shù)的基礎(chǔ)上,參數(shù)學(xué)習(xí)效率不高。鑒于此,常瑞等[14]、吳偉昆等[15]提出結(jié)合梯度下降法的BRB參數(shù)學(xué)習(xí)方法,這種方法雖然優(yōu)于FMINCON函數(shù),但其涉及的公式推導(dǎo)過于復(fù)雜,只能訓(xùn)練少量的參數(shù),不適合用來學(xué)習(xí)大量的參數(shù),且參數(shù)學(xué)習(xí)的收斂速度過慢。為了提高BRB系統(tǒng)參數(shù)學(xué)習(xí)的收斂速度和精度,蘇群等[16]、王韓杰等[17]相繼提出基于群智能算法的參數(shù)學(xué)習(xí)方法。以上參數(shù)學(xué)習(xí)方法均能夠優(yōu)化BRB參數(shù)取值,從而提高BRB的推理能力,但是,這些參數(shù)學(xué)習(xí)方法都是建立在Yang等[10]提出的參數(shù)學(xué)習(xí)模型基礎(chǔ)上的,無法避免重復(fù)的搜索過程,需要不斷地進(jìn)行迭代。此外,因?yàn)锽RB系統(tǒng)構(gòu)建時(shí)需要覆蓋所有的前提屬性的參考值,當(dāng)前提屬性和前提屬性參考值過多時(shí),會(huì)出現(xiàn)“組合爆炸”問題。為了解決該問題,專家學(xué)者們提出了各自的降維方法:Zhou等[18]提出“統(tǒng)計(jì)效用”的概念,根據(jù)每條規(guī)則的統(tǒng)計(jì)效用值來確定是否刪減該規(guī)則,如果某條規(guī)則的統(tǒng)計(jì)效用值越小,說明該規(guī)則對(duì)整體系統(tǒng)的貢獻(xiàn)越小,就可以將其刪除;Chang等[19]提出利用灰靶理論、多維尺度變換、主成分分析來選擇關(guān)鍵前提屬性,從而減少前提屬性的數(shù)量;王應(yīng)明等[20]引入粗糙集理論,提出客觀的規(guī)則約簡(jiǎn)方法,該方法不需要借助BRB以外的任何先驗(yàn)知識(shí)。這些BRB結(jié)構(gòu)優(yōu)化方法雖然可以在一定程度上避免組合爆炸問題,但是會(huì)降低BRB的推理能力。為了從根本上解決BRB參數(shù)取值以及組合爆炸問題,Liu等[21]對(duì)原有的置信規(guī)則進(jìn)行擴(kuò)展,在規(guī)則的前件部分也加入置信分布,提高其對(duì)含糊、不完整和不確定信息的表示能力,改進(jìn)后的規(guī)則庫(kù)被稱為擴(kuò)展置信規(guī)則庫(kù)(extended belief rule base, EBRB)。同時(shí),Liu等[21]還提出了一種簡(jiǎn)單且有效直接利用訓(xùn)練數(shù)據(jù)生成初始擴(kuò)展置信規(guī)則的規(guī)則生成機(jī)制,數(shù)據(jù)驅(qū)動(dòng)型的規(guī)則生成機(jī)制可以詳細(xì)表示出數(shù)據(jù)中包含的各種信息,不需要進(jìn)行反復(fù)迭代的參數(shù)學(xué)習(xí)過程也不會(huì)造成組合爆炸問題。但正因?yàn)閿U(kuò)展置信規(guī)則是根據(jù)訓(xùn)練數(shù)據(jù)集得到的,數(shù)據(jù)集的質(zhì)量對(duì)EBRB系統(tǒng)的推理能力影響要更大,相互矛盾、不一致的數(shù)據(jù)容易降低EBRB的推理準(zhǔn)確性。在EBRB中,數(shù)據(jù)的不一致是指兩條或多條規(guī)則的前提屬性取值大致相同,但評(píng)價(jià)結(jié)果卻完全不同或與專家知識(shí)相沖突。
針對(duì)EBRB系統(tǒng)中的數(shù)據(jù)不一致性的問題,Alberto等[22]提出動(dòng)態(tài)規(guī)則激活方法,該方法通過調(diào)整改進(jìn)后的相似性度量公式中的參數(shù)來選擇不一致性最小的激活規(guī)則集合,不過,該方法中用于衡量激活規(guī)則集合不一致性的公式只考慮了規(guī)則數(shù)量對(duì)其的影響,沒有考慮規(guī)則激活權(quán)重對(duì)其的影響。要減小激活規(guī)則集合之間的不一致性,最簡(jiǎn)單的方法就是舍棄部分不一致性較高的激活規(guī)則,這部分激活規(guī)則不參與最終的合成推理過程,但這部分激活規(guī)則可能帶有重要的信息,而且很難確定這部分激活規(guī)則的具體數(shù)量。為了減小激活規(guī)則集合的不一致性同時(shí)保留激活規(guī)則集合中的大部分重要信息,本文提出了基于NSGA-II的擴(kuò)展置信規(guī)則庫(kù)激活規(guī)則多目標(biāo)優(yōu)化方法,將激活規(guī)則的不一致性與激活權(quán)重和分別作為目標(biāo)函數(shù),通過求解多目標(biāo)優(yōu)化問題獲得相對(duì)較優(yōu)的激活規(guī)則集合并用于最終的合成推理。本文首先介紹擴(kuò)展置信規(guī)則庫(kù)和多目標(biāo)優(yōu)化問題的基礎(chǔ)知識(shí),然后介紹如何利用NSGA-II求解Pareto的最優(yōu)解,最后通過非線性函數(shù)問題和輸油管道檢漏實(shí)例對(duì)所提方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,并分析說明所提方法的有效性和可行性。
擴(kuò)展置信規(guī)則庫(kù)由一系列擴(kuò)展置信規(guī)則(extended belief rule)組成,其中第 k條擴(kuò)展置信規(guī)則的表示為
式中: ( A,αk)表示擴(kuò)展置信規(guī)則前件部分的置信分布,可表示成 {(,j=1,2,···,Ji}|i=1,2,···,Tk},Ai,j表 示第i個(gè) 前提屬性的第 j個(gè) 參考值,且第i個(gè)前提屬性的參考值總數(shù)為表示第 k 條 規(guī)則的第i個(gè)前提屬性輸入值相對(duì)該屬性的第 j個(gè) 參考值 Ai,j的置信度, Tk表 示第 k 條 規(guī)則前提屬性總數(shù);δi表 示第i個(gè)前提屬性的屬性權(quán)重; θk表 示第 k條規(guī)則的規(guī)則權(quán)重;j=1,2,···,N;k=1,2,···,L)表 示第 k條規(guī)則第j個(gè)評(píng)價(jià)結(jié)果 Dj的置信度,每條置信規(guī)則的所有評(píng)價(jià)結(jié)果置信度需滿足稱第 k條規(guī)則是完整的,否則稱第 k條規(guī)則是不完整的。
與BRB系統(tǒng)復(fù)雜煩瑣的規(guī)則生成機(jī)制不同,Liu等[21]提出的規(guī)則生成機(jī)制簡(jiǎn)單且有效,可直接將訓(xùn)練數(shù)據(jù)轉(zhuǎn)化為擴(kuò)展置信規(guī)則。假設(shè)Ui(i=1,2,···,Tk)示 第 k 個(gè) 樣本數(shù) 據(jù)的第i個(gè) 前提屬性,其輸入值為 xi,首先決策者或?qū)<倚枰獙⒌趇個(gè)前提屬性的參考值 Ai,j與數(shù)值量建立起對(duì)應(yīng)關(guān)系:
通過式(4)~(6)可得到 αi,j的具體取值從而生成規(guī)則的前件部分,相應(yīng)輸出的評(píng)價(jià)結(jié)果置信分布可采用同樣的方法產(chǎn)生。
1.2.1 激活權(quán)重的計(jì)算
假設(shè)第 i個(gè)前提屬性取值 xi已經(jīng)被表示成式(3)所示的形式,則 xi相 對(duì)第 k 條 規(guī)則的第i個(gè)前提屬性的個(gè)體匹配度可通過兩個(gè)置信分布的距離值來衡量,因?yàn)镋BRB前件部分的置信分布實(shí)質(zhì)上是概率分布,故可借助式(7)所示的歐氏距離來計(jì)算:
第 k條置信規(guī)則的激活權(quán)重可由式(9)得
1.2.2 激活規(guī)則的合成
用證據(jù)推理方法(evidential reasoning, ER)[23]得到推理結(jié)果前,要先按式(10)~(13)計(jì)算評(píng)價(jià)結(jié)果置信度的基本可信值:
式中:n =1,2,···,N。在此基礎(chǔ)上通過ER解析公式[24]計(jì)算評(píng)價(jià)結(jié)果的基本可信值,合成公式如式(14)~(19):
根據(jù)式(14)~(19)可得到式(20)所示的具有置信分布形式的BRB推理輸出:
基于上述ER解析算法,Wang等[25]進(jìn)一步推導(dǎo)出了組合所有的置信規(guī)則的計(jì)算公式,即
Liu等[21]提出的EBRB規(guī)則生成機(jī)制雖然簡(jiǎn)單且有效,但也使得EBRB系統(tǒng)的推理性能容易受訓(xùn)練數(shù)據(jù)的質(zhì)量影響,由于訓(xùn)練數(shù)據(jù)生成的擴(kuò)展置信規(guī)則庫(kù)可能存在不一致的規(guī)則即規(guī)則相互矛盾的問題,這些不一致的規(guī)則會(huì)降低EBRB系統(tǒng)的推理準(zhǔn)確性,尤其當(dāng)這些不一致規(guī)則同時(shí)成為激活規(guī)則。在EBRB中,這些激活權(quán)重大于零的規(guī)則被稱為激活規(guī)則,激活規(guī)則是用來進(jìn)行ER合成推理的,即EBRB系統(tǒng)的推理結(jié)果就是依靠這些激活規(guī)則得到的。由此可見,激活規(guī)則對(duì)于最終推理結(jié)果的重要性,而相互矛盾的、不一致的激活規(guī)則會(huì)對(duì)最終的BRB系統(tǒng)推理結(jié)果造成一定的干擾,進(jìn)而影響B(tài)RB系統(tǒng)的推理能力。為此,Alberto等[22]對(duì)式(8)進(jìn)行改進(jìn),提出動(dòng)態(tài)規(guī)則激活方法,通過不斷重復(fù)的搜索過程以找到不一致性最小的激活規(guī)則集合,該方法能夠有效減小激活規(guī)則之間的不一致性,但其參數(shù)取值需要不斷迭代,而且參數(shù)增加和減小幅度也較難確定。此外,實(shí)際工程應(yīng)用中,訓(xùn)練數(shù)據(jù)總數(shù)都比較多,當(dāng)采用Liu等[21]提出的規(guī)則激活方法時(shí),多數(shù)規(guī)則的激活權(quán)重都會(huì)大于零,激活規(guī)則數(shù)量的增多,意味著規(guī)則間的不一致性增大。要減小激活規(guī)則之間的不一致性,最簡(jiǎn)單的方法就是盡可能多地減少激活規(guī)則的數(shù)量,不一致性較高的這部分激活規(guī)則不參與最終的合成推理過程,但這種方法不一定有效,因?yàn)榧せ钜?guī)則數(shù)量一旦減少,原有激活規(guī)則集合中包含的信息就會(huì)減少,如果這些不參與最終合成推理過程的激活規(guī)則包含了原有激活規(guī)則中絕大部分重要信息,則EBRB的推理準(zhǔn)確性也會(huì)受到一定程度的影響。在EBRB中,激活規(guī)則的激活權(quán)重代表激活規(guī)則的重要性,激活權(quán)重越大,說明該激活規(guī)則越重要,其中包含的重要信息越多。鑒于此,為了減小激活規(guī)則之間的不一致性,同時(shí)保留住原有激活規(guī)則集合的絕大部分重要信息,本文提出激活規(guī)則多目標(biāo)優(yōu)化方法,把激活規(guī)則之間的不一致性以及激活規(guī)則的激活權(quán)重總和作為優(yōu)化目標(biāo),通過NSGA-II來求解較優(yōu)的激活規(guī)則集合用于最終的合成推理。
在實(shí)際應(yīng)用問題中,所求解的優(yōu)化目標(biāo)通常包含多個(gè),且它們之間經(jīng)常是相互矛盾、沖突的。也就是說,對(duì)于這一類問題,幾乎找不到一個(gè)可以同時(shí)滿足所有優(yōu)化目標(biāo)的最優(yōu)解。一個(gè)由m個(gè)決策參數(shù)和n個(gè)目標(biāo)變量組成的多目標(biāo)優(yōu)化問題的數(shù)學(xué)表達(dá)式[26]為
式中: x =(x1,x2,···,xm)表 示 m 維 的決策參數(shù);y=(y1,y2,···,yn)表 示 n 維 的目標(biāo)變量;F(x)=(f1(x),f2(x),···,fn(x))表 示所有的目標(biāo)函數(shù); gi(X)≤0表示所有的不等式約束條件; hi(X)=0表示所有的等式約束條件。
定義 1 (可行解)如果存在一個(gè)決策參數(shù) x它滿足所有不等式約束條件和等式約束條件,則稱 x為可行解。
定義 2 (可行解集合)可行解集合是指所有可行解組成的集合,記作 xf(xf?X)。
定義 3 (Pareto占優(yōu))假設(shè) xA,xB(xA,xB∈Xf)是多目標(biāo)優(yōu)化問題的兩個(gè)可行解,若 xA相 對(duì) xB是Pareto占優(yōu)(或稱 xA支 配 xB, 記作 xA?xB) ,則 xA,xB需要同時(shí)滿足以下兩個(gè)條件:
定義 4 (Pareto最優(yōu)解)若多目標(biāo)優(yōu)化問題的一個(gè)可行解 xC(xC∈Xf)是 Pareto最優(yōu)解,則 xC需要滿足條件 ? ?x∈Xf:x? xC。
2000年Kalyanmoy Deb等[27]首次提出了帶精英策略的快速非支配排序遺傳算法(簡(jiǎn)稱NSGAII),該方法是眾多求解多目標(biāo)優(yōu)化問題方法中應(yīng)用最為廣泛的一種。NSGA-II算法是非支配排序遺傳算法(non-dominated sorting genetic algorithm,NSGA)的改進(jìn),運(yùn)行速度更快,復(fù)雜度更低,且其求解的Pareto最優(yōu)解集收斂性更好。算法首先隨機(jī)產(chǎn)生一定規(guī)模數(shù)量的初始種群,然后利用非支配排序方法對(duì)種群中所有個(gè)體進(jìn)行分層,接著執(zhí)行遺傳算法的選擇、交叉和變異3個(gè)操作產(chǎn)生第一代子群。從第二代子群開始,先將父代種群和子代種群中所有個(gè)體合并在一起,然后利用快速非支配排序方法對(duì)其進(jìn)行分層,并計(jì)算每個(gè)非支配分層中所有個(gè)體的擁擠距離,在此基礎(chǔ)上從中選出較優(yōu)的個(gè)體組成新的父代種群,接著執(zhí)行遺傳算法的選擇、交叉和變異3個(gè)操作產(chǎn)生下一代子群,直至達(dá)到程序結(jié)束條件時(shí)終止,算法的具體流程如圖1所示。
圖1 NSGA-II算法流程Fig. 1 The process of NSGA-II
NSGA-II算法中個(gè)體的優(yōu)劣之分主要由個(gè)體的兩個(gè)屬性取值來決定,一個(gè)是其所在的非支配分層級(jí)別,另一個(gè)是個(gè)體的擁擠距離。前者是通過快速非支配排序方法確定,NSGA-II的快速非支配方法與NSG(A的非) 支配排序(方法)相 比,計(jì)算復(fù)雜度從原先的 O MN3減少至 O MN2(其中 M 為種群大小,M為目標(biāo)函數(shù)的個(gè)數(shù))。計(jì)算處于同一個(gè)非支配分層的個(gè)體擁擠距離之前,需要先對(duì)所有個(gè)體的擁擠距離進(jìn)行初始化,然后根據(jù)目標(biāo)函數(shù)將其按照升序進(jìn)行排序,接著再計(jì)算每個(gè)個(gè)體的擁擠距離。詳細(xì)的快速非支配排序算法以及個(gè)體擁擠距離的計(jì)算過程可參見文獻(xiàn)[27]。
確定完每個(gè)個(gè)體所在的非支配分層級(jí)別以及擁擠距離之后,就可以確定種群所有個(gè)體的優(yōu)劣,假設(shè)其中兩個(gè)個(gè)體 i和 j,其所在非支配分層級(jí)別為irank和 jrank, 擁擠距離為 idistance和 jdistance,如果這兩個(gè)個(gè)體滿足以下兩個(gè)條件中的一個(gè)條件:
則稱個(gè)體i優(yōu) 于 j, 表示成 i?nj。
數(shù)據(jù)驅(qū)動(dòng)型的EBRB規(guī)則數(shù)量等于訓(xùn)練數(shù)據(jù)集數(shù)量,每條置信規(guī)則對(duì)應(yīng)一個(gè)訓(xùn)練數(shù)據(jù),當(dāng)訓(xùn)練數(shù)據(jù)過多時(shí),由式(9)計(jì)算得到的激活規(guī)則數(shù)量也會(huì)比較多,但很多激活規(guī)則之間存在相互矛盾、不一致的情況,這些激活規(guī)則會(huì)對(duì)推理造成一定的干擾。為了減少不一致激活規(guī)則對(duì)EBRB推理準(zhǔn)確性的影響,本文提出基于NSGA-II的激活規(guī)則多目標(biāo)優(yōu)化方法,因此,多目標(biāo)優(yōu)化的兩個(gè)目標(biāo)函數(shù)分別為激活規(guī)則集合的不一致性以及激活權(quán)重和,其中,激活規(guī)則集合的不一致性用Liu等[21]提出的方法來衡量,假設(shè) RP,Rq為擴(kuò)展置信規(guī)則庫(kù)中的兩條規(guī)則,二者的不一致性可通過前提屬性相似度SRA和評(píng)價(jià)結(jié)果相似度SRC來衡量,規(guī)則 p 和 規(guī)則 q的SRA和SRC計(jì)算公式如下:
根據(jù)文獻(xiàn)[21],規(guī)則 p 和 規(guī)則 q之間的一致性可根據(jù)式(26)計(jì)算得到:
那么,第i條規(guī)則的不一致性為
由此可得NSGA-II的優(yōu)化目標(biāo)為
式中:R表示最終參與ER合成推理的激活規(guī)則集合;l表示參與ER合成推理的激活規(guī)則總數(shù)。O(MN);2)NSGA-II算法中非支配排序方法復(fù)雜度O(MN2);3)NSGA-II算法中擁擠距離計(jì)算復(fù)雜度O(MNlogN);4)NSGA-II算法中個(gè)體優(yōu)劣排序復(fù)雜度O(NlogN)。 因此整體復(fù)雜度為O (MN2)。
基于NSGA-II的激活規(guī)則多目標(biāo)優(yōu)化方法具體流程如圖2所示,該方法根據(jù)激活規(guī)則集合的不一致性以及激活權(quán)重和來求解最終參與ER合成推理的激活規(guī)則集合R。本文方法首先計(jì)算每條擴(kuò)展置信規(guī)則的激活權(quán)重,激活權(quán)重大于零的規(guī)則組成激活規(guī)則集合,然后對(duì)激活規(guī)則集合進(jìn)行二進(jìn)制編碼,1表示該激活規(guī)則參與最終ER合成推理過程,0表示該激活規(guī)則不參與ER合成推理,不同的激活規(guī)則集合,其中被標(biāo)識(shí)為1和0的規(guī)則不同,根據(jù)式(27)計(jì)算得到的規(guī)則不一致性以及激活權(quán)重和也不同,故接下來需要利用NSGA-II算法求解最優(yōu)化目標(biāo)(式(28))的Pareto最優(yōu)解集,這些Pareto最優(yōu)解集中編碼為1對(duì)應(yīng)的激活規(guī)則之間的不一致性既要最小同時(shí)激活權(quán)重和也要最大,然后從最優(yōu)解集中選擇一個(gè)合適的Pareto最優(yōu)解,該最優(yōu)解中編碼為1對(duì)應(yīng)的激活規(guī)則組成最終的激活規(guī)則集合并用于ER合成推理得出結(jié)果。本文方法的整體時(shí)間復(fù)雜度包括:1)EBRB系統(tǒng)查詢激活規(guī)則復(fù)雜度
圖2 激活規(guī)則多目標(biāo)優(yōu)化方法Fig. 2 The activated rules multi-objective optimization approach
本文引入非線性函數(shù)和輸油管道檢漏實(shí)例為研究對(duì)象以驗(yàn)證本文方法的有效性。實(shí)驗(yàn)中用到的NSGA-II算法的各個(gè)參數(shù)值分別為:個(gè)體交叉概率為0.9,個(gè)體變異概率為0.03,種群規(guī)模為100,進(jìn)化代數(shù)為1 000。實(shí)驗(yàn)環(huán)境為:Inter(R) Core(TM) i5-4570 CPU @ 3.20 GHz;8 GB 內(nèi)存;Windows 10 操作系統(tǒng);算法實(shí)現(xiàn)平臺(tái)Visual Studio 2010。
為了驗(yàn)證本文方法的有效性,引入一個(gè)非線性函數(shù)作為基準(zhǔn)測(cè)試函數(shù)進(jìn)行測(cè)試以說明本文方法的性能。非線性函數(shù)的數(shù)學(xué)表達(dá)式為
在EBRB系統(tǒng)構(gòu)建中,選取函數(shù)的自變量 x作為前提屬性,并從其定義域中均勻選擇7個(gè)數(shù)值作為其參考值,即 {0 ,0.5,1.0,1.5,2.0,2.5,3.0},然后根據(jù)函數(shù)值設(shè)定評(píng)價(jià)結(jié)果等級(jí)數(shù)及相應(yīng)效用值為{?2.5,?1.0,1.0,2.0,3.0}。 該實(shí)驗(yàn)的測(cè)試數(shù)據(jù)是從 x的定義域中均勻選取的500組數(shù)據(jù),訓(xùn)練數(shù)據(jù)是從 x的定義域中均勻選取的1 000組數(shù)據(jù),因此,構(gòu)建的EBRB系統(tǒng)總共有500條規(guī)則,然后根據(jù)Liu等[21]提出的方法和本文提出的方法構(gòu)建EBRB系統(tǒng),實(shí)驗(yàn)結(jié)果衡量的指標(biāo)為系統(tǒng)的推理輸出和真實(shí)輸出之間的均方誤差(mean squared error,MSE)、激活規(guī)則總數(shù)(Activated_rules)、參與合成推理的激活規(guī)則數(shù)(ER_rules),實(shí)驗(yàn)結(jié)果如表1所示。
表1 非線性函數(shù)問題實(shí)驗(yàn)結(jié)果Table 1 The results on nonlinear function
從表1可以發(fā)現(xiàn),NSGA-II_EBRB系統(tǒng)的推理準(zhǔn)確性要比Liu_EBRB系統(tǒng)的推理準(zhǔn)確性高,這主要是因?yàn)長(zhǎng)iu_EBRB系統(tǒng)中用來參與ER合成推理的規(guī)則是所有激活權(quán)重大于零的激活規(guī)則,這部分規(guī)則的不一致性較高且會(huì)降低EBRB系統(tǒng)的推理能力,而NSGA-II_EBRB通過減少激活規(guī)則的不一致性,選擇不一致性更小同時(shí)擁有原來激活規(guī)則中絕大部分信息的激活規(guī)則進(jìn)行ER合成推理,最終合成推理的激活規(guī)則數(shù)只占原來激活規(guī)則總數(shù)的49.89%,這些激活規(guī)則不一致性較低,從而提高EBRB系統(tǒng)的推理能力。
為了驗(yàn)證本文所提方法的有效性,引入一個(gè)具體的實(shí)際問題——輸油管道泄漏問題[7]作為實(shí)例。該實(shí)例的研究對(duì)象為安裝在英國(guó)的一條1 000多米長(zhǎng)的輸油管道,當(dāng)輸油管道發(fā)生泄漏時(shí),管道的泄漏大小(leak size,LS)會(huì)隨輸油管道輸入輸出的流量差(flow difference,F(xiàn)D)和輸油管道內(nèi)的平均壓力差(pressure difference,PD)變化而變化,因此,該實(shí)例的EBRB系統(tǒng)的前提屬性為FD和PD,結(jié)果屬性為L(zhǎng)S。其中FD、PD的參考值由專家根據(jù)經(jīng)驗(yàn)給出,分別為 {? 10,?5,?3,0,1,2,3}和 {?0.042,?0.025,?0.01,0,0.01,0.025,0.042},LS的評(píng)價(jià)等級(jí)為零、很小、中、高、很高,其數(shù)值效用值為 {0 ,2,4,6,8}。
該實(shí)驗(yàn)的測(cè)試數(shù)據(jù)是發(fā)生泄漏的2 008組數(shù)據(jù),訓(xùn)練數(shù)據(jù)按照一定比例分別從3個(gè)時(shí)間段隨機(jī)選取500組數(shù)據(jù),因此構(gòu)建的EBRB系統(tǒng)總共有1 500條規(guī)則,然后利用本文提出的方法構(gòu)建NSGAII_EBRB系統(tǒng),并將實(shí)驗(yàn)結(jié)果和Liu_EBRB系統(tǒng)相比較,衡量的指標(biāo)為平均絕對(duì)誤差(mean absolute difference,MAE)。
Liu_EBRB系統(tǒng)、NSGA-II_EBRB系統(tǒng)產(chǎn)生的推理輸出和測(cè)試數(shù)據(jù)的真實(shí)輸出對(duì)比如圖3、4所示。分析圖3、4可以發(fā)現(xiàn),Liu_EBRB系統(tǒng)在PD∈[–0.02,0.04],FD∈[–10,0]附近產(chǎn)生的推理輸出和測(cè)試數(shù)據(jù)的真實(shí)輸出有較大差距,尤其是PD∈[–0.02,0],FD∈[–10,5]附近的數(shù)據(jù)。而NSGA-II_EBRB系統(tǒng)推理輸出總體上和真實(shí)輸出相接近。這是因?yàn)?,本文方法減少了不一致規(guī)則對(duì)于推理結(jié)果的影響,從而進(jìn)一步提高了算法的推理性能。
圖3 Liu_EBRB輸出和真實(shí)輸出Fig. 3 Liu_EBRB output and real output
為了進(jìn)一步驗(yàn)證本文方法的有效性和可行性,表2列出了Liu_EBRB系統(tǒng)、BK_EBRB系統(tǒng)和NSGA-II_EBRB系統(tǒng)產(chǎn)生的推理輸出和測(cè)試數(shù)據(jù)的真實(shí)輸出的MAE值,其中BK_EBRB系統(tǒng)是指根據(jù)文獻(xiàn)[28]中的方法構(gòu)建的EBRB系統(tǒng)。如表2所示,和Liu_EBRB系統(tǒng)的MAE相比,NSGA-II_EBRB系統(tǒng)比Liu_EBRB系統(tǒng)的MAE值減小了61.61%;和BK_EBRB系統(tǒng)相比,NSGA-II_EBRB系統(tǒng)要比BK_EBRB(theta=0.7)的MAE值減小56.92%;和BK_EBRB(theta=0.4)的MAE值相差無幾。
圖4 NSGA-II_EBRB輸出和真實(shí)輸出Fig. 4 NSGA-II_EBRB output and real output
表2 輸油管道泄漏實(shí)例實(shí)驗(yàn)結(jié)果Table 2 The results on pipeline leak detection
數(shù)據(jù)驅(qū)動(dòng)型的擴(kuò)展置信規(guī)則庫(kù)系統(tǒng)易受數(shù)據(jù)質(zhì)量的影響,其推理能力常因不一致的數(shù)據(jù)而降低。因此,本文提出基于NSGA-II的擴(kuò)展置信規(guī)則庫(kù)激活規(guī)則多目標(biāo)優(yōu)化方法,通過NSGA-II來求解不一致性更小的激活規(guī)則集合,該方法既篩選出了不一致性更小的激活規(guī)則,同時(shí)又保留了原來激活規(guī)則集合中絕大部分信息,這些最終參與ER合成推理的激活規(guī)則一致性更高,更具代表性,能有效提高EBRB系統(tǒng)的推理能力。然而,本文方法還有許多需要改進(jìn)的地方,如何從Pareto最優(yōu)解集中選擇一個(gè)最合適的解,如何減少算法的復(fù)雜度等,這些都是將來的研究工作重點(diǎn)。