孫愛玲,張春英,王立亞,王志江
(華北理工大學 理學院, 河北 唐山 063009)
?
決策區(qū)間概念格的粗糙控制規(guī)則挖掘模型與應用
孫愛玲,張春英,王立亞,王志江
(華北理工大學 理學院, 河北 唐山 063009)
粗糙控制;決策區(qū)間概念格;屬性離散化;決策規(guī)則挖掘
融合區(qū)間概念格的結構特征和粗糙控制規(guī)則的實際需求,將一般區(qū)間概念格改造為決策區(qū)間概念格,并構建基于決策區(qū)間概念格的粗糙控制規(guī)則挖掘模型,以實現(xiàn)粗糙控制中挖掘成本和控制效率的整體最優(yōu)。首先,運用粗糙集理論對粗糙控制數(shù)據(jù)進行預處理,使其轉(zhuǎn)化成布爾型的形式背景表,并構建符合粗糙控制實際的決策區(qū)間概念格;其次,構建了決策區(qū)間概念格的控制規(guī)則挖掘模型,并對冗余規(guī)則進行分析判斷,形成最終的粗糙控制決策規(guī)則庫。分析結果表明:模型在提高規(guī)則可靠性的前提下,實現(xiàn)了粗糙控制成本與效率的最優(yōu)化目標;最后,將模型應用到水庫調(diào)度的決策規(guī)則挖掘中,驗證了模型的可行性與高效性。
粗糙控制是應用粗糙集方法從控制行為的數(shù)據(jù)中獲取控制規(guī)則,然后利用這些規(guī)則設計智能控制器從而實現(xiàn)對系統(tǒng)實施控制的過程,是一種新型的智能規(guī)則控制方法[1]。規(guī)則決定了控制者對控制行為做出的決策,因此,規(guī)則提取是智能控制中至關重要的環(huán)節(jié),規(guī)則的精度直接影響著控制的效率和準確度。
本文將決策區(qū)間概念格應用到粗糙控制規(guī)則的挖掘過程中,以期實現(xiàn)規(guī)則挖掘成本、應用效率與可靠性的整體最優(yōu)。首先,通過粗糙集的理論對數(shù)據(jù)進行離散化、歸一、合并等處理,將原始的數(shù)據(jù)轉(zhuǎn)化為布爾型的形式背景表,構建與粗糙控制實際背景相匹配的決策區(qū)間概念格;將決策區(qū)間概念格的控制規(guī)則挖掘算法應用到粗糙控制中,建立了基于決策區(qū)間概念格的粗糙控制模型,通過分析表明,模型實現(xiàn)了規(guī)則挖掘成本與效率的最優(yōu)化目標,并通過實例驗證了該模型設計的合理性。
1.1 基本概念
定義1 對于決策形式背景(U,C×D,R),RL(U,C×D,R)是其誘導的決策區(qū)間概念格,(M,N,Y)是RL(U,C×D,R)上的決策區(qū)間概念。設有區(qū)間[α,β](0αβ1)則α上界外延Mα、β下界外延Mβ分別為:Mα={x|x∈M,|f(x)∩Y/|Y|≥α,0α1}Mβ={x|x∈M,|f(x)∩Y/|Y|≥β,0αβ1}式中,C是條件屬性集,D是決策屬性集,Y是概念的內(nèi)涵,其中Y=C′∪D′,C′?C,D′?D,若Y≠φ則D′≠φ,稱C′為C的子條件屬性集,D′為D的子決策屬性集,f(x)是定義的算子,是集合Y中包含元素個數(shù),即基數(shù)。Mα表示可能被Y中至少α×|Y|個內(nèi)涵屬性所覆蓋的對象,Mβ表示可能被Y中至少β×|Y|個內(nèi)涵屬性所覆蓋的對象。
定義 2 設形式背景(U,C×D,R),三元序偶(Mα,Mβ,Y)稱為決策區(qū)間概念,其中,Y為內(nèi)涵,由條件內(nèi)涵和決策內(nèi)涵兩部分構成,是決策概念的描述;Mα為α上界外延;Mβ為β下界外延。
G1G2?C1?C2,如果不存在,使得G1G3G2,則G2是G1的父結點(直接前驅(qū)),G1是G2的子結點(直接后繼)。
1.2 決策區(qū)間規(guī)則
1.3 決策區(qū)間概念格的構建
算法:決策區(qū)間概念格建格算法。
輸入:決策形式背景(U,C×D,R)。
步驟:
(1)設定α、β,確定決策區(qū)間概念內(nèi)涵,生成初始化的概念節(jié)點集G。
(2)確定α上界外延集Mα和β下界外延集Mβ。
(3)形成格結構。對節(jié)點集合G,按照前驅(qū)后繼關系確定結點的層次及父子關系,根據(jù)父子節(jié)點的獨特性質(zhì)自下而上漸進式地生成決策區(qū)間概念格結構。
1.4 決策區(qū)間規(guī)則挖掘算法
在已設定的α、β參數(shù)值的前提下,對上述構建的決策區(qū)間概念格進行控制規(guī)則的挖掘,通過對參數(shù)值的調(diào)整,規(guī)則庫不斷更新優(yōu)化,提取的規(guī)則更具高效性,從而為決策者提供更優(yōu)的決策。具體描述如下:
算法:區(qū)間規(guī)則挖掘算法。
輸出:決策區(qū)間規(guī)則。
(3)對規(guī)則集Diset的每一條規(guī)則,分別求其粗糙度和屬性貢獻度,根據(jù)粗糙度和屬性貢獻度的大小,判斷精確性和可靠性,提取更優(yōu)的規(guī)則,即去除冗余規(guī)則,得到最終的控制決策規(guī)則集Disset。
2.1 模型設計
采用規(guī)則庫中的最簡決策規(guī)則來實現(xiàn)粗糙控制,實際上是在規(guī)則庫中查詢具有相同或者相似條件屬性的決策規(guī)則,將其用于粗糙控制。運用決策區(qū)間概念格挖掘粗糙控制決策可得到一組決策區(qū)間規(guī)則,其挖掘模型如圖1所示。
圖1 決策規(guī)則獲取流程
基于決策區(qū)間概念格的粗糙控制規(guī)則挖掘模型的最突出優(yōu)點是在保證規(guī)則可靠性的同時,使規(guī)則庫的規(guī)模與挖掘成本之間達到整體最優(yōu),其最優(yōu)性取決于對區(qū)間參數(shù)的設置,區(qū)間參數(shù)決定了所構造的決策區(qū)間概念格的結構,進而影響著區(qū)間關聯(lián)規(guī)則的數(shù)量和精確度。采用決策區(qū)間概念格的決策規(guī)則獲取方法,實現(xiàn)了挖掘成本與效率的最優(yōu)化。具體步驟如下:
第1步,原始數(shù)據(jù)采集與預處理,得到?jīng)Q策表。
(1)根據(jù)實際的粗糙控制背景,將觀測量和控制量分別作為條件屬性和決策屬性。記錄下調(diào)度人員對代表性狀態(tài)采取的控制策略,形成原始決策表;
(2)工業(yè)控制中的數(shù)據(jù)在大部分情況下都是連續(xù)取值的,采用決策區(qū)間概念格進行控制規(guī)則挖掘時,必須將連續(xù)變量離散化。借助工業(yè)過程的背景知識進行離散化,并用數(shù)字標記各離散區(qū)間 ;
(3) 利用粗糙集理論的方法對數(shù)據(jù)進行約簡、合并等處理,得到處理后的原始決策表。
第2步,構建布爾型的決策形式背景表。
(1)由上一步得到的初始決策表中各屬性的出現(xiàn)情況,標記屬性并構建屬性集合,其中集合元素的下標為標記數(shù)字,例如把某一屬性標記為A,表中出現(xiàn)的標記數(shù)字為2、3、4,則該屬性集合為A={a2,a3,a4};
(2)由得到的相應屬性集合,構建布爾型的決策形式背景表。
第3步,設定α、β,運用2.3的算法構建與實際粗糙控制背景相匹配的決策區(qū)間概念格。
第4步,運用2.4中的算法提取粗糙控制決策區(qū)間規(guī)則。
第5步,計算規(guī)則的粗糙度與屬性貢獻度,結合粗糙度與屬性貢獻度以及粗糙控制的實際成本去除冗余規(guī)則,以得到應用效率與可靠性整體最優(yōu)的粗糙控制規(guī)則庫。
在決策區(qū)間概念格構建的過程中,內(nèi)涵由條件屬性和決策屬性共同構成,因此,提取出的規(guī)則意味著對于不同的規(guī)則采取相同的措施,都能達到預期的效果。也就是說,在能接受的范圍內(nèi),對于同樣的控制操作有了多重選擇,提高了控制的高效性。將其應用于粗糙控制,可以根據(jù)具體的條件屬性實現(xiàn)所需的成本來權衡各規(guī)則,最終獲取最優(yōu)控制規(guī)則。
2.2 模型分析
決策區(qū)間概念格外延是具備一定數(shù)量或比例的內(nèi)涵中屬性的對象集合,由此挖掘出的規(guī)則更具針對性,在規(guī)則提取后去除了冗余,提高了規(guī)則的可靠性和控制的高效性。傳統(tǒng)的粗糙控制規(guī)則提取過程中,決策信息表的建立、連續(xù)量的離散化、決策表的完備化、決策規(guī)則的去離散化、決策規(guī)則的一致性等一系列問題的解決,時間復雜度較之更大,挖掘成本高。該模型在保證規(guī)則可靠性的前提下,提高了粗糙控制規(guī)則的挖掘精度和控制效率,達到了規(guī)則挖掘成本、應用效率與可靠性的整體最優(yōu)。
水庫是一個復雜的系統(tǒng),根據(jù)水庫運行特點進行水庫調(diào)度,使現(xiàn)有工程發(fā)揮最大效益,越來越受到重視。在本實例中,甲水電站是個以發(fā)電為主的前提下,發(fā)電與防洪同時并舉的大型水電站,甲水電站上游的乙水電站對甲水電站的調(diào)度起到很大影響,對水庫調(diào)度的決策規(guī)則進行挖掘,具體步驟如下:
(1)原始數(shù)據(jù)采集與預處理。
分析甲水電站的具體情況,將影響電站調(diào)度的主要因素所選取的觀測量形成條件屬性集,控制變量組成決策屬性集。
取乙水電站放流量,甲、乙區(qū)間的自然徑流狀態(tài)組成條件屬性集,一個控制變量水電站日平均發(fā)電量組成決策屬性集,對其中的連續(xù)屬性值進行離散化處理,具體過程如下:
條件屬性:a-乙水電站放流量,b-區(qū)間自然徑流狀態(tài),決策屬性:d-水電站日平均發(fā)電量。
a—離散化的乙水電站放流量屬性集表示范圍(m3/s)
b—離散化的區(qū)間自然徑流狀態(tài)屬性集表示范圍
1-枯; 2-中; 3-豐;
d—離散化的水電站日平均發(fā)電量屬性集表示范圍(kWh/d)
對調(diào)度人員從1~6月份采取的調(diào)度措施進行記錄并構成原始數(shù)據(jù)表,合并相同的決策,得到如表1所示的原始數(shù)據(jù)表。
表1 原始數(shù)據(jù)表
(2)構建水庫調(diào)度的決策形式背景表。根據(jù)表1所示的數(shù)據(jù)進行屬性的標記并構建屬性集合,得到A={a2,a3,a4},B={b1,b2,b3},D={d2,d3,d4},其中屬性下標表示表1中相應的屬性編號。最終,得到?jīng)Q策形式背景表,如表2所示。
表2 決策形式背景表
(3)構造水庫調(diào)度背景下的決策區(qū)間概念格。對表2所示的決策形式背景,設α=0.4,β=0.8,確定由條件屬性和決策屬性兩部分組成的概念內(nèi)涵,α上界外延Mα和β下界外延Mβ,根據(jù)定義得出如表3所示的決策區(qū)間概念。由文獻[9]的構造算法得到如圖2所示的決策區(qū)間概念格。
表3 決策區(qū)間概念
圖2 水庫調(diào)度的決策區(qū)間概念格
(4)根據(jù)決策區(qū)間概念格的決策規(guī)則挖掘算法提取水庫調(diào)度的控制規(guī)則。
在設定α=0.4,β=0.8前提下,廣度遍歷決策區(qū)間概念格中所有的概念結點,由于決策概念結點的條件屬性基數(shù)滿足αβ,因此得到?jīng)Q策概念結點集合
Dcset={F3,F4,F5,F6,F11,F12,F14,F17,F18,F19,F21,F22,F25,F28,F30},根據(jù)集合中的每一個結點內(nèi)涵生成相應的規(guī)則后,分別計算其粗糙度與屬性貢獻度,Diset中所有關聯(lián)規(guī)則的粗糙度和屬性貢獻度如表4所示。
表4 決策區(qū)間規(guī)則
(5)水庫調(diào)度的規(guī)則庫構建與優(yōu)化
根據(jù)粗糙度與屬性貢獻度,進行冗余規(guī)則的去除,例如,規(guī)則a2?d3與a3?d3相比,在屬性貢獻度相同的前提下,由于前者規(guī)則粗糙度比后者低,規(guī)則相對更精確,因此,后者可認為是冗余,由此操作,最終可得到規(guī)則集Disset。從粗糙控制實際意義下的成本考慮,進行二次冗余規(guī)則的去除,最終獲取的規(guī)則組成的集合即為所要得到的粗糙控制規(guī)則庫。在二次去除冗余規(guī)則時,例如,規(guī)則a2?d2與a3?d2,在粗糙度與屬性貢獻度都相同的前提下,條件屬性a3跟a2相比,達到要求所需的成本相對較高,因此,后者規(guī)則被認為是冗余規(guī)則。經(jīng)過二次冗余規(guī)則的去除,最終得到的規(guī)則組成的集合即為所要求的規(guī)則庫。粗糙控制規(guī)則庫為{a2?d2,b1?d2,a2b1?d2,a3b1?d2,a1?d3,b2?d3,a1b3?d3,a2b3?d3,a3b2?d3}隨著參數(shù)的不斷調(diào)整,規(guī)則庫也在不斷地發(fā)生變化,獲取的規(guī)則精度更高,效率更大,實現(xiàn)了挖掘成本與效率的整體最優(yōu)。
在水庫調(diào)度實例中,對于提取出的規(guī)則,采取相同的決策,都可以達到同等的效果。因此,在粗糙控制實際應用中,可以根據(jù)各條件屬性中成本需求、能源消耗等相關因素權衡各規(guī)則,從而獲取最優(yōu)控制規(guī)則。
(1)本文提出了基于決策區(qū)間概念格理論的粗糙控制規(guī)則挖掘模型。從初始的數(shù)據(jù)預處理到以粗糙控制為背景的決策區(qū)間概念格的構造,再到?jīng)Q策控制規(guī)則的提取,對模型進行了詳細的設計。模型分析總結了該模型的兩大主要部分,構建概念格與規(guī)則挖掘,與傳統(tǒng)的粗糙控制方法相比,突出了模型建立的可靠性與高效性,并通過實例進一步驗證了模型的可行性。
(2)由于決策區(qū)間概念的外延是由區(qū)間參數(shù)α和β所決定的,區(qū)間參數(shù)的變化會影響區(qū)間概念和區(qū)間概念格結構,進而會對決策區(qū)間規(guī)則的數(shù)量和精確度產(chǎn)生影響。因此,如何通過參數(shù)優(yōu)化來獲得最優(yōu)決策規(guī)則是后續(xù)要研究工作的重要內(nèi)容。
[1]潘愛先,高赟.粗糙控制中面臨的問題[J].中國海洋大學學報,2009,39(6):1315-1320.
[2]董威,王建輝,顧樹生.基于可變精度粗糙集理論的規(guī)則獲取算法[J].控制工程,2007,14(1):73-75.
[3]官禮和,王國胤,胡峰.一種基于屬性序的決策規(guī)則挖掘算法[J].控制與決策,2012,27(2):313-316.
[4]黃加增.基于粗糙概念格的屬性約簡及規(guī)則獲取[J].軟件,2011,32(10):16-23.
[5]Liu Baoxiang,Hao Shasha. Optimal design of weigh for networks based on rough sets[C]. Lecture Note in Computer Science,2011,7030:521-528.
[6]James F.Peters, Andrzej Skowron, Zbigniew Suraj. An Application of Rough Set Methods in Control Design[J].Fundamenta Informaticae,2011,43(1): 269-290.
[7]Wang Haifang,Rong Yu,Wang Tao.Rough control for hot rolled laminar cooling[C].International Conference on Industrial Mechatronics and Automation,2010.
[8]劉保相,張春英. 一種新的概念格結構——區(qū)間概念格[J].計算機科學2012,39(8):273-277.
[9]張春英,王立亞. 基于屬性集合冪集的區(qū)間概念格 的漸進式生成算法[J]. 計算機應用研究,2014,31(3):731-734.
Rough Control Rule Mining Model Based on Decision Interval Concept Lattice and Its Application
SUN Ai-ling, ZHANG Chun-ying, WANG Li-ya, WANG Zhi-jiang
(College of Science, North China University of Science and Technology, Tangshan Hebei 063009,China)
rough control; decision interval concept lattice; attribute discretization; decision rule mining
Fusing the structure feature of interval concept lattice and the actual needs of the rough control rules, the general interval concept lattice is transformed into decision interval concept lattice, and building a rules mining model of rough control based on decision interval concept lattice, in order to achieve the optimal overall in rough control mining cost and control efficiency. Firstly, The model preprocess the collected original data , which is transformed into the Boolean formal context form, and construct the decision interval concept lattice in rough control; secondly, establishing the control rules of decision interval concept lattice algorithm, and analyzing and judging the redundant rules, form a rough control association rule base in end. Analysis shows that under the premise of improving the reliability of the rules, the model has achieved the rough control optimization goal of its cost and efficiency. Finally, the model is applied to the reservoir scheduling of decision rules mining, verifying its feasibility and efficiency.
2095-2716(2016)01-0053-07
2015-10-27
2015-12-15
國家自然科學基金項目:(61370168,61472340)。
TP273+.4
A