鈔娜,萬仁霞*,苗奪謙
(1.北方民族大學 數學與信息科學學院,寧夏 銀川 750021;2.同濟大學 電子與信息工程學院,上海 201804)
粗糙集理論[1]是由波蘭數學家Pawlak在1982年提出的理論,是繼概率論、模糊集、證據理論之后的又一個處理不確定性或不一致信息的有效數學工具,能有效地分析不精確、不一致、不完整等不完備的信息,還可以對數據進行分析和推理,從中發(fā)現隱含的知識,揭示潛在的規(guī)律,因此被廣泛應用于知識依賴性發(fā)現、數據挖掘[2]、機器學習[3]、決策分析[4]、醫(yī)療診斷[5]等問題。直覺模糊的概念是處理不精確或不完備信息的另一個重要概念,由Atanassov[6]提出,是Zadeh模糊集[7]的推廣。直覺模糊集同時考慮隸屬度、非隸屬度和猶豫度三個方面,比模糊集更具靈活性與實用性。
經典粗糙集模型作為一種有效的粒度計算模型,定義在經典的等價關系和等價類的基礎上,一般只適用于處理名義型數據,卻不能直接處理數值型數據。為了解決這類問題。一些學者從對象關系的角度突破等價類的限制,來拓展粗糙集模型。例如,Skowron等[8]把粗糙集的等價關系弱化為相容關系,提出了相容粗糙集模型,研究出了公差近似空間;費穎[9]依據偏序關系性質,建立了偏序粗集模型;Slow?inski等[10]提出了優(yōu)勢粗糙集,通過梯度優(yōu)勢關系建立偏好關系的粗略近似,能有效處理帶有偏好關系的屬性及不完備、不一致信息決策問題;Lin等[11]給出了鄰域的概念,通過空間中點的鄰域?;撚颍绵徲蛳到y(tǒng)來研究近似算子,來描述空間中的其他概念。Yao[12]和Wu等[13]分別提出并研究了l-step鄰域和k-step鄰域信息系統(tǒng)的性質。還有一部分學者用其他不確定理論來改造粗糙集模型。Dubois等[14]將模糊集理論與粗糙集結合起來,提出了一種模糊粗糙集。胡清華等[15]將鄰域的概念結合到粗糙集理論中,提出了鄰域粗糙集,是一種基于覆蓋的集合模型。Zhou等[16]將直覺模糊集與粗糙集結合,提出了直覺模糊粗糙集。文獻[17-19]研究了基于優(yōu)勢關系的粗糙集方法,用于解決多屬性決策問題。文獻[20]運用用直覺模糊關系,系統(tǒng)構建具備概率、多粒度、雙論域的多粒度概率粗糙集,即多粒度雙論域直覺模糊概率粗糙集。
模型的拓展為粗糙集的廣泛應用提供了堅實的基礎,然而,隨著數據規(guī)模的不斷增長以及數據形式的日趨復雜,一些特殊的信息處理現實需求給現有的粗糙集模型帶來了巨大的挑戰(zhàn)。因此,進一步開展粗糙集的分析和探討,為粗糙集引入必要的拓展要素,增強模型的強健性、可靠性,對于推動信息的智能處理具有重要的理論意義和應用價值。本文研究在直覺模糊信息系統(tǒng)中優(yōu)勢關系下的鄰域粗糙集模型的構建問題,提出了基于優(yōu)勢關系下的鄰域粗糙集模型,并研究該模型的相關性質。本文所提出的粗糙集模型將直覺模糊集的思想與鄰域粗糙集結合起來,從直覺模糊集的角度去構造鄰域粗糙集的鄰域,使得同一鄰域內的對象之間具有更精確的相似性刻畫,在此基礎上構建基于優(yōu)勢關系的鄰域粗糙集模型,是粗糙集模型的有效補充和拓展。
本節(jié)簡要回顧直覺模糊集,鄰域粗糙集的相關基礎知識。
定義1[6]設U是一個非空有限論域,U上的一個直覺模糊集A定義為A={x,μA(x),νA(x)|x ∈ U},其中 μA(x),νA(x)表示U中的元素x屬于直覺模糊集A的隸屬度和非隸屬度,且 ?x∈U,0≤μA(x)+νA(x)≤1,μA:U →[0,1]和 νA:U →[0,1]分別表示在 A 上的隸屬函數和非隸屬函數。πA(x)=1?μA(x)?νA(x)。表示U對集合A的猶豫度,顯然πA(x)∈[0,1]。 對任意x∈U,稱 A(x)=(μA(x),νA(x))是U在集合A下的直覺模糊數。U上的所有直覺模糊集的全體記作IFS(U)。
不失一般性,常用a=(μ,ν)來表示直覺模糊數,則0≤μ≤1,0≤ν≤1且μ+ν≤1。
定義 2[21]設 a1=(μ1,ν1),a2=(μ2,ν2)。 為2個直覺模糊數,則 a1≤a2當且僅當 μ1≤ μ2且ν1≥ ν2。
文獻[6]給出了直覺模糊集上的運算定義。
設
(6) A?B=A∩~B。其中,"~"表示補集合。
定義3[15]設U是一個非空有限論域,U上的一個鄰域關系N,我們稱(U,N)為鄰域近似空間。
給定集合 U={x1,x2,…,xn},條件屬性集B?N,Δ表示距離函數,對于U上的任意樣本xi,δ鄰域信息顆粒在條件屬性集B中定義如下:
對于 ?x1,x2,x3∈U,距離函數 Δ 滿足如下關系:
1) Δ(x1,x2)≥ 0,Δ(x1,x2)=0,當 且 僅 當x1=x2;
2) Δ(x1,x2)= Δ(x2,x1);
3) Δ(x1,x3)≤ Δ(x1,x2)+ Δ(x2,x3)。
對于?X?U,在(U,N)中關于X的上下近似算子分別表示為:
定義4[15]對于n個屬性的樣本,距離一般用閔可夫斯基距離來表示,定義如下:
其中f(x,b)表示樣本x在屬性b上的取值。在模式識別中廣泛使用的距離度量函數有三種:
當p=1時,為曼哈頓距離;
當p=2時,為歐式距離;
當p=3時,為切比雪夫距離。
在本文中我們選取的距離函數為歐氏距離,即:在條件屬性集 B={b1,b2,…,bn}下,樣本x1與x2之間的距離如下:
本節(jié)給出基于距離函數定義直覺模糊矩陣以及直覺模糊矩陣的δ-截陣,同時給出鄰域類、優(yōu)勢類、優(yōu)勢鄰域類以及直覺模糊鄰域粗糙集的上下近似定義和基于優(yōu)勢關系的直覺模糊鄰域粗糙集的上下近似定義。
在本文中對于n個屬性的多個樣本,基于上述歐式距離函數和直覺模糊信息的理論,給出如下定義。
定義5 設U是一個非空有限論域,A={x,μA(x),νA(x)|x ∈ U}為 U上的一個直覺模糊集,其中μA(x),νA(x)表示U中的元素x屬于直覺模糊集A的隸屬度和非隸屬度,稱矩陣K為n×n直覺模糊矩陣:
對于任意 δ ∈[0,1],稱 Kδ=ΔB(i,j)δ是直覺模糊矩陣K的δ-截陣,其中:
顯然,δ-截陣Kδ為布爾矩陣。
結合定義3和定義5可知,在δ的某一取值下,xi的鄰域類如下:
定義6 稱I={U,B,V,f}為直覺模糊信息系 統(tǒng) ,其 中 U={x1,x2,…,xn}是 非空有限論域 ,B={b1,b2,…,bn}是非空有限條件屬性集,f:U×B→V×V,即?b∈B,x∈U, f( )x,b ∈V×V,V是不同對象在不同屬性下的值域。
關于優(yōu)勢關系下的直覺模糊鄰域粗糙集,其上下近似以及優(yōu)勢關系下的優(yōu)勢鄰域類具有下述重要性質:
命題1 I={U,B,V,f}是直覺模糊信息系統(tǒng) ,對于條件屬性子集 B1?B2?B,?X?U。有
優(yōu)勢關系下的直覺模糊鄰域粗糙集關于集合的交、并、補等基本運算,有以下重要結論。
命題2 I={U,B,V,f}是直覺模糊信息系統(tǒng),對于條件屬性子集B1?B,?X?U。有
近似精度和粗糙度是刻畫粗糙集不精確性和不完備性的兩個重要指標[22-23]。結合優(yōu)勢鄰域類特點,優(yōu)勢關系下直覺模糊鄰域粗糙集的近似精度和粗糙度定義如下:
定義9 直覺模糊信息系統(tǒng)I={U,B,V,f}中,對于?X?U,條件屬性b∈B,則在條件屬性b下X的近似精度與粗糙度分別為:
近似精度越高,粗糙度相應就也低,代表模型給出的結果越精確,越有效。
例1 給出直覺模糊信息系統(tǒng)如下,表1是完備的直覺模糊信息表論域U={x1,x2,…,x6},條件屬性B={b1,b2,…,b4},在實際問題中,可以表示對象的評分指標,表中的各個條件屬性值的直覺模糊數可以表示為評審員對對象的各個指標的滿意度與不滿意度,這里取目標集X={x3,x4,x5},?X ? U。
為便于研究,取δ=0.1,Δi表示在第i個屬性下對象之間的鄰域矩陣,首先計算各個屬性下的鄰域矩陣 K1,K2,K3,K4。
根據以上4個鄰域類矩陣,可以得到各個屬性的鄰域類如下表,其中,其余類似給出如表2所示。
根據定義6,可得各個屬性的優(yōu)勢類,例[x2]≤b1={x2,x3,x5},其余如下表 3。
根據上下近似定義可知X的上下近似:
近似精度:
粗糙度:
粗糙集模型的拓展研究是增強其可靠性的重要手段。本文基于優(yōu)勢關系,將直覺模糊思想融入到鄰域粗糙集中, 構建了一種新的鄰域粗糙集模型,得到了新模型的上下近似、優(yōu)勢鄰域類、集合的基本運算等性質。文中將直覺模糊集的思想與粗糙集的上下近似概念結合起來,從直覺模糊集的角度去構造鄰域粗糙集的鄰域,使得同一鄰域內的對象之間具有更精確的相似性刻畫。新粗糙集模型融合了直覺模糊集合和鄰域粗糙集的優(yōu)點,是粗糙集理論模型的有效補充和拓展,具有一定的理論研究與應用價值。
大數據是當前海量數據構成的主體,而多粒度數據分析又是大數據研究領域中的重要課題[24], 研究模型在多粒度數據分析下的拓展形式及相關性質是我們下一步工作的主要內容。