劉曉麗 劉毅娟 雷 鳴 何 旸
(華北理工大學(xué)冀唐學(xué)院 河北唐山 063000)
淺談粒度計(jì)算模型
劉曉麗 劉毅娟 雷 鳴 何 旸
(華北理工大學(xué)冀唐學(xué)院 河北唐山 063000)
近年來,人們開始將粒度計(jì)算應(yīng)用到數(shù)據(jù)挖掘領(lǐng)域中,并初步取得了一些成果,成為當(dāng)前數(shù)據(jù)挖掘領(lǐng)域一個(gè)新的研究方向。本文研究了模型中的粒度計(jì)算,淺談了幾類粒度計(jì)算模型。
數(shù)據(jù)挖掘 粒度計(jì)算 粒度計(jì)算模
1979年,美國數(shù)學(xué)家Zadeh在模糊集合論的基礎(chǔ)上,首次提出并討論了模糊信息?;瘑栴},推動(dòng)了模糊邏輯理論及其應(yīng)用的發(fā)展,但當(dāng)時(shí)未引起普遍的重視。1985年,Hobbs提出一種粒度理論,在人工智能中將一個(gè)表示待求解的整體問題的邏輯公式用粒度理論方法分解成若干個(gè)小問題或子公式,然后分別對(duì)這些子公式求解并最后合并成整體公式的解。Hobbs在文中提出的這個(gè)模型實(shí)質(zhì)上是把較大的整體粒度拆成較小的局部粒度,反過來又從較小的粒度合并成整體粒度解,但該文只是提出了這個(gè)模型的假設(shè),并沒有給出粒度計(jì)算的規(guī)則,只是用謂詞或函數(shù)項(xiàng)定義了粒度和劃分粒度。T.Y.Lin等人于1997年正式提出粒度計(jì)算概念,隨后,在短短的幾年里,人們?cè)诟鱾€(gè)不同的角度中廣泛研究粒度計(jì)算,但更多的還是從模糊集和粗糙集方面入手,目前粒度計(jì)算都是和這些學(xué)科結(jié)合起來,沒獨(dú)立成形。
1.粒度計(jì)算定義
L.A.Zadeh提出了人類認(rèn)知的三個(gè)基本概念:?;╣ranulation)、組織(organization)和因果(causation)。?;笇⒄w分解為部分,組織指從部分合并為整體,因果指原因和結(jié)果的關(guān)聯(lián)。他進(jìn)一步指出粒度計(jì)算是信息處理的一種新的概念和計(jì)算范式,覆蓋了所有有關(guān)粒度的理論、方法、技術(shù)和工具的研究。粗略地講,一方面它是模糊信息粒度理論、粗糙集理論、商空間理論、區(qū)間計(jì)算等的超集,另一方面是粒度數(shù)學(xué)的子集。具體地講,凡是在分析問題和求解問題中應(yīng)用了分組、分類和聚類手段的一切理論與方法均屬于粒度計(jì)算的范疇。
2.粒度計(jì)算的基本問題
粒度計(jì)算主要涉及兩個(gè)方面的問題:粒的構(gòu)造和利用粒作為對(duì)象的運(yùn)算、推理。對(duì)于其中的每個(gè)問題都可以從語義和算法兩個(gè)方面來進(jìn)行研究。
粒的構(gòu)造涉及粒的形成、表示。在集合理論中,一個(gè)??梢员焕斫鉃橐粋€(gè)子集,在詞計(jì)算理論中,將語句作為一個(gè)模糊粒。
一個(gè)粒的構(gòu)造可以采用自頂向下(top-down)的分解形成,也可以自底向上(button-up)的合成。分解或合成到什么地步以達(dá)到所需的粒度,一般來說是基于相互之間的關(guān)系來確定是不是應(yīng)該合成或分解,有時(shí)也會(huì)借助于語義或領(lǐng)域知識(shí)的幫助。
具體說來,粒的構(gòu)造包含以下三個(gè)方面的內(nèi)容:
(1)構(gòu)造粒的標(biāo)準(zhǔn)、準(zhǔn)則。準(zhǔn)則是用來確定、規(guī)定為什么不同的對(duì)象需要放到同一粒中,準(zhǔn)則必須信息?;慕Y(jié)果對(duì)問題的本質(zhì)有更深入的理解。
(2)構(gòu)造粒的方法。構(gòu)造粒或者信息?;姆椒ㄊ菑乃惴ń嵌葋砜紤],也就是回答如何將不同的對(duì)象放到同一個(gè)粒中。
(3)粒的表示及描述。一旦?;Y(jié)束,也即粒已經(jīng)構(gòu)造好了,必須使用某種語言去描述它。可以給不同層次的粒度標(biāo)上標(biāo)記,也可以用數(shù)學(xué)公式形式化地描述它,也可以用粒中的中心點(diǎn)來表示,或者可以通過描述不同粒度的范圍來區(qū)分不同的粒度。
(4)定性、定量分析。通過對(duì)粒的定性、定量分析,可以提取必要的規(guī)則。
3.粒度計(jì)算模型
目前有關(guān)粒度計(jì)算的理論與方法,主要有三個(gè)。一是Zadeh的“詞計(jì)算理論”(Theory of Works Computing),二是Z.Pawlak的“粗糙集理論”(Theory of Rough Set),三是國內(nèi)的張鈸院士和張鈴教授提出的“商空間理論”(Theory of Quotient Space)。
(1)詞計(jì)算理論
Zadeh認(rèn)為人類在進(jìn)行思考、判斷、推理時(shí)主要是用語言進(jìn)行的,而語言是一個(gè)很粗的“粒度”,如我們說“九寨溝的風(fēng)景很美”,其中州良美”這個(gè)詞就比較“籠統(tǒng)”,也就是說其粒度很粗,如何利用語言進(jìn)行推理判斷,這就是要進(jìn)行“詞計(jì)算”,早在二十世紀(jì)六十年代Zadeh提出模糊集理論,就是“詞計(jì)算”的雛型。沿Zadeh的模糊集論的方向,用模糊數(shù)學(xué)的方法進(jìn)行有關(guān)粒度計(jì)算的方法和理論的研究,就構(gòu)成“粒度計(jì)算”的一個(gè)非常重要的方法和方向。這也是人們比較熟悉的一個(gè)方法。
(2)粗糙集理論
知識(shí)的含糊性包括:①語言的模糊性,如大小、多少;②數(shù)據(jù)的不完整性,如噪聲、干擾;③知識(shí)本身的粗糙性,如規(guī)則的前后間的依賴關(guān)系不確定性等。
波蘭學(xué)者Z.Pawlak在1982年首先提出了粗糙集理論,它不僅能夠在缺少關(guān)于數(shù)據(jù)的先驗(yàn)知識(shí)的情況下,僅僅以觀測(cè)數(shù)據(jù)的分類能力為基礎(chǔ),解決模糊或不確定性數(shù)據(jù)的分析和處理,而且算法簡(jiǎn)單,易于理解。粗糙集理論把知識(shí)看成是對(duì)有關(guān)對(duì)象論域的劃分,而等價(jià)關(guān)系和由其產(chǎn)生的等價(jià)類則是關(guān)于的有效信息東或知識(shí)。
分類和概念形成的實(shí)際需要促進(jìn)了理論的發(fā)展,目前粗糙集模型已成功應(yīng)用于智能研究領(lǐng)域的方方面面,表現(xiàn)出巨大的實(shí)用價(jià)值和通用性、。為了本文以后的研究需要,本節(jié)敘述一些有關(guān)粗糙集的基本概念與記號(hào)。
(3)基于商空間的粒度計(jì)算
粒度概念可以用子集來表示,不同粒度的概念就體現(xiàn)為不同粒度的子集,一簇概念就構(gòu)成空間的一個(gè)劃分—商空間(知識(shí)基),不同的概念簇就構(gòu)成不同的商空間。故粒度計(jì)算,就是研究在給定知識(shí)基礎(chǔ)上的各種子集合之間的關(guān)系和轉(zhuǎn)換。以及對(duì)同一問題,取不同的適當(dāng)?shù)牧6?,從?duì)不同的粒度的研究中,綜合獲取對(duì)原問題的了解。這種對(duì)粒度的理解與模糊集對(duì)粒度的理解不完全一樣。
本文主要介紹了粗糙集理論和粒度計(jì)算模型的基本理論和相關(guān)概念。粒度計(jì)算是信息處理的一種新的概念和計(jì)算范式,覆蓋了所有有關(guān)粒度的理論、方法、技術(shù)和工具的研究,現(xiàn)己成為人工智能領(lǐng)域研究的熱點(diǎn)之一。主要討論了粒度計(jì)算的基本問題,三種不同模型。
[1]Hobbs,J.R.Granularity.In:Proc of IJCAI[Z],Los Angeles,1985:432-435.
[2]Zadeh,L.A.Fuzzy logic=computing with words[J],TEEE Transaction on fuzzy Systems,1996,2:103-111.
[3]Zadeh,L.A.Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic[J],F(xiàn)uzzy Sets and Systems,1997,(19):111-127.
[4]粒度計(jì)算方法,趙立權(quán),計(jì)算機(jī)工程與應(yīng)用,2006(35):1-1.
[5]粒度計(jì)算與圖像匹配技術(shù)改進(jìn),汪建,電腦知識(shí)與技術(shù),2013(33):50-53.