秦貞燕+王永麗+于慧慧+周杰
摘要:概率統(tǒng)計,模糊數(shù)學(xué),灰色系統(tǒng),粗糙集和未確知數(shù)學(xué)是目前存在的五種不確定性數(shù)學(xué)方法。本文針對不確定性信息及其數(shù)學(xué)方法的概念進(jìn)行了闡述和分析,并且比較了五種方法的不同之處,使人們更清晰的認(rèn)識和區(qū)分這五種不確定性數(shù)學(xué)方法及其應(yīng)用領(lǐng)域。
關(guān)鍵詞:概率統(tǒng)計;模糊數(shù)學(xué);灰色系統(tǒng);粗糙集;未確知數(shù)學(xué);不確定性信息
中圖分類號:TP273 文獻(xiàn)識別碼:A 文章編號:1001-828X(2016)009-000-03
Abstract: Probability statistics, fuzzy mathematics, gray system, rough sets and unascertained mathematics are five existing uncertainty mathematical methods at present. This text described and analyzed the concept and the mathematical methods of uncertain information,and compared the difference of five methods, to make people understand and distinguish these five uncertainty mathematical methods clearly.Probability statistics.
Keywords: Probability statistics; fuzzy mathematics; gray system; rough sets; uncertain information;
一、引言
經(jīng)典數(shù)學(xué)的研究對象局限在確定性對象,因此人們又稱之為確定性數(shù)學(xué)。在信息多變的.時代,不確定現(xiàn)象無處不在,其存在形式各式各樣。人類在不斷認(rèn)識世界和改造世界的過程中發(fā)現(xiàn)經(jīng)典數(shù)學(xué)不再是解決問題的有效途徑。面對大量得不確定現(xiàn)象,如何從數(shù)學(xué)上定量的描述這些不確定現(xiàn)象,并研究不確定現(xiàn)象數(shù)量規(guī)律及優(yōu)化問題一直是人們追求的課題研究。在研究過程中,人們發(fā)現(xiàn)了信息的不確定性是多種多樣的,并將多樣的不確定性信息進(jìn)行分類表述,就出現(xiàn)了信息的隨機(jī)性、模糊性、灰色性、粗糙性和未確知性,相關(guān)的概率統(tǒng)計、模糊數(shù)學(xué)、灰色系統(tǒng)、粗糙集和未確知數(shù)學(xué)學(xué)科也被專家一一提出,做了深入研究,并且取得良好的理論和應(yīng)用成果[1,2,3]。
我們把研究自然社會中存在的不確定現(xiàn)象的數(shù)學(xué)理論和方法統(tǒng)稱為不確定數(shù)學(xué)。因此,概率統(tǒng)計、模糊數(shù)學(xué)、灰色系統(tǒng)、粗糙集和未確知數(shù)學(xué)學(xué)科都可以包含在不確定數(shù)學(xué)的范疇之中[4]。這五種學(xué)科是當(dāng)前研究不確定性問題的不同的數(shù)學(xué)方法,這些學(xué)科的發(fā)展也就是反映了不確定性數(shù)學(xué)的發(fā)展。
二、不確定性信息
不確定性是指客觀事物在發(fā)展與聯(lián)系的過程中,存在無序的,或然的,未知的,近似的屬性。任何一個復(fù)雜的系統(tǒng)都存在不確定性因素,不確定性因素的產(chǎn)生不僅僅涉及主觀因素,還會涉及很多客觀因素,而且是兩者交互影響。由于信息的產(chǎn)生及其傳播的過程條件不同,不確定信息的表現(xiàn)會有不同的特征。根據(jù)這些不確定信息的表現(xiàn)特征,人們將已認(rèn)識到的不確定性信息主要分為如下五種。
1.隨機(jī)信息
在隨機(jī)現(xiàn)象中,事件結(jié)果是確定的,由于偶然因素干擾,使得幾種確定結(jié)果呈或然性出現(xiàn)。即在某次試驗中事件在相同的情況下卻有不同的結(jié)果,這種試驗稱為隨機(jī)試驗。由隨機(jī)試驗得到的信息稱為隨機(jī)信息。如市場價格波動、彩票中獎情況等[5]。由隨機(jī)信息引起的不確定性稱為隨機(jī)不確定。
2.模糊信息
因為事物的復(fù)雜性,事物的自身概念外延不明確,即事物特征界限不明確,其概念不能準(zhǔn)確的被描述和評定。事物從一方概念到另一方概念存在過渡的過程,它提供的很難說清邊界的的信息稱為模糊信息[6],如穩(wěn)定、不穩(wěn)定、健康、不健康等。由模糊信息引起的不確定性稱為模糊不確定。
3.灰色信息
在事物發(fā)展過程中,由于人們接收信息系統(tǒng)的能力有限,使得人們只能獲取事物發(fā)展的部分信息,而不能獲得全部的確切信息。即部分信息已知,部分信息未知[7]。這種外延明確內(nèi)涵不明確的信息我們將之稱為灰色信息。如玉米的產(chǎn)量、金融市場中的股票市場等。由灰色信息引起的不確定稱為灰色不確定。
4.粗糙信息
由于不確定性,導(dǎo)致事物的不可辨性。事物的集合是明確,但其中所包含的元素是不明確的,這種信息被稱為粗糙信息。它與模糊信息的區(qū)別在于,模糊信息的集合邊界不確定。如人的外貌、人的品質(zhì)。由粗糙信息引起的不確定性稱為粗糙不確定。
5.未確知信息
未確知信息是指因為條件的限制,在進(jìn)行決策時,無法確知的信息[8]。這些信息既無隨機(jī)性,也無模糊性,它是由于決策者所掌握的信息不充足,不精確。以至不足以確定事物的真實狀態(tài)和數(shù)量關(guān)系。這種未確知信息可以帶來主觀認(rèn)識上的不確定性。如地震的震源、一座已建成的建筑物的重量等。由未確知信息引起的不確定性稱為未確知不確定。
三、不確定性數(shù)學(xué)方法
1.概率統(tǒng)計
1657年,荷蘭著名數(shù)學(xué)家惠更斯就對隨機(jī)性進(jìn)行研究,隨后前蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫提出并建立的概率論。概率統(tǒng)計是以隨機(jī)現(xiàn)象為基礎(chǔ)。概率論是根據(jù)大量相同隨機(jī)現(xiàn)象的規(guī)律,對在隨機(jī)現(xiàn)象某一結(jié)果出現(xiàn)的的可能性給出客觀的科學(xué)的判斷,并且進(jìn)行數(shù)量方面的描述[9]。
要研究一個隨機(jī)現(xiàn)象,首先要研究明白它服從的概率分布,但是在現(xiàn)實當(dāng)中,有些隨機(jī)現(xiàn)象所服從的分布是什么概型可能完全不知道,有的根據(jù)現(xiàn)象自身的特點和已經(jīng)發(fā)生出現(xiàn)的結(jié)果,我們可以推測出其服從的概型,卻不能確定其分布函數(shù)中所含的參數(shù)值。例如,某天某公路段所行駛每輛車的速度服從什么分布是完全不能知道的,某一商業(yè)部收購N件產(chǎn)品,每件產(chǎn)品不是合格就是不合格,顯然產(chǎn)品的是否合格得情況是服從二項分布,但分布中的參數(shù)P(不合格品率)卻是不知道的。為了要掌握上述車輛速度的分布、不合格品率,我們必須對這一公路上所行使的車輛速度及工業(yè)產(chǎn)品是否合格進(jìn)行觀察和試驗。類似這種統(tǒng)計處理尋求參數(shù)值就是概率統(tǒng)計的應(yīng)用之處。在數(shù)理統(tǒng)計的過程中,我們總需從待研究的全體對象中隨機(jī)或有目的地抽取一部分進(jìn)行觀測或試驗以取得所需信息,從而對研究對象作出推斷。每個推斷都伴隨一定的概率用以表明推斷的可靠程度。像這種伴有一定概率的推斷稱為統(tǒng)計推斷[9]。數(shù)理統(tǒng)計中假設(shè)檢驗、參數(shù)估計、方差分析和回歸分析等思想也都達(dá)到成熟狀態(tài)并在氣象預(yù)測、保險工作、抽獎活動、質(zhì)量判斷、游戲活動等方面得到了很好的應(yīng)用。
2.模糊數(shù)學(xué)
1965年,扎德教授論文“模糊集合”的發(fā)表標(biāo)志著模糊數(shù)學(xué)的誕生[10]。模糊集合的提出是模糊信息客觀存在的必然反映。面對模糊問題,如判斷生態(tài)環(huán)境是否文明,“生態(tài)文明”沒有一個確切衡量標(biāo)準(zhǔn),怎樣才算是生態(tài)文明是無法說清楚的,也就不能用普通實數(shù)集合論里僅取0或1兩個值的特征函數(shù)來刻畫。為了解決類似問題中含有連續(xù)過渡的共性,扎德將普通集合論里的特征函數(shù)的取值范圍由{0,1}推廣到閉區(qū)間[0,1],用一個實數(shù)去度量它,這個實數(shù)值我們稱之為是隸屬度[6]。
定義1[6]設(shè)在論域U上給定了一個映射
則稱A為U上的模糊集,A(u)稱為A的隸屬度函數(shù)(或稱為u對A的隸屬度)。
隸屬度函數(shù)在模糊數(shù)學(xué)理論應(yīng)用中占有至關(guān)重要的地位,是將模糊性運(yùn)用數(shù)學(xué)方法來解決的關(guān)鍵媒介。隸屬度函數(shù)的確定,是一個比較復(fù)雜的問題,在許多實際情況下,通常根據(jù)經(jīng)驗或統(tǒng)計規(guī)律來決定。
模糊數(shù)學(xué)有著相當(dāng)豐富的研究內(nèi)容,到目前為止,經(jīng)典數(shù)學(xué)中的很多理論分支學(xué)科也進(jìn)行模糊化,成為模糊數(shù)學(xué)學(xué)科的組成部分。如模糊關(guān)系、模糊矩陣、模糊變換、模糊拓?fù)淇臻g、模糊圖論、模糊概率統(tǒng)計、模糊線性規(guī)劃、模糊邏輯、模糊變量、模糊博奕等。廣泛的模糊分支使模糊數(shù)學(xué)在生活中的很多方面得到了良好的應(yīng)用。
3.灰色系統(tǒng)
1982年,鄧聚龍教授創(chuàng)立的灰色系統(tǒng)理論,是針對研究少數(shù)據(jù)、貧信息不確定性問題的新方法[7]?;疑到y(tǒng)的研究方法主要是通過對現(xiàn)有的“部分”已知信息的開發(fā),挖掘有效的信息,實現(xiàn)對系統(tǒng)運(yùn)行行為、演化規(guī)律的正確描述和有效監(jiān)控?;疑到y(tǒng)理論重點研究的是具有“外延明確,內(nèi)涵不明確”特點的對象。比如到2050年,中國將人口控制在15億到16億之間,這個“15億到16億之間”就是一個灰概念,其外延很清楚,但進(jìn)一步問15億到16億之間的哪個具體值,則不清楚[11]。
灰色系統(tǒng)理論認(rèn)為,盡管客觀事物的表面現(xiàn)象復(fù)雜,數(shù)據(jù)無序,它們總會蘊(yùn)含著自身的特征規(guī)律,關(guān)鍵是如何選擇合適有效的方法去利用和挖掘信息。對數(shù)據(jù)構(gòu)造不同的算子成是灰色系統(tǒng)處理信息的重要手段。
定義2 [11] 設(shè)初始數(shù)據(jù)序列為:X (0)(k)=(x(0)(1), x(0)(2), …, x(0)(n)),D為序列算子
X (0)D=(x(0)(1)d, x(0)(2)d, …, x(0)(n)d )
其中,。則稱D為X (0)的一次累加生成算子。X (0)D為X (0)的一次累加生成序列。
定義3[11] 設(shè)初始數(shù)據(jù)序列為:X (0)(k)=(x(0)(1), x(0)(2), …, x(0)(n)),D為序列算子
X (0)D=(x(0)(1)d, x(0)(2)d, …, x(0)(n)d )
其中:x(0)(k)d = x(0)(k)-x(0)(k-1);k=2,,3,…n
則稱D為X (0)的一次累減生成算子,X (0)D為X (0)的一次累減生成序列。
累加生成和累減生成是在灰色系統(tǒng)中使灰色信息變白化的一種方法,累加生成的數(shù)據(jù)可以用來描述灰色數(shù)據(jù)積累過程的發(fā)展勢態(tài),使不具有明顯規(guī)律的原始數(shù)據(jù)中蘊(yùn)藏的累積特性充分顯現(xiàn)出來。累減生成也是在獲取增量信息時常用的一種手段,累減生成可以還原累加生成。累減生成與累加生成是一對互逆的序列算子,它們是構(gòu)建GM(1,1)模型的理論基礎(chǔ)。
灰色系統(tǒng)在經(jīng)典數(shù)學(xué)理論的基礎(chǔ)上生成了很多彼此相關(guān)的理論,包括灰數(shù)運(yùn)算、灰色代數(shù)系統(tǒng)、灰色方程、灰色矩陣等。此外,灰色系統(tǒng)在實際應(yīng)用方面也構(gòu)建了許多經(jīng)典模型,如用于系統(tǒng)診斷、分析的系統(tǒng)灰色關(guān)聯(lián)分析模型;用于解決系統(tǒng)要素和對象分類問題的灰色聚類評估模型;用于方案評估和選擇的灰靶決策和多目標(biāo)加權(quán)灰靶決策模型,以及灰色規(guī)劃、灰色投入產(chǎn)出、灰色博弈、灰色控制等[7]。其中灰色系統(tǒng)理論在農(nóng)業(yè)科學(xué)、經(jīng)濟(jì)管理、環(huán)境與安全科學(xué)、天文和地球科學(xué)方面應(yīng)用較為突出和廣泛。
4.粗糙集
在灰色系統(tǒng)成立的同時,1982年,Pawlak教授針對G.Frege的邊界線區(qū)域思想提出粗糙集理論[12]。與其他不確定方法不同,粗糙集的基本思想是用已有的知識庫中的知識和信息,通過等價關(guān)系來近似表示不確定的未知目標(biāo)。上近似算子和下近似算子是粗糙集理論的基礎(chǔ),是粗糙集依靠等價關(guān)系判定分類的手段。
定義4[13] 設(shè)U為一論域,R是U上的等價關(guān)系,對于任意XU,X基于等價關(guān)系R的下近似R(X )與上近似R(X )分別定義如下:
目前,粗糙集理論在現(xiàn)實中的應(yīng)用研究主要集中在屬性約簡、規(guī)則獲取、基于粗糙集的計算智能算法等方面。粗糙集的知識約簡理論的發(fā)展為數(shù)據(jù)挖掘提供了一些有效的新方法。例如、數(shù)據(jù)分析法、基于信息熵的屬性約簡算法、動態(tài)約簡算法、增量式算法、可辨識矩陣算法等[12]。此外,粗糙集結(jié)合信息論、概念格、群體智能算法技術(shù)等也都有了顯著的的研究成果[14,15]。目前粗糙集理論的應(yīng)用領(lǐng)域涉及決策分析系統(tǒng)、數(shù)據(jù)挖掘、模糊粗糙集控制、粗糙神經(jīng)網(wǎng),以及醫(yī)療診斷、專家系統(tǒng)等諸多方面。
5.未確知數(shù)學(xué)
1990年,我國學(xué)者王光遠(yuǎn)教授提出了未確知信息,從而創(chuàng)立了未確知數(shù)學(xué)理論。未確知數(shù)學(xué)主要研究、表達(dá)和處理未確知信息的一種理論與方法。若想將未確知的事情變成已知,主觀概率和主觀隸屬度函數(shù)是未知數(shù)學(xué)的重要依據(jù)。所謂主觀概率[16],就是人們對某個未確知事件的各種可能情況為真幾率的主觀估計。因為有時候研究的是已發(fā)生的事件,因而沒有隨機(jī)性,又因為是一次性事件,因而主觀概率不存在任何統(tǒng)計的含義。主觀隸屬度[16]的產(chǎn)生是由于采用解決模糊性信息的手段來處理未確知的信息。例如,通過測量分析后,估計某一條河水的重量為3000噸左右。這個回答是用一個模糊量來估計大量液體的重量這個確定性的量。它純粹是回答者對該具體量的一種主觀上的粗略估計,因而稱為主觀隸屬度分布。
未確知數(shù)學(xué)也根據(jù)原數(shù)學(xué)的領(lǐng)域進(jìn)行了推廣,建立了“未確知集合”、“未確知順序”、“未確知函數(shù)”、“未確知極限”等相關(guān)的數(shù)學(xué)內(nèi)容。
四、五種不確定數(shù)學(xué)方法的比較
概率統(tǒng)計、模糊數(shù)學(xué)、灰色系統(tǒng)、粗糙集和未確知數(shù)學(xué)是當(dāng)前存在的解決不確定問題的五種數(shù)學(xué)方法,他們彼此之間存有相似之處卻又彼此不同。而其研究對象都具有某種不確定性,這是他們的共同點。正是研究對象在不確定性上的區(qū)別,派生出五種各具特色的不確定性學(xué)科。綜上所述,我們可以把五種常用不確定性數(shù)學(xué)方法的區(qū)別歸納如表1所示。
五、小結(jié)
本文主要探討了五種不確定性數(shù)學(xué)方法的特點,并對其區(qū)別及其應(yīng)用領(lǐng)域進(jìn)行了總結(jié)。由于信息的復(fù)雜化,在很多情況下,多種不確定性信息相互參雜,因此出現(xiàn)了多種復(fù)合型不確定性數(shù)學(xué)方法。不確定數(shù)學(xué)方法應(yīng)用領(lǐng)域非常廣泛,幾乎涉及到學(xué)科領(lǐng)域的各個角落,如經(jīng)濟(jì)學(xué)、邏輯學(xué)、管理學(xué)、氣象學(xué)、醫(yī)學(xué)、情報學(xué)、系統(tǒng)論、控制論等方面,尤其在人工智能、工業(yè)生產(chǎn)、綜合評價、模式識別、聚類分析、層次分析等理論中應(yīng)用顯著。概率統(tǒng)計和模糊數(shù)學(xué)理論提出較早,很多專家對這兩個不確定性數(shù)學(xué)方法內(nèi)容研究深刻,所以該些方法的理論應(yīng)用都達(dá)到了相對成熟的狀態(tài)。而灰色系統(tǒng)、粗糙集和未確知數(shù)學(xué)僅僅經(jīng)過了二、三十年的研究,很多理論方法正在發(fā)展和完善過程中。
參考文獻(xiàn):
[1]Wen-xiu Li,Dong-liang Qi,Shao-feng Zheng Fuzzy mathematics model and its numerical method of stability analysis on rock slope of opencast metal mine.Applied Mathematical Modelling, 2014.
[2]靖洪文,吳俊浩,馬波楊,圣奇.基于模糊灰色系統(tǒng)的深部巷道圍巖變形預(yù)測模型及應(yīng)用[J].煤炭學(xué)報,2012.
[3]馬文萍,黃媛媛,李豪,李曉婷,焦李成.基于粗糙集與差分免疫模糊聚類算法的圖像分割[J].軟件學(xué)報,2014.
[4]李群..不確定性數(shù)學(xué)方法研究及其在經(jīng)濟(jì)管理中的應(yīng)用[D].大連理工大學(xué),2002,1~2.
[5]王清印,劉志勇.不確定性信息的概念、類別及其數(shù)學(xué)表述[J].運(yùn)籌與管理,2001.
[6]周浩亮.模糊數(shù)學(xué)基本理論及其應(yīng)用[J].建井技術(shù),1994(4、5).
[7]劉思峰.灰色系統(tǒng)理論的產(chǎn)生與發(fā)展[J].南京航空航天大學(xué)學(xué)報,2004.
[8]王光遠(yuǎn).未確知信息及其數(shù)學(xué)處理[J].哈爾濱建筑工程學(xué)院學(xué)報,1990.
[9]魏宗舒,黃先開.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2008.
[10]石瑞民.模糊數(shù)學(xué)思想及與經(jīng)典數(shù)學(xué)思想的辯證關(guān)系[J].中國人民公安大學(xué)學(xué)報,2003
[11]劉思峰,郭天榜,黨耀國.灰色系統(tǒng)理論及其應(yīng)用(第七版)[M].北京:科學(xué)出版社,2014.i~ii.
[12]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計算機(jī)學(xué)報,2009.
[13]張文修,仇國芳.基于粗糙集的不確定決策[M].北京:清華大學(xué)出版社,2006.
[14]Li H R, Zhang W X, Wang H. Classification and reduction of attributes in concept lattices//Proceedings of the 2006 IEEE International Conference on Granular Computing (GrC.06). Georgia State University, Atlanta, USA, 2006:142-147.
[15]Liang J Y, Shi Z Z, Li D Y, Wireman M J. The information entropy, rough entropy and knowledge granulation in incomplete information systems. International Journal of General Systems, 2006, 34(1): 641-654.
[16]梁紅.未確知數(shù)學(xué)在地鐵工程施工安全評價中的應(yīng)用研究[D].北京:中國地質(zhì)大學(xué),2010.28~19.
作者簡介:秦貞燕(1990–),女,山東濟(jì)寧,漢族,山東科技大學(xué)在讀研究生,研究方向:數(shù)據(jù)挖掘。王永麗(1977–),女,山東煙臺,漢族,山東科技大學(xué)副教授,主要從事最優(yōu)化理論與算法、支持向量機(jī)的研究。于慧慧(1991–),女,山東菏澤,漢族,山東科技大學(xué)在讀研究生,研究方向:分布式優(yōu)化。周 杰(1990–),男,山東濟(jì)寧,漢族,淄博礦助理工程師、技術(shù)員,工作方向:工程測繪。