張建華,李方方,楊 嵐
1.鄭州大學(xué) 管理工程學(xué)院,鄭州 450001
2.鄭州大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,鄭州 450001
在知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)已經(jīng)成為生產(chǎn)運(yùn)營(yíng)活動(dòng)中必不可少的重要資源。隨著知識(shí)管理研究的不斷深入,如何提高知識(shí)資源的應(yīng)用與創(chuàng)新效益,成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。知識(shí)資源與用戶(hù)需求之間的匹配程度制約著知識(shí)效能的發(fā)揮[1]。知識(shí)供需匹配可以有效解決知識(shí)傳遞效率低的問(wèn)題,是實(shí)現(xiàn)知識(shí)資源有效配置、應(yīng)用乃至創(chuàng)新的前提。根據(jù)知識(shí)自身的復(fù)雜特性,可將其劃分為多種類(lèi)型;在完備知識(shí)結(jié)構(gòu)中,模糊不確定性知識(shí)占有很大比重。探討不確定性知識(shí)系統(tǒng)與用戶(hù)知識(shí)需求之間的匹配問(wèn)題,是提高知識(shí)資源利用率的關(guān)鍵。
粗糙集是處理不確定性和模糊性問(wèn)題的常用數(shù)學(xué)方法。不過(guò),其只適用于處理知識(shí)表達(dá)系統(tǒng)中離散型或符號(hào)型的屬性值;然而,對(duì)連續(xù)型的屬性值實(shí)施離散化,亦可能導(dǎo)致重要信息損失。于是,有學(xué)者將模糊集與粗糙集相結(jié)合,用模糊相似關(guān)系代替等價(jià)關(guān)系,以擴(kuò)展粗糙集理論到模糊粗糙集[2]。近年來(lái),隨著模糊粗糙集理論的發(fā)展,越來(lái)越多的科研工作者將其與其他數(shù)學(xué)方法相結(jié)合,以研究屬性約簡(jiǎn)與決策問(wèn)題。(1)在屬性約簡(jiǎn)方面。路艷麗等將直覺(jué)模糊集與模糊粗糙集相結(jié)合,將知識(shí)約簡(jiǎn)概念推廣到直覺(jué)模糊環(huán)境[3]。王金英等將二型直覺(jué)模糊集和粗糙集理論融合,建立了二型直覺(jué)模糊粗糙集模型,并對(duì)二型直覺(jué)模糊關(guān)系進(jìn)行了界定[4]。為了提高處理噪音數(shù)據(jù)的精確度,李冬梅等提出了基于區(qū)間二型模糊粗糙集的屬性約簡(jiǎn)算法,該算法可在有限時(shí)間內(nèi)收斂,使計(jì)算結(jié)果更加合理[5]。基于嚴(yán)格、平均、寬松三個(gè)視角,Zhang 等引入了三種二類(lèi)分類(lèi)方式,并提出了基于模糊粗糙集的多標(biāo)記屬性約簡(jiǎn)算法;由于該方法需要計(jì)算多個(gè)標(biāo)記對(duì)應(yīng)的模糊下近似,導(dǎo)致計(jì)算復(fù)雜度較高[6]。張照星等為了解決對(duì)不同參數(shù)約簡(jiǎn)需重新計(jì)算的問(wèn)題,利用嵌套結(jié)構(gòu),提出了基于已有約簡(jiǎn)的快速約簡(jiǎn)算法,有效降低了屬性約簡(jiǎn)的時(shí)耗[7]。為提高屬性約簡(jiǎn)的效率,彌補(bǔ)現(xiàn)有基于模糊粗糙集的多標(biāo)記特征選擇算法僅能對(duì)單一的樣本空間刻畫(huà)屬性區(qū)分能力的不足,姚二亮等考慮了屬性對(duì)標(biāo)記的區(qū)分能力,從標(biāo)記和樣本兩個(gè)空間出發(fā),提出了基于雙空間模糊辨識(shí)關(guān)系的多標(biāo)記特征選擇算法,并通過(guò)權(quán)重融合的方式對(duì)兩種多標(biāo)記屬性重要度進(jìn)行融合,從而提出多標(biāo)記屬性約簡(jiǎn)算法[8]。針對(duì)模糊粗糙集中相交運(yùn)算可能會(huì)導(dǎo)致高維數(shù)據(jù)空間中模糊決策辨別力低的問(wèn)題,Wang 等將距離測(cè)度引入模糊粗糙集,基于此構(gòu)建了模糊粗糙集模型,并給出了計(jì)算屬性相關(guān)性與重要性的迭代公式,設(shè)計(jì)了一種貪婪收斂的屬性約簡(jiǎn)算法,實(shí)驗(yàn)分析驗(yàn)證了該算法的有效性及比較優(yōu)勢(shì)[9]。(2)在決策研究方面。不少學(xué)者將模糊粗糙集與其他理論相結(jié)合對(duì)決策問(wèn)題展開(kāi)了研究。如針對(duì)模糊系統(tǒng)中噪聲對(duì)相似度計(jì)算結(jié)果的影響,楊霽琳等通過(guò)引入閾值對(duì),建立了基于相似度三支決策的模糊粗糙集模型。該模型保留了模糊信息系統(tǒng)的不確定性,并降低了噪聲的影響[10]。傳統(tǒng)的直覺(jué)模糊粗糙集未考慮屬性之間的差別,趙天娜等構(gòu)造了多伴隨直覺(jué)模糊粗糙集模型,并將其運(yùn)用到三支決策中,研究了基于多伴隨直覺(jué)模糊粗糙集的三支決策算法,更符合實(shí)踐過(guò)程規(guī)律[11]。根據(jù)數(shù)據(jù)的模糊性和不可區(qū)分性,Vluymans等為解決機(jī)器學(xué)習(xí)方法難以選擇合適加權(quán)方案的問(wèn)題,提出了有序加權(quán)平均的模糊粗糙算子,通過(guò)實(shí)驗(yàn)分析證明了基于有序加權(quán)平均模糊粗糙集的適用性,實(shí)現(xiàn)了對(duì)加權(quán)方案選擇過(guò)程的優(yōu)化[12]。Zhang等基于覆蓋模糊粗糙集模型提出了TOPSIS-WAA 方法用于解決多準(zhǔn)則決策問(wèn)題,并將五種不同的決策方法與該方法進(jìn)行了比較,并通過(guò)實(shí)證證明了TOPSIS-WAA 方法解決決策問(wèn)題的優(yōu)越性[13]。根據(jù)多元化、多屬性的群體決策問(wèn)題,Sun等將模糊粗糙集與粒計(jì)算相結(jié)合,構(gòu)建了多粒度軟模糊粗糙集模型,并通過(guò)定義多粒度的上下近似,提出了一種基于多粒度軟模糊粗糙集和TODIM的多元化多屬性群決策方法,該方法可以有效規(guī)避損失,并充分考慮了決策者的參考依賴(lài)[14]。在多屬性決策系統(tǒng)中,一般的屬性決策方法很難進(jìn)行有效的決策規(guī)則提取和方案排序,劉勇等構(gòu)建了一種基于優(yōu)勢(shì)直覺(jué)模糊粗糙集的決策方法,能很好地處理含有偏好信息和模糊信息的多屬性決策系統(tǒng)[15]。綜上,模糊粗糙集已成為研究不確定性知識(shí)獲取的基本方法。
同時(shí),為了能夠更加客觀地描述現(xiàn)實(shí)世界的模糊本質(zhì),越來(lái)越多的學(xué)者將直覺(jué)模糊集引入模糊粗糙集中。直覺(jué)模糊集考慮了隸屬度、非隸屬度和猶豫度信息,研究成果豐碩[16-17]。但直覺(jué)模糊集只能描述隸屬度與非隸屬度之和不大于1 的情況,使決策過(guò)程受限,影響其適用范圍。為解決這一問(wèn)題,Yager等提出隸屬度、非隸屬度之和大于1,而平方和不超過(guò)1 的畢達(dá)哥拉斯模糊集(PFS)[18-19]。Garg 對(duì)PFS 的相關(guān)系數(shù)進(jìn)行了計(jì)算,并考慮不同元素的權(quán)重問(wèn)題,對(duì)相關(guān)系數(shù)的計(jì)算方法進(jìn)行改進(jìn),以得到更為準(zhǔn)確客觀的計(jì)算結(jié)果,最后將其應(yīng)用到多屬性決策過(guò)程中[20]。在此基礎(chǔ)上,劉衛(wèi)鋒等將PFS進(jìn)一步擴(kuò)展,提出了畢達(dá)哥拉斯猶豫模糊集,并給出其相關(guān)測(cè)度的計(jì)算過(guò)程[21]。綜上可知,PFS 是對(duì)直覺(jué)模糊集的推廣,比直覺(jué)模糊集有更強(qiáng)的刻畫(huà)模糊現(xiàn)象的能力[22]。隨著信息技術(shù)的不斷發(fā)展,面對(duì)海量的知識(shí),用戶(hù)往往會(huì)出現(xiàn)“知識(shí)迷向”的問(wèn)題。因此,對(duì)知識(shí)資源與用戶(hù)需求進(jìn)行匹配是實(shí)現(xiàn)知識(shí)資源有效配置的關(guān)鍵。在既有研究的基礎(chǔ)上,本文將PFS 與模糊粗糙集相結(jié)合,發(fā)揮其各自?xún)?yōu)勢(shì),提出畢達(dá)哥拉斯模糊粗糙集(PFRS),構(gòu)建模糊知識(shí)表達(dá)系統(tǒng),并將衡量知識(shí)供需匹配程度的屬性相似度用PFS相關(guān)系數(shù)進(jìn)行表示,同時(shí)考慮知識(shí)屬性集對(duì)應(yīng)的權(quán)重向量(知識(shí)視圖)決定了參與匹配計(jì)算的屬性數(shù)量及各屬性的參與程度[23],將其與視圖相似度結(jié)合,確定最終匹配結(jié)果。
現(xiàn)實(shí)世界中存在大量的不確定性知識(shí),快速準(zhǔn)確地為用戶(hù)提供所需要的知識(shí),是提高知識(shí)資源利用效益和用戶(hù)滿(mǎn)意度的關(guān)鍵所在。粗糙集作為一種處理模糊不確定性的計(jì)算方法,自提出以來(lái)相關(guān)學(xué)者對(duì)其進(jìn)行不斷完善與改進(jìn),并通過(guò)與其他模糊理論相結(jié)合以突破傳統(tǒng)粗糙集的局限性。
(1)模糊粗糙集
傳統(tǒng)粗糙集采用離散化手段對(duì)數(shù)值型數(shù)據(jù)進(jìn)行處理時(shí),會(huì)造成信息損失。針對(duì)這一局限性,諸多學(xué)者引入模糊理論,提出了模糊粗糙集。其定義為:設(shè)U為論域,若R∈F(U×U),則R為一個(gè)在U×U上的模糊關(guān)系。給定相似關(guān)系R,模糊集合中的上、下近似為[24],對(duì)于 ?x∈U,
模糊決策系統(tǒng)可用二元組進(jìn)行表示:(U,A?D),A?D=?,其中,A為條件屬性集,D為決策屬性集。定義為決策屬性集D上的一個(gè)等價(jià)關(guān)系,則由RD產(chǎn)生關(guān)于U的分類(lèi)為:是包含元素xi的等價(jià)類(lèi),其中,。
(2)直覺(jué)模糊集
模糊粗糙集在處理不確定性知識(shí)時(shí),只能用隸屬度刻畫(huà)完全肯定的程度,而對(duì)完全否定則缺乏判斷[25]。為解決這一問(wèn)題,有學(xué)者通過(guò)引入直覺(jué)模糊數(shù)對(duì)模糊理論進(jìn)行了擴(kuò)充[26]。設(shè)X為一個(gè)非空論域,稱(chēng)A={x,μA(x),為論域X上的一個(gè)直覺(jué)模糊集,其中是X上的模糊集,μA(x)、νA(x)分別為論域X上元素x屬于A的隸屬度和非隸屬度,且?x∈X,μA,νA∈ [0,1],滿(mǎn)足0 ≤μA(x)+νA(x)≤1。
(3)畢達(dá)哥拉斯模糊集
與傳統(tǒng)模糊集相比,直覺(jué)模糊集更符合決策者對(duì)被評(píng)估對(duì)象表現(xiàn)出肯定、否定和猶豫的思維習(xí)慣,在處理模糊性和不確定問(wèn)題方面更具靈活性和實(shí)用性[27]。然而,在直覺(jué)模糊決策過(guò)程中,Yager等發(fā)現(xiàn)專(zhuān)家給出的方案往往會(huì)出現(xiàn)屬性的隸屬度與非隸屬度之和大于1 的現(xiàn)象,此時(shí)直覺(jué)模糊集無(wú)法正確地描述專(zhuān)家對(duì)信息的偏好,于是提出了畢達(dá)哥拉斯模糊集對(duì)其進(jìn)行擴(kuò)展。畢達(dá)哥拉斯模糊集的定義如下[18]:
設(shè)X為論域,則稱(chēng)為畢達(dá)哥拉斯模糊集(PFS),其中μA(x)為:X→ [0,1],νA(x):X→[0,1]分別為X上元素x屬于A的隸屬度和非隸屬度。為x屬于A的猶豫度或不確定度。稱(chēng)為畢達(dá)哥拉斯模糊數(shù),為方便表述,將其記為在畢達(dá)哥拉斯模糊系統(tǒng)中,A的信息能量可表示為:
A與B的相關(guān)系數(shù)可表示為:
源于客觀世界的復(fù)雜性與不確定性,實(shí)踐中存在大量模糊的、偏好型知識(shí),如何使其精準(zhǔn)滿(mǎn)足用戶(hù)需求,是確保知識(shí)資源有效配置的前提。傳統(tǒng)的知識(shí)供需匹配方法多以模糊粗糙集為理論基礎(chǔ),但該方法在刻畫(huà)不確定性現(xiàn)象時(shí)具有一定的局限性。畢達(dá)哥拉斯模糊集是近年來(lái)被提出的處理模糊現(xiàn)象的有力工具。為彌補(bǔ)模糊粗糙集在描述不確定性知識(shí)方面的不足,本文將畢達(dá)哥拉斯模糊集與其相結(jié)合,提出基于畢達(dá)哥拉斯模糊粗糙集的知識(shí)供需匹配模型。該模型主要包括兩個(gè)部分:(1)建立畢達(dá)哥拉斯知識(shí)表達(dá)系統(tǒng),通過(guò)對(duì)原始數(shù)據(jù)的處理,實(shí)現(xiàn)對(duì)知識(shí)屬性值的畢達(dá)哥拉斯模糊數(shù)表示;(2)將畢達(dá)哥拉斯模糊集的相關(guān)測(cè)度引入知識(shí)供需匹配過(guò)程,對(duì)知識(shí)視圖相似度進(jìn)行改進(jìn),以提高匹配結(jié)果的準(zhǔn)確性,并根據(jù)用戶(hù)需求與既有知識(shí)之間視圖相似度的計(jì)算結(jié)果確定匹配對(duì)象。
模糊粗糙集是處理不精確、不確定性問(wèn)題的重要數(shù)學(xué)工具。它通過(guò)將模糊集中的隸屬度看作粗糙集中的屬性值,可有效進(jìn)行特征選??;同時(shí),亦可避免對(duì)連續(xù)屬性值的離散化,減少了信息損失。畢達(dá)哥拉斯模糊集是對(duì)直覺(jué)模糊集的擴(kuò)展,可描述隸屬度與非隸屬度之和大于1 且平方和小于等于1 的現(xiàn)象,又能體現(xiàn)決策者在二者之間的猶豫程度,是一個(gè)對(duì)不確定現(xiàn)象進(jìn)行表達(dá)的強(qiáng)有力工具。將畢達(dá)哥拉斯模糊集與模糊粗糙集相結(jié)合,本文構(gòu)建畢達(dá)哥拉斯模糊粗糙集(PFRS)模型。
定義1設(shè)為論域U中的畢達(dá)哥拉斯模糊集合,R是論域U上的畢達(dá)哥拉斯模糊等價(jià)關(guān)系,對(duì)x∈U,A畢達(dá)哥拉斯模糊粗糙集的上、下近似可分別表示為:
其中:
設(shè)S=(U,A,V,F)為畢達(dá)哥拉斯模糊知識(shí)表達(dá)系統(tǒng),U={x1,x2,…,xn} 為論域,且是一個(gè)非空有限集合;A為屬性集,可表示為A=C?D,且C?D=? 。其中,C={a1,a2,…,am} 為條件屬性集,對(duì)于 ?ai∈A都有一個(gè)映射:U→Vai,Vai為ai的屬性值;D=j5i0abt0b為決策屬性集,Vd為決策屬性d的值域,知識(shí)i的第j個(gè)條件屬性值為vij。在PFRS 中,條件屬性值vij可由一組畢達(dá)哥拉斯模糊數(shù)進(jìn)行表示,即ννij分別表示U上知識(shí)i的第j個(gè)屬性屬于A的隸屬度和非隸屬度;πνij表示U上知識(shí)i的第j個(gè)屬性屬于A的不確定度,其中πνij=f(μνij,ννij),為方便表述,后文簡(jiǎn)記為。
傳統(tǒng)的匹配方法一般由用戶(hù)知識(shí)需求與已有知識(shí)之間的視圖相似度來(lái)衡量匹配水平。視圖相似度是通過(guò)用戶(hù)所需知識(shí)的各屬性與所提供知識(shí)屬性集之間的相近程度確定。本文通過(guò)引入PFS 相關(guān)系數(shù)對(duì)視圖相似度進(jìn)行改進(jìn),以提高匹配精度。PFS相關(guān)系數(shù)是將知識(shí)看作一個(gè)整體來(lái)考慮的,通過(guò)各知識(shí)與用戶(hù)需求之間的相關(guān)程度確定匹配結(jié)果?;诖耍疚膶傩韵嗨贫韧ㄟ^(guò)PFS相關(guān)系數(shù)進(jìn)行表征,其計(jì)算方法為式(2)~(4)。同時(shí),考慮屬性集各成分對(duì)知識(shí)供需匹配過(guò)程的影響差異,引入知識(shí)屬性權(quán)重向量,對(duì)相關(guān)系數(shù)進(jìn)行改進(jìn),得出視圖相似度,使計(jì)算結(jié)果更為準(zhǔn)確客觀?;谇笆鲇?jì)算公式可知,確定知識(shí)屬性權(quán)重是計(jì)算知識(shí)用戶(hù)需求與既有知識(shí)之間視圖相似度前提。熵權(quán)法根據(jù)數(shù)據(jù)的離散程度確定權(quán)重,使計(jì)算結(jié)果更為客觀可靠、區(qū)分度較高,本文選取它計(jì)算各知識(shí)屬性的權(quán)重向量。
該方法的計(jì)算過(guò)程為:(1)為消除不同量綱對(duì)計(jì)算結(jié)果的影響,對(duì)原始屬性數(shù)據(jù)實(shí)現(xiàn)歸一化處理;(2)計(jì)算屬性aij的信息熵,;(3)通過(guò)信息熵計(jì)算各屬性的權(quán)重,。基于屬性權(quán)重可以求解用戶(hù)知識(shí)需求與知識(shí)之間的視圖相似度,其計(jì)算公式如下:
綜上,在基于畢達(dá)哥拉斯模糊粗糙集的知識(shí)供需匹配過(guò)程中(以案例知識(shí)為例),需首先構(gòu)建知識(shí)表達(dá)系統(tǒng)S=(U,A,V,F),同時(shí)確定各知識(shí)屬性的權(quán)重,即計(jì)算屬性集C對(duì)應(yīng)的權(quán)重向量ω=(ω1,ω2,…,ωm)T;進(jìn)而計(jì)算在論域U中,各案例知識(shí)的信息量;而后輸入用戶(hù)需求C′,并將知識(shí)需求進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算其與案例知識(shí)xi的相關(guān)指標(biāo),從而求出知識(shí)供需匹配視圖相似度的計(jì)算結(jié)果(Simiq):若Simiq=1,則將匹配結(jié)果提交用戶(hù)。由于在知識(shí)供需匹配過(guò)程中,視圖相似度的結(jié)果為1的可能性很小,因此,本文在供需匹配過(guò)程中預(yù)設(shè)視圖相似度閾值α,將Simiq與該閾值進(jìn)行比較:若Simiq≠1且滿(mǎn)足Simiq≥α,則將滿(mǎn)足條件的案例提交適配,重構(gòu)滿(mǎn)足用戶(hù)需求的解/決策屬性并形成新案例提交用戶(hù)(已另文探討)。后續(xù)需計(jì)算新案例與系統(tǒng)既有各案例之間的視圖相似度,若其最大值小于系統(tǒng)學(xué)習(xí)閾值,則案例入庫(kù);否則,系統(tǒng)不予納入、放棄學(xué)習(xí)。若所有案例視圖相似度Simiq<α,則既有知識(shí)庫(kù)尚未具備滿(mǎn)足用戶(hù)需求的知識(shí),匹配失敗。如此,基于PFRS的知識(shí)供需匹配過(guò)程如圖1所示。
為驗(yàn)證前述基于PFRS 知識(shí)供需匹配方法的有效性與可行性,本文選取UCI 數(shù)據(jù)庫(kù)中的“iris”數(shù)據(jù)集進(jìn)行實(shí)證分析。該數(shù)據(jù)集記錄了三種鳶尾花的不同生長(zhǎng)特點(diǎn),同一模式下的案例數(shù)量為150。每一案例包含4個(gè)條件屬性,1 個(gè)決策屬性。首先,對(duì)案例庫(kù)中的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,即對(duì)屬性值vij∈A有:為方便表述,仍用vij標(biāo)記標(biāo)準(zhǔn)化的條件屬性值。同時(shí),采用熵權(quán)法確定知識(shí)庫(kù)中各條件屬性的權(quán)重,得該數(shù)據(jù)集的屬性權(quán)重向量為:ω=(0.243 1,0.155 7,0.191 3,0.409 9)T。而后,建立知識(shí)表達(dá)系統(tǒng),對(duì)預(yù)處理后的數(shù)據(jù)集中任意標(biāo)準(zhǔn)化的條件屬性a,定義模糊關(guān)系:若為符號(hào)值的條件屬性c,則定義:由此,該案例庫(kù)轉(zhuǎn)化為一個(gè)畢達(dá)哥拉斯模糊決策系統(tǒng)。
圖1 知識(shí)供需匹配過(guò)程
已知某用戶(hù)的知識(shí)需求表述為C′=(6.8,3.5,4.3,1.7 )。經(jīng)標(biāo)準(zhǔn)化處理后,該用戶(hù)知識(shí)需求可轉(zhuǎn)化為:C′={ 0.482 3,0.093 4, 0.390 6,0.140 6, 0.312 8,0.194 2,0.444 4,0.111 1 }。在此基礎(chǔ)上,將用戶(hù)需求與知識(shí)庫(kù)中的所有案例進(jìn)行匹配計(jì)算。由于在實(shí)踐過(guò)程中,匹配結(jié)果往往無(wú)法完全滿(mǎn)足用戶(hù)需求,即視圖相似度為1。因此,本文僅得出在既有案例下,與之匹配程度足夠相近的案例。在知識(shí)供需匹配過(guò)程中,設(shè)置視圖相似度的閾值為α=0.95,當(dāng)視圖相似度Simiq≥0.95 時(shí),返回該匹配案例;重復(fù)該過(guò)程,直至遍歷知識(shí)庫(kù)中所有案例知識(shí);若在匹配過(guò)程中,視圖相似度滿(mǎn)足Simiq≠1 且Simiq≥0.95,則進(jìn)行案例適配(適配過(guò)程參見(jiàn)文獻(xiàn)[28])。依前文所述的方法確定供需匹配的案例集,經(jīng)計(jì)算可知,滿(mǎn)足Simiq≥0.95 的案例有15 個(gè)。為方便表述,將知識(shí)庫(kù)中的案例按照決策屬性d進(jìn)行排序,具體的匹配案例結(jié)果如表1所示。
表1 匹配案例集
在供需匹配過(guò)程中,符合匹配要求的案例集的計(jì)算過(guò)程如下,首先,基于前文所述,計(jì)算案例知識(shí)庫(kù)中xi的信息能量Eω(xi),其計(jì)算結(jié)果如表2 所示。繼而,根據(jù)知識(shí)供需匹配過(guò)程,計(jì)算用戶(hù)知識(shí)需求C′與案例知識(shí)之間的相關(guān)指標(biāo)Cω(xi,C′ ),其結(jié)果如表3 所示。最后,根據(jù)式(7),將用戶(hù)需求與案例集中各案例進(jìn)行視圖相似度計(jì)算,最終的匹配結(jié)果以降序排列選取前15 個(gè)視圖相似度所對(duì)應(yīng)的案例作為該用戶(hù)知識(shí)需求的匹配案例集,計(jì)算結(jié)果如表4所示。
表2 匹配結(jié)果的信息能量
表3 相關(guān)指標(biāo)
表4 視圖相似度
結(jié)合以上實(shí)證結(jié)果分析可知,相較于傳統(tǒng)處理模糊不確定知識(shí)的匹配方法,本文所提出的基于PFRS 的知識(shí)供需匹配算法具有如下優(yōu)勢(shì):
(1)模糊不確定性的知識(shí)在知識(shí)供需匹配過(guò)程中大量存在,處理該類(lèi)知識(shí)的匹配問(wèn)題是以模糊理論為基礎(chǔ),常用的方法包括經(jīng)典粗糙集理論、模糊粗糙集理論以及在此基礎(chǔ)上改進(jìn)的算法。畢達(dá)哥拉斯模糊集是一種新興的處理模糊不確定信息的方法,因其既能很好地解釋隸屬度與非隸屬度平方和小于等于1,又能描述隸屬度與非隸屬度之和超過(guò)1 的現(xiàn)象,所以在表達(dá)不確定現(xiàn)象時(shí)更具優(yōu)勢(shì)。與直覺(jué)模糊集相比,其刻畫(huà)模糊現(xiàn)象的能力如圖2 所示。因此,本文將該方法與模糊粗糙集相結(jié)合,提出畢達(dá)哥拉斯模糊粗糙集模型,并基于該模型實(shí)現(xiàn)知識(shí)供需匹配的過(guò)程,具備一定的理論優(yōu)勢(shì)。
圖2 模糊現(xiàn)象的描述范圍
(2)傳統(tǒng)的知識(shí)供需匹配算法是通過(guò)相似度的計(jì)算確定最終的匹配結(jié)果,本文通過(guò)引入畢達(dá)哥拉斯模糊集的相關(guān)測(cè)度,并考慮知識(shí)屬性權(quán)重,用PFS 的加權(quán)相關(guān)系數(shù)對(duì)視圖相似度進(jìn)行表征?;赑FS 相關(guān)系數(shù)的視圖相似度考慮了模糊知識(shí)在知識(shí)表達(dá)系統(tǒng)中的不確定性,提高了知識(shí)供需匹配精度,使計(jì)算結(jié)果更加客觀準(zhǔn)確。本文算法得出的視圖相似度匹配結(jié)果與一般算法得出的相似度的結(jié)果如圖3 所示。由圖3 可知,由加權(quán)PFS相關(guān)系數(shù)確定的視圖相似度高于一般算法,可見(jiàn)本文算法具有更好的區(qū)分能力。
綜上,本文提出的知識(shí)供需匹配算法相較于業(yè)內(nèi)既有的方法,其適用范圍更廣,匹配結(jié)果更為客觀。
圖3 視圖相似度算法比較
隨著信息技術(shù)的迅速發(fā)展,知識(shí)供需匹配的問(wèn)題日益凸顯。為提高知識(shí)資源的利用效益,本文在前人研究的基礎(chǔ)上,提出了基于畢達(dá)哥拉斯模糊粗糙集的知識(shí)供需匹配算法。首先將PFS 與模糊粗糙集相結(jié)合,給出PFRS 的定義;而后,構(gòu)建畢達(dá)哥拉斯模糊決策系統(tǒng),并給出知識(shí)供需匹配的具體步驟,引入PFS 的相關(guān)測(cè)度,并通過(guò)加權(quán)PFS的相關(guān)系數(shù)對(duì)視圖相似度進(jìn)行表征,以提升匹配精度;最后,將用戶(hù)需求與已有案例知識(shí)進(jìn)行匹配,得出匹配結(jié)果。文末實(shí)證分析驗(yàn)證了本文所提方法的可行性與比較進(jìn)步性。在該供需匹配過(guò)程中,為得到匹配結(jié)果,每次匹配需要遍歷案例庫(kù)中的所有案例。為提高匹配過(guò)程的效率可引入聚類(lèi)算法對(duì)案例庫(kù)中的案例進(jìn)行聚類(lèi),以壓縮匹配空間,這是未來(lái)需要進(jìn)一步研究的內(nèi)容。
計(jì)算機(jī)工程與應(yīng)用2020年23期