(鄭州中學(xué) 454170)
摘要:現(xiàn)在國(guó)際上數(shù)學(xué)的發(fā)展十分的先進(jìn),但還在相似算法方面的研究?jī)?nèi)容還比較的稀缺,目前已經(jīng)有學(xué)者提出來(lái)了相似算法的廣義的定義。這種定義是以案例推理為基礎(chǔ)建立的,本文主要介紹的就是案例推理的內(nèi)涵以及案例推理中相似度算法的使用情況及在該領(lǐng)域內(nèi)相似度算法的發(fā)展情況。
關(guān)鍵詞:相似度算法;案例推理;發(fā)展?fàn)顩r;
一、相似運(yùn)算的含義
案例推理的運(yùn)算系統(tǒng)是通過(guò)依賴以往的解決問(wèn)題的方法經(jīng)驗(yàn)來(lái)應(yīng)對(duì)現(xiàn)在面臨的問(wèn)題。當(dāng)我們遇到一個(gè)新的問(wèn)題的時(shí)候,系統(tǒng)會(huì)通過(guò)搜索以往處理過(guò)的問(wèn)題并進(jìn)行相似度的匹配,直到找出相似度最高的那個(gè)問(wèn)題,通過(guò)借鑒那個(gè)問(wèn)題的解決方法來(lái)處理當(dāng)前問(wèn)題。所以相似度對(duì)于案例推理運(yùn)算而言有著重要的意義,除此之外,還有許多領(lǐng)域的發(fā)展運(yùn)用都需要運(yùn)用到相似的技術(shù)。
二、如何對(duì)相似度進(jìn)行評(píng)估
案例推理的相關(guān)工作者通過(guò)和心理學(xué)的知識(shí)認(rèn)知方面的內(nèi)容進(jìn)行結(jié)合,在對(duì)相似度進(jìn)行評(píng)估的方面形成了一種共同的認(rèn)識(shí),也就識(shí)對(duì)相似度進(jìn)行評(píng)估需要依賴輸入的案例和歷史數(shù)據(jù)庫(kù),或者在檢索的過(guò)程中能夠保障自動(dòng)化程度較高,使得輸入的案例可以與大量的歷史數(shù)據(jù)進(jìn)行快速的比對(duì)??墒怯捎谝恍﹥?nèi)容之間的聯(lián)系比較的抽象,對(duì)比推理起來(lái)難度較大,那么對(duì)于案例推理系統(tǒng)的聯(lián)想能力要求就更高了。
三、相似度算法的概念
許多人對(duì)于相似度算法以及檢索方法之間的聯(lián)系和區(qū)別認(rèn)識(shí)有誤。相似算法與表現(xiàn)鏈接更為緊密,檢索更趨向于計(jì)算,兩者之間的本質(zhì)有所區(qū)別,但都是包含在相似算法之內(nèi)的。在這篇文章中,相似度算法就是代表了兩者的總稱,由于兩者間差別不大,在學(xué)術(shù)界一般也將兩者混在一起述說(shuō)。
四、案例推理中的相似度算法
在案例推理系統(tǒng)中,相似度算法不僅僅應(yīng)用于某個(gè)方面,而是貫穿整個(gè)系統(tǒng)。也就是說(shuō)相似度算法在案例推理的很多方面均有所使用。
(1)案例推理系統(tǒng)和相似度算法的關(guān)系
相似度算法的基礎(chǔ)條件之一就是案例,在進(jìn)行相似度計(jì)算的過(guò)程中,需要大量的案例來(lái)進(jìn)行比對(duì),面對(duì)不同類型的案例,需要采取不一樣的計(jì)算方法。
案例根據(jù)表示復(fù)雜程度的不同可以劃分成為兩個(gè)類別,即結(jié)構(gòu)化和簡(jiǎn)單的表示。早進(jìn)行案例推理計(jì)算的時(shí)候,系統(tǒng)會(huì)默認(rèn)案例都是一種類別的,但是隨著該領(lǐng)域的逐步發(fā)展,這種計(jì)算方法咋一些較為復(fù)雜的情況下就不適用了,為了解決所面臨的的問(wèn)題,就有人提出了新的相似度算法,這種新算法的出現(xiàn)也給整個(gè)案例推理系統(tǒng)帶來(lái)了巨大的影響。
(2)案例的分類和相似度算法間的關(guān)系
為了保障檢索的高效性,在計(jì)算的時(shí)候需要對(duì)案例進(jìn)行分類。在進(jìn)行相似度計(jì)算的時(shí)候,會(huì)根據(jù)案例的不同特點(diǎn)把它們進(jìn)行分類,形成一個(gè)個(gè)的類別或者簇,當(dāng)我們輸入想要研究的問(wèn)題時(shí),系統(tǒng)就會(huì)根據(jù)輸入的案例進(jìn)行檢索找到它所屬于的類別,之后再在這個(gè)類別中去進(jìn)行仔細(xì)的查找。使用這樣的計(jì)算方法,前提就是要對(duì)案例進(jìn)行分類,所以可以說(shuō)案例分類是相似度算法的基礎(chǔ)。
五、案例推理系統(tǒng)中相似度算法的應(yīng)用情況
隨著近幾年來(lái)學(xué)術(shù)界對(duì)案例推理系統(tǒng)的不斷完善,在進(jìn)行相似度運(yùn)算的時(shí)候越來(lái)越快速靈活。系統(tǒng)會(huì)根據(jù)輸入案例的特征對(duì)安利進(jìn)行自動(dòng)的劃分,并根據(jù)案例的種類選取相適應(yīng)的算法來(lái)進(jìn)行運(yùn)算。主要的研究成果有一下幾個(gè)方面。
第一,最鄰近算法。這種算法是整個(gè)案例推理系統(tǒng)中最常見(jiàn)也是最簡(jiǎn)單的計(jì)算方法,它樂(lè)意通過(guò)加權(quán)運(yùn)算將案例的全部屬性進(jìn)行加權(quán)、綜合處理,到最后根據(jù)加權(quán)的得分找到案例所歸屬的類別,并對(duì)數(shù)據(jù)庫(kù)中的案例與之相似程度進(jìn)行排序,最終找到最最貼近的案例作為例子,根據(jù)找到的案例的解決方法來(lái)解決當(dāng)前輸入的問(wèn)題。
第二,進(jìn)行多維的檢索。一些結(jié)構(gòu)型的案例可以很清楚額表現(xiàn)出其屬性和相關(guān)的內(nèi)容,但是還有很多的表示型的案例不能被直接觀察到,它具有的屬性以各種各樣的方式組合在一起。這時(shí)候就需要對(duì)案例進(jìn)行多維的檢索,形成多維的空間再在其中找尋臨近的點(diǎn)。目前的多維檢索主要是指降低維度的索引方法和空間的索引方法。
第三,以歸納方法為基礎(chǔ)的相似度算法。在商業(yè)范疇內(nèi),有許多的案例推理系統(tǒng)都運(yùn)用到了歸納的方法,通過(guò)對(duì)原來(lái)的檢索進(jìn)行匯總歸納,制造出決策的流程,通過(guò)原來(lái)處理案例的經(jīng)驗(yàn)來(lái)對(duì)新的案例進(jìn)行識(shí)別處理,自動(dòng)的將案例根據(jù)屬性的不同劃分成簇,最后使得每個(gè)簇中的案例都有許多的相似之處,這就是歸納,對(duì)案例的歸納。這種以歸納作為運(yùn)算基礎(chǔ)的算法比較適合于語(yǔ)義方面,面對(duì)一些描述不夠完整的案例,運(yùn)用這種計(jì)算方法能夠很快又準(zhǔn)確的進(jìn)行。不過(guò)這種算法需要很高的知識(shí)和工程成本,而且這種算法必須借助互聯(lián)網(wǎng)進(jìn)行運(yùn)算傳播。
第四,以模糊邏輯為基礎(chǔ)的算法。有時(shí)候輸入案例和我們儲(chǔ)存的案例差異程度較大,這個(gè)時(shí)候就需要采取模糊邏輯來(lái)對(duì)案例進(jìn)行處理。案例推理系統(tǒng)一般是通過(guò)講案例的結(jié)構(gòu)和屬性進(jìn)行轉(zhuǎn)化,轉(zhuǎn)化成模糊的邏輯或者模糊的邏輯術(shù)語(yǔ),從而使得匹配的過(guò)程得以簡(jiǎn)化,同時(shí)也便于對(duì)案例的分類。運(yùn)用這種算法還可以將多個(gè)案例結(jié)合在一起建成一個(gè)索引,這種方法運(yùn)用起來(lái)十分靈活,在天氣預(yù)報(bào)方面的使用十分廣泛。
第五,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的算法。以神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)的相似度算法又可以根據(jù)連接結(jié)構(gòu)分為以原型為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)和以專家經(jīng)驗(yàn)為基礎(chǔ)的子網(wǎng)絡(luò)。以原型為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)將案例庫(kù)分為了三層,第一層是輸入,輸入的案例的每個(gè)屬性作為一個(gè)神經(jīng)元來(lái)儲(chǔ)存,第二層則是代表了神經(jīng)元的原型,原型之中包含了案例的特征,第三層是輸出,輸出的內(nèi)容作為一個(gè)類別。除了整個(gè)輸入輸出的過(guò)程,整個(gè)系統(tǒng)還有儲(chǔ)存的空間來(lái)安放那些無(wú)法被識(shí)別和分類的內(nèi)容。專家經(jīng)驗(yàn)的子網(wǎng)絡(luò)及時(shí)通過(guò)對(duì)每個(gè)輸入層內(nèi)容的屬性進(jìn)行相似度進(jìn)行分析,最終和歷史信息比對(duì),一層一層的找出相似度最高的案例。
總結(jié):
案例推理系統(tǒng)是以相似度算法作為核心的一種研究方式,隨著近幾年來(lái)相關(guān)專業(yè)的不斷發(fā)展,人們對(duì)此耳朵重視程度也越來(lái)越高,相關(guān)專業(yè)的衍生技術(shù)也越來(lái)越多,案例推理系統(tǒng)也發(fā)展的越來(lái)越完善,可是相比較于其他專業(yè)的發(fā)展,相似度算法方面的研究還是過(guò)于淺顯,筆者認(rèn)為在該方面還有很大的研究和發(fā)展空間。加強(qiáng)對(duì)相似度算法的研究,有助于推進(jìn)案例推理系統(tǒng)的發(fā)展,同時(shí)也有助于拓寬專業(yè)的研究范圍,推進(jìn)我國(guó)相關(guān)產(chǎn)業(yè)和技術(shù)的發(fā)展。希望相關(guān)方面的專家學(xué)者可以在現(xiàn)有的理論基礎(chǔ)上進(jìn)一步對(duì)相似度算法進(jìn)行研究,以挖掘其深層次的作用和意義。
參考文獻(xiàn):
[1] Gentner D. Structure-mapping: A theoretical framework for analogy[J].Cognitive Science, 1983, 7 (2 ): 155一170.
[2] Gick M.,Holyoak K J. Analogical problem solving[J].Cognitive psychology,1980, 12:306-355.
[3]Tversky A. Feature of Similarity) JI .Psychological Review, 1977, 84 (4 ) : 327一352.
[4] Vosniadou S, Ortoxry A. Similarity and Analogical Reason-ingl MI·New York:Cambridge University Press, 1989.
[5] Bunke H, Messmer S T. Similarity measures for structuredrepresentation) CI //Proceedings First European Workshop on Case-Based Reasoning.}S. 1. I:}s. n. I,1993: 26一31.
作者簡(jiǎn)介:王西妍,(2000.9.7-),女,漢族,河南省焦作市人,學(xué)生,鄭州中學(xué)。endprint