歷子謙 劉寶
摘 要:提出了一種基于本體的相似度評估的方法和案例檢索以及一種基于本體的案例自適應(yīng)模型,這使得CBR(Case-based Reasoning)系統(tǒng)的開發(fā)能夠在語義層次上進行相似性評估和案例自適應(yīng),從而得出結(jié)果??梢愿玫胤从秤脩舻恼鎸嵭枨?并可以從中獲得CBR所需的領(lǐng)域知識。本體獲取極大地減少了傳統(tǒng)CBR系統(tǒng)中知識獲取的瓶頸。最后,提出了一種基于本體的CBR系統(tǒng)模型框架,從軟件復(fù)用的角度提高了CBR系統(tǒng)的開發(fā)效率。
關(guān)鍵詞:本體;案例推理;語義相似性;案例適配;模型;
1、CBR與本體的結(jié)合
1)本體作為CBR系統(tǒng)詞匯
針對案例的詞匯,一種直接的表達方式是使用領(lǐng)域本體以一種面向?qū)ο蟮姆绞絹肀磉_它,即概念上對應(yīng)的類和個體對應(yīng)的對象,而關(guān)系對應(yīng)于描述對象的屬性(可以分為數(shù)據(jù)類型屬性和對象屬性)。案例結(jié)構(gòu)可以通過本體中的類來定義,例如destination目的地概念,可以將其視為一個類,并且該類的實例可以是北京或上海等。類似地,對于查詢詞匯,本體也可以用于定義和表達更豐富的查詢,以便用戶可以更好地表達他們的需求。在相似性評估中,本體可以在語義級別上填補查詢詞和案列詞之間的空白。
2)基于本體的案例檢索
在案例檢索中,相似性評估是非常重要的推理環(huán)節(jié),用于評估查詢和檢索到的案例之間的相似性。使用本體知識時,概念層次結(jié)構(gòu)及其在本體中的關(guān)系將對相似性評估產(chǎn)生有益的影響。類層次結(jié)構(gòu)包括對象之間的相似性知識。在本文中,我們定義并使用基于本體的案例相似性度量函數(shù)。一般而言,兩個結(jié)構(gòu)化案例的相似性可以分為全局和局部兩個層次。局部相似性是簡單屬性之間的相似性,而全局相似性是簡單屬性的加權(quán)平均值,也稱為平均相似性,可以通過以下公式計算:
averageSimilarity=∑i=1nlocalSimi(i)×weightaverageSimilarity=∑i=1nlocalSimi(i)×weight(i)/∑i=1nweight(i)(i)/∑i=1nweight(i)
其中:n為簡單屬性的個數(shù);localSimi (i) 表示案例間第i個簡單屬性間的相似度 (0~1的某個值) ;weight (i) 表示第i個屬性的權(quán)重。
局部相似性度量使用了基于本體的概念相似性度量標準?;诒倔w的相似性度量從不同的角度可有多種方法, 本文定義了如下兩種:
deep_Simi (ci, cj)
=max (depth (commonSuper(ci,cj)))/maxCi∈CN(depth(Ci)) ?cosine_Simi (ci, cj) =|super (ci, C) ∩super
其中:CS為本體中的概念集;super (c, C) 表示概念c的超概念集;commonSuper (ci, cj) 表示兩個體ci、cj共同的超概念集;depth (c) 表示概念c的深度。
3)基于本體的案例適配
本文利用描述邏輯的推理機制定義了基于本體的模型和基于替代的適配方案。替代的定義如下:若依賴關(guān)系Depends On(i1,i2 )成立,當i1被另外一個值i1″代替時,為了使關(guān)系Depends On()仍然成立,必須找到i2的代替物i2″。因此需要在知識庫中聲明i2″與i1″的關(guān)系應(yīng)與i2與i1的關(guān)系相似。
2基于本體的案例推理模型框架(MONCBR)
從頭開發(fā)CBR應(yīng)用程序?qū)⑹且豁椘D巨的任務(wù)。但是,如果我們可以重用以前開發(fā)的某些組件和推理方法,則開發(fā)效率將大大提高。從這個角度出發(fā),在以上關(guān)于本體和CBR結(jié)合的討論的基礎(chǔ)上,本文提出了一個開發(fā)CBR應(yīng)用程序的模型框架。由于該框架可以集成以前的開發(fā)結(jié)果,并為將來的開發(fā)提供通用的開發(fā)過程和接口,因此在兩個方面都很好地支持了軟件工程中軟件重用的想法。
下面分別介紹各層的功能及其實現(xiàn)。
2.1持久層
持久層是指案例的持久化的存儲位置,其可以是數(shù)據(jù)庫,文本文件,或是描述邏輯本體的持久存儲位置。可以根據(jù)知識類型同時選擇幾種方法。有許多方式來表達的情況下,如最一般的(屬性值),結(jié)構(gòu)化表示,基于框架的表示,面向?qū)ο蟮谋硎竞驼Z義網(wǎng)絡(luò)方法。
2.2連接器
連接器是一種接口并且是接口層的主要組件。它負責(zé)訪問和檢索持久層案例,并以統(tǒng)一的方式將案例返回給CBR系統(tǒng)。根據(jù)案例持久存儲的三種主要方式(關(guān)系數(shù)據(jù)庫,本體庫,文本文件),下面將描述相應(yīng)的訪問方法和技術(shù)實現(xiàn):
2.2.1關(guān)系數(shù)據(jù)庫連接器
由于該框架基于Java技術(shù),因此可以充分利用Java Bean和J2EE的最新核心技術(shù)Hibernate。關(guān)系數(shù)據(jù)庫的情況也可以用Java Bean表示。Java Bean是Java類。每個公共屬性都有其自己的get和set方法。它的修改和管理可以通過稱為Introspection的Java技術(shù)自動實現(xiàn)。
2.2.本體連接器
本體連接器用于訪問存儲在本體中的知識。用于訪問存儲在本體中的知識。Jena是基于Java語言的語義Web開發(fā)工具,提供用于處理Modal類的RDF圖的API。使用這些API,用戶可以選擇將RDF圖存儲在內(nèi)存或持久性存儲(文件或數(shù)據(jù)庫)中。新版本的jena2支持基于RDFS和owl的語義推理,并提供了相應(yīng)的API工具包,因此該層的實現(xiàn)主要基于Jena工具包。
2.2.3文本連接器
由于許多經(jīng)驗都以文本形式存在(例如網(wǎng)頁),因此訪問文本案例非常重要。該層的實現(xiàn)首先使用信息提取方法來獲取文本信息,然后使用結(jié)構(gòu)化的方式來表達案例。這樣,可以使用常見的CBR方法(例如最近鄰算法)進行推理,因此文本信息的提取是該層的關(guān)鍵。
2.3案例的內(nèi)存組織
通過將連接器對象連接到特定的案例持久性層,將案例加載到內(nèi)存中,然后需要一個數(shù)據(jù)結(jié)構(gòu)來組織案例。好的數(shù)據(jù)結(jié)構(gòu)將大大提高效率。針對具體的案例結(jié)構(gòu)案例庫的組織可選用線性表、k-d樹等。
2.4邏輯推理層
該層次是CBR推理過程中相關(guān)算法的具體實現(xiàn),主要是相似性算法和自適應(yīng)算法。根據(jù)應(yīng)用需求,我們可以實現(xiàn)其特定的算法,例如基于數(shù)據(jù)庫的傳統(tǒng)案例檢索算法和ID3決策樹k-d樹。該層還實現(xiàn)了基于本體的相似性評估方法和基于本體的模型替換方法。
3結(jié)語
基于案例的推理(CBR)是快速發(fā)展的人工智能中的一個子領(lǐng)域,基于本體的知識表示是語義推理的前提和基礎(chǔ)。CBR和本體技術(shù)的結(jié)合是CBR發(fā)展的趨勢。本文主要闡述了本體在案例檢索和案例自適應(yīng)中的明顯優(yōu)勢。在此基礎(chǔ)上,提出了一種基于本體的基于案例的推理模型框架MONCBR,并分析了各個模塊的實現(xiàn)方法。該框架具有通用框架的優(yōu)點,并從軟件重用的角度提高了開發(fā)效率。
參考文獻:
[1]曹勇. 基于案例推理的地震應(yīng)急本體案例庫構(gòu)建及案例檢索研究[D].中國地質(zhì)大學(xué)(北京),2018.
[2]吳文曉. 基于本體的突發(fā)事件網(wǎng)絡(luò)輿情案例推理研究[D].西南科技大學(xué),2017.
[3]李蘇豪. 基于點云的建筑表面損傷三維重建與信息集成研究[D].東南大學(xué),2017.
作者簡介:
歷子謙,性別:男,出生年(1995-),籍貫(山東省日照市),民族(漢),學(xué)歷(在讀研究生),研究方向(案例推理系統(tǒng))。