• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于面本體的情境搜索研究

      2013-07-11 09:36:04周竹榮
      關(guān)鍵詞:本體文檔語(yǔ)義

      王 敏,周竹榮

      西南大學(xué) 計(jì)算機(jī)與信息科學(xué)學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,重慶 400715

      基于面本體的情境搜索研究

      王 敏,周竹榮

      西南大學(xué) 計(jì)算機(jī)與信息科學(xué)學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,重慶 400715

      搜索引擎從1994年第一次被提出以來(lái),經(jīng)歷了幾代的發(fā)展,從簡(jiǎn)單的關(guān)鍵字匹配技術(shù),發(fā)展到了廣泛使用鏈接分析和相關(guān)度反饋等技術(shù)[1]。當(dāng)前的搜索引擎發(fā)展趨勢(shì)是增加搜索結(jié)果的覆蓋面和提高用戶的相關(guān)度。

      目前已有將用戶情境引入信息搜索的研究,這些研究的目標(biāo)是從某一特定方面反映用戶當(dāng)前情境,從而貼近用戶需求。常用的方法通常是按領(lǐng)域進(jìn)行分類搜索,或者通過(guò)對(duì)用戶的瀏覽歷史進(jìn)行用戶的特征分析來(lái)表示用戶情境等。但是,當(dāng)前的情景搜索研究,還不能夠充分考慮用戶的當(dāng)前狀態(tài),全面體現(xiàn)用戶的即時(shí)情境信息,同時(shí)搜索的查全率和查準(zhǔn)率都有待提高。為了解決這些問(wèn)題,本文提出了基于面本體的情境搜索,將用戶的搜索過(guò)程與用戶當(dāng)前情境關(guān)聯(lián)起來(lái)。根據(jù)情境本體對(duì)用戶輸入的關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展,生成相應(yīng)的搜索本體。通過(guò)面本體標(biāo)注各類異構(gòu)文檔,最后利用洪泛相似度算法進(jìn)行搜索本體與面本體的本體匹配,從而實(shí)現(xiàn)情境搜索。本文的工作可以較全面地利用用戶的當(dāng)前情境信息,從各個(gè)“面”,返回用戶情境相關(guān)聯(lián)的搜索結(jié)果。

      1 相關(guān)研究

      目前,國(guó)內(nèi)已經(jīng)有把情境因素應(yīng)用于信息搜索的嘗試,比如騰訊公司推出的騰訊搜搜,它認(rèn)為情境搜索是綜合考慮用戶情境的一種智能化搜索[2]。通過(guò)對(duì)用戶意圖的深入理解,在用戶使用互聯(lián)網(wǎng)服務(wù)的各種場(chǎng)景下提供給用戶的最貼切的搜索服務(wù),強(qiáng)調(diào)“以人為本”,也就是以用戶為中心,根據(jù)其搜索行為的時(shí)間、地點(diǎn)、輸入、需求、習(xí)慣、背景等因素,通過(guò)情境匹配得到最適合的搜索結(jié)果,再將這一結(jié)果通過(guò)用戶的搜索情境因時(shí)因地地呈現(xiàn)給用戶。騰訊搜搜采用的技術(shù)主要是針對(duì)龐大的用戶數(shù)據(jù)進(jìn)行海量的Hidden Web數(shù)據(jù)挖掘,通過(guò)龐大的用戶關(guān)聯(lián)來(lái)表示用戶情境。

      同時(shí),國(guó)外已經(jīng)出現(xiàn)了基于情境因素的信息搜索研究,只是每種研究對(duì)情境的定義與表示都是不一樣的。Lawrence[3]通過(guò)用戶選擇搜索信息的類別,把詳細(xì)的信息

      CNKI出版日期:2011-11-14 http://www.cnki.net/kcms/detail/11.2127.TP.20111114.0939.028.html分類作為情境信息提交給搜索引擎,返回的結(jié)果跟提交的信息密切相關(guān)。另外一些工具通過(guò)自動(dòng)地分析用戶桌面上的文檔,將用戶常用的文檔內(nèi)容生成情境信息提交給搜索引擎[4]。還有一種方法是將用戶之前的瀏覽信息和歷史操作作為用戶的情境數(shù)據(jù),根據(jù)用戶的瀏覽與操作習(xí)慣,通過(guò)一種個(gè)性化定制的方法來(lái)搜索信息[5]。此外,還有一些常用的方法是通過(guò)鏈接分析[6]或者啟發(fā)式搜索[7]來(lái)表示用戶的情境信息。與這些方法不同的是,本文使用本體來(lái)表示用戶的情境信息,本體擁有良好的概念層次結(jié)構(gòu),能夠支持邏輯推理,非常適合信息檢索中的基于要領(lǐng)的檢索的需求。

      2 基于面本體的情境搜索模型

      2.1 總體思想

      在信息搜索中,用戶輸入的查詢信息往往是未經(jīng)語(yǔ)法和語(yǔ)義規(guī)范化處理的關(guān)鍵詞,由于這些查詢?cè)~語(yǔ)有多義性和片面性,它們不能準(zhǔn)確表達(dá)出用戶的搜索需求,所以需要對(duì)用戶輸入用來(lái)查詢的關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展。語(yǔ)義擴(kuò)展技術(shù)是在原來(lái)查詢的基礎(chǔ)上加入與用戶用詞相關(guān)聯(lián)的詞,組成新的更長(zhǎng)的,語(yǔ)義上更準(zhǔn)確的查詢?cè)~,這樣可以在一定程度上彌補(bǔ)用戶查詢信息不足的缺陷。

      情境是對(duì)當(dāng)前環(huán)境持續(xù)變化的狀態(tài)表示,這種環(huán)境既包括用戶環(huán)境,也有當(dāng)前搜索的物理環(huán)境和計(jì)算環(huán)境,因此,基于情境對(duì)用戶查詢關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展能更貼近用戶基于自身環(huán)境的需求。情境可以用面來(lái)表示,因?yàn)槊媸且环N表達(dá)領(lǐng)域知識(shí)的元數(shù)據(jù),通過(guò)面將領(lǐng)域知識(shí)的整體信息分解為含有具體意義的部分信息,生成面本體,使領(lǐng)域知識(shí)的表達(dá)更為體系化,結(jié)構(gòu)化。因此,提出一種基于面本體的情境搜索模型(Faceted Ontology-based Context Search,F(xiàn)OCS),F(xiàn)OCS模型結(jié)構(gòu)如圖1所示。

      圖1 基于面本體的情境搜索

      FOCS模型的總體思想是:首先構(gòu)建情境本體,利用情境本體對(duì)用戶輸入的查詢?cè)~進(jìn)行語(yǔ)義擴(kuò)展,生成與當(dāng)前用戶情境相關(guān)聯(lián)的搜索本體,再通過(guò)標(biāo)注各類異構(gòu)文檔形成基于不同領(lǐng)域的面本體;然后搜索本體與面本體通過(guò)相似度洪泛算法進(jìn)行本體匹配,在面本體中匹配出與搜索本體最相似的面本體的子本體,最后通過(guò)相關(guān)函數(shù)將子本體轉(zhuǎn)換成由標(biāo)題,日期,鏈接,內(nèi)容這幾個(gè)關(guān)鍵字段組成的數(shù)據(jù)信息,形成搜索結(jié)果,返回給用戶。本文主要的研究重點(diǎn)是在情境本體和面本體的基礎(chǔ)上構(gòu)造情境搜索模型,由于將本體轉(zhuǎn)換為數(shù)據(jù)信息的技術(shù)比較成熟,這部分內(nèi)容本文不作詳細(xì)介紹。

      2.2 相關(guān)定義

      2.2.1 情境搜索

      定義1(情境搜索(Faceted Ontology-based Context Search,F(xiàn)OCS))基于面本體的情境搜索可抽象為四元組的概念模型,表示為FOCS=<SO,F(xiàn)O,UI,map(SO,F(xiàn)O),res(RO,Doc)>。

      SO表示搜索本體,是由用戶輸入的查詢關(guān)鍵詞通過(guò)情境本體進(jìn)行語(yǔ)義擴(kuò)展生成;FO表示相關(guān)領(lǐng)域的面本體,通過(guò)文檔標(biāo)注生成;情境本體和面本體都是領(lǐng)域本體。UI是用戶接口,它的作用是通過(guò)函數(shù)Vq:INquery→RCsetin將用戶輸入的關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展生成相應(yīng)的搜索本體;map(SO,F(xiàn)O)是匹配搜索本體和面本體的相似度洪泛映射,通過(guò)map(SO,F(xiàn)O)實(shí)現(xiàn)本體匹配;res(RO,Doc)函數(shù)將匹配的結(jié)果本體轉(zhuǎn)換成相應(yīng)的數(shù)據(jù)信息,形成搜索結(jié)果,返回給用戶。

      2.2.2 領(lǐng)域本體

      領(lǐng)域本體是用于描述特定領(lǐng)域知識(shí)的一種專門本體,它由概念,屬性,對(duì)象,關(guān)系和子領(lǐng)域本體組成。本文對(duì)領(lǐng)域本體的形式化定義如下。

      定義2(領(lǐng)域本體(Domain Ontology,DO))表示為一個(gè)五元組,即DO=<C,Ac,Hc,R,f>。

      其中,C={c1,c2,…,cn}表示特定領(lǐng)域概念集合;Ac表示概念屬性的集合;Hc(Arc)?C×C是一個(gè)有向關(guān)系,表示為一個(gè)有向無(wú)環(huán)圖;R表示概念之間的非層次關(guān)系;f表示概念的實(shí)例集合。

      下文定義的面本體和情境本體是領(lǐng)域本體的實(shí)例化表示,本身屬于自身特定領(lǐng)域的一種領(lǐng)域本體。面本體用來(lái)規(guī)范不同領(lǐng)域的搜索數(shù)據(jù),情境本體用來(lái)規(guī)范用戶的情境信息數(shù)據(jù)。面本體可以包含情境本體,情境本體是面本體的子集,可以通過(guò)本體匹配來(lái)篩選取出面本體中與由情境本體擴(kuò)展形成的搜索本體最相似的部分,以此來(lái)實(shí)現(xiàn)情境搜索。

      2.2.3 面本體

      在面搜索里,各個(gè)不同領(lǐng)域的文檔信息以面為單位被標(biāo)注,文檔根據(jù)不同的面,按概念的層次結(jié)構(gòu)進(jìn)行分類,通過(guò)與不同的領(lǐng)域本體進(jìn)行索引形成相關(guān)領(lǐng)域的面本體,在基于共享一系列面本體的基礎(chǔ)上,系統(tǒng)能語(yǔ)義的搜索信息,提供給用戶更智能的搜索內(nèi)容。

      定義3(面(Facets,F(xiàn)S))一種為信息空間定義的可供選擇的,可按相應(yīng)概念進(jìn)行層次劃分的元數(shù)據(jù)。對(duì)于每一個(gè)領(lǐng)域,可按以下五個(gè)面進(jìn)行劃分[8],即,領(lǐng)域(Discipline),實(shí)體(Entity),性質(zhì)(Property),活動(dòng)(Action),修正(Modifier)。

      圖2 計(jì)算機(jī)領(lǐng)域的面本體

      定義4(面本體(Facet Ontology,F(xiàn)O))領(lǐng)域本體的實(shí)例化表示,將事物的各個(gè)面按概念層次進(jìn)行表示的數(shù)據(jù)模型。面本體的形式化定義為:FO={FC,Ac,Hc,R,f}。FC表示在領(lǐng)域,實(shí)體,性質(zhì),活動(dòng),修正五個(gè)面上相應(yīng)的概念。圖2表示了一個(gè)計(jì)算機(jī)領(lǐng)域的面本體。

      2.2.4 情境本體

      情境表示對(duì)可執(zhí)行環(huán)境持續(xù)變化的狀態(tài)表示,可執(zhí)行環(huán)境包括計(jì)算環(huán)境,用戶環(huán)境和物理環(huán)境。情境需要表明的信息需要符合一個(gè)4W1H原則,即誰(shuí)(Who),時(shí)間(When),地點(diǎn)(Where),內(nèi)容(What),方式(How)。本文對(duì)情境的定義如下:

      定義5(情境(Context))用來(lái)描述一個(gè)實(shí)體特征的相關(guān)信息,基本的屬性有四個(gè),位置,身份,活動(dòng),時(shí)間。這四個(gè)屬性是對(duì)特定情境實(shí)體的一種初始化特征描述屬性,這些屬性不僅符合了4W1H原則,同時(shí)也提供了其他情境信息的線索。

      定義6(情境本體(Context Ontology))領(lǐng)域本體的一種實(shí)例化,表示與之相關(guān)聯(lián)的事情的各種層次分類,包括當(dāng)前的場(chǎng)景,事件,社會(huì)等。其形式化定義為:CO={CC,Ac,Hc,R,f},其中CC={cc1,cc2,…,ccn}表示各個(gè)情境的概念集合。

      情境本體[9]可以分為上層本體(Upper Ontology)和特定領(lǐng)域本體(Domain-Specific Ontologies)。上層本體是一個(gè)高層本體,描述了基本情境屬性的通用特征,包括位置,身份,活動(dòng),時(shí)間。特定領(lǐng)域本體是一個(gè)本體集,定義了相關(guān)子領(lǐng)域的通用概念和特征。情境本體的通用描述圖和一個(gè)具體的情境本體描述圖如圖3、圖4所示。

      2.3 關(guān)鍵算法

      2.3.1 基于情境本體的語(yǔ)義擴(kuò)展算法

      定義7(用戶接口(User Interface,UI))用二元組表示UI=<INquery,vq:INquery→Csetin>。

      將用戶輸入的查詢關(guān)鍵詞通過(guò)情境本體進(jìn)行語(yǔ)義擴(kuò)展是情境搜索的一個(gè)重要步驟,在FOCS模型中用函數(shù)vq:INquery→RCsetin來(lái)實(shí)現(xiàn)語(yǔ)義擴(kuò)展。INquery表示用戶輸入的查詢?cè)~。vq表示用戶需求生成函數(shù),將用戶輸入的查詢?cè)~,通過(guò)情境本體進(jìn)行語(yǔ)義擴(kuò)展生成相應(yīng)的搜索本體。

      圖3 情境本體的通用描述圖

      圖4 具體的情境本體

      本文所提出的基于情境本體的語(yǔ)義擴(kuò)展就是建立在利用子類關(guān)系進(jìn)行擴(kuò)展的方法之上的,其基本思想是利用本體中的路徑來(lái)進(jìn)行用戶查詢的擴(kuò)展,本文所用到的本體是一種表示情境概念的領(lǐng)域本體,它能夠充分地表達(dá)出用戶的角色,環(huán)境等當(dāng)前的情境信息。情境本體作為情境概念的組織方式,概念之間的關(guān)系主要是層次關(guān)系,可以把情境本體通過(guò)IMO規(guī)格轉(zhuǎn)換成相應(yīng)的情境圖。上下層次關(guān)系與平行層次關(guān)系用情境圖來(lái)表示即父子關(guān)系和兄弟關(guān)系,語(yǔ)義擴(kuò)展可以從上下層次或平行層次進(jìn)行擴(kuò)展,用情境圖來(lái)表示即是從父節(jié)點(diǎn),孩子節(jié)點(diǎn),兄弟節(jié)點(diǎn)進(jìn)行擴(kuò)展。

      本文基于情境本體的語(yǔ)義擴(kuò)展算法(Context Ontologybased Semantic Expansion,COSE),以用戶輸入的關(guān)鍵詞為基本節(jié)點(diǎn),通過(guò)情境圖進(jìn)行相應(yīng)的兄弟節(jié)點(diǎn),父節(jié)點(diǎn),孩子節(jié)點(diǎn)的擴(kuò)展。為了控制擴(kuò)展范圍可以參照文獻(xiàn)[10],定義語(yǔ)義集合SRC(c,r),SRP(c,r),SRS(c,r),分別表示情境圖中孩子概念集合,父概念集合和兄弟概念集合,其中語(yǔ)義半徑r(r>1),表示概念與其相關(guān)概念之間的距離,c∈A表示待擴(kuò)展的語(yǔ)義概念。

      基于情境本體的語(yǔ)義擴(kuò)展算法(COSE):

      2.3.2 基于本體映射的情境搜索算法

      在本文中,搜索本體映射面本體的基本思想是,將搜索本體和面本體通過(guò)IMO規(guī)格轉(zhuǎn)換成為相應(yīng)的有向無(wú)環(huán)圖,稱為搜索圖和面圖。搜索圖中的每一個(gè)元素映射其在面圖中最相似的子圖,搜索本體到面本體的映射就轉(zhuǎn)換成了搜索圖在面圖中獲得最佳的子圖的圖匹配問(wèn)題。

      Melnik等人在2002年的時(shí)候,提出了一種多功能的圖匹配算法SF[11]。該方法的基本思想是將要匹配的模型轉(zhuǎn)換為帶標(biāo)記的有向圖,這些圖用來(lái)做迭代不動(dòng)點(diǎn)計(jì)算,由計(jì)算結(jié)果可知一個(gè)圖里的哪些節(jié)點(diǎn)和另一個(gè)圖的節(jié)點(diǎn)相似。相似度的計(jì)算的基本思想為:如果兩個(gè)節(jié)點(diǎn)是相似的,當(dāng)它們的鄰接元素也是相似的。兩個(gè)元素的相似性部分傳播給了它們的鄰居,這種傳播方式類似于IP廣播。在FOCS模型中,假設(shè)有搜索本體S1,面本體S2,首先將S1和S2轉(zhuǎn)換成相應(yīng)的搜索圖G1和面圖G2,圖中的每條邊,用一個(gè)三元組表示(s,p,o),分別是 源點(diǎn),邊名,目的點(diǎn)。

      定義8(相似度傳播圖(Pairwise Connectivity Graph,PCG))由搜索圖和面圖中具有相同權(quán)值的邊的節(jié)點(diǎn)組成的新的節(jié)點(diǎn)的有向圖。用三元組((x;y);p;(x′;y′))表示。其中,PCG(A;B)<==>(x;p;x′) €A and(y;p;y′) €B。關(guān)鍵是p要相同。

      如圖5所示,模型A、B從兩個(gè)有向圖中建立起它們的PCG。圖中的每個(gè)節(jié)點(diǎn),都是A和B中的元素構(gòu)成的2元組,叫做匹配對(duì)(map pairs)。

      圖5 相似度傳播圖

      定義9(傳播推導(dǎo)圖(Induced Propagation Graph,IPG))從PCG推導(dǎo)而來(lái),加上了反向的邊,邊上注明了傳播系數(shù)(Transmission Coefficient,TC),其值為1/n,n為相應(yīng)的相同權(quán)值的邊的數(shù)目,如圖6所示。

      圖6 傳播推導(dǎo)圖

      定義10(映射對(duì))經(jīng)過(guò)相似度洪泛計(jì)算后的匹配對(duì)的結(jié)果稱作映射對(duì)(mapping),記作ó(x;y), 其值大于0,代表了節(jié)點(diǎn)x∈A和y∈B的相似度,是在整個(gè)A×B的范圍上定義的。

      相似度的計(jì)算就是基于ó-values的迭代計(jì)算。假設(shè)ói代表了第i次迭代后的結(jié)果,ó0代表初始相似度,由初始匹配的字符串相似度得出,通常與情境本體所在的領(lǐng)域相關(guān)。在下面的例子里,設(shè)ó0=1。每次迭代中,ó-values都會(huì)根據(jù)其鄰居節(jié)點(diǎn)對(duì)的ó-values乘以相應(yīng)節(jié)點(diǎn)對(duì)的傳播系數(shù)來(lái)增加。例如,在第一次迭代ó1(a1;b1)=ó0(a1;b1)+ ó0(a;b) ×0.5=1.5。類似地,ó1(a,b)=ó0(a,b)+ó0(a1;b1)× 1.0+ó0(a2,b1)×1.0=3.0。接下來(lái),所有ó值進(jìn)行正規(guī)化,比如除以當(dāng)前迭代的ó的最大值,保證所有ó都不大于1。所以在正規(guī)化以后,ó1(a;b)=1.0,ó1(a1,b1)=1.5/3.0=0.5。

      本文提出的情境搜索模型用面本體標(biāo)注各類異構(gòu)文檔,因此,基于上面相似度洪泛的計(jì)算過(guò)程,給出一個(gè)基于面本體的相似度洪泛算法(Faceted Ontology-based SFJoin,F(xiàn)OSFJohin),算法的輸入是由搜索本體和面本體,搜索本體屬于面本體。算法的輸出是由映射對(duì)表示的結(jié)果本體,結(jié)果本體是面本體中與搜索本體最相似的部分,是面本體的子集?;诿姹倔w的相似度洪泛算法表示如下:

      3 實(shí)驗(yàn)

      本文提出的基于面本體的情境搜索模型(FOCS)用一個(gè)中等規(guī)模的數(shù)據(jù)集在一個(gè)實(shí)驗(yàn)性的原形系統(tǒng)里實(shí)現(xiàn)。為了測(cè)試加入情境因素的基于本體的信息搜索系統(tǒng)與沒(méi)有相關(guān)技術(shù)的信息搜索系統(tǒng)的差異,用下面三種信息搜索的技術(shù)來(lái)進(jìn)行比較:(1)通用的使用關(guān)鍵字匹配的信息搜索;(2)使用本體作為知識(shí)表示的信息搜索[12];(3)加入了情境因素的使用本體作為知識(shí)表示的信息搜索(FOCS)。

      實(shí)驗(yàn)采用從CNN科技頻道下載的相關(guān)電子文檔進(jìn)行測(cè)試,用Ontotext實(shí)驗(yàn)室開發(fā)的基于KIM平臺(tái)[13]的本體知識(shí)庫(kù)(Knowledge Base,KB)提供的領(lǐng)域本體對(duì)CNN科技頻道的數(shù)據(jù)進(jìn)行標(biāo)注,該領(lǐng)域KB包含278個(gè)類,131種屬性,34 689個(gè)實(shí)例和462 848個(gè)句子,總共包括705 MB的RDF文本格式。在一個(gè)原型系統(tǒng)上進(jìn)行實(shí)驗(yàn)[14]。采用信息檢索領(lǐng)域廣泛使用的查準(zhǔn)率(Precision)和查全率(Recall)來(lái)評(píng)價(jià)實(shí)驗(yàn)結(jié)果。

      查準(zhǔn)率=檢索到的相關(guān)文檔數(shù)/檢索到的全部文檔數(shù)

      查全率=檢索到的相關(guān)文檔數(shù)/系統(tǒng)全部相關(guān)文檔數(shù)

      在基于KIM平臺(tái)的基礎(chǔ)上,用七組假設(shè)的數(shù)據(jù)進(jìn)行檢測(cè),結(jié)果對(duì)比如表1示。

      表1 關(guān)鍵字搜索法,本體模型搜索與FOCS比較

      表1展示了七個(gè)關(guān)鍵詞分別輸入關(guān)鍵字搜索,本體模型搜索與FOCS模型得出的查全率與查準(zhǔn)率,三個(gè)信息搜索系統(tǒng)的查全率與查準(zhǔn)率對(duì)比如圖7,圖8所示。

      圖7 關(guān)鍵字搜索,本體模型搜索與FOCS模型的查準(zhǔn)率對(duì)比圖

      圖8 關(guān)鍵字搜索,本體模型搜索與FOCS模型的查全率對(duì)比圖

      從實(shí)驗(yàn)結(jié)果生成的表與圖提供的分析數(shù)據(jù)可以看出,較之于傳統(tǒng)的關(guān)鍵字匹配的搜索,采用了本體作為知識(shí)表示的信息搜索系統(tǒng),不僅規(guī)范了用戶的查詢輸入,還能識(shí)別檢索語(yǔ)義,因此,采用本體作為知識(shí)表示的搜索模型較于僅用關(guān)鍵字匹配的搜索模型,可以提高用戶搜索的查準(zhǔn)率與查全率。

      本文所提出的FOCS模型在戶接口部分增加了基于情境本體的語(yǔ)義擴(kuò)展,在搜索過(guò)程中,F(xiàn)OCS模型用面本體進(jìn)行異構(gòu)文檔標(biāo)注,使用面本體與搜索本體進(jìn)行本體匹配,更全面,更準(zhǔn)確地匯集了相關(guān)的信息數(shù)據(jù)。因此FOCS模型比僅用本體作為知識(shí)表示的信息搜索系統(tǒng)的查準(zhǔn)率更高。

      4 結(jié)束語(yǔ)

      本文將本體技術(shù)融合到信息檢索中,首先利用情境本體中的概念詞匯,對(duì)用戶在客戶端輸入的關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展,規(guī)范用戶自然語(yǔ)言的查詢輸入,提取有檢索意義的概念詞組;同時(shí),利用情境本體中定義的概念關(guān)系來(lái)識(shí)別和擴(kuò)展用戶檢索的語(yǔ)義,將其與用戶特定的情境信息相關(guān)聯(lián)。其次將異構(gòu)數(shù)據(jù)庫(kù)中的文檔按領(lǐng)域進(jìn)行標(biāo)注生成相應(yīng)的面本體,規(guī)范了數(shù)據(jù)庫(kù)的信息表示;最終通過(guò)本體匹配從用戶的情境角度,返回用戶的查詢信息,實(shí)現(xiàn)情境搜索。

      [1]Sherman C.Inkomi inside[EB/OL].[2010-08-15].Http://websearch.about.com.

      [2]孫良.用情境搜索開啟未來(lái)之路[J].程序員,2010(3).

      [3]Lawrence S.Context in web search:data engineering[J].IEEE Computer Society,2000,23(9):25-32.

      [4]Duda R O,Hart P E.Patter classification and scene analysis[M]. New York:John Wiley and Sons,1973.

      [5]Bharat K.SearchPad:explicit capture of search context to support web search[C]//Proceedings of the 9th International World Wide Web Conference.Amsterdam:[s.n.],2000.

      [6]Sherman C.Link building strategies[EB/OL].[2010-08-15].http:// websearch.about.com.

      [7]Finkelstein L,Gabrilovich E,Matias Y,et al.Placing search in context:the concept revisited[C]//Proceedings of the 10th International World Wide Web Conference.Hong Kong:[s.n.],2001.

      [8]Giunchiglia F,Dutta B.Faceted lightweight ontologies[D]. Italy:University of Trento,2009.

      [9]Gu T.An ontology-based context model in intelligent environments[C]//Proc Communication Networks and Distributed Systems Modeling and Simulation Conf.San Diego,California,USA:[s.n.],2004.

      [10]張磊.基于語(yǔ)義Ontology聚類研究[J].應(yīng)用科學(xué)學(xué)報(bào),2007,25 (1):74-80.

      [11]Giunchiglia F,Shvaiko P.Semantic matching[J].Knowledge Engineering Review Journal,2004,18(3):265-280.

      [12]Vallet D,F(xiàn)ernandez M.An ontology-based information retrieval model[C]//2nd European Semantic Web Conference (ESWC 2005).Berlin:Springer-Verlag,2005:455-470.

      [13]Kiryakov A,Popov B.Semantic annotation,indexing,and retrieval[J].Journal of Web Semantic,2004,2(1):47-49.

      [14]Castells P,F(xiàn)ernandez M.Self-tuning personalized information retrieval in an ontology-based framework[C]//1st International Workshop on Web Semantics(SWWS2005).Berlin:Springer-Verlag,2005:977-986.

      WANG Min,ZHOU Zhurong

      Department of Computer Science and Technology,Institute of Computer and Information Science,Southwest University, Chongqing 400715,China

      This paper describes a new model based on the faceted-ontology,FOCS,for performing search in context.In the model, the keywords inputted by users are semantic expansion by context-ontology and the related search-ontology is produced.And it annotates all kinds of heterogeneous documents by faceted-ontology.The realization of context search is mapping search-ontology and faceted-ontology by the similarity flooding algorithm.The experimental results show the FOCS is better than the traditional search in the facets of recall and precision.

      faceted ontology;context ontology;context search;similarity flooding algorithm

      為了將用戶的搜索過(guò)程與用戶當(dāng)前情境相關(guān)聯(lián),提出一種基于面本體的情境搜索模型(Faceted Ontology-based Context Search,F(xiàn)OCS)。FOCS根據(jù)情境本體對(duì)用戶輸入的關(guān)鍵字進(jìn)行語(yǔ)義擴(kuò)展,生成相應(yīng)的搜索本體。通過(guò)面本體標(biāo)注各類異構(gòu)文檔,利用洪泛相似度算法進(jìn)行搜索本體與面本體的本體匹配,實(shí)現(xiàn)情境搜索。實(shí)驗(yàn)結(jié)果表明,提出的方法應(yīng)用于搜索引擎,與傳統(tǒng)的信息搜索比較,具有更好的查全率與查準(zhǔn)率。

      面本體;情境本體;情境搜索;相似度洪泛算法

      A

      TP391

      10.3778/j.issn.1002-8331.1107-0474

      WANG Min,ZHOU Zhurong.Context search based on faceted ontology.Computer Engineering and Applications,2013, 49(5):127-131.

      王敏(1987—),女,碩士研究生,主要研究方向:語(yǔ)義網(wǎng)與面向服務(wù)計(jì)算;周竹榮(1970—),男,博士,副教授,碩士生導(dǎo)師,主要研究方向:語(yǔ)義網(wǎng)與面向服務(wù)計(jì)算。E-mail:creaking@swu.edu.cn

      2011-07-25

      2011-10-19

      1002-8331(2013)05-0127-05

      猜你喜歡
      本體文檔語(yǔ)義
      Abstracts and Key Words
      有人一聲不吭向你扔了個(gè)文檔
      對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
      語(yǔ)言與語(yǔ)義
      基于RI碼計(jì)算的Word復(fù)制文檔鑒別
      “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
      認(rèn)知范疇模糊與語(yǔ)義模糊
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      澄江县| 交口县| 翁牛特旗| 宿迁市| 淅川县| 西充县| 广西| 新昌县| 和硕县| 平塘县| 皋兰县| 沅江市| 柳林县| 孙吴县| 冷水江市| 安达市| 安溪县| 孟州市| 长寿区| 罗城| 平舆县| 正蓝旗| 长子县| 丰宁| 鲁甸县| 瑞昌市| 永定县| 涿鹿县| 大埔区| 隆回县| 遵义县| 龙游县| 平凉市| 莱西市| 江永县| 微山县| 松桃| 万年县| 大安市| 富宁县| 利津县|