• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于漢語框架網(wǎng)絡(luò)本體的問答系統(tǒng)中語句相似度計(jì)算

    2012-12-31 00:00:00邰楊芳賈君枝
    知識(shí)管理論壇 2012年9期

    [摘要] 基于概念圖理論提出將漢語框架網(wǎng)絡(luò)問答系統(tǒng)中問句的語義框架結(jié)構(gòu)與檢索文本中句子的語義框架結(jié)構(gòu)的匹配問題轉(zhuǎn)化為概念圖匹配問題的思想,將查詢概念圖與資源概念圖的相似度分為框架概念相似度、框架元素概念相似度及句子中語塊相似度三個(gè)部分。測試表明,這種新的計(jì)算問句與答案候選句的語義相似度的方法較之傳統(tǒng)基于關(guān)鍵詞匹配技術(shù)的方法效率更高。

    [關(guān)鍵詞]概念圖匹配 語句相似度 相似度計(jì)算

    1 引 言

    在整個(gè)問答系統(tǒng)中,信息檢索模塊處于一個(gè)中間地位,一方面,它接受問題分析模塊所返回的帶有加權(quán)系數(shù)的問句的特征信息;另一方面,它從大量收集到的文檔集合中,找到與給定的查詢請(qǐng)求相關(guān)的恰當(dāng)數(shù)目的文檔提交給答案抽取模塊。信息檢索模塊對(duì)檢索結(jié)果的篩選并不是一個(gè)精確的匹配過程,而是一個(gè)相似匹配過程,具有一定的模糊值,需要用相似度值來度量查詢與文檔集中某個(gè)文檔之間的相似程度[1]。以用戶的自然語言提問為檢索入口的語義檢索系統(tǒng),需要衡量信息資源中答案候選句與問句的相似度,提取與問句相似度最大的句子,采用適當(dāng)?shù)母袷较蛴脩籼峤粶?zhǔn)確答案。因此,語句相似度的計(jì)算是信息檢索模塊的一個(gè)關(guān)鍵問題。

    2 語句相似度的計(jì)算方法概述

    語句相似度的衡量機(jī)制與對(duì)語句的分析深度密切相關(guān)。從對(duì)語句的分析深度來看,目前句子的相似度計(jì)算方法主要有兩種:①基于向量空間模型的方法[2-3]。該方法把句子看成詞的線性序列,不對(duì)語句進(jìn)行語法結(jié)構(gòu)分析,相應(yīng)的語句相似度衡量機(jī)制只能利用句子的表層信息,即組成句子中詞的詞性、位置、詞頻等信息。由于不加任何結(jié)構(gòu)分析,該方法在計(jì)算語句之間的相似度時(shí)不能考慮句子整體結(jié)構(gòu)的相似性。②基于句法語義分析的方法[4-5]。這是一種深層結(jié)構(gòu)分析法,對(duì)被比較的兩個(gè)句子進(jìn)行深層的句法分析和語義分析,找出句子的組成詞匯信息及語義結(jié)構(gòu)信息。

    本文討論的是封閉式問答系統(tǒng)中問句與檢索文本中句子的相似度,由于漢語句子的表達(dá)形式是多種多樣的,因此重點(diǎn)在于考察問句與檢索文本中句子在語義上的相似度。我們采用基于概念圖匹配的方法計(jì)算法律框架網(wǎng)絡(luò)檢索子系統(tǒng)中用戶自然語言問句與答案候選句的語義相似度,該方法也屬于第二種。

    3 概念圖及語義框架結(jié)構(gòu)

    3.1 概念圖與概念圖匹配

    概念圖是一個(gè)由一些結(jié)點(diǎn)和弧線組成的層次結(jié)構(gòu),其中結(jié)點(diǎn)用來表示概念,對(duì)應(yīng)于本體中的類、屬性或者實(shí)例等;而弧線則表示兩個(gè)概念之間的關(guān)系,對(duì)應(yīng)本體中的關(guān)系。

    概念圖的匹配不是概念圖的完全匹配,而是概念圖間的相似度計(jì)算。文獻(xiàn)[6]中闡述了通過WorldNet中兩個(gè)概念的語義距離得到類之間的語義相似度,然后將各個(gè)結(jié)點(diǎn)和關(guān)系的相似度按權(quán)值累加得出兩個(gè)RDF圖之間的相似度。文獻(xiàn)[7]也用到了該方法來計(jì)算兩個(gè)概念圖之間的相似性。在這兩篇文獻(xiàn)中,分別把本體看作一個(gè)RDF圖和一個(gè)概念圖。為了避免計(jì)算時(shí)遞歸陷入無限循環(huán),規(guī)定用戶指定一個(gè)查詢概念圖的入口結(jié)點(diǎn),已有的被檢索的概念圖也有一個(gè)入口結(jié)點(diǎn),僅僅比較在兩個(gè)概念圖中同等位置的概念的相似性。Poole和Campebll在文獻(xiàn)[8]中為概念圖的匹配定義了三種相似度,即表層相似度(surface similarity)、結(jié)構(gòu)相似度(structure similarity)和主題相似度(thematic similarity),表層相似度和結(jié)構(gòu)相似度分別對(duì)應(yīng)于待匹配的對(duì)象和關(guān)系的相似性,而主題相似度則取決于同時(shí)考慮概念和關(guān)系出現(xiàn)的特定模式。

    3.2 基于漢語框架網(wǎng)絡(luò)本體的句子語義框架結(jié)構(gòu)

    3.2.1 漢語框架網(wǎng)絡(luò)本體 利用框架語義學(xué)原理,我們構(gòu)建了漢語框架網(wǎng)絡(luò)知識(shí)本體,并利用該本體知識(shí)對(duì)本地庫中的文本進(jìn)行了框架語義標(biāo)注。按照框架語義學(xué)的思想,句子中一個(gè)含有述謂意義的詞匯激活一個(gè)事件場景,場景中有各種角色參加[9]。在漢語框架網(wǎng)絡(luò)數(shù)據(jù)庫中,這個(gè)被激活的事件場景被稱為“框架”(Frame),參與到場景中的角色被稱為框架元素(Frame Element, FE),句子中那些含有述謂意義的詞匯就是所激活框架的詞元(Lexical Unit,LU)。此外,“框架”之間的相互作用形成多樣化的框架間關(guān)系,包括橫向關(guān)系和縱向關(guān)系。例如,依照概念間的相似性比較形成概念的邏輯關(guān)系,屬種關(guān)系(繼承關(guān)系)、使用關(guān)系、參照關(guān)系等;根據(jù)概念的個(gè)體在空間或時(shí)間上的連接性形成總分關(guān)系、因果關(guān)系等。

    3.2.2基于漢語框架網(wǎng)絡(luò)本體的句子語義框架結(jié)構(gòu) 本文所定義的語義框架結(jié)構(gòu)是指利用漢語框架網(wǎng)絡(luò)本體知識(shí)對(duì)本地庫中或網(wǎng)絡(luò)上的文本、句子進(jìn)行概念分析并采用標(biāo)準(zhǔn)化的形式對(duì)句子進(jìn)行框架語義標(biāo)注所形成的句子的語義邏輯結(jié)構(gòu),是對(duì)句子基于概念層面的、機(jī)器可識(shí)別的語義理解。

    Fillermore曾經(jīng)這樣定義框架這個(gè)概念:“當(dāng)使用‘框架’這個(gè)術(shù)語時(shí),我心里想到的是一個(gè)互相聯(lián)系的概念體系,對(duì)這個(gè)體系中任何一個(gè)概念的理解都必須依賴對(duì)其所屬的整個(gè)結(jié)構(gòu)的理解” [10]。也就是說,語義框架可以是任何一個(gè)概念體系,其中的概念之間相互關(guān)聯(lián),要理解這一體系中的任何一個(gè)概念,就必須理解整個(gè)概念體系。例如,想要知道“victim”、“perpetrator”、“goods”這些概念的意義,就要知道“Theft”這個(gè)概念。因?yàn)檫@些詞都是涵蓋在“Theft”框架之中,是該框架的框架元素,框架與框架元素之間的關(guān)系為“hasFE”。而對(duì)“Theft”框架的進(jìn)一步理解可能還會(huì)涉及到“taking”框架和 “Commiting_crime”框架,因?yàn)樗謩e是后兩個(gè)框架的子框架,構(gòu)成繼承關(guān)系(InheritsFrom)。當(dāng)這樣一個(gè)概念結(jié)構(gòu)中的諸多概念中的一個(gè)被置入到一個(gè)文本或一次交談中時(shí),該概念結(jié)構(gòu)中其相關(guān)的概念都自動(dòng)被激活。

    例如,句子S1“近日,被廣東省中山市一家貿(mào)易公司招聘為煤場鏟車司機(jī)兼看守的一名保安人員周紹海因與他人合伙盜煤被中山市中級(jí)人民法院以職務(wù)侵占罪判處有期徒刑一年六個(gè)月”中的目標(biāo)動(dòng)詞“盜” 激活框架Theft(盜竊) ,相應(yīng)地,句中的語塊(span)“被廣東省中山市一家貿(mào)易公司招聘為煤場鏟車司機(jī)兼看守的一名保安人員周紹海”、“煤”和“與他人合伙”激活了該框架中的框架元素Perpetrator (犯罪者)、Means(方式)、Goods (物品)。在數(shù)據(jù)庫中,我們將語塊與框架元素以及目標(biāo)詞與框架之間的這種激活與被激活的關(guān)系定義為填槽或喚醒關(guān)系(Fillerof/evokes)。每個(gè)語塊與句子之間是從屬關(guān)系(Subsumes)。據(jù)此,利用漢語框架網(wǎng)絡(luò)本體知識(shí)對(duì)句子S1的理解所產(chǎn)生的語義框架結(jié)構(gòu)如圖1所示:

    根據(jù)框架網(wǎng)絡(luò)本體知識(shí),一個(gè)框架與其它框架之間以及它們的框架元素之間也通過相關(guān)關(guān)系連接,構(gòu)成一個(gè)概念層級(jí)結(jié)構(gòu)。例如,前面提到的框架——盜竊(Theft)、占有(Taking)和犯罪(Committing_crime)及它們的框架元素之間的關(guān)系如下圖2所示:

    通過對(duì)概念圖及句子語義結(jié)構(gòu)的分析及對(duì)比,我們發(fā)現(xiàn):可以將句子的語義結(jié)構(gòu)視作一個(gè)由表示框架、框架元素及語塊的結(jié)點(diǎn)和表示關(guān)系(框架關(guān)系,框架元素關(guān)系及它們與語塊之間關(guān)系)的弧線組成的概念圖。對(duì)句子的語義理解是就對(duì)其語義框架結(jié)構(gòu)的認(rèn)識(shí),句子間的相似性問題就轉(zhuǎn)化為其語義框架結(jié)構(gòu)的匹配問題,而框架語義結(jié)構(gòu)的匹配問題又可被視為概念圖的匹配問題。

    4 基于法律框架網(wǎng)絡(luò)本體的句子相似度計(jì)算

    基于漢語框架網(wǎng)絡(luò)本體的問答系統(tǒng)中,問句處理模塊采用基于規(guī)則匹配的方法對(duì)問句進(jìn)行了基于漢語框架網(wǎng)絡(luò)本體知識(shí)的語義分析,生成問句的框架語義結(jié)構(gòu)并根據(jù)疑問詞及相應(yīng)規(guī)則確定了問句的焦點(diǎn)。沿用上述研究的結(jié)論,結(jié)合所構(gòu)建的漢語框架網(wǎng)絡(luò)本體的特點(diǎn),我們將問句的語義框架結(jié)構(gòu)與本地庫中經(jīng)過加工的文本句子的語義框架結(jié)構(gòu)視作概念圖(為敘述方便,前者稱為查詢概念圖CGQ,后者稱為資源概念圖CGR)進(jìn)行語義相似度計(jì)算。

    4.1 漢語框架網(wǎng)絡(luò)問答系統(tǒng)中問句與答案候選句的相似度計(jì)算思路

    計(jì)算過程中,我們把查詢概念圖CGQ與資源概念圖CGR的語義相似度分為框架概念相似度、框架元素概念相似度、語塊相似度三部分來考量。具體設(shè)計(jì)思路如下:

    ?以查詢概念圖CGQ中的根節(jié)點(diǎn)即框架概念節(jié)點(diǎn)(QFR)為檢索入口節(jié)點(diǎn),與資源概念圖CGR中的根結(jié)點(diǎn)((RFR))相比較,依據(jù)兩框架概念在框架網(wǎng)絡(luò)本體結(jié)構(gòu)體系中的位置及關(guān)系,計(jì)算兩圖中根節(jié)點(diǎn)的相似度。

    ?讀取CGQ中的次級(jí)節(jié)點(diǎn)即框架元素概念節(jié)點(diǎn)(QFEi),遍歷CGR中的相應(yīng)層次的節(jié)點(diǎn)(RFE),選擇與QFEi相似度值最大的RFEj作為匹配框架元素。

    ?計(jì)算相匹配的框架元素節(jié)點(diǎn)所對(duì)應(yīng)的語塊之間的相似度。

    ?計(jì)算兩概念圖之間的相似度大小并進(jìn)行排序。

    4.2 基于法律框架網(wǎng)絡(luò)本體的句子相似度計(jì)算模型

    4.2.1 框架概念相似度 由前述的相關(guān)文獻(xiàn),兩個(gè)概念之間的距離可以通過它們?cè)诟拍顚哟沃械南鄬?duì)位置來決定。一般來說,概念之間的相似度取0到1之間的值,0表示相似度最小,1表示最大。給定概念C1、C2之間的概念相關(guān)性為:

    (1)

    在本體結(jié)構(gòu)體系中,不同層次概念之間抽象跨度不均勻,各概念層次中的每個(gè)結(jié)點(diǎn)都有一個(gè)計(jì)算距離用的值,稱為“里程碑”(milestone)。它的計(jì)算公式為:

    (2)

    通常設(shè)K=2, 代表節(jié)點(diǎn)到根節(jié)點(diǎn)的距離(其中根節(jié)點(diǎn) )。這樣,

    (3)

    其中,ccp代表C1、C2兩者最接近的共同父節(jié)點(diǎn)。該計(jì)算模型源于這樣一種設(shè)計(jì)思想:較高層次概念之間的相異程度要大于較低層次概念之間的相異程度;同時(shí),兄弟概念(直接繼承于同一個(gè)父類的概念)之間的相異程度要大于父子概念之間的相異程度。

    在實(shí)際的語義檢索應(yīng)用中,我們要評(píng)估的是資源圖符合查詢圖的程度,而不是查詢圖符合資源圖的程度。因此,在考察概念的匹配時(shí),我們要特別考慮兩個(gè)概念間為繼承關(guān)系的情形。設(shè)概念C1是概念C2的父類,若C1來自查詢圖、C2來自資源圖,那么因?yàn)镃2 IsA C1,所以應(yīng)該認(rèn)為完全符合匹配的條件,相似度為1;反之,若C2來自查詢圖、C1來自資源圖,那么因?yàn)镃1中可能包含非C2的子類,所以不能認(rèn)為一定匹配C2,故此時(shí)應(yīng)通過語義距離計(jì)算相似度。

    框架概念之間相似度也通過兩個(gè)框架概念在框架網(wǎng)絡(luò)本體中相應(yīng)位置間的距離來計(jì)算??紤]到現(xiàn)有資源條件及效率問題,系統(tǒng)目前只處理到CGQ與CGR中的框架概念在框架網(wǎng)絡(luò)本體中位置相同或構(gòu)成直接父子關(guān)系的情形,即CGQ與CGR的入口概念相同或是相互間是具有繼承關(guān)系的父框架或子框架。

    當(dāng)QFR與RFR相同或QFR為RFR的父框架時(shí),它們的相似度為1;當(dāng)RFR為QFR的父框架時(shí),它們的相似度根據(jù)它們?cè)诒倔w概念層次中的位置計(jì)算;當(dāng)QFR與RFR不相同且它們?cè)诳蚣芫W(wǎng)絡(luò)本體庫中沒有直接的相關(guān)關(guān)系時(shí),我們即認(rèn)為這兩個(gè)框架概念之間沒有“共同父結(jié)點(diǎn)”,它們的相似度為0。

    綜上所述,來自查詢圖的概念框架QFR與來自資源圖的概念框架RFR之間的相似度定義為:

    (4)

    4.2.2 框架元素概念相似度 當(dāng)查詢圖中的概念框架QFR與資源圖中的概念框架RFR的相似度不為0時(shí),進(jìn)一步分析兩圖中作為概念框架的子節(jié)點(diǎn)的框架元素概念節(jié)點(diǎn)之間的相似性。讀取查詢資源圖中的框架元素概念節(jié)點(diǎn)QFEi,遍歷資源圖中的框架元素概念節(jié)點(diǎn)RFE,計(jì)算二者之間的相似度,直到比完為止。在每個(gè)遞歸過程中,選擇資源圖中與查詢圖中框架元素概念相似度最大的框架元素概念作為與QFEi相匹配的框架元素節(jié)點(diǎn)。在漢語框架網(wǎng)絡(luò)知識(shí)庫中,每個(gè)框架元素都有唯一的標(biāo)識(shí)符。相互關(guān)聯(lián)框架所對(duì)應(yīng)的框架元素之間構(gòu)成映射,在具體的文本中,這些框架元素之間被定義為同一關(guān)系(iendtity)。因此,語義角色之間的相似度只有兩個(gè)取值:0和1。當(dāng)兩個(gè)框架元素ID相等或二者為同一關(guān)系時(shí),相似度為1,否則為0。

    4.2.3語塊相似度 本文進(jìn)行概念圖語義匹配的最終目的是在文本中檢索出符合用戶問句查詢要求的句子。因此,概念圖匹配的最后一步必須落腳到在具體句子中作為概念圖中概念結(jié)點(diǎn)實(shí)例的語塊之匹配,即進(jìn)行框架語義結(jié)構(gòu)中框架元素實(shí)例的匹配。在得到資源圖中與查詢圖的框架元素概念相似度最大的框架元素概念節(jié)點(diǎn)之后,進(jìn)一步進(jìn)行這些語義槽中相應(yīng)值(即句子中為框架元素填槽的語塊)之間的相似度衡量。由于我們已經(jīng)計(jì)算了問句及答案候選句中被句子的目標(biāo)謂詞激活的相應(yīng)框架概念的相似性,這里的“語塊”不包括圖1中激活所示的(evokes)語義框架的目標(biāo)謂詞。

    一個(gè)完整的漢語句子由句子的關(guān)鍵成分和修飾成分所構(gòu)成,而人們往往從關(guān)鍵成分就可以了解一個(gè)句子的大概意思。但由于漢語表達(dá)形式的多樣性,相同的關(guān)鍵成分可用不同的修飾成分來修飾,如果強(qiáng)調(diào)修飾成分,這無疑會(huì)給句子間相似度的計(jì)算增加噪音。因此,在進(jìn)行語塊的相似度計(jì)算時(shí),我們選擇每個(gè)語塊中的核心詞匯或有效詞匯。這里,我們將語塊的核心詞匯定義為名詞、動(dòng)詞、形容詞及限定性副詞,它們由分詞后的詞性標(biāo)注決定。語塊相似度分為詞形相似度和詞義相似度兩個(gè)方面。

    ?詞形相似度。詞形相似度分析詞的表層相似性,計(jì)算公式為:

    (5)

    其中, 表示是兩個(gè)語塊之間的詞形相似度。 和 分別表示兩個(gè)語塊中所包含的核心詞匯的集合, 表示兩個(gè)詞匯集合中包含的相同詞匯的數(shù)目, 表示 和 中包含的核心詞匯數(shù)目的最大值。

    ?詞義相似度。對(duì)于 和 中詞形不同詞匯,我們需要考慮這些詞匯在具體的上下文中的確切含義,判斷它們是否具有相同的義原以判斷它們之間的語義相似度。我們采用的工具是哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院智能內(nèi)容管理實(shí)驗(yàn)室所做的語義消歧系統(tǒng)。目前該系統(tǒng)在開放測試下準(zhǔn)確率能夠達(dá)到91.89%,封閉測試準(zhǔn)確率能夠達(dá)到98.67%[11]。該系統(tǒng)能夠?qū)?jīng)過分詞和詞性標(biāo)注后的句子進(jìn)行語義消歧,并在每個(gè)詞后面標(biāo)注上相應(yīng)的語義號(hào)。例如,對(duì)于句子:“哈爾濱/ nd在/P什么/r地方/ng? /wj”,經(jīng)過語義消歧后變?yōu)?“哈爾濱/17在/1269什么/468地方/17?/-1”。每個(gè)語義號(hào)都對(duì)應(yīng)知網(wǎng)中的一個(gè)義原。例如,“17”對(duì)應(yīng)的義原為“placel地方”,“1269”對(duì)應(yīng)的義原為 “{location}”, “468”對(duì)應(yīng)的義原為“aValuel屬性值,kind I類型”,“-1”表示在知網(wǎng)中找不到這個(gè)詞或者這個(gè)詞是沒有價(jià)值的語義信息(如標(biāo)點(diǎn)符號(hào))。對(duì)問句和答案候選句執(zhí)行“語義消歧”并識(shí)別句中詞匯所對(duì)應(yīng)的語義號(hào)后,通過比較語塊中核心詞匯的語義號(hào)可計(jì)算語塊的語義相似度。計(jì)算公式如下:

    (6)

    類似地, 表示兩個(gè)語塊之間的語義相似性, 和 分別表示兩個(gè)語塊中所包含的核心語義的集合。 表示兩個(gè)語義集合中共同包含的詞匯語義數(shù)目, 表示 和 中包含詞匯數(shù)目的最大值。

    由于基于詞形和基于語義的相似度計(jì)算方法各有優(yōu)點(diǎn),因此,我們綜合公式5和公式6,用下面的公式計(jì)算句子的語義框架結(jié)構(gòu)中葉節(jié)點(diǎn)對(duì)應(yīng)的短語相似度:

    (7)

    公式中, 。

    考慮問句焦點(diǎn)的特殊情況,我們規(guī)定查詢概念圖中代表問句焦點(diǎn)的框架元素所在的語塊與資源概念圖中相應(yīng)框架元素所在語塊之間的相似度為1。

    4.2.4查詢概念圖CGQ與資源概念圖CGR的相似度 基于上面框架概念相似度、框架元素相似度以及語塊的相似度計(jì)算,最終得出查詢概念圖與資源概念圖語義相似度的計(jì)算公式:

    (8)

    上式中, 是分別代表問句的框架語義結(jié)構(gòu)和信息資源中答案候選句的框架語義結(jié)構(gòu)的查詢概念圖與資源概念圖的相似度。 是查詢圖與資源圖中框架概念節(jié)點(diǎn)的相似度。 是查詢概念圖中包含的框架元素概念節(jié)點(diǎn)數(shù)。 代表表示查詢圖中第i個(gè)框架元素概念節(jié)點(diǎn)的權(quán)重,該權(quán)重的計(jì)算采取基于統(tǒng)計(jì)的方法,根據(jù)該框架網(wǎng)絡(luò)本體標(biāo)注例句庫中該框架元素出現(xiàn)的頻率計(jì)算。 表示查詢概念圖中第 框架元素概念節(jié)點(diǎn)與資源圖中各個(gè)框架元素概念節(jié)點(diǎn)之間的相似度。選擇資源概念圖中與之相似度最大的那個(gè)框架元素概念RFEj作為相匹配的框架元素,進(jìn)一步計(jì)算框匹配的兩個(gè)框架元素節(jié)點(diǎn)所在的語塊的相似度。對(duì)查詢圖中所有框架元素及其所在的語塊與資源圖中最匹配的框架元素及語塊的相似度求和,與它們的框架概念相似度的乘積即是查詢概念圖與資源概念圖之間的相似度或相關(guān)度。

    查詢模塊計(jì)算出問句與答案候選句之間的語義相關(guān)度之后,按照相關(guān)度大小對(duì)答案候選句排序,將相關(guān)度達(dá)到一定數(shù)值的答案候選句提交給答案抽取模塊,答案抽取模塊結(jié)合問句焦點(diǎn)信息,抽取準(zhǔn)確答案,以適當(dāng)?shù)男问綄⒋鸢阜祷亟o用戶。

    5 結(jié) 論

    在對(duì)問句及檢索文本進(jìn)行框架語義標(biāo)注的基礎(chǔ)上,本文利用概念圖相關(guān)理論并參照現(xiàn)有的概念圖相似度計(jì)算方法,提出了一種基于漢語框架網(wǎng)絡(luò)本體知識(shí)的問句與答案候選句的語句相似度計(jì)算方法。將該語句相似度匹配技術(shù)應(yīng)用于我們所開發(fā)的基于法律框架網(wǎng)絡(luò)本體的問答檢索系統(tǒng)LawOntoSearch中的檢索模塊,經(jīng)過系統(tǒng)測試,初步證明了該方法在檢全率和檢準(zhǔn)率兩方面都比基于關(guān)鍵字的信息檢索系統(tǒng)有一定程度的提高[12]。

    本研究的不足之處在于,系統(tǒng)中對(duì)漢語框架網(wǎng)絡(luò)本體庫中框架及框架元素之間關(guān)系的利用還有一定的局限,不能最大限度地發(fā)揮這些關(guān)系在信息檢索乃至語義推理中的作用,這也將是我們下一步研究的重點(diǎn)。

    參考文獻(xiàn):

    [1] 宋俊峰,李國微.信息檢索算法評(píng)價(jià)指標(biāo)的分析與改進(jìn)[J].小型微型計(jì)算機(jī)系統(tǒng),2003(10):1800-1803.

    [2] 王長勝,劉群.基于實(shí)例的漢英機(jī)器翻譯系統(tǒng)研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2002, 38(8): 126-127.

    [3] 呂學(xué)強(qiáng),任飛亮,黃志丹,等.句子相似模型和最相似句子查找算法[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2003, 24(6): 531-534.

    [4] 穗志方,俞士反.基于骨架依存樹的語句相似度計(jì)算模型[C]//1998中文信息處理國際會(huì)議文集.北京:清華大學(xué)出版社,1998:458-465

    [5] 李彬,劉挺,秦兵,等.基于語義依存的漢語句子相似度計(jì)算[J].計(jì)算機(jī)應(yīng)用研究,2003, 20(12): 15-17.

    [6] Zhu Haiping, Zhong Jiwei, Li Jianming, et al. An approachfor semantic search by matching RDF graphs[C] //Proceedings of the Fifteenth International Florida Artificial Intelligence Research Society Conference. palo Alto:AAAI Press,2002:450-454.

    [7] Zhong Jiwei, Zhu Haiping, Li Jianming, et al. Conceptual graph matching for semantic search[C]//Proceedings of the 10th International Conference on Conceptual Structures: Integration and Interfaces. London: Spring- Verlag ,2002:92-106.

    [8] Poole J, Campbell J A. A novel algorithm for matching conceptual and related graphs[C]// Proceedings of the 3th International Conference on Conceptual Structrues: Application, Implementation and Theory. London:Springer-Verlag,1995:293 -307.

    [9] Narayanan S, Harabagiu S. Question answering based on semantic structures[C]//Proceedings of the 20th International Conference on Computational Linguistics (COLING-2004) . Geneva: COLING , 2004 :693-701.

    [10] 楊琳琳. 語義框架在詞匯、語義現(xiàn)象中的運(yùn)用[J].懷化學(xué)院學(xué)報(bào),2007,26(5):125-126.

    [11] 李彬,劉挺,秦兵,等. 基于語義依存的漢語句子相似度計(jì)算.計(jì)算機(jī)應(yīng)用研究,2003, 20(12): 15-17.

    [12] 邰楊芳,賈君枝. 基于漢語框架網(wǎng)絡(luò)本體的問答式語義檢索系統(tǒng)的分析與設(shè)計(jì).圖書情報(bào)工作,2010,54(12):113-118.

    [作者簡介] 邰楊芳,女,1974年生,講師,碩士,發(fā)表論文12篇。

    賈君枝,女,1972年生,教授,博士,發(fā)表論文54篇。

    禄劝| 高邮市| 香港| 武功县| 榆社县| 禄丰县| 呼伦贝尔市| 榕江县| 安图县| 枣庄市| 博罗县| 赤水市| 社会| 英吉沙县| 科技| 斗六市| 长阳| 沙湾县| 太仆寺旗| 尼玛县| 勐海县| 崇左市| 嘉义县| 井冈山市| 同江市| 巴里| 曲松县| 四川省| 桂林市| 攀枝花市| 江油市| 乐安县| 阳谷县| 铜鼓县| 泽库县| 承德市| 水城县| 南投县| 德州市| 南通市| 德钦县|