• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于網(wǎng)絡(luò)分析的語義冗余發(fā)現(xiàn)方法

      2017-04-14 03:20:14王國棟張自力
      關(guān)鍵詞:本體語義概念

      王國棟,高 超,原 野,張自力

      (西南大學(xué) a.計算機與信息科學(xué)學(xué)院;b.智能軟件與軟件工程重點實驗室,重慶 400715)

      一種基于網(wǎng)絡(luò)分析的語義冗余發(fā)現(xiàn)方法

      王國棟,高 超,原 野,張自力

      (西南大學(xué) a.計算機與信息科學(xué)學(xué)院;b.智能軟件與軟件工程重點實驗室,重慶 400715)

      以農(nóng)業(yè)AGROVOC本體為例,結(jié)合語義萬維網(wǎng)推理機制定性分析冗余信息產(chǎn)生原因,利用復(fù)雜網(wǎng)絡(luò)分析方法量化推理過程中產(chǎn)生的冗余,進(jìn)而確定本體中的核心概念,解決推理冗余問題。實驗表明,復(fù)雜網(wǎng)絡(luò)分析方法可從定量角度找出核心節(jié)點及導(dǎo)致推理產(chǎn)生冗余的邊,并揭示了語義冗余引起的推理效率降低問題。為優(yōu)化本體設(shè)計、提高推理效率提供了一種新的可行方法。

      復(fù)雜網(wǎng)絡(luò);推理;冗余;AGROVOC

      0 引言

      隨著Tim Berners-Lee在1998年提出語義萬維網(wǎng)(The Semantic Web)概念和體系結(jié)構(gòu),人們對下一代Web——語義萬維網(wǎng)的發(fā)展和研究產(chǎn)生了濃厚興趣[1]。本體是一種用來描述概念以及概念之間關(guān)系的知識表示[2],其為Web上的信息賦予一種語義含義[3],在語義萬維網(wǎng)中起著核心作用,是實現(xiàn)基于語義的互操作的關(guān)鍵因素,因此本體的構(gòu)建也就成為語義萬維網(wǎng)實現(xiàn)的重要步驟。

      在構(gòu)建基于物聯(lián)網(wǎng)的柑橘種植知識本體過程中[4],通過對聯(lián)合國糧食組織(FAO)農(nóng)業(yè)AGROVOC本體[5]的研究發(fā)現(xiàn),本體的結(jié)構(gòu)將在推理過程中發(fā)生變化,在只有部分本體參與推理時,產(chǎn)生了新的連接,而當(dāng)全部本體都參與推理時,卻沒有產(chǎn)生新的連接,這表明推理產(chǎn)生了冗余。為什么會出現(xiàn)這種情況?產(chǎn)生新的連接是什么?這些新的連接在其中起了什么作用?為回答這些問題,本文首先從定性角度分析推理前后農(nóng)業(yè)AGROVOC本體結(jié)構(gòu)變化及冗余產(chǎn)生原因,再從定量角度進(jìn)行實驗驗證。

      1 相關(guān)概念和工作

      1.1 語義萬維網(wǎng)的推理機制

      傳統(tǒng)Web資源中的語義信息和領(lǐng)域知識是建立在機器難以處理的自由文本方式之上,它們以一種隱含的語義關(guān)系形式存在。而語義萬維網(wǎng)中語義推理的一個基本作用就是解讀這些隱性知識,把隱含在顯示定義和聲明中的知識通過推理機制提取出來。以圖1中肯尼迪家族本體為例,圖1a表示已有的屬性hasParent定義為父母與兒女之間的關(guān)系,而hasAncestor則沒有事先定義,hasParent只是它的子屬性(subProperty),而在圖1b中,所有人之間只有hasParent一種關(guān)系,那么在肯尼迪家族中誰是Maria Shriver的長輩?在沒有推理存在的情況下,得不到任何結(jié)果,因為圖1b所示的本體中沒有任何一個人(圖1b中的實例節(jié)點)同hasAncestor有直接關(guān)聯(lián),但是當(dāng)打開推理引擎時,卻出現(xiàn)了4個結(jié)果,分別是Jossph Kennedy、Robert Shriver、Rose Fitzgerald和Eunice Kennedy。

      圖1 屬性關(guān)系結(jié)構(gòu)圖和肯尼迪家族關(guān)系結(jié)構(gòu)圖Fig.1 The structure of attribute relationship and relationship diagram of Kennedy's family

      此外,我們根據(jù)柑橘種植專家提供的柑橘病癥方面的專家知識,構(gòu)建了柑橘病癥本體[4],并構(gòu)建了病癥查詢系統(tǒng),該系統(tǒng)已成功應(yīng)用于柑橘實際生產(chǎn)當(dāng)中,指導(dǎo)重慶忠縣新立鎮(zhèn)現(xiàn)代化生態(tài)柑橘園的農(nóng)戶[6]。用戶只需在系統(tǒng)界面輸入觀察到的柑橘表象癥狀,本體會在后臺進(jìn)行自動推理,最終反饋給用戶最為可能的柑橘致病原因。由此可見,語義推理在發(fā)現(xiàn)隱藏于數(shù)據(jù)間的知識有著非常好的應(yīng)用效果。

      1.2 本體結(jié)構(gòu)分析

      已有的本體結(jié)構(gòu)研究主要從本體的語義角度分析。Burton-Jones等[7]研究了一套從句法、語義、實效性等角度對DAML(DARPA Agent Markup Language)本體進(jìn)行評估,最后通過函數(shù)計算得出本體的評價指標(biāo)。Yao等[8]利用本體凝聚力來衡量OWL本體的模塊化關(guān)聯(lián),根據(jù)樹狀的OWL本體的語義層次結(jié)構(gòu)計算這些指標(biāo),它們分別是根類(NOR),葉類(NOL)和平均深度繼承樹的所有葉節(jié)點(ADIT-LN)的數(shù)目。Kang等[9]采用加權(quán)類關(guān)系圖表示一個給定的類圖,提出一種基于熵距離的方法評估UML類圖的復(fù)雜性結(jié)構(gòu),并提出將這種復(fù)雜度轉(zhuǎn)化成加權(quán)類關(guān)系圖的規(guī)則。His等[10]用圖論的方法研究了本體概念間的相關(guān)性,提出了概念一致性和概念復(fù)雜性兩個指標(biāo)衡量概念的平均關(guān)系數(shù)和概念間的平均距離。

      1.3 農(nóng)業(yè)AGROVOC本體

      農(nóng)業(yè)AGROVOC本體[11]是由聯(lián)合國糧農(nóng)組織和歐洲共同體委員會創(chuàng)建的一個多語言結(jié)構(gòu)化詞庫,涉及領(lǐng)域包括食品、農(nóng)業(yè)、林業(yè)、漁業(yè)和其他相關(guān)領(lǐng)域,它由近40 000個概念20多種語言組成的,具備各類詞間關(guān)系(如:廣義(broader)關(guān)系、狹義(narrower)關(guān)系和相關(guān)(related)關(guān)系等),旨在全球范圍內(nèi)將信息索引標(biāo)準(zhǔn)化,提高搜索信息來源的準(zhǔn)確性[12]。

      1.3.1 AGROVOC本體描述

      本體可以看作是概念和關(guān)系的集合,以農(nóng)業(yè)AGROVOC本體庫為例,本體可表示為一個二元組O=(C,R),C=(c1,c2,c3,…,cn),其中ci=(i∈[1,n])代表農(nóng)業(yè)相關(guān)領(lǐng)域的概念事實,R=(r1,r2,r3,…,rn),其中ri=(i∈[1,n])代表概念事實間不同關(guān)系。在農(nóng)業(yè)領(lǐng)域,概念事實之間的關(guān)系包含不同的類別,比如傳統(tǒng)詞庫關(guān)系、概念到概念的關(guān)系、術(shù)語到術(shù)語的關(guān)系、概念到術(shù)語的關(guān)系等,但是最重要的是傳統(tǒng)關(guān)系,即R=(broader,narrower,related)。

      傳統(tǒng)關(guān)系中廣義(broader)關(guān)系是將一個通用的術(shù)語同更具體的術(shù)語聯(lián)系起來,在圖2a中,“土壤”這個概念通過broader同“土地覆蓋”這個概念相聯(lián)系。而狹義(narrower)關(guān)系則表示相反的broader?!巴寥馈蓖ㄟ^narrower同“頂部土壤”、“根際土壤”和“底土”3個更具體的概念連接。相關(guān)術(shù)語(related)關(guān)系連接任何兩個非等級關(guān)系的概念,在圖2b中,“魚”這一概念可以通過related和“食品”、“易腐產(chǎn)品”、“海鮮”或者“新鮮產(chǎn)品”等概念連接起來。

      1.3.2 AGROVOC本體推理邏輯分析

      圖2 農(nóng)業(yè)AGROVOC中的廣義關(guān)系概念圖和相關(guān)術(shù)語關(guān)系概念圖Fig.2 The concept map of broader relationship and the concept map of related relationship in AGROVOC

      圖3 語義的從屬關(guān)系Fig.3 Semantic dependency relationship

      圖4 傳導(dǎo)推理規(guī)則Fig.4 Rules of conduction inference

      本文用SKOS(Simple Knowledge Organization System)來表示知識組織系統(tǒng)的一個模型,充當(dāng)知識組織系統(tǒng)設(shè)計和應(yīng)用之間的橋梁[13]。SKOS區(qū)分兩種語義關(guān)系:層次關(guān)系和關(guān)聯(lián)關(guān)系。層次關(guān)系鏈接兩個概念指的是其中一個概念比另一個更通用(或更具體),而關(guān)聯(lián)關(guān)系指的是兩個概念是“相關(guān)”的,其中任何一個不比另一個通用或具體。在農(nóng)業(yè)AGROVOC本體中,W3C標(biāo)準(zhǔn)在SKOS框架下提出了R=(narrower,broader,narrower Transitive,related,broader Transitive)5種關(guān)系[14],其中narrower、broader和related出現(xiàn)在本體推理前,narrowerTransitive和broaderTransitive出現(xiàn)在本體推理后[15]。related屬于關(guān)聯(lián)關(guān)系,不具有傳遞特性[16]。其他4種是層次關(guān)系,如圖3所示。其中narrower,broader只用于直接的層次關(guān)系。narrowerTransitive和broaderTransitive用來推理層級關(guān)系的傳遞性,具體規(guī)則如圖4所示。

      根據(jù)以上分析,本體中的概念及其關(guān)系構(gòu)成了一個動態(tài)網(wǎng)絡(luò),推理前后,網(wǎng)絡(luò)的結(jié)構(gòu)發(fā)生了變化。如何定量衡量語義萬維網(wǎng)推理結(jié)構(gòu)變化,發(fā)現(xiàn)核心概念對本體構(gòu)造人員來說是一種挑戰(zhàn)。由于任何一種現(xiàn)實網(wǎng)絡(luò)都兼有確定性和隨機性,而確定性的法則或特征通常都隱藏在統(tǒng)計漲落之中[7],因此,利用復(fù)雜網(wǎng)絡(luò)分析方法研究語義萬維網(wǎng)推理前后的網(wǎng)絡(luò)統(tǒng)計特征為本體構(gòu)造人員提供一種分析推理中的確定性法則和特征的新手段。

      1.3.3 AGROVOC本體推理冗余定性分析

      本文通過觀察推理前后農(nóng)業(yè)AGROVOC本體關(guān)系,驗證了related關(guān)系只參與了部分本體的推理,而沒有參與整個本體的推理。從定性角度來看,由于related與剩余本體的關(guān)聯(lián)被割斷,成為一種單連通狀態(tài),它們只與部分本體中的事實相連。但在推理過程中,推理機卻默認(rèn)單連通狀態(tài)全部參與推理,導(dǎo)致了related關(guān)系參與了沒有必要的推理過程,由此推斷related關(guān)系是導(dǎo)致推理冗余產(chǎn)生的根源。舉例來講,Mutton(羊肉)與Sheep(羊)相關(guān)(羊肉出在羊身上),Sheep(羊)與Clothes(衣服)相關(guān)(羊毛衣服的材料來自于羊身上的毛),用語義關(guān)系結(jié)構(gòu)表達(dá)如下:

      :Mutton skos:related:Sheep.

      (1)

      :sheep skos:related:Clothes.

      (2)

      根據(jù)related邊的定義,無法得出

      :Mutton skos:related Clothes.

      (3)

      但若related邊參與了推理,則(3)成立。因此,本體推理冗余可表達(dá)為

      圖5 本體與復(fù)雜網(wǎng)絡(luò)的對應(yīng)關(guān)系Fig.5 The corresponding relationship between ontology network and complex network

      其中,R表示推理產(chǎn)生的冗余,Y表示本體推理中產(chǎn)生了冗余,N表示本體推理中未產(chǎn)生冗余。

      本文將進(jìn)一步從定量的角度分析推理產(chǎn)生的冗余,為優(yōu)化本體設(shè)計、提高推理效率提供一種新的可行方法。

      2 研究方法

      如圖5所示,若將本體中的概念建模成復(fù)雜網(wǎng)絡(luò)中的節(jié)點,將本體中的關(guān)系建模成復(fù)雜網(wǎng)絡(luò)中的邊,則本體可以建模成一個復(fù)雜網(wǎng)絡(luò)。本文采用復(fù)雜網(wǎng)絡(luò)分析方法對農(nóng)業(yè)AGROVOC本體推理前后的結(jié)構(gòu)進(jìn)行分析,從定量角度衡量農(nóng)業(yè)AGROVOC本體推理前后是否產(chǎn)生冗余。復(fù)雜網(wǎng)絡(luò)分析方法是一種研究各類網(wǎng)絡(luò)共性的通用方法,提供了一系列指標(biāo)對節(jié)點和網(wǎng)絡(luò)特性進(jìn)行定量評估。例如,可通過節(jié)點度數(shù)和網(wǎng)絡(luò)度分布特性來判斷某個節(jié)點是否為核心節(jié)點;利用網(wǎng)絡(luò)平均最短路徑判斷網(wǎng)絡(luò)在演化時是否產(chǎn)生新的邊。因此,本節(jié)將利用復(fù)雜網(wǎng)絡(luò)分析方法所提供的度分布、簇系數(shù)和平均最短路徑等指標(biāo)對本體結(jié)構(gòu)進(jìn)行定量衡量,找出推理產(chǎn)生冗余的原因,為解決推理冗余問題提供一種可行方案[17]。

      2.1 度與無尺度分布

      網(wǎng)絡(luò)中節(jié)點的度是其互相連接統(tǒng)計特性的直接描述,也反映重要的網(wǎng)絡(luò)演化特征[18],大部分節(jié)點只與少數(shù)重要節(jié)點連接,這些重要節(jié)點為集散節(jié)點。在語義網(wǎng)絡(luò)中,本體也存在一些核心概念,其它的概念或多或少都會與其有聯(lián)系。而一個本體與其他本體聯(lián)系的強度可以用復(fù)雜網(wǎng)絡(luò)中度的大小來表示,本體中某個節(jié)點的度數(shù)可判斷該節(jié)點是否為核心概念,一個本體中的節(jié)點度數(shù)較大,說明該節(jié)點是該本體中的集散節(jié)點,從而可確定該節(jié)點為本體中較為核心的概念。本文將采用度分布和累積度分布來觀察本體網(wǎng)絡(luò)的分布特征,驗證其是否具有無標(biāo)度網(wǎng)絡(luò)的特性[18]。

      2.2 聚類特性

      簇系數(shù)用來衡量網(wǎng)絡(luò)節(jié)點聚集情況[19]。網(wǎng)絡(luò)中某個節(jié)點的簇系數(shù)定義為所有相鄰節(jié)點之間連接的數(shù)目占最大連接數(shù)目的比例,而網(wǎng)絡(luò)的簇系數(shù)是所有節(jié)點的簇系數(shù)的平均值。網(wǎng)絡(luò)的簇系數(shù)越大,類聚特性越高,網(wǎng)絡(luò)越緊密。根據(jù)簇系數(shù)計算公式,網(wǎng)絡(luò)中一個節(jié)點i的相鄰節(jié)點之間的邊數(shù)li是影響網(wǎng)絡(luò)簇系數(shù)大小的根本原因,網(wǎng)絡(luò)簇系數(shù)會隨著li的增大而增大。在本體推理過程中,li增大意味著推理產(chǎn)生新的連接(即冗余)。因此,根據(jù)本體簇系數(shù)在推理前后的變化即可判斷推理是否產(chǎn)生了冗余。

      2.3 平均最短路徑與小世界性質(zhì)

      本文將采用介數(shù)中心性方法[20]計算語義網(wǎng)中本體間推理路徑的變化。在本體推理過程中,若推理產(chǎn)生了新連接,大部分概念可用3~4條短路徑連接起來,則本體的最短路徑減小,使其具有小世界網(wǎng)絡(luò)的特征[21];若推理未產(chǎn)生新連接,則本體的最短路徑?jīng)]有變化。因此本體的最短路徑的變化亦可說明推理是否產(chǎn)生了冗余。

      2.4 重要度評價矩陣與網(wǎng)絡(luò)貢獻(xiàn)度

      重要度評價矩陣方法是綜合考慮節(jié)點自身在網(wǎng)絡(luò)信息流通中所起作用和相鄰節(jié)點對其重要貢獻(xiàn)度而產(chǎn)生的一種評價方法[22-23]。在構(gòu)建本體時,關(guān)鍵節(jié)點的設(shè)計是重中之重。這不僅體現(xiàn)在推理前的分析中,在推理后,一些之前不重要的節(jié)點有可能變得很重要,成為關(guān)鍵節(jié)點。因此,本體構(gòu)建中采用節(jié)點重要度評價方法可很容易地鑒別關(guān)鍵本體。相對于節(jié)點重要性,網(wǎng)絡(luò)中不同性質(zhì)的邊也是網(wǎng)絡(luò)的重要組成。因此,本文用網(wǎng)絡(luò)貢獻(xiàn)度表示不同的邊在網(wǎng)絡(luò)中的占比,發(fā)現(xiàn)構(gòu)建本體時的關(guān)鍵邊,這也對構(gòu)建本體有很大幫助。

      小圖為概率分布圖,大圖為累積度分布圖。圖6 農(nóng)業(yè)AGROVOC本體出入度分布雙對數(shù)坐標(biāo)圖Fig.6 The cumulative degree distribution of AGROVOC ontology network

      3 實驗結(jié)果分析

      3.1 度與集散節(jié)點

      通過對比發(fā)現(xiàn)推理前后網(wǎng)絡(luò)平均度由4.12增加到23.71,這表明農(nóng)業(yè)AGROVOC本體推理后的新關(guān)系narrowerTransitive和broaderTransitive具有傳導(dǎo)性,它們使得概念間有了更多聯(lián)系,推理產(chǎn)生了冗余。

      表1 網(wǎng)絡(luò)簇系數(shù)對比表Tab.1 The comparision of network cluseter coefficient

      圖6a、6b展現(xiàn)了農(nóng)業(yè)AGROVOC本體推理前的冪律分布特性,這說明該本體具有無標(biāo)度分布特性,只有極少數(shù)集散節(jié)點與網(wǎng)絡(luò)中多數(shù)節(jié)點相連。這些集散節(jié)點代表本體中某一農(nóng)業(yè)領(lǐng)域的核心概念或者這一領(lǐng)域概念的總稱,如灌溉方法下面包含渠灌、哇灌、滴灌等。根據(jù)此特點,在搜索農(nóng)業(yè)AGROVOC本體的時候,為了提高效率,通??梢詢?yōu)先匹配比較核心的概念,確定搜索方向,再進(jìn)行更細(xì)致的搜索。圖6c、6d展現(xiàn)了推理后農(nóng)業(yè)AGROVOC本體度分布也滿足冪律分布,且推理后的冪指數(shù)α=0.9小于推理前的冪指數(shù)α=1.9,這說明推理后網(wǎng)絡(luò)比推理前更緊密、本體之間的關(guān)系更復(fù)雜,推理產(chǎn)生了冗余。

      3.2 簇系數(shù)和類聚特性

      表1對比了推理前農(nóng)業(yè)AGROVOC本體和一些已知的具有高聚類特性的網(wǎng)絡(luò)的簇系數(shù),農(nóng)業(yè)AGROVOC本體的簇系數(shù)遠(yuǎn)小于因特網(wǎng)和食物鏈的簇系數(shù),由此可見推理前農(nóng)業(yè)AGROVOC本體不具備高聚類特性。

      圖7分析了推理前后節(jié)點度和簇系數(shù)的關(guān)系。圖7a顯示大部分節(jié)點的度數(shù)偏小,集中在4到100中間,隨著度數(shù)的增加,簇系數(shù)從1逐漸減小到0.001,說明在AGROVOC本體中,各個詞匯與核心詞匯聯(lián)系不緊密,整個結(jié)構(gòu)接近樹狀圖。圖7b顯示推理后農(nóng)業(yè)AGROVOC本體的簇系數(shù)增加到0.948 3,遠(yuǎn)大于因特網(wǎng)和食物鏈的簇系數(shù),推理后網(wǎng)絡(luò)具有高類聚特性,因此推理產(chǎn)生了冗余,概念間聯(lián)系更緊密,網(wǎng)絡(luò)也狀圖接近于完全圖??梢?,narrowerTransitive和broaderTransitive兩個關(guān)系的傳導(dǎo)性可使得聚集度低的網(wǎng)絡(luò)變得更緊密。

      3.3 平均最短路徑和介數(shù)中心性

      圖8展示了在農(nóng)業(yè)AGROVOC本體中,推理前兩概念間最短路徑長度的最大值為14,有87%的路徑值不大于16,有98.7%的路徑不大于20,整個網(wǎng)絡(luò)的平均最短路徑為12.6,說明農(nóng)業(yè)AGROVOC本體不具有小世界網(wǎng)絡(luò)特征。

      圖7 推理前后節(jié)點的度與簇系數(shù)雙對數(shù)圖Fig.7 The relationship between the degree and cluster coefficient of a node in the logarithmic coordinates

      圖8 路徑長度分布圖Fig.8 The distribution of path length

      圖9 推理前后最短路徑比較Fig.9 Comparsion of the shortest path before and after reasoning

      圖9對比了推理前后最短路徑的變化,結(jié)果表明推理前后平均最短路徑差距明顯,說明經(jīng)過推理后網(wǎng)絡(luò)中節(jié)點之間有了更多的聯(lián)系,可連通節(jié)點間的路徑一般都很短,本體符合了小世界網(wǎng)絡(luò)類似的特征,這說明農(nóng)業(yè)AGROVOC本體在推理過程中產(chǎn)生了冗余。

      3.4 推理冗余的定量分析

      在農(nóng)業(yè)AGROVOC本體中,SKOS中的5種關(guān)系只有narrower、broader和related出現(xiàn)在推理前[14]。而灌溉本體是農(nóng)業(yè)AGROVOC本體的一部分,它由23個節(jié)點和36條邊組成,包括7條related邊、14條narrower邊和15條broader邊,其結(jié)構(gòu)如圖10所示。因此,選取灌溉本體作為樣本進(jìn)行定量分析能夠全面分析哪一類型的邊才是導(dǎo)致推理產(chǎn)生冗余的根本原因。通過計算發(fā)現(xiàn),灌溉本體推理后的平均最短路徑為2.009。

      圖10 灌溉本體結(jié)構(gòu)圖Fig.10 The network structure of irrigation ontology network

      表2 不同推理關(guān)系的比較Tab.2 The comparison of different reasoning relations

      為分析related、narrowerTransitive和broaderTransitive邊在推理前后的作用,分別去除3組邊后構(gòu)成3個新網(wǎng)絡(luò)。表2對比了最短路徑變化情況以及它們對最終網(wǎng)絡(luò)的貢獻(xiàn)度。結(jié)果表明related邊對網(wǎng)絡(luò)的貢獻(xiàn)度最低,分別是其他邊的一半或更少。由此可以證明related邊就是冗余邊,同時通過對運行時間的對比也可知related邊對推理沒有產(chǎn)生影響反而影響了效率,去邊前推理時間為349ms,去邊后則提升到287ms。實驗結(jié)果證明,去除冗余邊可以明顯提高推理的效率。

      在語義網(wǎng)中,一個概念的“鄰居”越多,越能體現(xiàn)這個概念的重要性[24]。鑒于概念本體在語義網(wǎng)中是以單屬性形式存在(即概念的推理屬性,是由每個概念與其它概念構(gòu)成的推理邊組成),因此本文將本體中的概念建模成復(fù)雜網(wǎng)絡(luò)中的節(jié)點,將關(guān)系建模成邊,目的是利用復(fù)雜網(wǎng)絡(luò)中基于拓?fù)鋵傩缘墓?jié)點重要度排名方法分析本體中概念的重要性。節(jié)點n2代表灌溉本體中的灌溉方法(Irrigation methods),是灌溉本體中最重要的概念,所以在推理前后其重要度排名都是第一;節(jié)點n20代表方法(Methods),是比灌溉方法更為通用的概念(但在灌溉本體中不一定重要),而它從推理前的第13名攀升到推理后的第2名,成了灌溉本體中的關(guān)鍵節(jié)點,所以在本體構(gòu)建時要特殊關(guān)注諸如n20這樣的節(jié)點,以降低因推理產(chǎn)生冗余對節(jié)點重要度產(chǎn)生的影響。

      表3 節(jié)點重要度排名Tab.3 The ranking result of node importance

      4 結(jié)論

      語義推理的一個基本作用就是把隱含的知識通過處理機制提取出來。在實際應(yīng)用中,推理會產(chǎn)生無意義的信息,即推理冗余,它不僅影響了準(zhǔn)確性,也影響速度和效率。在構(gòu)建本體時及早地去除這些導(dǎo)致冗余的推理關(guān)系是解決這一問題的關(guān)鍵。本文以農(nóng)業(yè)AGROVOC本體為例,從定性的角度解釋了推理冗余的產(chǎn)生原因,并利用復(fù)雜網(wǎng)絡(luò)分析方法提供的衡量指標(biāo)(如度分布、簇系數(shù)、最短路徑等)從定量的角度鑒別本體中的核心概念,以便在推理中優(yōu)先匹配核心概念,提高推理效率。同時,通過劃分區(qū)域的方式發(fā)現(xiàn)推理冗余問題,為減少推理冗余、提高推理效率提供一種新手段。

      本文對推理冗余的研究是語義推理領(lǐng)域的一次拓展,為語義研究人員在本體優(yōu)化、提高推理效率方面提供衡量標(biāo)準(zhǔn),同時也為語義技術(shù)的發(fā)展提供更多的參考和使用價值。

      [1]Meenachi N,Sai Baba M.Web ontology language editors for semantic web:a survey [J].International Journal of Computer Applications,2012,53(12):12-16.

      [2]Antoniou G,Van Harmelen F.A semantic web primer[M].Cambridge,Massachusetts,United States:MIT Press,2004:9-12.

      [3]Berners-Lee T,Hendler J,Lassila O.The semantic web[J].Scientific American,2001,284(5):28-37.

      [4]Yuan Y,Zeng W,Zhang Z L.A semantic technology supported precision agriculture system:a case study for citrus fertilizing[C]// 6th International Conference on Knowledge Science,Engineering and Management.Dalian,China:Springer Berlin Heidelberg,2013:104-111.

      [5]The AGROVOC team.AGROVOC [OL].(2015-03-01) [2015-06-01].http://aims.fao.org/zh-hans/agrovoc.

      [6]王藝,王英,原野,等.基于語義本體的柑橘肥水管理決策支持系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報,2014,30(9):93-101.Wang Yi,Wang Ying,Yuan Ye,et al.A decision support system for fertilization and irrigation management of citrus based on semantic ontology[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(9):93-101.

      [7]Xu Y,Zou S,Gu A,et al.Research on the complex network of the UNSPSC ontology[J].Physics Procedia,2012,24:1863-1867.

      [9] Zhang H,Li Y F,Tan H B K.Measuring design complexity of semantic web ontologies[J].Journal of Systems and Software,2010,83(5):803-814.

      [10] Hsi I.Analyzing the conceptual coherence of computing applications through ontological excavation[D].Atlanta:Georgia Institute of Technology,2004.

      [11] Caracciolo C,Stellato A,Morshed A,et al.The agrovoc linked dataset[J].Semantic Web,2013,4(3):341-348.

      [12] Rajbhandari S,Keizer J.The AGROVOC concept scheme-a walkthrough[J].Journal of Integrative Agriculture,2012,11(5):694-699.

      [13] Manaf N A A,Bechhofer S,Stevens R.The current state of SKOS vocabularies on the web[C]// 9th Extended Semantic Web Conference.Greece:Springer Berlin Heidelberg,2012:270-284.

      [14] Myers T,Atkinson I.Eco-informatics modelling via semantic inference[J].Information Systems,2013,38(1):16-32.

      [15] 唐晉韜,王挺,王戟.利用復(fù)雜網(wǎng)絡(luò)分析方法研究基因本體隱藏結(jié)構(gòu)信息[J].東南大學(xué)學(xué)報:英文版,2010,1:31-35.Tang JinTao,Wang Ting,Wang Ji.Discovering hidden information of gene ontology based on complex networks analysis[J].Journal of Southeast University,2010,26(1):31-35.

      [16] 張自力,李莉.語義萬維網(wǎng)——工程實踐指南 [M].第2版.北京:高等教育出版社,2015:184-185.

      [17] 張大陸,王志曉,劉雯,等.基于復(fù)雜網(wǎng)絡(luò)的本體結(jié)構(gòu)分析[J].同濟(jì)大學(xué)學(xué)報:自然科學(xué)版,2009,2:258-261.Zhang Da,Wang Zhixiao,Liu Wen,et al.Complex network-based ontology structure analysis[J].Journal of Tongji University (Natural Science),2009,2:258-261.

      [18] Costa L F,Oliveira Jr O N,Travieso G,et al.Analyzing and modeling real-world phenomena with complex networks:a survey of applications[J].Advances in Physics,2011,60(3):329-412.

      [19] Maoz Z.Preferential attachment,homophily,and the structure of international networks,1816-2003[J].Conflict Management and Peace Science,2012,29(3):341-369.

      [20] Zhou L,Lu F,Zhang H.Evaluating road selectivity of urban-trip based on dynamic betweenness centrality[C]// The 20th International Conference on Geoinformatics (GEOINFORMATICS).Hong Kong:IEEE,2012:1-5.

      [21] Gulati R,Sytch M,Tatarynowicz A.The rise and fall of small worlds:Exploring the dynamics of social structure[J].Organization Science,2012,23(2):449-471.

      [22] 周漩,張鳳鳴,李克武,等.利用重要度評價矩陣確定復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點[J].物理學(xué)報,2012,61(5):050201.Zhou Xuan,Zhang Fengming,Li Kewu,et al.Use importance evaluation matrix to determine the complex network nodes [J].Journal of Physics,2012,61(5):050201.

      [23] 任曉龍,呂琳媛.網(wǎng)絡(luò)重要節(jié)點排序方法綜述[J].科學(xué)通報,2014,13:1175-1197.Ren Xiaolong,Lv Linyuan.Review of ranking nodes in complex networks[J].Chinese Science Bulletin,2014,13:1175-1197.

      [24] Zhang X,Cheng G,Ge W Y,et al.Summarizing vocabularies in the global semantic web[J].Journal of Computer Science and Technology,2009,24(1):165-174.

      (責(zé)任編輯 耿金花)

      Network-Based Analysis for Discovering Semantic Redundancy

      WANG Guodong,GAO Chao,YUAN Ye,ZHANG Zili

      (a.School of Computer and Information Science; b.Key Laboratory of Intelligent Software and Software Engineering,Southwest University,Chongqing 400715,China)

      The efficiency of semantic reasoning can be improved through constructing the semantic ontology reasonably and reducing the redundant information in the process of reasoning.It is a feasible method to reveal the reason of the redundant information in the process of reasoning through analyzing the dynamic changes of an ontology structure and the important role of nodes in an ontology.Taking AGROVOC ontology network as an example,this paper provides qualitative analyses based on the reasoning mechanism of semantic web for understanding the redundant information.Meanwhile,some quantitative measurements from the perspective of complex network are provided in order to identify the core concepts in a semantic web,and further to solve the problem of redundant information.Experimental results show that the reasoning of semantic web and the rationality of ontology construction can be quantitatively analyzed from the perspective of complex network,which provides a new measurement to optimize the design of ontology and improve the efficiency of reasoning in the semantic web.

      complex networks; reasoning; redundancy; AGROVOC

      1672-3813(2017)01-0058-08;

      10.13306/j.1672-3813.2017.01.009

      2015-06-04;

      2015-12-07

      國家高技術(shù)研究發(fā)展計劃項目(2013AA013801);國家自然科學(xué)基金(61402379,61403315);重慶市研究生科研創(chuàng)新項目(CYS14063)

      王國棟(1990-),男,山東魚臺人,碩士研究生,主要研究方向為語義萬維網(wǎng)。

      TP392

      A

      猜你喜歡
      本體語義概念
      Abstracts and Key Words
      Birdie Cup Coffee豐盛里概念店
      對姜夔自度曲音樂本體的現(xiàn)代解讀
      語言與語義
      幾樣概念店
      學(xué)習(xí)集合概念『四步走』
      聚焦集合的概念及應(yīng)用
      “上”與“下”語義的不對稱性及其認(rèn)知闡釋
      《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
      認(rèn)知范疇模糊與語義模糊
      平谷区| 清原| 习水县| 濉溪县| 绍兴市| 塔河县| 远安县| 温泉县| 手游| 朝阳县| 阜南县| 大冶市| 沽源县| 满洲里市| 崇明县| 翁牛特旗| 宁夏| 乌拉特前旗| 喜德县| 合肥市| 湖州市| 阿拉善盟| 阳城县| 南宫市| 宁河县| 百色市| 邵阳市| 大丰市| 北辰区| 镇康县| 攀枝花市| 南宁市| 扎兰屯市| 定陶县| 肃北| 招远市| 岢岚县| 临桂县| 临西县| 诸城市| 陕西省|