何來(lái)坤,繆健美,劉禮芳,潘 紅
(1. 杭州師范大學(xué)信息化中心,浙江 杭州 310036;2. 杭州師范大學(xué)科技處,浙江 杭州 310036;3. 杭州師范大學(xué)杭州國(guó)際服務(wù)工程學(xué)院,浙江 杭州 310036)
基于Ontology與Jena的研究綜述
何來(lái)坤1,繆健美2,劉禮芳1,潘 紅3
(1. 杭州師范大學(xué)信息化中心,浙江 杭州 310036;2. 杭州師范大學(xué)科技處,浙江 杭州 310036;3. 杭州師范大學(xué)杭州國(guó)際服務(wù)工程學(xué)院,浙江 杭州 310036)
Ontology是共享概念模型明確的形式化的規(guī)范說(shuō)明.它是實(shí)現(xiàn)語(yǔ)義Web的關(guān)鍵技術(shù)之一.Ontology的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語(yǔ))和詞匯之間相互關(guān)系的明確定義.文章首先對(duì)Ontology在語(yǔ)義Web中地位、Ontology的定義、相關(guān)理論、構(gòu)建方法以及構(gòu)建工具等方面加以系統(tǒng)闡述,然后介紹了構(gòu)造語(yǔ)義Web應(yīng)用程序Java框架的工具Jena.最后對(duì)目前基于Ontology與Jena的應(yīng)用現(xiàn)狀進(jìn)行綜述性介紹.
Ontology;Jena; 語(yǔ)義Web;本體建模;RDF
隨著互聯(lián)網(wǎng)的高速發(fā)展,Internet中的數(shù)據(jù)資源不斷增長(zhǎng),無(wú)論是有用的信息還是臟數(shù)據(jù),都會(huì)隨時(shí)間的推移而不斷出現(xiàn)在Internet資源庫(kù)中.存儲(chǔ)在互聯(lián)網(wǎng)中的數(shù)據(jù),絕大部分是以Hypertext Markup Language (HTML)結(jié)構(gòu)化格式表示的,是一種松散的[1]、不嚴(yán)格的組織數(shù)據(jù)文件.人們?cè)谏钪袕倪@些HTML中查找信息時(shí),借助搜索引擎,輸入關(guān)鍵詞后獲得匹配的文檔鏈接,人們需要自己逐一排查這些文檔鏈接.為提高人與計(jì)算機(jī)的交互能力,1998年,Tim Berners-Lee提出了語(yǔ)義網(wǎng)概念[2],讓計(jì)算機(jī)程序或搜索工具更加有效的自動(dòng)聚集信息.目前,許多國(guó)內(nèi)外眾多科研人員在研究和關(guān)注語(yǔ)義網(wǎng),并且在某些領(lǐng)域中已經(jīng)獲得應(yīng)用.本文針對(duì)語(yǔ)義網(wǎng)架構(gòu)中的核心Ontology層及相關(guān)技術(shù)和應(yīng)用進(jìn)行系統(tǒng)性分析,闡述目前Ontology技術(shù)在一些領(lǐng)域應(yīng)用的現(xiàn)狀.
1.1 Ontology與語(yǔ)義Web
圖1 語(yǔ)義Web框架Fig. 1 the Semantic Web Architecture
在1980年期間,Tim Berners-Lee為了與同事們分享一些文檔而發(fā)明了超文本鏈接,并在1990年第一次使用了超文本標(biāo)記語(yǔ)言(HTML),將萬(wàn)維網(wǎng)推向了全世界,互聯(lián)網(wǎng)成為全球性的信息空間.但隨著信息量越來(lái)越大,在鏈接庫(kù)中查找信息變得很困難,為了讓計(jì)算機(jī)夠智能理解互聯(lián)網(wǎng)的信息,Tim Berners-Lee,在2000年XML主題會(huì)議上又提出了語(yǔ)義Web的愿景框架[3].語(yǔ)義Web框架如圖1所示.
語(yǔ)義Web框架包括了7層(見(jiàn)圖1):底層的Unicode和URI是整個(gè)語(yǔ)義Web框架的基礎(chǔ),保障了全球互聯(lián)網(wǎng)中的資源編碼的統(tǒng)一性和信息唯一性;第二層X(jué)ML是一種用來(lái)結(jié)構(gòu)化文檔和數(shù)據(jù)的通用且適應(yīng)性強(qiáng)的格式,方便應(yīng)用程序交換數(shù)據(jù),通過(guò)命名空間(Name Space,簡(jiǎn)稱(chēng)NS)可以自由的定義標(biāo)記;第三層資源描述框架(Resource Description Framework,RDF),可以方便通過(guò)類(lèi)、屬性和值來(lái)表示豐富的Web資源內(nèi)容與結(jié)構(gòu).雖然RDF/RDFS[4-6]能夠用斷言句(主語(yǔ)+謂語(yǔ)+賓語(yǔ))描述資源之間的關(guān)系,但是在某些領(lǐng)域相對(duì)簡(jiǎn)單,不易描述復(fù)雜的資源關(guān)系;第四層為本體層,是在RDF/RDFS的擴(kuò)展,可以進(jìn)一步描述復(fù)雜的資源關(guān)系;第五層主要任務(wù)是邏輯推理與建立推理規(guī)則;第六層負(fù)責(zé)應(yīng)用推理規(guī)則對(duì)資源推理出的結(jié)果實(shí)現(xiàn)驗(yàn)證;第七層,對(duì)驗(yàn)證推理結(jié)果的基礎(chǔ)上實(shí)現(xiàn)信任評(píng)估.
數(shù)字簽名貫徹了從RDF層到Proof層,來(lái)確保建立資源、資源之間的關(guān)系、推理規(guī)則及邏輯推理結(jié)果的來(lái)源可信任性,它是實(shí)現(xiàn)Web信任的關(guān)鍵技術(shù).從語(yǔ)義Web框架中可知,第二至第四層為實(shí)現(xiàn)語(yǔ)義Web框架的核心層,即XML、RDF/RDFS及Ontology為三大關(guān)鍵技術(shù).
1.2 Ontology定義
Ontology源于古希臘,根據(jù)文[7]可知,Ontology原本是哲學(xué)領(lǐng)域的核心術(shù)語(yǔ),即存在論,國(guó)內(nèi)一般翻譯為“本體”.20世紀(jì)90年代,本體論被應(yīng)用到了計(jì)算機(jī)領(lǐng)域.在計(jì)算機(jī)界,1991年Neches等最早給出Ontology定義[8],即給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系,以及利用這些術(shù)語(yǔ)和關(guān)系構(gòu)成的規(guī)定這些詞匯外延規(guī)則的定義.1993年,斯坦福大學(xué)的Gruber給出的定義[9],即本體論是對(duì)概念化的精確描述.1997年Borst認(rèn)為Ontology是“共享概念模型的形式化規(guī)范說(shuō)明”[10].1998年Studer等進(jìn)一步完善后給出目前被廣泛認(rèn)可的定義:Ontology是共享概念模型的明確的形式化的規(guī)范說(shuō)明[11].文獻(xiàn)[12]認(rèn)為“Ontology的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語(yǔ))和詞匯間相互關(guān)系的明確定義”.文獻(xiàn)[13]認(rèn)為“Ontolgoy是某個(gè)領(lǐng)域內(nèi)不同主體之間進(jìn)行交流的一種語(yǔ)義基礎(chǔ)”.國(guó)內(nèi)大多數(shù)研究者在引入本體論最初目的都是為實(shí)現(xiàn)應(yīng)用程序間的“共享”,例如,引用本體論主要解決聯(lián)邦體與主體之間的交互[14];“本體論的最終目標(biāo)是精確地表示那些隱含(或不明確的)信息,使得它們可被軟件系統(tǒng)重用和共享”[15];利用本體論找出事務(wù)本質(zhì),統(tǒng)一知識(shí)的組織和知識(shí)的表達(dá),以此來(lái)解決知識(shí)共享問(wèn)題[16];制定關(guān)于生產(chǎn)過(guò)程領(lǐng)域內(nèi)的標(biāo)準(zhǔn)Ontology的目的,是使應(yīng)用軟件可以共享生產(chǎn)過(guò)程知識(shí)[17];開(kāi)發(fā)本體的目的是用于人類(lèi)、計(jì)算機(jī)對(duì)知識(shí)的共享和重用[18].綜合上述,筆者認(rèn)為本體論的內(nèi)涵應(yīng)該是以共享概念為目的而進(jìn)行一種對(duì)特定領(lǐng)域概念(概念之間的關(guān)系)用規(guī)范術(shù)語(yǔ)格式化表示的活動(dòng)過(guò)程框架.
1.3 Ontology相關(guān)理論
Ontology建模需要詳細(xì)說(shuō)明Perez等人提出的本體模型中涵蓋的5個(gè)基本元語(yǔ)[12]:類(lèi)(Classes)或概念(Concepts)、關(guān)系(Relations)、函數(shù)(Functions)、實(shí)例(Instances)、公理(Axioms).類(lèi)是Ontology的焦點(diǎn),類(lèi)描述在某一領(lǐng)域的概念,例如,教師、學(xué)生等.關(guān)系是指概念與概念之間的關(guān)系,主要分為4種關(guān)系[19]:屬性關(guān)系、繼承關(guān)系、聚集關(guān)系、類(lèi)與實(shí)例關(guān)系.一類(lèi)特殊的關(guān)系,該關(guān)系的前n-1個(gè)元素可以唯一決定第n個(gè)元素,其形式化的定義為F:C1×C2×…×Cn-1→Cn.實(shí)例就是元素、對(duì)象.公理即永真的斷言,一個(gè)斷言的邏輯形式.
圖2 本體分類(lèi)圖Fig. 2 The Ontology classification diagram
Ontology形式定義:OntologyO= {C,R,A},其中:C是某個(gè)領(lǐng)域的概念集合;R?C×C是指概念與概念之間的關(guān)系集合.如r=(c1,c2)∈R,也可以這樣表示r(c1)=c2;A是一組描述公理(規(guī)則)的詞匯集,有L={Lc,Lr,F,G}.Lc是一組與概念有關(guān)的詞匯元素集,Lr是一組與關(guān)系有關(guān)的詞匯元素集,引用概念集F?Lc×C|F(lc)={c∈C(lc,C)∈F} ,則對(duì)于所有l(wèi)c∈Lc;引用關(guān)系集G?Lr×R|G(lr)={r∈R(lr,R)∈F},則對(duì)于所有l(wèi)r∈Lr.依據(jù)對(duì)領(lǐng)域的依賴(lài)程度,Ontology可以分為4類(lèi)[20]:頂級(jí)本體(Top-level ontology)、領(lǐng)域本體(Domain ontology)、任務(wù)本體(Task ontology)、應(yīng)用本體(Application ontology)(見(jiàn)圖2).頂級(jí)本體描述的是最一般的概念,比如空間、時(shí)間等不依賴(lài)于任何特定問(wèn)題或領(lǐng)域;領(lǐng)域本體和任務(wù)本體用于描述特定領(lǐng)域(醫(yī)藥、汽車(chē)等)或一般任務(wù)或一種活動(dòng)(銷(xiāo)售等)中的概念及概念間的關(guān)系;應(yīng)用本體描述的概念是常依賴(lài)于特定領(lǐng)域和任務(wù)領(lǐng)域這兩者中的概念及概念間的關(guān)系.
1998年Studer[21]等人,將本體分為輕量級(jí)(lightweight)和重量級(jí)(heavyweight)本體.2001年Lassila和McGuinness[22]將兩大類(lèi)本體進(jìn)一步細(xì)化.他們用一條連續(xù)帶有節(jié)點(diǎn)的直線表示從非常輕量級(jí)類(lèi)到非形式化本體甚至重量級(jí)本體分類(lèi).Kayed和Colomb[23]在2002年將本體分為兩類(lèi):一類(lèi)是領(lǐng)域本體,表示關(guān)于概念和關(guān)系的;另一類(lèi)為結(jié)構(gòu)化領(lǐng)域本體(Structure Domain,SADO),表示概念和結(jié)構(gòu)的.雖然對(duì)本體有各種分類(lèi)方式,說(shuō)法不一,但目的是一致的,為了更好的理解本體,建設(shè)好本體.
1.4 Ontology構(gòu)建方法及工具
本體建模離不開(kāi)建模語(yǔ)言,目前有很多種本體語(yǔ)言,主要有兩大類(lèi):基于人工智能(Artificial Intelligence,AI)的本體描述語(yǔ)言,代表的有KIF、Ontolingua、Loom、OCML、Flogic等;另一種是基于Web的本體語(yǔ)言,代表的有SHOE、XOL、RDF(S)、OIL、OIL+DAML、OWL,其中W3C先后將RDF(S),DAML+OIL及OWL作為本體描述語(yǔ)言的推薦標(biāo)準(zhǔn).本文將重點(diǎn)介紹W3C推薦的Web本體語(yǔ)言(Web Ontology Language,OWL).OWL的起點(diǎn)是DAML+OIL[24],并且與RDF(S)有著重要的聯(lián)系.
RDF(S)是RDF和RDF Schema的合稱(chēng).RDF與領(lǐng)域無(wú)關(guān),但可以借助RDFS完成描述特定的領(lǐng)域,并且可對(duì)RDFS表示的內(nèi)容加以限制或約束.RDF與RDFS關(guān)系類(lèi)似于對(duì)象與類(lèi)的關(guān)系.DARPA Agent Markup Language (DAML),是一種通過(guò)行為代理將智能內(nèi)置在語(yǔ)言之內(nèi)的技術(shù).Ontology Interface Layer(OIL)是歐洲研究機(jī)構(gòu)設(shè)計(jì)的描述邏輯、基于框架及基于XML、RDF(S)的本體語(yǔ)言.DAML+OIL是建立在RDFS基礎(chǔ)之上,并繼承OIL的特性,豐富了約束條件,增強(qiáng)了語(yǔ)言表達(dá)能力,是RDFS的擴(kuò)展.
OWL[25],以RDF和RDFS為基礎(chǔ),使用基于XML的RDF語(yǔ)法,目前W3C為積極發(fā)展語(yǔ)義網(wǎng)而推薦眾多標(biāo)準(zhǔn)之一.OWL新增了更多用來(lái)描述屬性與類(lèi)別的詞匯,比如:類(lèi)別之間的關(guān)系、基數(shù)約束、相等、屬性的對(duì)稱(chēng)、枚舉類(lèi)等.OWL既具有描述各種本體和知識(shí)的充分表達(dá)能力,又具有高效的推理能力.OWL分3種不同的子語(yǔ)言(OWL Full、OWL DL及OWL Lite),每個(gè)子語(yǔ)言在不同層次上滿足不同的需求.本體設(shè)計(jì)的原則(最有影響的是Gruber于1995年在文獻(xiàn)[26]中提出的5條規(guī)則):明晰、一致性、可擴(kuò)展性、完全性、最小本體承諾.
本體構(gòu)建過(guò)程是一個(gè)復(fù)雜過(guò)程,如何利用好現(xiàn)有的工具,可以有效提高本體構(gòu)建的效率.本體工具目前主要分為兩大類(lèi)[22]:一是基于AI本體描述語(yǔ)言的工具,比如Ontolingua、OntoSaurus、WebOnto等.二是基于Web的本體描述語(yǔ)言工具,比如Protégé、WebODE、OntoEdit、OilEd、KAON[27]等.其中,Protégé[28]已成為目前使用最廣泛的本體論編輯器之一,是一套用于對(duì)本體知識(shí)進(jìn)行描述、表達(dá)和推理的軟件.它擁有一個(gè)靈活的架構(gòu),支持插件開(kāi)發(fā),并且提供了一套JavaAPI供編程人員使用.
2.1 Jena介紹
圖3 Jena2框架圖[30]Fig. 3 The Jena2 Architecture
Jena最初是來(lái)自HP(惠普)實(shí)驗(yàn)室語(yǔ)義網(wǎng)研究項(xiàng)目的開(kāi)源工具.Jena是一個(gè)構(gòu)造語(yǔ)義網(wǎng)應(yīng)用程序的Java框架.它能夠幫助我們利用工具包、Java庫(kù)去開(kāi)發(fā)語(yǔ)義網(wǎng)及相關(guān)的應(yīng)用程序.在2000年出了第一版本Jena1,隨后在2003年8月出了Jena2[29].Jena1提供豐富的RDF模型接口,包括各種工具,例如:RDF/XML解析器;一種查詢(xún)語(yǔ)言(RDQL);以及為N3、N-triple及RDF/XML輸出的I/O模型.使用API可以讓用戶(hù)實(shí)現(xiàn)RDF模型存儲(chǔ)在內(nèi)存或永久存儲(chǔ)在磁盤(pán)上.Jena1還提供了對(duì)DAML+OIL的支持.Jena2擴(kuò)展了新的APIs對(duì)RDFS和OWL的支持,確保能夠訪問(wèn)和處理本體知識(shí)庫(kù).Jena2相比Jena1,一方面允許開(kāi)發(fā)者利用APIs開(kāi)發(fā)新的功能應(yīng)用,另一方面,可以動(dòng)態(tài)實(shí)現(xiàn)對(duì)傳統(tǒng)數(shù)據(jù)訪問(wèn)及推理進(jìn)行輸出某些處理結(jié)果.Jena2的框架如圖3所示.
Jena2框架包括:ARP(N3 I/O)、RDQL、Model(Ontology)、EnhGraph、Graph及數(shù)據(jù)持久層.其中:1)Model(Ontology)層:為應(yīng)用程序員提供豐富的方法來(lái)操作圖(模型,Model)和節(jié)點(diǎn)(資源,Resource);2)EnhGraph層:多態(tài)同步視圖.該層提供了圖的視圖和帶有節(jié)點(diǎn)圖的視圖,通常需要Model(Ontology)層的API,并且允許同步使用多態(tài)的圖和節(jié)點(diǎn)視圖;3)Graph層:統(tǒng)一的三元數(shù)據(jù)結(jié)構(gòu).Graph層以RDF為標(biāo)準(zhǔn).該層僅僅向下提供功能:三元數(shù)據(jù)存儲(chǔ);將非三元數(shù)據(jù)當(dāng)作只讀的三元數(shù)據(jù)處理;通過(guò)推理產(chǎn)生的三元數(shù)據(jù)(虛擬三元數(shù)據(jù)).該層可以通過(guò)高效率的快速查詢(xún)引擎,獲得不同種類(lèi)的結(jié)果.
目前Jena2提供的功能主要有:1)RDF API:讀取、處理、創(chuàng)建RDF文檔(XML、N-triples及Turtle格式);2)Ontology API:管理OWL和RDFS本體集;3)推理子系統(tǒng),具備建立推理引擎的規(guī)則庫(kù):利用RDF和OWL數(shù)據(jù)資源實(shí)現(xiàn)推理應(yīng)用;4)提供實(shí)現(xiàn)將RDF的模型數(shù)據(jù)在內(nèi)存存儲(chǔ)或磁盤(pán)上的可持久性存儲(chǔ);5)提供支持SPRQL規(guī)范的查詢(xún)引擎.2008年1月15日,SPARQL[31]正式成為一項(xiàng)W3C推薦標(biāo)準(zhǔn).
2.2 Jena推理
圖4 Jena推理框架[30]Fig. 4 The Inference Architecture of Jena
Jena2中推理子系統(tǒng)是基本核心系統(tǒng)之一,它提供了基于規(guī)則的推理機(jī),除包含一般的推理功能外,應(yīng)用程序員還可以根據(jù)自定義規(guī)則實(shí)現(xiàn)推理.Jena推理框架如圖4所示.RDF/XML文檔是最基本的信息資源文件,通過(guò)ARP(一個(gè)RDF解析器)和RDF API接口程序轉(zhuǎn)換成RDF模型,模型可以暫時(shí)放置內(nèi)存中,也可以永久性的存儲(chǔ)在磁盤(pán)(Mysql、Oracle等數(shù)據(jù)庫(kù))中.這樣,RDF模型可以被用于信息檢索,也可以通過(guò)推理子系統(tǒng)和Ontology子系統(tǒng)生成具有語(yǔ)義推理能力的模型對(duì)象(InfGraph).
Jena2通過(guò)ModelFactory實(shí)現(xiàn)訪問(wèn)推理機(jī)制,即把ModelFactory類(lèi)將推理機(jī)與數(shù)據(jù)模型關(guān)聯(lián)起來(lái)實(shí)現(xiàn)推理的目的.Jena2實(shí)現(xiàn)推理的過(guò)程如下:1)通過(guò)推理機(jī)注冊(cè)(Reasoner Register).根據(jù)已經(jīng)創(chuàng)建的RDF三元數(shù)據(jù)信息資源與Ontology內(nèi)包含的信息利用通用規(guī)則或自定義規(guī)則創(chuàng)建出推理機(jī)(Reasoner);2)把需要進(jìn)行查詢(xún)推理的數(shù)據(jù)實(shí)例(Graph-base assertions)或本體(Graph-ontology definitions)同推理機(jī)綁定在一起,生成了核心的模型對(duì)象(InfGraph);3)利用Ontology/Model API對(duì)建立的模型對(duì)象(InfGraph)進(jìn)行操作和處理,完成推理過(guò)程.當(dāng)用戶(hù)使用查詢(xún)時(shí),不僅能夠獲得數(shù)據(jù)模型本身所包含的數(shù)據(jù),同時(shí)還可以獲得推理機(jī)所生成的推理數(shù)據(jù).
目前基于Ontology與Jena的應(yīng)用領(lǐng)域有很多.比如,通過(guò)具體的實(shí)例來(lái)闡述Jena推理機(jī)如何在現(xiàn)代企業(yè)雇員本體中進(jìn)行推理的過(guò)程[32];用Jena集成網(wǎng)格開(kāi)發(fā)工具GT3實(shí)現(xiàn)模擬語(yǔ)義網(wǎng)格[33];使用OWL語(yǔ)言創(chuàng)建TBT領(lǐng)域本體,并引入Jena工具實(shí)現(xiàn)了TBT搜索系統(tǒng)對(duì)本體的查詢(xún)、處理及推理應(yīng)用[34];給出用Jena工具構(gòu)建OWL本體的5個(gè)步驟的具體方法[35];利用Protégé 工具構(gòu)建OWL教學(xué)資源本體庫(kù),并實(shí)現(xiàn)基于Jena工具的查詢(xún)及推理應(yīng)用[36];采用Jena對(duì)RDF模型中的潛在知識(shí)進(jìn)行查詢(xún),實(shí)現(xiàn)了基于語(yǔ)義網(wǎng)技術(shù)的制造業(yè)多源異構(gòu)知識(shí)集成[37];利用Jena工具實(shí)現(xiàn)了動(dòng)態(tài)提取和處理RDF模型的方法及語(yǔ)義檢索[38];重點(diǎn)研究了Jena的結(jié)構(gòu)與推理機(jī)制,并利用Jena對(duì)裝備領(lǐng)域本體實(shí)現(xiàn)了推理查詢(xún)應(yīng)用[39];采用Jena并構(gòu)造了三條推理規(guī)則,完成了對(duì)徐悲鴻的油畫(huà)本體知識(shí)推理應(yīng)用[40];采用Jena對(duì)旅游飯店本體實(shí)現(xiàn)查詢(xún)和推理應(yīng)用[41];實(shí)現(xiàn)Jena在地理本體空間信息查詢(xún)和在自定義規(guī)則下利用Jena推理機(jī)實(shí)現(xiàn)空間推理的應(yīng)用[42];在數(shù)字圖書(shū)館信息檢索領(lǐng)域,采用Protégé 手工建立人工智能本體,并利用Jena實(shí)現(xiàn)對(duì)本體的檢索與推理應(yīng)用[43];利用Jena提供的RDQL查詢(xún)語(yǔ)言實(shí)現(xiàn)了對(duì)計(jì)算機(jī)科學(xué)本體的基本語(yǔ)義信息查詢(xún)功能[44];采用Jena工具,借助推理規(guī)則實(shí)現(xiàn)了基于網(wǎng)狀知識(shí)方面的推理應(yīng)用[45];基于Jena并采用SPARQL查詢(xún)語(yǔ)言實(shí)現(xiàn)對(duì)博物館領(lǐng)域本體進(jìn)行查詢(xún)和推理的應(yīng)用[46];進(jìn)行了在知識(shí)管理中基于Jena及SPARQL的通用檢索系統(tǒng)構(gòu)建的應(yīng)用研究[47];利用Jena及構(gòu)造推理規(guī)則,實(shí)現(xiàn)交通領(lǐng)域本體的查詢(xún)與推理應(yīng)用[48].上述文獻(xiàn)在各自領(lǐng)域中都采用了Jena技術(shù)來(lái)實(shí)現(xiàn)本體的查詢(xún)及推理,但在高校信息化建設(shè)領(lǐng)域中的應(yīng)用幾乎是空白.例如,學(xué)生課程本體,科研信息本體,網(wǎng)絡(luò)運(yùn)維本體,數(shù)字應(yīng)用服務(wù)本體等等.
Jena能獲得如此廣泛應(yīng)用,得益于它是開(kāi)源工具包,支持權(quán)威可靠的DC元數(shù)據(jù)(DCMI,Dublin Core Metadata Initiative),支持功能強(qiáng)大的SPARQL查詢(xún)語(yǔ)言,提供豐富的API,可自由定義推理規(guī)則及推理,方便嵌入到應(yīng)用系統(tǒng)中等特點(diǎn).
隨著目前全球大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)的無(wú)序化越來(lái)越嚴(yán)重,如何讓已有的數(shù)據(jù)更加智能化,幫助使用者發(fā)現(xiàn)更多的信息價(jià)值是未來(lái)幾年的發(fā)展趨勢(shì).目前Ontology的發(fā)展與應(yīng)用還處于起步階段,但預(yù)計(jì)將在未來(lái)大數(shù)據(jù)時(shí)代發(fā)揮著重要角色,將原本相對(duì)孤立的信息變得更加有序化及智能化.研究者很多情況下受限于研究經(jīng)費(fèi)的影響而放棄Ontology相關(guān)技術(shù)研究.因此,本文介紹的Jena工具、Protégé等工具,本身是基于開(kāi)源的產(chǎn)品,可以為廣泛研究者提供基礎(chǔ)研究環(huán)境,也有利于Ontology技術(shù)的推廣.
構(gòu)建Ontology的目的就是為了實(shí)現(xiàn)軟件共享、重用,隨著Internet不斷發(fā)展,計(jì)算機(jī)應(yīng)用不斷豐富,Ontology領(lǐng)域也會(huì)越來(lái)越豐富,越來(lái)越完善.并且與之相關(guān)的開(kāi)發(fā)工具也會(huì)越來(lái)越強(qiáng)大.另外,隨著高校各領(lǐng)域的研究不斷豐富,往往很多研究源于高校,但很多研究成果卻未能夠反哺于高校,特別表現(xiàn)在高校信息化建設(shè)領(lǐng)域中.在此闡述的Ontology知識(shí)、Jena框架知識(shí)及其目前在領(lǐng)域中的應(yīng)用與研究狀況,能對(duì)在語(yǔ)義網(wǎng)領(lǐng)域中的研究開(kāi)發(fā)人員起到一定作用.
[1] Dave R. HTML 4.01 Specification[EB/OL]. [1999-10-29].http://www.w3.org/TR/html4
[2] Tim B-L. A roadmap to the Semantic Web [EB/OL]. [1998-10-14].http://www.w3.org/DesignIssues/Semantic.html
[3] Tim B-L. Semantic Web-XML2000 [EB/OL]. [2000-12-06].http://www.w3.org/2000/Talks/1206-xml2k-tbl/
[4] Brickley D, Guha R V. RDF Vocabulary Description Language 1.0: RDF Schema [EB/OL]. [2004-02-10]. http://www.w3.org/TR/rdf-schema/
[5] Beckett D. RDF/XML Syntax Specification (Revised) [EB/OL]. [2004-02-10].http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/
[6] Jeen Broekstra, Michel Klein, Stefan Decker,etal. Enabling knowledge representation on the Web by extending RDF Schema[J]. Computer Network, 2002, 39:609-634.
[7] 張紅霞,李海青.巴門(mén)尼德Ontology淺釋[J].湖南師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2006(1):24-25.
[8] Neches R, Fike R F, Gruber T R,etal. Enabling Technology for Knowledge Sharing[J]. AI Magazine,1991,12(3):36-56.
[9] Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993(5):199-220.
[10] Borst W N. Construction of Engineering Ontologies for Knowledge Sharing and Reuse[D]. Enschede: University of Twente,1997.
[11] Studer R, Benjamins V R, Fensel D. Knowledge Engineering, Principles and Methods[J]. Data and Knowledge Engineering,1998,25(122):161-197.
[12] 鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2002(5):730-737.
[13] 杜小勇,李曼,王大治.語(yǔ)義Web與本體研究綜述[J].計(jì)算機(jī)應(yīng)用,2004(10):14-16.
[14] 王念濱,徐曉飛,王剛,等.基于本體論的聯(lián)邦式多主體系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)工程,1999(3):49-50.
[15] 廖明宏.本體論與信息檢索[J].計(jì)算機(jī)工程,2000(2):56-58.
[16] 金芝.基于本體的需求自動(dòng)獲取[J].計(jì)算機(jī)學(xué)報(bào),2000(5):486-490.
[17] 傅謙,張申生,胡錦敏.基于本體的領(lǐng)域知識(shí)共享研究[J].計(jì)算機(jī)集成制造系統(tǒng)-CIMS,2001(11):54-58.
[18] 徐振寧,張維明,陳文偉.基于Ontology的智能信息檢索[J].計(jì)算機(jī)科學(xué),2001(6):21-26.
[19] 張東民,廖文和,胡建,等.基于本體的設(shè)計(jì)知識(shí)建模[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2005(5):26-30.
[20] Guarino N. Semantic Matching: Formal Ontological Distinctions for Information Organization, Extraction and Integration[J]. Lecture Notes in Computer Science,1997,1299:139-170.
[21] Mohammad N A, Robert M C. Overview of Ontology Servers Research [EB/OL]. [2007-04-25].http://www.webology.org/2007/v4n2/a43.html
[22] Corcho, O. Ontology based document annotation: trends and open research problems[J]. International Journal of Metadata, Semantics and Ontologies,2006:1(1),47-57.
[23] Kayed A , Colomb R M.Ontological and conceptual structures for tendering automation[C]//Gable G, Vitale M, Proceedings of the 11th Australasian Conference on Information Systems: ACIS 2000, Brisbane:2000(1-15):6-8.
[24] 尹奇韡,李善平.語(yǔ)義Web語(yǔ)言DAML+OIL及其應(yīng)用初探[J].計(jì)算機(jī)科學(xué),2003(1):139-141.
[25] W3C.OWL Web Ontology Language Guide [EB/OL].[2003-03-01].http://www.w3.org/TR/owl-guide/
[26] Gruber T R. Towards Principles for the Design of Ontologies Used for Knowledge Sharing[J]. International Journal of Human Computer Studies,1995,43:907-928.
[27] Bozsak E, Ehriq, M, Handschuh S,etal. KADN-Towards a large scale semantic web[J]. Ecommerce and Web Technologies Lecture Notes in Computer Science,2002,2455:304-313.
[28] Stanford University School of Medicine. What is protégé [EB/OL]. [2011-12-01]. http://protege.stanford.edu/over view,
[29] The Apache Software Foundation. What is Jena? [EB/OL]. [2011-10-10].http://incubator.apache.org/jena/about_jena/about.html
[30] Carroll J J, Dickinson I, Dollin C,et.al. Jena: Implementing the Semantic Web Recomandations[EB/OL].[2003-11-24].http://www.hpl.hp.com/techreports/2003/HPL-2003-146.PDF
[31] Herman I. SPARQL is a Recommendation [EB/OL]. [2008-01-15]. http://www.w3.org/blog/SW/2008/01/15/sparql_is_a_recommendation/
[32] 耿科明,袁方.Jena推理機(jī)在基于本體的信息檢索中的應(yīng)用[J].微型機(jī)與應(yīng)用,2005(10):62-64.
[33] 韓貴來(lái),余遠(yuǎn)波.集成Jena和GT3模擬語(yǔ)義網(wǎng)格[J].計(jì)算機(jī)時(shí)代,2006(12):10-11.
[34] 張占一,蔣國(guó)瑞,黃梯云.Jena在基于Ontology的TBT文檔搜索中的應(yīng)用研究[J].中國(guó)科技信息,2007(15):132-134.
[35] 向陽(yáng),王敏,馬強(qiáng).基于Jena的本體構(gòu)建方法研究[J].計(jì)算機(jī)工程,2007(14):59-61.
[36] 陳和平,郭晶晶,吳懷宇,等.基于Ontology和Jena的個(gè)性化E-Learning系統(tǒng)研究[J].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2007(6):1049-1052.
[37] 王晶,張文學(xué),徐琪,等.基于RDF/Jena的制造業(yè)信息系統(tǒng)多源異構(gòu)知識(shí)集成框架[J].計(jì)算機(jī)應(yīng)用與軟件,2008(7):103-104.
[38] 盛秋艷,印桂生.基于Jena的動(dòng)態(tài)語(yǔ)義檢索方法[J].計(jì)算機(jī)工程,2009,16:62-64.
[39] 譚月輝,肖冰,陳建泗,等.Jena推理機(jī)制及應(yīng)用研究[J].河北省科學(xué)院學(xué)報(bào),2009(4):14-17.
[40] 梁曄,劉宏哲.運(yùn)用Jena對(duì)本體模型進(jìn)行推理及其應(yīng)用[J].北京聯(lián)合大學(xué)學(xué)報(bào):自然科學(xué)版,2009(3):23-27.
[41] 何勝利,陳福.網(wǎng)絡(luò)環(huán)境下基于Jena的規(guī)則推理方法研究[J].鐵路計(jì)算機(jī)應(yīng)用,2009(6):38-41.
[42] 李宏偉,蔡暢,李勤超.基于Jena和地理本體的空間查詢(xún)與推理研究[J].測(cè)繪工程,2009(5):5-9.
[43] 嚴(yán)武軍.基于Jena規(guī)則推理數(shù)字圖書(shū)館信息檢索系統(tǒng)研究[J].電腦開(kāi)發(fā)與應(yīng)用,2010(2):40-42.
[44] 李桂華.基于Jena的語(yǔ)義信息檢索應(yīng)用研究[J].計(jì)算機(jī)與信息技術(shù),2010(1):8-13.
[45] 林楨.基于Jena的網(wǎng)狀知識(shí)推理與應(yīng)用研究[J].情報(bào)探索,2010(4):94-96.
[46] 季嚴(yán)亮,劉厚泉.基于Jena的博物館展品信息語(yǔ)義查詢(xún)[J].大眾科技,2010(6):59-60.
[47] 李剛,錢(qián)省三,葉春明.基于Jena的知識(shí)檢索系統(tǒng)的優(yōu)化研究[J].微計(jì)算機(jī)信息,2011(8):23-24.
[48] 田宏,馬朋云.基于Jena的城市交通領(lǐng)域本體推理和查詢(xún)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011(8):57-59.
OverviewofOntologyandJena
HE Laikun1, MIAO Jianmei2, LIU Lifang1, PAN Hong3
(1. Informatization Center, Hangzhou Normal University, Hangzhou 310036, China; 2. Science and Technology Department of Administration, Hangzhou Normal University, Hangzhou 310036, China; 3. Institute of Service Engineering, Hangzhou Normal University, Hangzhou 310036, China)
Ontology is a formal, explicit specification of a shared conceptualmodel. It is one of the key technologies to implement the semantic Web. The target of ontology is to capture the domain knowledge, provide the comprehension of domain knowledge, ensure the acknowledgeable vocabularies of the domain, and explicitly define the vocabularies and relationships between these vocabularies by formal models in different gradation. This paper first systematically stated the position of ontology in the semantic web, and the basic knowledge of the ontology such as the definition, the correlation theories, the construction method as well as the construction tools. Jena which was the tool to construct Java framework of the semantic Web application was also presented, and the current application based on Ontology and Jena was finally reviewed.
Ontology; Jena; semantic Web; ontology modeling; RDF
2012-12-06
浙江省自然科學(xué)基金項(xiàng)目(Y1110820);浙江省教育廳科研項(xiàng)目(Y201121188).
何來(lái)坤(1975—),男,工程師,主要從事數(shù)字化校園建設(shè)與管理等研究.E-mail: hlk@hznu.edu.cn
10.3969/j.issn.1674-232X.2013.05.016
TP301
A
1674-232X(2013)05-0467-07