汪圳 祝婷
摘? 要:為提升面向用戶的精細(xì)化知識(shí)服務(wù)質(zhì)量及資源利用效率,提出一種基于模糊Petri網(wǎng)的數(shù)字圖書館標(biāo)準(zhǔn)化知識(shí)元集成方法,充分展示內(nèi)容之間的語義關(guān)系。首先,引入本體與模糊Petri網(wǎng)技術(shù),對(duì)數(shù)字圖書館文獻(xiàn)知識(shí)進(jìn)行獲取和重組,從而構(gòu)建知識(shí)元庫(kù);其次,將本體應(yīng)用于知識(shí)元的語義鏈接,使計(jì)算機(jī)能夠“理解”知識(shí)元的語義并能自動(dòng)集成;最后,構(gòu)建知識(shí)元模糊Petri網(wǎng)以規(guī)范用戶和系統(tǒng)對(duì)概念語義的理解,清晰描述知識(shí)元概念之間的語義關(guān)系,由此消除人與計(jì)算機(jī)對(duì)語義理解的歧義。文獻(xiàn)集成案例展示語義知識(shí)元的集成策略,案例表明該方法可以有效揭示文獻(xiàn)內(nèi)容之間的語義關(guān)聯(lián)及文獻(xiàn)之間的關(guān)聯(lián)程度。
關(guān)鍵詞:模糊Petri網(wǎng);數(shù)字圖書館;知識(shí)元;本體;知識(shí)集成
中圖分類號(hào):TP301.1? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)24-0072-06
Research on Semantic Integration of Literature Knowledge Units Based on Fuzzy Petri Nets
WANG Zhen1, ZHU Ting2
(1.Chang'an University Library, Xi'an? 710064, China; 2.Xi'an Technological University Library, Xi'an? 710021, China)
Abstract: To improve the quality of user oriented refined knowledge services and resource utilization efficiency, a standardized Knowledge Units integration method for digital libraries based on fuzzy Petri nets is proposed, fully demonstrating the semantic relationships between contents. Firstly, the ontology and fuzzy Petri net technology are introduced to acquire and reorganize literature knowledge in digital libraries, thereby constructing a knowledge metabase; secondly, applying ontology to semantic linking of Knowledge Units enables computers to “understand” the semantics of Knowledge Units and automatically integrate them; finally, a Knowledge Units fuzzy Petri net is constructed to standardize the understanding of conceptual semantics by users and systems, clearly describing the semantic relationships between Knowledge Units concepts, and thus eliminating ambiguity in semantic understanding between humans and computers. The literature integration case demonstrates the integration strategy of semantic Knowledge Units, and the case demonstrates that this method can effectively reveal the semantic correlation between literature content and the degree of correlation between literatures.
Keywords: fuzzy Petri net; digital library; Knowledge Unit; ontology; knowledge integration
0? 引? 言
文獻(xiàn)資源是學(xué)者們?cè)诳蒲羞^程中必不可少的參考資源,然而數(shù)字圖書館面對(duì)海量數(shù)據(jù)的沖擊,檢索系統(tǒng)提供的文獻(xiàn)結(jié)構(gòu)化的信息格式只能展示文獻(xiàn)及其相關(guān)屬性值,已不能滿足科研用戶精細(xì)化的信息需求。目前文獻(xiàn)的組織方式不能充分挖掘文獻(xiàn)內(nèi)容層面的語義關(guān)系,導(dǎo)致用戶通過關(guān)聯(lián)關(guān)系學(xué)習(xí)理論或衍生新知識(shí)的效率不高。知識(shí)元集成的目的是將隱性知識(shí)進(jìn)行顯性化,實(shí)現(xiàn)知識(shí)元的有序化,衍生新的知識(shí)單元。通過提取文獻(xiàn)資源中的知識(shí)節(jié)點(diǎn),并建立文獻(xiàn)之間知識(shí)元的語義鏈接,從而為研究人員提供高效的知識(shí)服務(wù)。
模糊Petri網(wǎng)是在Petri網(wǎng)圖形表達(dá)的基礎(chǔ)上增加了模糊數(shù)學(xué)的推理機(jī)制,不僅能清晰描述元素之間的關(guān)系,也可以進(jìn)行知識(shí)的推理、分析及決策等,是一種融合Petri網(wǎng)和知識(shí)表達(dá)的良好建模工具。相關(guān)研究主要應(yīng)用在安全評(píng)估、物理系統(tǒng)分析及故障排查等領(lǐng)域,本文將Petri網(wǎng)應(yīng)用到知識(shí)元語義集成領(lǐng)域,實(shí)現(xiàn)文獻(xiàn)之間有價(jià)值節(jié)點(diǎn)的語義鏈接的問題,促進(jìn)跨領(lǐng)域?qū)W科的新知識(shí)的衍生學(xué)習(xí)。
1? ?相關(guān)研究綜述
知識(shí)元是相對(duì)獨(dú)立且具有完備知識(shí)表達(dá)的基本單元,通過對(duì)知識(shí)元的準(zhǔn)確標(biāo)引和有效集成,可以挖掘同一或不同學(xué)科之間的隱形和顯性的知識(shí)關(guān)系[1]。知識(shí)元標(biāo)引是實(shí)現(xiàn)跨領(lǐng)域知識(shí)集成與知識(shí)發(fā)現(xiàn)的基礎(chǔ)。溫有奎等首次提出了知識(shí)元標(biāo)引的概念,對(duì)文本知識(shí)元類型及其標(biāo)引規(guī)則進(jìn)行了研究[2],在此基礎(chǔ)上付蕾設(shè)計(jì)了一個(gè)知識(shí)元標(biāo)引系統(tǒng),并對(duì)該系統(tǒng)進(jìn)行了設(shè)計(jì)和實(shí)現(xiàn)[3];蔣玲則進(jìn)一步將以主題詞為知識(shí)元名稱進(jìn)行標(biāo)引的標(biāo)引技術(shù)細(xì)化到屬性信息進(jìn)行提取,提出了基于規(guī)則的知識(shí)元標(biāo)引方法[4]。總結(jié)知識(shí)元標(biāo)引方法主要有兩類:基于分類的標(biāo)引和基于主題的標(biāo)引,前者比如Jiang等研究了基于知識(shí)元的中文文本知識(shí)標(biāo)引,提出了知識(shí)元標(biāo)引的步驟[5];后者比如Luo等設(shè)計(jì)了基于知識(shí)元標(biāo)引的智能資源學(xué)習(xí)系統(tǒng),通過智能學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)自動(dòng)知識(shí)元標(biāo)引[6]。
知識(shí)元集成是將存在邏輯關(guān)聯(lián)的不同的知識(shí)元進(jìn)行鏈接,從而構(gòu)成以知識(shí)元為基本單位的知識(shí)網(wǎng)絡(luò)[7];溫有奎等研究了基于語義知識(shí)庫(kù)的智能推理機(jī)的問題答案服務(wù)系統(tǒng)[8];曾建勛探討基于知識(shí)元的知識(shí)鏈接的4種主要構(gòu)建方式[9];姜永常提出了一種基于知識(shí)元本體語義鏈接的知識(shí)網(wǎng)絡(luò)實(shí)現(xiàn)流程[10];陳蘭杰梳理了知識(shí)鏈接理論與實(shí)踐的三個(gè)時(shí)期,并指出以知識(shí)元鏈接為核心的知識(shí)服務(wù)模式是發(fā)展的必然趨勢(shì)[11];王靜等以飲食與疾病領(lǐng)域的知識(shí)元為研究對(duì)象,對(duì)兩個(gè)領(lǐng)域的知識(shí)元之間的語義關(guān)系進(jìn)行了鏈接,從而實(shí)現(xiàn)了知識(shí)元的語義推理[12];曾建勛認(rèn)為知識(shí)鏈接將朝著面向科研環(huán)境、個(gè)性化推薦鏈接、基于本體的語義關(guān)系鏈接等方面發(fā)展[13]??偨Y(jié)知識(shí)元集成主要有兩類方法:利用關(guān)聯(lián)數(shù)據(jù)等建立知識(shí)元之間的導(dǎo)航和應(yīng)用本體技術(shù)進(jìn)行知識(shí)元的集成,前者如溫有奎等探討了利用譜分析對(duì)知識(shí)元進(jìn)行提取的算法[14],高勁松等利用關(guān)聯(lián)數(shù)據(jù)的相關(guān)技術(shù)對(duì)抽取的文獻(xiàn)知識(shí)元之間的語義進(jìn)行了鏈接[15];后者比如Wu等設(shè)計(jì)了一種基于本體的知識(shí)元鏈接的系統(tǒng)[16]。
本文參考的關(guān)于模糊Petri網(wǎng)本體建模的相關(guān)研究如下:王卓等將本體概念視為各種模型與Petri網(wǎng)模型之間轉(zhuǎn)換的橋梁[17];相東明等根據(jù)領(lǐng)域本體為Petri網(wǎng)中的所有庫(kù)所添加語義標(biāo)記,使其與已有的語義庫(kù)建立聯(lián)系[18];裘杭萍等提出了一種基于Petri網(wǎng)的OWL-S語義匹配機(jī)制[19];劉如娟等基于本體理論設(shè)計(jì)了一種基于時(shí)間約束Petri網(wǎng)的Web服務(wù)時(shí)間模型定義方法,該方法不僅擴(kuò)展已有的Petri網(wǎng)本體,而且增強(qiáng)其描述能力,使其能夠描述服務(wù)數(shù)據(jù)及時(shí)間信息,并定義了在OWL-S上定義的時(shí)間本體與Petri網(wǎng)時(shí)間本體間的關(guān)系[20];吳敏敏等提出了一種Petri網(wǎng)和本體的語義Web服務(wù)組合方法[21]。
泛在環(huán)境下知識(shí)元的標(biāo)引和集成是并發(fā)的,需要協(xié)同標(biāo)引手段,模糊Petri網(wǎng)作為動(dòng)態(tài)系統(tǒng)的有效建模工具,在并發(fā)服務(wù)等方面取得了很多研究成果,但缺少在知識(shí)元協(xié)同標(biāo)引和集成過程方面的研究。因此,本文利用模糊Petri網(wǎng)進(jìn)行數(shù)字圖書館文獻(xiàn)層面知識(shí)元的協(xié)同標(biāo)引,同時(shí)將本體應(yīng)用于知識(shí)元的集成過程,使計(jì)算機(jī)能夠“理解”知識(shí)元的語義并能自動(dòng)集成,以解決知識(shí)元集成過程中語義的鏈接,進(jìn)而揭示文獻(xiàn)內(nèi)容層面的語義關(guān)系。
2? 基于模糊Petri網(wǎng)的文獻(xiàn)知識(shí)網(wǎng)絡(luò)
知識(shí)之間存在不同類型和程度的關(guān)聯(lián)關(guān)系,但傳統(tǒng)的知識(shí)描述方式缺乏對(duì)知識(shí)之間關(guān)聯(lián)類型和程度的表達(dá)和描述,不能很好地描述知識(shí)之間的關(guān)聯(lián)關(guān)系,模糊Petri網(wǎng)可以通過描述臨近知識(shí)之間的關(guān)系,形成知識(shí)間的語義鏈接,進(jìn)而組成知識(shí)網(wǎng)絡(luò),使計(jì)算機(jī)能夠“理解”知識(shí)間的相互關(guān)系并能自動(dòng)集成。同時(shí),還可以跨越領(lǐng)域、地域等限制,發(fā)現(xiàn)隱藏的知識(shí)關(guān)系,擴(kuò)大知識(shí)應(yīng)用范圍,促進(jìn)創(chuàng)新也啟發(fā)用戶思維。
2.1? 文獻(xiàn)知識(shí)標(biāo)準(zhǔn)化處理
數(shù)字圖書館的知識(shí)資源數(shù)據(jù)庫(kù)來源主要包括學(xué)術(shù)論文、專著、課題報(bào)告等,要實(shí)現(xiàn)對(duì)這些知識(shí)資源的知識(shí)元抽取,首先需要制定內(nèi)容分解規(guī)則來識(shí)別和分解數(shù)據(jù)庫(kù)資源的主題內(nèi)容,一般分為三步:
1)判斷知識(shí)資源類型及領(lǐng)域,分解歸類到不同的資源庫(kù)。
2)依據(jù)語法結(jié)構(gòu)和內(nèi)容表現(xiàn)形式,將每條知識(shí)中包含的語句分解為簡(jiǎn)單的主謂賓結(jié)構(gòu),再進(jìn)一步轉(zhuǎn)換成“對(duì)象—屬性”的表現(xiàn)形式。
3)隱藏冗余語句,建立剩余語句之間的知識(shí)關(guān)系,突出主題內(nèi)容。
經(jīng)過處理后的知識(shí)被重新組織排列成具有標(biāo)準(zhǔn)術(shù)語的句式,然后就可以根據(jù)知識(shí)元分類,經(jīng)過人工識(shí)別篩選,生成基于知識(shí)元的知識(shí)庫(kù),數(shù)字圖書館文獻(xiàn)知識(shí)元標(biāo)準(zhǔn)收取過程如圖1所示。
主題內(nèi)容識(shí)別與分解過程中常常會(huì)產(chǎn)生無法識(shí)別的內(nèi)容,一般情況下需要人工進(jìn)行識(shí)別描述,并形成新的內(nèi)容分解規(guī)則,擴(kuò)充到內(nèi)容分解規(guī)則中。
2.2? 文獻(xiàn)知識(shí)的本體描述
知識(shí)元缺乏面向語義的表達(dá)和描述,不能很好地支持語義集成,因此可以將本體(Ontology)應(yīng)用于知識(shí)元的語義鏈接,使計(jì)算機(jī)能夠“理解”知識(shí)元的語義并能自動(dòng)集成。本體早在20世紀(jì)60年代就被計(jì)算機(jī)領(lǐng)域使用,卻一直缺少對(duì)本體統(tǒng)一的看法,從1993年到1997年,經(jīng)過Gruber、Borst等人給出本體定義的基礎(chǔ)上,Studer等人認(rèn)為本體是“共享概念模型的明確的形式化規(guī)范說明”[22]。這個(gè)普遍公認(rèn)的定義指出本體描述的是專業(yè)領(lǐng)域內(nèi)的概念與概念之間的相互關(guān)系,從而構(gòu)成一個(gè)學(xué)科領(lǐng)域內(nèi)部概念的詞表以及概念間清晰的層次關(guān)系。
本體的目標(biāo)是規(guī)范用戶和計(jì)算機(jī)對(duì)概念語義的理解,表達(dá)清晰的概念層次和語義關(guān)系,建立孤立知識(shí)概念間的語義聯(lián)系,通過推理關(guān)系得到概念間蘊(yùn)含的聯(lián)系,由此消除人—計(jì)算機(jī)對(duì)語義理解的歧義。
P?erez等人對(duì)本體進(jìn)行諸多研究,提出本體的五元組邏輯結(jié)構(gòu)[23],本文結(jié)合此研究,定義知識(shí)元本體模型Knowledge=
知識(shí)元的初始標(biāo)識(shí)(C)即本體的唯一標(biāo)識(shí)代碼,便于存儲(chǔ)和提取。
知識(shí)元的存在領(lǐng)域(RC)依據(jù)《中圖法》對(duì)本體的類別進(jìn)行劃分,即5大部類、22個(gè)大類,它們的標(biāo)識(shí)符和類名如下:A:馬克思主義、列寧主義、毛澤東思想;B:哲學(xué);C:社會(huì)科學(xué)總論;D:政治、法律;E:軍事;F:經(jīng)濟(jì);G:文化、科學(xué)、教育、體育;H:語言、文字;I:文學(xué);J:藝術(shù);K:歷史、地理;N:自然科學(xué)總論;O:數(shù)理科學(xué)和化學(xué);P:天文學(xué)、地球科學(xué);Q:生物科學(xué);R:醫(yī)藥、衛(wèi)生;S:農(nóng)業(yè)科學(xué);T:工業(yè)技術(shù);U:交通運(yùn)輸;V:航空、航天;X:環(huán)境科學(xué);Z:綜合類。
知識(shí)元內(nèi)包含的內(nèi)容(I)即知識(shí)元的定義或模型等具體解釋性內(nèi)容。
知識(shí)元與其他知識(shí)元間的關(guān)系類型(XR)是知識(shí)元間比較顯性的關(guān)系(如part-of:部分與整體的關(guān)系、kind-of:繼承關(guān)系、instance-of:實(shí)例和整體的關(guān)系、attribute-of:屬性關(guān)系)的描述。
知識(shí)元與其他知識(shí)元間的關(guān)聯(lián)程度(XRD)不僅可以描述知識(shí)元間的緊密程度,還可以進(jìn)一步體現(xiàn)知識(shí)元間的隱性關(guān)系(即相同、相似、相關(guān)、無關(guān))。關(guān)聯(lián)程度采用五元組進(jìn)行表示:XRD=(RC,P,O,I,KT);其中,RC為知識(shí)元存在領(lǐng)域,P為知識(shí)元的語義來源,O為知識(shí)元描述對(duì)象,I為知識(shí)元內(nèi)容,T為知識(shí)元應(yīng)用情景。假設(shè)第j種要素對(duì)知識(shí)元i的影響程度為dji,則知識(shí)元i的向量模型為:
采用余弦相似度計(jì)算知識(shí)元i與知識(shí)元j間的關(guān)聯(lián)程度:
當(dāng)相似度值d大于某閾值時(shí)認(rèn)為這兩種知識(shí)元是相同的,介于某兩個(gè)閾值之間表示兩種知識(shí)元是相似的,小于模擬閾值且大于0時(shí)兩種知識(shí)元有關(guān)系,等于0時(shí)知識(shí)元是無關(guān)的。閾值的選取根據(jù)不同情況可采用專家評(píng)分的方法確定閾值。
2.3? 基于模糊Petri網(wǎng)的知識(shí)網(wǎng)構(gòu)建
Petri網(wǎng)最早由物理學(xué)家卡爾· A ·佩特里應(yīng)用在描述并發(fā)現(xiàn)象上。Petri網(wǎng)中不存在“全局時(shí)間”概念,描述的是專業(yè)領(lǐng)域內(nèi)的事件與事件之間的相互關(guān)系,只要條件成熟,節(jié)點(diǎn)所包含的事件就可以發(fā)生,從而構(gòu)成一個(gè)學(xué)科領(lǐng)域內(nèi)部知識(shí)點(diǎn)間清晰的層次關(guān)系。
模糊Petri網(wǎng)是由Petri網(wǎng)與模糊數(shù)學(xué)相結(jié)合,對(duì)并行問題進(jìn)行模糊處理的建模工具,主要要素包括庫(kù)所節(jié)點(diǎn)、變遷節(jié)點(diǎn)、連接強(qiáng)度以及負(fù)實(shí)數(shù)變遷啟動(dòng)閾值等。其構(gòu)建流程如圖2所示。
模糊Petri網(wǎng)主要由節(jié)點(diǎn)(庫(kù)所、變遷、引用)、特征信息和弧組成,每條知識(shí)有唯一的初始標(biāo)識(shí),經(jīng)過加工處理后會(huì)被賦予其他更規(guī)范的不同標(biāo)識(shí);節(jié)點(diǎn)分為庫(kù)所節(jié)點(diǎn)、變遷節(jié)點(diǎn)和引用節(jié)點(diǎn),庫(kù)所和變遷兩節(jié)點(diǎn)之間的關(guān)系通過弧連接,弧的強(qiáng)度超過特征信息中的閾值時(shí),變遷節(jié)點(diǎn)啟動(dòng);引用節(jié)點(diǎn)包括引用庫(kù)所和引用變遷,是對(duì)另外不同網(wǎng)絡(luò)中知識(shí)的引入,可以實(shí)現(xiàn)不同模糊Petri網(wǎng)之間的關(guān)聯(lián),擴(kuò)大知識(shí)鏈接面。
構(gòu)建模糊Petri網(wǎng)的目標(biāo)是規(guī)范用戶和系統(tǒng)對(duì)概念語義的理解,表達(dá)清晰的概念層次和語義關(guān)系,建立孤立知識(shí)概念間的語義聯(lián)系,由此消除人—計(jì)算機(jī)對(duì)語義理解的歧義。
本文采用大數(shù)據(jù)統(tǒng)計(jì)方法對(duì)知識(shí)庫(kù)內(nèi)知識(shí)元之間的關(guān)聯(lián)性進(jìn)行統(tǒng)計(jì),推理出知識(shí)元間的模糊關(guān)聯(lián)規(guī)則,構(gòu)建基于模糊Petri網(wǎng)的知識(shí)關(guān)聯(lián)關(guān)系,主要分為兩步:
1)對(duì)每條知識(shí)內(nèi)部的知識(shí)元進(jìn)行梳理,確定知識(shí)內(nèi)部知識(shí)元間基于模糊Petri網(wǎng)的關(guān)聯(lián)關(guān)系,如圖3所示。
知識(shí)元k1和k2在條件達(dá)到各自變遷節(jié)點(diǎn)啟動(dòng)的閾值v1、v2后啟動(dòng)變遷節(jié)點(diǎn),與一個(gè)或多個(gè)知識(shí)元ki產(chǎn)生關(guān)聯(lián),wi為關(guān)聯(lián)系數(shù);以此類推,經(jīng)過多個(gè)知識(shí)元間的規(guī)則轉(zhuǎn)換后最終與知識(shí)元kn產(chǎn)生關(guān)系。當(dāng)條件不能達(dá)到啟動(dòng)閾值時(shí),vi = 0,則有:
當(dāng)vi ≠ 0時(shí),知識(shí)元ki與知識(shí)元kn之間存在的關(guān)聯(lián)程度lin = vi×wn;
若vi = 0,lin = lij×…×ljn;
結(jié)合式(2),和知識(shí)元km有關(guān)聯(lián)的知識(shí)元kn與知識(shí)元ki的關(guān)聯(lián)程度lin表示為:lin = lim×dmn;
取:
2)以知識(shí)內(nèi)部的每條知識(shí)元作為節(jié)點(diǎn),在知識(shí)庫(kù)內(nèi)尋找與之有關(guān)聯(lián)的知識(shí)元及其所在的知識(shí)內(nèi)容,并根據(jù)知識(shí)元之間的關(guān)聯(lián)關(guān)系形成知識(shí)間的關(guān)聯(lián)關(guān)系,如圖4所示。
知識(shí)i和知識(shí)j內(nèi)部存在相同的或者可以產(chǎn)生關(guān)系的知識(shí)元,將之通過關(guān)聯(lián)規(guī)則產(chǎn)生聯(lián)系,最終形成知識(shí)i和知識(shí)j之間的關(guān)聯(lián)關(guān)系。
為了實(shí)現(xiàn)不同領(lǐng)域間的知識(shí)關(guān)聯(lián),我們選取知識(shí)i中的知識(shí)元與知識(shí)j中的知識(shí)元關(guān)聯(lián)程度最大的值作為知識(shí)i與知識(shí)j的關(guān)聯(lián)程度值:
可以根據(jù)知識(shí)之間的關(guān)聯(lián)程度值來發(fā)現(xiàn)不同領(lǐng)域有關(guān)聯(lián)的知識(shí)內(nèi)容,從而實(shí)現(xiàn)知識(shí)的融合。
3? 基于模糊Petri網(wǎng)的文獻(xiàn)知識(shí)元集成實(shí)例
本文選取兩篇文獻(xiàn)作為實(shí)例進(jìn)行知識(shí)集成說明,由于篇幅問題,只選取主要步驟的重要部分進(jìn)行展示。
3.1? 知識(shí)資源標(biāo)準(zhǔn)化處理
論文依據(jù)《中圖法》對(duì)知識(shí)資源的類型及領(lǐng)域進(jìn)行劃分,再根據(jù)論文內(nèi)容提取主要內(nèi)容及所包含的知識(shí)元,如表1所示。
3.2? 知識(shí)元交互關(guān)系及相關(guān)知識(shí)元整理
確定知識(shí)資源《基于用戶情境的高校圖書館書目協(xié)同過濾推薦研究》中的知識(shí)元間的語義交互關(guān)系。如圖5所示。
并根據(jù)式(1)(2)搜索并計(jì)算與知識(shí)資源《基于用戶情境的高校圖書館書目協(xié)同過濾推薦研究》中知識(shí)元相似的知識(shí)元,部分結(jié)果如表2所示。
3.3? 基于模糊Petri網(wǎng)的知識(shí)網(wǎng)構(gòu)建及關(guān)聯(lián)程度分析
本文主要目的是鏈接不同學(xué)科領(lǐng)域間知識(shí)內(nèi)容的語義,進(jìn)而擴(kuò)展需求者思維,隨機(jī)篩選一篇相關(guān)示例文獻(xiàn)《貝葉斯更新下基于情景樹的動(dòng)態(tài)訂貨策略研究》,與示例文獻(xiàn)進(jìn)行對(duì)比分析。
將處理過后的知識(shí)文獻(xiàn)按照知識(shí)元關(guān)聯(lián)規(guī)則用模糊Petri網(wǎng)表示出來,如圖6所示。
根據(jù)式(3),文獻(xiàn)《貝葉斯更新下基于情景樹的動(dòng)態(tài)訂貨策略研究》中知識(shí)元與文獻(xiàn)《基于用戶情境的高校圖書館書目協(xié)同過濾推薦研究》中的知識(shí)元——書目推薦的關(guān)聯(lián)程度計(jì)算結(jié)果如表3所示。
對(duì)比文獻(xiàn)與書目推薦的關(guān)聯(lián)程度l = max{0.367,0.294,0.406,0.337} = 0.406。
根據(jù)式(4),文獻(xiàn)《貝葉斯更新下基于情景樹的動(dòng)態(tài)訂貨策略研究》與文獻(xiàn)《基于用戶情境的高校圖書館書目協(xié)同過濾推薦研究》的相關(guān)程度L = max{l1,8,l1,9,l3,7} = max{0.906,0.752,0.910} = 0.910。,即兩篇文獻(xiàn)存在一定的關(guān)聯(lián)性。
兩篇文獻(xiàn)中,都需要通過用戶需求來推理情境,所需要的理論方法有一定的相似性;同時(shí),貝葉斯定理在兩篇文獻(xiàn)中都有應(yīng)用,知識(shí)需求者可以根據(jù)這種關(guān)聯(lián)關(guān)系學(xué)習(xí)理論或衍生跨領(lǐng)域的新知識(shí)。
4? 結(jié)? 論
通過模糊Petri網(wǎng)模型將文獻(xiàn)資源在知識(shí)元層面進(jìn)行了語義關(guān)聯(lián),可以為用戶提供文獻(xiàn)內(nèi)容層面知識(shí)的產(chǎn)生和發(fā)展脈絡(luò),通過建立知識(shí)元之間的語義關(guān)聯(lián),清晰了解獨(dú)立知識(shí)元的發(fā)展軌跡和現(xiàn)狀,為用戶提供文獻(xiàn)內(nèi)容全景式的知識(shí)網(wǎng)體系;知識(shí)元語義集成過程,消除了學(xué)科領(lǐng)域界限,可視化展示跨領(lǐng)域的知識(shí)內(nèi)容層面的語義聯(lián)系及文獻(xiàn)之間的關(guān)聯(lián)程度,為跨學(xué)科演進(jìn)新知識(shí)提供理論層面的推理機(jī)制。
參考文獻(xiàn):
[1] 溫有奎,焦玉英.基于知識(shí)元的知識(shí)發(fā)現(xiàn) [M].西安:西安電子科技大學(xué)出版社,2011:12-14.
[2] 溫有奎,溫浩,徐端頤,等.基于知識(shí)元語義網(wǎng)格平臺(tái)的知識(shí)發(fā)現(xiàn)研究 [J].計(jì)算機(jī)工程與應(yīng)用,2006(4):4-6+34.
[3] 付蕾.知識(shí)元標(biāo)引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [D].武漢:華中師范大學(xué),2009.
[4] 蔣玲.面向?qū)W科的知識(shí)元標(biāo)引關(guān)鍵技術(shù)研究 [D].武漢:華中師范大學(xué),2011.
[5] JIANG L,YANG Z K,WANG J X. Knowledge Indexing of Chinese Text Based Knowledge Element [C]//2008 International Symposium on Knowledge Acquisition and Modeling.Wuhan:IEEE,2008:35-38.
[6] LUO L M,YANG L Q. Design of the Intelligent Learning Resources Learning System Based on the“Knowledge Points”Indexing [C]//2013 Fourth International Conference on Intelligent Systems Design and Engineering Applications.Zhangjiajie:IEEE,2013:264-267.
[7] 司莉,李月婷.我國(guó)三大全文數(shù)據(jù)庫(kù)知識(shí)鏈接方式比較分析 [J].圖書館建設(shè),2013(4):33-35+40.
[8] 溫有奎,溫浩,喬曉東.讓知識(shí)產(chǎn)生智慧——基于人工智能的文本挖掘與問答技術(shù)研究 [J].情報(bào)學(xué)報(bào),2019,38(7):722-730.
[9] 曾建勛.知識(shí)鏈接的構(gòu)建方式研究 [J].圖書情報(bào)工作,2010,54(12):32-35+77.
[10] 姜永常.基于知識(shí)元語義鏈接的知識(shí)網(wǎng)絡(luò)構(gòu)建 [J].情報(bào)理論與實(shí)踐,2011,34(5):50-53+45.
[11] 陳蘭杰.知識(shí)鏈接理論與實(shí)踐的三次嬗變探究 [J].圖書情報(bào)工作,2010,54(12):46-49+63.
[12] 王靜,劉成山,秦春秀.一種基于模糊Petri網(wǎng)的知識(shí)元語義集成方法 [J].情報(bào)理論與實(shí)踐,2017,40(9):140-144.
[13] 曾建勛.知識(shí)鏈接的研究現(xiàn)狀與發(fā)展趨勢(shì) [J].情報(bào)理論與實(shí)踐,2011,34(2):119-123.
[14] 溫有奎,焦玉英.知識(shí)元語義鏈接模型研究 [J].圖書情報(bào)工作,2010,54(12):27-31.
[15] 高勁松,馬倩倩,周習(xí)曼,等.文獻(xiàn)知識(shí)元語義鏈接的圖式存儲(chǔ)研究 [J].情報(bào)科學(xué),2015,33(1):126-131.
[16] WU D,LI X J,ZHANG C W. The design of ontology-based semantic label and classification system of knowledge elements [C]//2011 International Conference on Uncertainty Reasoning and Knowledge Engineering.Bali:IEEE,2011:95-98.
[17] 王卓,馮曉寧,徐玉如.基于本體的Petri網(wǎng)模型轉(zhuǎn)換方法 [J].計(jì)算機(jī)科學(xué),2009,36(6):147-149+166.
[18] 相東明,馬炳先,張正明.基于語義的Petri網(wǎng)自動(dòng)共享合成方法研究 [J].系統(tǒng)仿真學(xué)報(bào),2012,24(11):2237-2242.
[19] 裘杭萍,胡汭,羅晨.基于Petri網(wǎng)的OWL-S語義匹配機(jī)制研究 [J].計(jì)算機(jī)科學(xué),2012,39(10):174-176+213.
[20] 劉如娟,陳俊杰,王立軍,等.一種基于Ontology的WEB服務(wù)時(shí)間約束定義及驗(yàn)證方法 [J].四川大學(xué)學(xué)報(bào):工程科學(xué)版,2009,41(6):158-164.
[21] 吳敏敏.基于Petri網(wǎng)的語義Web服務(wù)組合方法 [J].南陽理工學(xué)院學(xué)報(bào),2016,8(4):29-34.
[22] 陸建江,張亞飛,苗壯,等.語義網(wǎng)原理與技術(shù) [M].北京:科學(xué)出版社,2008.
[23] P?EREZ A G,BENJAMINS V R. Overview of Knowledge Sharing and Reuse Components: Ontologies and Problem-Solving Methods [EB/OL].[2023-04-06].http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-18/.
作者簡(jiǎn)介:汪圳(1992—),男,漢族,山東臨清人,
館員,碩士,研究方向:數(shù)字圖書館技術(shù)及應(yīng)用;祝婷(1990—),女,漢族,陜西咸陽人,助理館員,碩士,研究方向:個(gè)性化推薦。
收稿日期:2023-05-06
基金項(xiàng)目:2023年度長(zhǎng)安大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(300102503601);陜西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)項(xiàng)目(2022KTF-06)