黃素君(廣東省委黨校圖書館,廣東廣州510053)
?
語義網(wǎng)環(huán)境下數(shù)字圖書館信息服務(wù)模式研究
黃素君
(廣東省委黨校圖書館,廣東廣州510053)
[摘要]介紹了當(dāng)前數(shù)字圖書館信息服務(wù)中存在的局限性,闡述了語義網(wǎng)技術(shù)的層次結(jié)構(gòu),分析了語義網(wǎng)在數(shù)字圖書館中的應(yīng)用優(yōu)勢,并對語義網(wǎng)環(huán)境下數(shù)字圖書館的幾種信息服務(wù)模式進(jìn)行了探討。
[關(guān)鍵詞]語義網(wǎng)數(shù)字圖書館信息服務(wù)服務(wù)模式
[分類號]G253
數(shù)字圖書館引入了各種現(xiàn)代高新技術(shù),是一種可以承載海量數(shù)字化信息的資源庫,也是一種全新的網(wǎng)上信息資源服務(wù)模式,它能夠有效擺脫當(dāng)前信息資源使用限制與分布不均的問題。在互聯(lián)網(wǎng)技術(shù)高速發(fā)展的今天,數(shù)字圖書館開始逐漸得到人們的重視,但同時在信息服務(wù)方面也逐漸凸顯出不足,如智能化信息服務(wù)水平不高、信息反饋機(jī)制不健全、很難完全滿足用戶多樣化的信息需求,這也在一定程度上影響到信息資源共享。當(dāng)前信息環(huán)境發(fā)生了很大的變化,實際應(yīng)用中很多信息系統(tǒng)存在語義、信息過載等問題,這就需要在互聯(lián)網(wǎng)環(huán)境下提高信息服務(wù)的實效性與準(zhǔn)確度,保障海量信息能夠得到有效利用和互通?;谛畔z索的圖書館傳統(tǒng)信息服務(wù)模式已經(jīng)不適應(yīng)讀者的需求,在這種情況下,將語義網(wǎng)應(yīng)用于數(shù)字圖書館信息服務(wù)成為一種有效的解決模式。
在互聯(lián)網(wǎng)技術(shù)的推動下,讀者獲取信息資源的渠道逐漸增多,這就要求數(shù)字圖書館能夠為用戶提供個性化的信息服務(wù)。在這個過程中,數(shù)字圖書館首先需要了解用戶對信息的具體需求,然后主動搜集信息資源,并形成個性化的信息資料庫,及時向用戶反饋刊物訂閱、熱點鏈接等信息。從這個角度來說,數(shù)字圖書館提供給用戶的信息是否具有時效性、針對性以及準(zhǔn)確度,是評判信息服務(wù)質(zhì)量的一個重要標(biāo)準(zhǔn)[1]。
①信息異構(gòu)、分散的問題。當(dāng)前數(shù)字圖書館為用戶提供個性化的信息服務(wù),其針對的信息系統(tǒng)與用戶群體均是特定的,而在信息異構(gòu)、分散的環(huán)境下服務(wù)很難開展。若出現(xiàn)信息異構(gòu)、分散的服務(wù)環(huán)境,如何實現(xiàn)各種信息資源的互通,如何在信息系統(tǒng)中準(zhǔn)確獲取用戶的需求信息,如何保障獲取信息的準(zhǔn)確性與時效性,這些均是圖書館需要考慮的問題。
②集成數(shù)據(jù)與推送方式問題。數(shù)字圖書館在當(dāng)前信息服務(wù)過程中的推送模式較為單一,并且很多信息系統(tǒng)能夠提供給用戶的只是部分信息。在數(shù)字圖書館發(fā)展過程中,圖書館應(yīng)盡可能地為用戶提供更多可用的信息,并通過多種方式繼承數(shù)據(jù),運用多樣化的信息推送方式,以此適應(yīng)不同的信息服務(wù)環(huán)境。
③服務(wù)質(zhì)量問題。當(dāng)前數(shù)字圖書館為用戶提供信息服務(wù)的模式,依然在沿用傳統(tǒng)的關(guān)鍵詞檢索方法,并沒有引入支撐系統(tǒng)的語義[2]。這樣系統(tǒng)很難對用戶的需求進(jìn)行準(zhǔn)確理解與分析,也很難快速了解搜集資源中是否具備語義數(shù)據(jù),同時由于信息系統(tǒng)在算法等方面還存在一些不足,這些均可能導(dǎo)致信息服務(wù)質(zhì)量難以提高,而在信息推送服務(wù)中也可能出現(xiàn)很多不匹配的信息。
④時效性問題。數(shù)字圖書館在信息服務(wù)中要同時保障精確度與時效性還存在一定的難度,這是因為大部分用戶并沒有耐心等待,這樣系統(tǒng)可能在保障時效性的同時無法兼顧質(zhì)量。因此,如何在信息異構(gòu)以及分散的情況下也能夠保證信息服務(wù)的時效性就顯得尤為關(guān)鍵。
2.1語義網(wǎng)的層次結(jié)構(gòu)
語義網(wǎng)這一概念的提出改變了傳統(tǒng)的信息資源共享模式,它可將各種語義信息通過本體來描述,進(jìn)而實現(xiàn)語義資源共享。何紹華、宮兆暉在《基于語義網(wǎng)的網(wǎng)絡(luò)信息檢索相關(guān)性研究》一文中曾給出語義網(wǎng)的層次結(jié)構(gòu)圖,其基本模型如圖1所示。筆者通過對其詳細(xì)的分析,以期促進(jìn)語義網(wǎng)在數(shù)字圖書館環(huán)境下的應(yīng)用。語義網(wǎng)的構(gòu)建充分融合了RDF 和XML技術(shù),其層次結(jié)構(gòu)的基本模型如圖1所示[4]。
圖1 語義網(wǎng)的層次結(jié)構(gòu)
從中可以看出,語義網(wǎng)一共可分為7層,其中的Unicode 和URI奠定了整個結(jié)構(gòu)的基礎(chǔ)。語義網(wǎng)中所有信息資源的編碼與標(biāo)識均在該層完成,可以保障信息查詢的精確度。第二層中的XML語言可以分離網(wǎng)絡(luò)資源的結(jié)構(gòu)、形式以及內(nèi)容,并為系統(tǒng)與其他以XML為基礎(chǔ)資源無縫對接提供支撐。第三層主要功能是描述互聯(lián)網(wǎng)上各種類別的資源,并為信息資源的集成提供解決方案。其中RDF為信息資源的描述制定了一些準(zhǔn)則與詞匯表,在進(jìn)行資源描述時必須按照這些準(zhǔn)則執(zhí)行。第四層即本體,是該結(jié)構(gòu)中比較重要的部分,可以賦予網(wǎng)絡(luò)資源一定的語義以理解人的意圖。這一層主要用于收集、表示與理解相關(guān)領(lǐng)域的信息,并從多個層次與形式來明確定義信息以及詞匯表之間的關(guān)系。第五層主要是對第四層的信息數(shù)據(jù)進(jìn)行邏輯推理。第六層是在前幾層的基礎(chǔ)上進(jìn)行驗證,而最后一層為信任層,可以讓用戶與系統(tǒng)之間建立一定的信任關(guān)系。
在該層次結(jié)構(gòu)中,二三四層是最為重要的部分,主要是對信息資源進(jìn)行語義描述,它也是很多學(xué)者研究的重點內(nèi)容。語義網(wǎng)中各種類型的資源均可以在收集后被計算機(jī)獲取,然后通過準(zhǔn)則并被理解后進(jìn)行處理,進(jìn)而與用戶建立一定的連接,保障智能設(shè)備可以輕松訪問、檢索分散異構(gòu)的網(wǎng)絡(luò)資源。在這樣的技術(shù)環(huán)境下,網(wǎng)絡(luò)資源可以實現(xiàn)全面的語義上的關(guān)聯(lián),促進(jìn)信息數(shù)據(jù)智能化的應(yīng)用[5]。
2.2語義網(wǎng)環(huán)境下的數(shù)字圖書館模型
語義網(wǎng)技術(shù)在數(shù)字圖書館的應(yīng)用,一方面可以對信息資源進(jìn)行語義描述,另一方面可以保障系統(tǒng)各種負(fù)載信息的平衡,并有合適的耦合度,以此為整合用戶需求信息提供便利。圖2為語義網(wǎng)環(huán)境下數(shù)字圖書館的基本模型[5]。
圖2 語義網(wǎng)環(huán)境下數(shù)字圖書館的模型
圖2顯示,在語義網(wǎng)環(huán)境下的數(shù)字圖書館可分為4層。其中分布式資源層涵蓋了多種類型的資源,它既為圖書館存儲海量信息創(chuàng)造了條件,同時也是圖書館開展各項智能化服務(wù)的基礎(chǔ)。數(shù)字圖書館信息資源的搜集、整合、計算以及調(diào)度主要在網(wǎng)格服務(wù)層中完成,并可以提供應(yīng)用接口和共享信息、數(shù)據(jù)、計算等服務(wù)。從語義的角度來描述、整合信息資源,并運用本體知識處理信息主要是在語義服務(wù)層完成的,這是整個系統(tǒng)的核心,可以提供計算、數(shù)據(jù)處理以及調(diào)度信息等多種服務(wù)。知識服務(wù)層則主要提供知識服務(wù),應(yīng)用數(shù)據(jù)挖掘、網(wǎng)格等技術(shù)來提供應(yīng)用接口,并保障信息資源之間的互聯(lián)和語義匹配,然后向用戶及時反饋各種需求信息。
2.3語義網(wǎng)在數(shù)字圖書館中的應(yīng)用優(yōu)勢
在數(shù)字圖書館信息服務(wù)過程中,互聯(lián)網(wǎng)頁面對信息服務(wù)效率有一定的影響,而信息系統(tǒng)的很多功能均受到超文本語言的限制。而引入語義網(wǎng)的概念可以改變傳統(tǒng)的通過關(guān)鍵詞匹配的模式,賦予計算機(jī)理解人的意圖的能力,進(jìn)而促進(jìn)數(shù)字圖書館信息服務(wù)質(zhì)量的提升。在數(shù)字圖書館信息資源服務(wù)中應(yīng)用語義網(wǎng)技術(shù),其優(yōu)勢主要有以下幾個方面。
①應(yīng)用可擴(kuò)展標(biāo)記語言。可擴(kuò)展標(biāo)記語言(XML)的語法功能非常強(qiáng)大,對于用戶自己標(biāo)記的字段以及語言也給予支持,并且可以方便地通過字段結(jié)合來表達(dá)數(shù)字圖書館中較為少見的信息。與超文本語言不同,運用該語言編寫的頁面可以區(qū)分元信息與信息,并可以保障信息的嵌套,增強(qiáng)了信息檢索的功能,也提高了信息資源的查詢與檢索的準(zhǔn)確性。
②RDF的應(yīng)用。數(shù)字圖書館中應(yīng)用RDF可增強(qiáng)系統(tǒng)的搜索能力,并發(fā)揮強(qiáng)大的信息導(dǎo)航作用。它可以對信息結(jié)合之間的關(guān)系進(jìn)行語義表述,保障知識之間的交互與共享[6]。同時可以對相對獨立的文集進(jìn)行轉(zhuǎn)換,變?yōu)槌S玫腤eb頁面,并對該頁面的知識產(chǎn)權(quán)給予說明。這樣有助于數(shù)字圖書館對信息資源進(jìn)行有效利用、管理和維護(hù),也可以達(dá)到保護(hù)網(wǎng)上資源產(chǎn)權(quán)的目的。
③本體的應(yīng)用。數(shù)字圖書館常用的信息檢索模式是關(guān)鍵詞,這樣獲取的信息資源沒有必要由語義來連接,而網(wǎng)上資源本身較為分散,這樣就無法提高信息服務(wù)的效率。通過對用戶的需求進(jìn)行分析,可以發(fā)現(xiàn)他們要求圖書館搜集、獲取以及處理知識與信息的方式更加靈活多樣。要想滿足用戶對信息資源組織的要求,可以將本體技術(shù)應(yīng)用于信息資源服務(wù)中,實現(xiàn)對信息資源語義的重復(fù)利用與共享,便于不同類型、領(lǐng)域之間的信息交流。
語義網(wǎng)是在網(wǎng)格以及Web技術(shù)上的進(jìn)一步擴(kuò)展,它可以從語義層對知識進(jìn)行閱讀,并且具備強(qiáng)大的計算能力,將語義網(wǎng)應(yīng)用于數(shù)字圖書館中,可以構(gòu)建良好的信息檢索環(huán)境,有效整合用戶與信息資源,有助于數(shù)字圖書館為讀者提供優(yōu)質(zhì)的信息服務(wù),豐富數(shù)字圖書館信息服務(wù)的內(nèi)容與模式。通過對數(shù)字圖書館的相關(guān)研究與實踐,語義網(wǎng)環(huán)境下數(shù)字圖書館的信息服務(wù)模式主要有以下幾種。
3.1以語義關(guān)聯(lián)為基礎(chǔ)的信息服務(wù)模式
數(shù)字圖書館在處理信息資源時充分應(yīng)用語義網(wǎng)技術(shù),可以幫助用戶快速發(fā)現(xiàn)平臺中的資源。通過語義導(dǎo)航體系可以汲取資源與數(shù)據(jù)集合中相關(guān)聯(lián)的信息,并將這些資源根據(jù)著者、種類以及研究領(lǐng)域表述為不同的主題,并將各種主題資源通過主題圖的形式展現(xiàn)出來,然后根據(jù)主題的區(qū)別來為用戶提供信息導(dǎo)航服務(wù)。通過這種導(dǎo)航的方式,在科研與資源開發(fā)過程中的所有相關(guān)信息均會被用戶輕松獲取,這也為研究創(chuàng)新提供了思路。同時數(shù)字圖書館可以應(yīng)用該技術(shù)對用戶提供的信息進(jìn)行映射與匹配,增加圖書館信息資源的瀏覽量,而在用戶進(jìn)行信息檢索時也可以給出相關(guān)的類別以及資源數(shù)量等信息[7]。語義導(dǎo)航可以同時支持信息的瀏覽與檢索,促進(jìn)用戶與系統(tǒng)之間的溝通,而對于用戶的每一步操作,系統(tǒng)均能快速作出反應(yīng),以幫助用戶去發(fā)現(xiàn)與獲取信息。
若系統(tǒng)中的各類信息有規(guī)范的組織體系,并保障各詞匯表之間映射的有效性,就可以得到一個與各詞匯表關(guān)系對應(yīng)的數(shù)據(jù)模型,進(jìn)而為不同的RDF提供查詢服務(wù)。該技術(shù)與適宜的多媒體技術(shù)的融合,能夠為梳理各信息類別的語義關(guān)系提供便利,也有助于信息資源的發(fā)現(xiàn)與共享。
3.2跨越空間的移動信息服務(wù)模式
移動通信技術(shù)的發(fā)展以及移動通訊設(shè)備的廣泛應(yīng)用,為用戶便捷、泛在、高效地獲取信息提供了多樣的途徑。而智能手機(jī)、GPS等移動服務(wù)方式的推廣,也為數(shù)字圖書館提供移動信息服務(wù)創(chuàng)造了條件。在語義網(wǎng)這種全新的技術(shù)環(huán)境下,數(shù)字圖書館的移動服務(wù)將有充足的空間,并可以整合用戶驅(qū)動、在線支付和網(wǎng)上社區(qū)等社交服務(wù)模式。讀者可以通過移動信息服務(wù)來搜索、預(yù)約以及借閱圖書館提供的資源,促進(jìn)知識、信息的發(fā)現(xiàn)與共享并拓展信息推薦、用戶交流等移動社交服務(wù)模式。
3.3結(jié)合科研動態(tài)的信息鏈接服務(wù)模式
語義網(wǎng)的提出與發(fā)展為研究者提供了新的數(shù)字化環(huán)境,在科研過程中的各項信息均可以被計算機(jī)獲取,并在通過可視化、信息關(guān)聯(lián)等方式進(jìn)行處理后被展示出來,這樣就可以幫助用戶了解科研設(shè)施、基本理論、觀察數(shù)據(jù)以及模擬分析等方面的動態(tài)信息。在現(xiàn)有的技術(shù)條件下,科研人員需要獲取更深入的信息資源,而在科研中涉及的人員、數(shù)據(jù)、設(shè)施以及項目等重要的信息資源,均會在計算機(jī)中進(jìn)行數(shù)字化標(biāo)識與表述。利用語義網(wǎng)可以發(fā)現(xiàn)這些數(shù)字化資源之間的相互關(guān)系,進(jìn)而可以為科研人員提供有效的信息鏈接服務(wù)。數(shù)字圖書館通過語義網(wǎng)等技術(shù)可以實現(xiàn)信息資源的一站式鏈接,這樣分散于各個圖書館中的資源可以被有效整合與關(guān)聯(lián),形成云知識產(chǎn)物,即便是異構(gòu)、分散的復(fù)雜信息資源,也可以通過相關(guān)分析工具為用戶提供知識鏈接服務(wù)。
移動通訊與互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,提升了人們對信息資源的需求量,在各類信息資源迅速增多的同時,由于用戶信息檢索技能以及系統(tǒng)無法理解用戶需求等問題,反而增加了用戶獲取信息資源的難度。將語義網(wǎng)引入數(shù)字圖書館信息資源服務(wù)中,提出以語義關(guān)聯(lián)為基礎(chǔ)、跨越空間并結(jié)合科研動態(tài)進(jìn)行語義檢索的模式,其目的在于進(jìn)一步提高信息服務(wù)的高效性與準(zhǔn)確性,以此為廣大用戶獲取信息提供便利。
參考文獻(xiàn):
[1]何紹華,宮兆暉.基于語義網(wǎng)的網(wǎng)絡(luò)信息檢索相關(guān)性研究[J].情報雜志,2010(12).
[2]王文峰,趙莉.語義網(wǎng)中的本體對象研究及應(yīng)用[J].棗莊學(xué)院學(xué)報,2011(2).
[3]王松林,王玉媛.語義網(wǎng)的技術(shù)體系結(jié)構(gòu)及其對圖書館的影響[J].圖書館學(xué)刊,2012(12).
[4]谷琦.對語義網(wǎng)及其在數(shù)字圖書館信息檢索中的應(yīng)用[J].數(shù)字圖書館技術(shù),2010(3).
[5]代金晶,紀(jì)希禹.基于語義網(wǎng)的智能搜索引擎在數(shù)字圖書館中的應(yīng)用[J].圖書館學(xué)研究,2011(9).
[6]黃果,周竹榮,周亭.基于語義網(wǎng)的信息檢索研究[J].西南大學(xué)學(xué)報:自然科學(xué)版,2011(1).
[7]陳駿.基于本體的語義網(wǎng)在數(shù)字圖書館中的應(yīng)用[J].科技情報開發(fā)與經(jīng)濟(jì),2012(34).
黃素君女,1979年生。碩士,館員。研究方向:圖書館服務(wù)、網(wǎng)絡(luò)和數(shù)字技術(shù)、數(shù)據(jù)庫建設(shè)。
收稿日期:(2014-12-30;責(zé)編:楊新寬。)