• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于跨庫檢索的數(shù)字圖書館資源整合方式研究

    2016-05-30 06:20:15南曉凡遼寧省圖書館遼寧沈陽110167
    圖書館學刊 2016年1期
    關鍵詞:資源整合檢索數(shù)據(jù)庫

    南曉凡(遼寧省圖書館,遼寧沈陽110167)

    ?

    基于跨庫檢索的數(shù)字圖書館資源整合方式研究

    南曉凡
    (遼寧省圖書館,遼寧沈陽110167)

    [摘要]闡述數(shù)字圖書館資源整合的必要性,介紹了數(shù)字圖書館中兩種主要的跨庫檢索模型:概率檢索模型、向量檢索模型。探討了數(shù)字圖書館資源整合內容方案,包括零次信息的重組與整合、一次信息的重組與整合和二次信息的重組與整合方案。最后根據(jù)上述內容,構建了基于跨庫檢索的館藏資源整合平臺。

    [關鍵詞]跨庫檢索數(shù)字圖書館資源整合

    [分類號]G250.73

    跨庫檢索平臺是指在呈現(xiàn)給讀者的一個檢索系統(tǒng)界面中,對存在于多個數(shù)據(jù)庫中的所需資源進行相關搜索,所以也稱為統(tǒng)一檢索平臺,可以完成統(tǒng)一數(shù)據(jù)搜索,把在不同網(wǎng)絡、環(huán)境、數(shù)據(jù)庫存儲系統(tǒng)以及操作系統(tǒng)中分布的數(shù)據(jù)檢索出來,并集成檢索結果,在用戶操作界面上進行展示[1]。在目前的數(shù)字化時代,信息資源數(shù)量劇增,用戶在對所需資源進行定位時可以在跨庫搜索的基礎上利用信息資源整合系統(tǒng)來實現(xiàn),并且檢索結果還能反饋到用戶的使用界面上。跨庫檢索的優(yōu)點是用戶只需要登錄一次就可以實現(xiàn)在全庫范圍內搜索資源,免去了不必要的重復登錄[2]。

    目前的跨庫檢索平臺中,常用的整合信息資源的系統(tǒng)包括兩個部分:首先是整合檢索界面,主要是整合在信息資源系統(tǒng)中的所有庫的界面,雖然有便利性的優(yōu)點[3],但是其檢索效率低下的缺點同樣不可忽視,對底層數(shù)據(jù)源的控制并不能得到很好的實現(xiàn);其次是要對數(shù)字資源信息系統(tǒng)間進行整合,這部分整合方式的實現(xiàn)主要是針對系統(tǒng)的分布式異構,利用分布式異構性管理中的算法,實現(xiàn)信息的整合檢索,其優(yōu)點是用戶檢索的效率能得到極大提高,但存在操作麻煩的缺點。在跨庫檢索基礎上的資源整合在目前數(shù)字圖書館檢索研究中無疑已經(jīng)成為熱點之一。

    1 數(shù)字圖書館資源整合的必要性

    在管理數(shù)字圖書館的日常工作過程中,通常會出現(xiàn)無法有效管理文獻資料及數(shù)據(jù)資源的情況,而且存在這種情況的文獻資源還為數(shù)不少,導致查詢時耗費了大量的人力、物力和時間;面對圖書館中關系類型的數(shù)據(jù)庫,對其中的信息資源無法高效地進行全文搜索;在圖書館的數(shù)字化進程中,要相應地把文件及資料也電子化,還涉及電子版發(fā)布的問題,所以必須以整合化來進行信息資源的建設。不難預料,隨著圖書館的發(fā)展,圖書館館藏管理的研究方向逐漸向信息資源的整合調整,在整合時必然要采用現(xiàn)代化的信息技術,這也是社會發(fā)展的必然要求。評價圖書館的信息資源體系時,其中關鍵的評價因素包含信息資源的整合能力及整合程度[4]。

    1.1信息完整性、知識體系化的要求

    信息技術和電子技術在不斷發(fā)展,數(shù)字圖書館也隨之擁有了越來越多的信息資源種類和數(shù)量。在信息資源中,以書目、索引和獨立數(shù)據(jù)庫等形式存在的大量異構資源在查看時只能給出資源鏈接和出處說明,用戶在資源的使用時只能對資源分別獲取,不能展現(xiàn)出資源與資源之間的聯(lián)系。而在數(shù)字圖書館中,整合信息資源能建立不同載體和類型信息資源之間的聯(lián)系,能有效地溝通信息和資源,知識結構愈加完整。

    1.2用戶使用的要求

    公眾性和開放性是數(shù)字圖書館的本質所在,也即是說在數(shù)字圖書館中無論信息資源的形式是什么,其目的無外乎是方便用戶的使用和查詢,所以必須要保證信息資源能被用戶有效利用,但通常來說圖書館面對著差別較大的用戶類型,檢索對象包含不同文化程度和年齡層的用戶,所以有必要整合數(shù)字圖書館的信息資源,確保用戶只需要從一個檢索入口查到的結果就是非常全面的,使檢索效率和資源利用率都得到有效的提高。

    1.3數(shù)字圖書館建設的要求

    數(shù)字圖書館大多擁有數(shù)量較大、種類繁多的信息資源,在信息錄入時,也容易出現(xiàn)重復的情況,不僅造成大量的人力物力消耗,還會導致數(shù)字圖書館中出現(xiàn)數(shù)量較多的冗余資源[5]。為了避免信息資源重復建設,使信息資源建設的質量得到有效提高,必須整合和重組現(xiàn)有信息資源,保證信息資源的健康發(fā)展,使信息資源保持可持續(xù)發(fā)展的狀態(tài)。從數(shù)字圖書館的角度來說,其創(chuàng)新和科研能力也都得以進一步提升。

    2 數(shù)字圖書館中的跨庫檢索模型

    2.1概率檢索模型

    眾所周知,判斷系統(tǒng)用戶與圖書館文獻相關性,具有不確定性和隨機性。圖書館館藏文獻與用戶需求相關的可能性是隨機的,這種隨機事件發(fā)生的概率是文獻與用戶需求相關性的隱蔽性表達。通過計算或者估計隨機事件的概率,文獻相關的不確定性得以解除。

    基于相關性理論構建的概率檢索模型,是在對相關性不同理解方式的基礎上,構建出的概率檢索模型也有所不同,而且由此導出的排序原則也都是不同的。也可以認為概率檢索模型的理論核心就是相關性原理及排序原理,而其技術難點在于數(shù)據(jù)來源以及有關概率的計算[7]。

    2.2向量檢索模型

    為了把符合用戶需求的檢索結果反饋給用戶,人們建立了一種向量檢索模型,該模型多應用在查詢請求較長時。該模型并不要求精確匹配查詢請求和文檔,只需要在查詢請求和文檔之間對檢索方法進行定義,使其相似度符合即可,并且根據(jù)兩者之間的相似程度排序所有的檢索結果呈現(xiàn)給用戶,便于用戶對所需文檔更方便地選擇。

    在20世紀60年代就提出了向量空間模型,與布爾模型不同的是,該模型囊括了線性代數(shù)的知識,在數(shù)據(jù)庫文檔以及用戶檢索請求的表達時使用了檢索項的向量空間,并且對向量空間的相關性進行計算,對所有檢索結果進行分類和排序提供給用戶,便于用戶對所需信息更好地定位。

    3 數(shù)字圖書館信息資源整合內容方案

    3.1零次信息的重組與整合方案

    在數(shù)字圖書館中,零次信息也可稱為灰色文獻,字面上理解就是處在白色文獻和保密文獻之間的文獻。白色文獻是可公開發(fā)行的,保密文獻是不公開發(fā)行的,灰色文獻雖然不是保密的,但是也不公開發(fā)行。這類文獻一般為政府的行政和科技報告、科研院內刊、高校學生的學生論文、學術會議相關資料、專家手稿以及調查報告等。其特點為具有較強的專業(yè)性、文獻質量較高、與最新的科研動態(tài)接軌、涉及面較廣以及種類繁多、包含的信息量較大等優(yōu)點。但也有不可忽視的缺點:文獻透明度較低以及讀者范圍狹窄等。從文獻意義上來說,灰色文獻是我國現(xiàn)代化發(fā)展進程中的重要信息資源,能把最新的科研水平和發(fā)展趨勢展現(xiàn)出來,在文獻信息資源中灰色文獻已經(jīng)成為不容忽視的一部分。因此,應該對這類文獻分類,然后更深層次地開發(fā)和利用,構建完成零次文獻數(shù)據(jù)庫,并接受遠程查詢請求,使該信息資源可通過計算機網(wǎng)絡在網(wǎng)上利用。

    3.2一次信息的重組與整合方案

    與零次信息不同的是,一次信息是經(jīng)過加工的信息資源,并將其加入網(wǎng)絡的電子化信息之中。一次信息的優(yōu)點是有較廣泛的信息來源,而且擁有繁多的種類以及豐富的內容;其缺點是內容優(yōu)劣不等,零散雜亂。其優(yōu)缺點決定了我們在進行信息的選取時,要把無用的信息摒棄掉,選擇質量較高、來源可靠、實用的精加工過的信息資源。組織一次信息時,有多樣化的方式,包括自有文本、超文本以及主頁方式。其中自有文本方式多用來構建全文數(shù)據(jù)庫,把采集的網(wǎng)外全文信息組織在一起,輸入網(wǎng)絡;超文本方式是有機地組織網(wǎng)絡上相關文本的信息,用戶可以從不同角度從任意節(jié)點對信息進行瀏覽和查詢;主頁方式與檔案組織法較為類似,多用于組織個人和有關機構的信息。目前在互聯(lián)網(wǎng)上,超文本方式是大部分一次信息的組織方式。

    3.3二次信息的重組與整合方案

    加工、提煉和濃縮一次信息之后可以得到二次信息,其是一種工具性文獻,是為了便于對一次文獻管理和利用而累積起來的。目前在網(wǎng)內具有海量的一次信息資源,并且其數(shù)量還在不斷地迅速增長,但互聯(lián)網(wǎng)并不具備情報功能,不能把一次信息與用戶所需信息進行自動轉換,這就需要我們借助情報學有關知識,基于相關理論和分析方法,進行“信息資源鏈”的組織,構建出信息搜索工具,對網(wǎng)上一次信息資源進行管理和控制。目前,二次信息主要以搜索引擎為組織方式,作為互聯(lián)網(wǎng)上的一類網(wǎng)站,搜索引擎要從Web服務器中自動搜尋信息,并且分類搜尋到的信息,之后把建立的索引內容存放到數(shù)據(jù)庫中。全文搜索引擎是搜索引擎研究的一個主要的發(fā)展方向,主要是全面檢索站點頁面文字內容,提供的檢索功能相當強大,在直接搜索文獻內容的同時,還支持多側面和多角度的綜合利用。在信息的發(fā)現(xiàn)、分析、過濾、代理和安全控制方面全文搜索技術是應用的基礎所在。搜索引擎的核心就是全文檢索,目前已經(jīng)成為當今時代的主流之一。對全文檢索系統(tǒng)評價的關鍵指標是全面、準確和快速,整合和重組二次信息,首先要從網(wǎng)上對所需文獻進行有針對性的選擇、分析和下載,并且簡要地介紹和評價文獻資源的內容特色和學術價值。然后在文獻目錄中按照統(tǒng)一格式組織鏈接相關知識點和文章。其次,要進行軟件的開發(fā),要具有自動轉換網(wǎng)頁文件、搜索、關鍵詞的搜索以及著錄等功能,并且經(jīng)過自動的整理之后傳遞給用戶便捷的網(wǎng)頁形式。再次,進行數(shù)據(jù)庫鏡像的設立,對國內外源數(shù)據(jù)庫進行定期精選,并將鏡像復制到本地服務器上,使用戶能對最新的文獻資源進行及時的利用。最后,要開發(fā)出圖書館與用戶交互的功能,用戶使用后進行意見的反饋,對用戶個性化需求進行分析和跟蹤,同時圖書館還能以郵件的方式將檢索到的文獻資源及時提供給用戶。

    4 基于跨庫檢索的館藏資源整合平臺的構建

    4.1跨庫檢索統(tǒng)一平臺設計

    跨庫檢索中,設計統(tǒng)一平臺的目的是接受用戶的查詢請求并把檢索到的結果按照統(tǒng)一格式反饋給用戶,同時用戶接口管理模塊還要負責身份認證等;面對返回的數(shù)據(jù),統(tǒng)一平臺中的信息處理程序的功能是執(zhí)行排序、合并、去重、轉換格式等操作;數(shù)據(jù)接口模塊的主要任務是通過連接數(shù)據(jù)庫及各異構數(shù)據(jù)源,進行資源的選擇,并根據(jù)檢索服務的不同傳遞相應的查詢結果,結構如圖1所示。

    圖1 跨庫檢索統(tǒng)一平臺結構

    4.2跨庫檢索平臺的實現(xiàn)

    目前有很多方法都可以實現(xiàn)跨庫檢索,比如利用數(shù)據(jù)庫接口軟件能直接連接不同的數(shù)據(jù)庫,但是最常用的方式是中間件的使用,異構數(shù)據(jù)庫通過中間件實現(xiàn)跨庫檢索可分為以下幾個部分,具體實現(xiàn)原理如圖2所示。

    圖2 跨庫檢索系統(tǒng)實現(xiàn)框架

    首先是統(tǒng)一檢索界面,該部分設置的功能包括:讀者身份驗證時采用用戶名和密碼進行網(wǎng)頁登陸的方式;用戶輸入檢索請求;用戶選擇所需的數(shù)據(jù)庫及檢索結果的排序方式;幫助模塊;返回跨庫檢索查詢并處理排序后的結果。

    其次是數(shù)據(jù)處理系統(tǒng),該部分設置的功能包括:按照檢索系統(tǒng)的要求以統(tǒng)一的規(guī)范對用戶的輸入詞進行轉換,并且把轉換后的檢索請求發(fā)送到中間件;中間件對各異構數(shù)據(jù)庫進行查詢之后反饋檢索結果,數(shù)據(jù)處理系統(tǒng)進行數(shù)據(jù)的合并和排序等操作,同時參考用戶在檢索界面中設置好的排序方法進行數(shù)據(jù)的排序顯示。

    最后是中間件,這是一種重要的工具,支持著網(wǎng)絡分布式應用系統(tǒng)的構建,該部分設置的主要功能是在網(wǎng)絡分布計算機環(huán)境下解決相關異構數(shù)據(jù)源的共享與互聯(lián),同時還協(xié)調提供多種應用軟件的使用。用戶輸入檢索關鍵詞之后,數(shù)據(jù)處理系統(tǒng)把檢索關鍵詞按照統(tǒng)一的格式進行關鍵詞的轉換,使之適應各數(shù)據(jù)庫的查詢格式要求,中間件再把處理后的檢索詞提交給各異構數(shù)據(jù)庫進行信息檢索;中間件獲取檢索后,轉換檢索結果為統(tǒng)一檢索平臺支持的格式并提供給數(shù)據(jù)處理系統(tǒng)。

    5 結語

    跨庫檢索技術應用在數(shù)字化圖書館資源整合中,能充分利用館藏資源,最大限度地共享網(wǎng)絡資源,為數(shù)字圖書館的進一步發(fā)展提供更好的技術支持。相信未來隨著跨庫檢索技術的不斷發(fā)展,圖書館資源整合會更加合理和完善。

    參考文獻:

    [1]黃傳慧,李娟.我國圖書館數(shù)字資源整合研究[J].圖書與情報,2009(4):66-69.

    [2]夏明春,強切云.我國高校圖書館資源整合的現(xiàn)狀:調查與建議[J].大學圖書館學報,2008(1):39-44.

    [3]謝寶義.高校圖書館數(shù)字資源整合模式研究與實踐——以石家莊鐵道大學圖書館為例[J].圖書館建設,2011(2):33-35.

    [4]欒芳芳,韓全惜.圖書館數(shù)字資源整合方式比較調查分析[J].現(xiàn)代情報,2007(12):94-98.

    [5]張云秋.國內外跨庫檢索系統(tǒng)功能的比較研究[J].圖書情報工作,2006(8):114-116.

    [6]翟姍姍,陳卓群,夏立新.基于OGSA的數(shù)字圖書館跨庫檢索平臺構建[J].情報科學,2011(2):292-297.

    [7]王軼珺.基于本體的跨庫檢索集成系統(tǒng)框架研究[J].現(xiàn)代情報,2008(1):170-175.

    南曉凡男,1978年生。本科學歷,副研究館員。研究方向:數(shù)字圖書館。

    ·文獻考略·

    收稿日期:(2015-10-12;責編:張欣。)

    猜你喜歡
    資源整合檢索數(shù)據(jù)庫
    少先隊活動與校外資源整合的實踐與探索
    “五育并舉”下家校社資源整合的價值意義
    海外并購中的人力資源整合之道
    中國外匯(2019年19期)2019-11-26 00:57:32
    2019年第4-6期便捷檢索目錄
    智慧高速資源整合方式實踐
    數(shù)據(jù)庫
    財經(jīng)(2017年2期)2017-03-10 14:35:35
    數(shù)據(jù)庫
    財經(jīng)(2016年15期)2016-06-03 07:38:02
    專利檢索中“語義”的表現(xiàn)
    專利代理(2016年1期)2016-05-17 06:14:36
    數(shù)據(jù)庫
    財經(jīng)(2016年3期)2016-03-07 07:44:46
    數(shù)據(jù)庫
    財經(jīng)(2016年6期)2016-02-24 07:41:51
    青神县| 鄂托克前旗| 黄陵县| 长春市| 茶陵县| 来安县| 湘乡市| 五常市| 扎兰屯市| 隆子县| 酉阳| 阜平县| 响水县| 化州市| 天等县| 循化| 嘉善县| 武功县| 温泉县| 宝坻区| 铜川市| 巴彦县| 中方县| 利川市| 辽源市| 重庆市| 织金县| 衡南县| 和硕县| 读书| 天镇县| 芦溪县| 息烽县| 类乌齐县| 呼玛县| 寿宁县| 桂平市| 龙游县| 宁南县| 六安市| 郴州市|