邢榮華 朱玉珍 韓依辰
〔摘要〕隨著社會步入高速信息時代,資源的分散性、異構(gòu)性產(chǎn)生的資源利用困難嚴重影響數(shù)字資源的有效利用,迫切需要進行數(shù)字資源整合。本文從高校利用者的數(shù)字資源需求入手,結(jié)合高校數(shù)字資源的實際情況,經(jīng)過對比和分析,對高校的數(shù)字資源整合系統(tǒng)進行設(shè)計。認為高校應(yīng)當建立一站式數(shù)字資源整合平臺對利用者提供服務(wù)。
〔關(guān)鍵詞〕高校;圖書館;數(shù)字資源;整合;系統(tǒng)設(shè)計
DOI:10.3969/j.issn.1008-0821.2017.02.013
〔中圖分類號〕G25073〔文獻標識碼〕A〔文章編號〕1008-0821(2017)02-0068-07
〔Abstract〕With the social development toward a high-speed information era,the dispersity and heterogeneity of resources make it hard to utilize resource,which influences effective utilization of digital resources,so digital resources integration is urgently needed.This paper started with the users requirement of digital resources in universities,analyzed and compared data by taking account of actual situation of digital resources in universities,then designed the digital resources integration system.The one-stop digital resources integration platform should be set up in universities to provide service for users.
〔Key words〕university;library;digital resource;integration;system design
對高校來說,數(shù)字資源面向的利用者是全校的科技、教育、研究工作者和學(xué)生等。對高校利用者來說,要獲取圖書館藏需要登錄圖書館的圖書借閱查詢系統(tǒng);要獲取文獻、論文等需要登錄CNKI、PUBMED等資源檢索網(wǎng)站;要獲取法律、公文、專利要訪問因特網(wǎng)中不同的政府網(wǎng)站;要獲取學(xué)校保存的檔案和資料要登錄檔案查詢系統(tǒng);要查詢課程安排要登錄教學(xué)管理系統(tǒng);要申報課題要登錄各級課題申報網(wǎng)站或?qū)W校的科研管理系統(tǒng)等;……如此這般,分別登陸一個個不同的網(wǎng)站,輸入不同的賬號密碼,查詢并獲得一堆不同形式的文本、數(shù)據(jù)、鏈接、圖片、音頻、視頻等等數(shù)據(jù)文件,再反復(fù)查找和比對,才能獲得需要的“資源”的過程嚴重影響科、教、研的效率和質(zhì)量,高效高質(zhì)服務(wù)應(yīng)該意味著用戶通過少量幾次檢索形成的檢索結(jié)果就能迅速有效地定位和獲得需要的資源。
1數(shù)字資源整合研究現(xiàn)狀
信息資源整合的概念可從狹義和廣義兩方面理解。從狹義方面講,它是指將某一范圍內(nèi)的,原本離散、多元化異構(gòu)的、分布的、信息資源通過邏輯的或物理的方式組織為一個整體,使之有利于管理、利用和服務(wù)。廣義的信息資源整合概念,就是把分散的資源集中起來,把無序的資源變?yōu)橛行?,使之方便用戶,它包含了信息采集、組織、加工以及服務(wù)等過程[1]。
對于數(shù)字資源整合,早在2003年起,行業(yè)就已經(jīng)開始進行較為廣泛的討論,從2007-2016年12月,共有564篇文獻對數(shù)字資源整合進行了討論。對于資源整合方法,郝欣[2]和趙英[3]等人使用基于本體的研究方法進行信息資源整合;崔偉[4]等提出基于知識鏈的數(shù)字資源整合方法;呂莉媛[5]提出了基于復(fù)雜網(wǎng)絡(luò)的整合方法。
對于資源整合的實現(xiàn),目前最大的困難在于海量數(shù)據(jù)存儲和大數(shù)據(jù)檢索。對于數(shù)據(jù)存儲,當前行業(yè)內(nèi)討論最多的是Hadoop和MapReduce。郝樹魁[6]、譚黔林[7]、朱瑩芳[8]等人對此進行了較多的技術(shù)研究,柏雪[9]基于Hadoop設(shè)計一個分布式搜索引擎。對于數(shù)據(jù)檢索,OPAC平臺作為一種成熟產(chǎn)品,已經(jīng)使圖書雜志實現(xiàn)了資源整合,然而新技術(shù)和方法依然不斷涌現(xiàn)。宋敏[10]、呂希艷[11]等多人介紹使用SOA架構(gòu)建立檢索系統(tǒng);劉巧園[12]、朱倩[13]等人提出使用“中間件”來實現(xiàn)異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)通信;葛微[14]提出使用Hibase技術(shù)索引建立查詢系統(tǒng);張秀華[15]、許愛軍[16]、韓冬[17]等人提出基于Muti-Agent對圖書館、教育資源、醫(yī)療信息進行整合;伍玉成[18]提出基于SOA和Web Services進行數(shù)據(jù)集成;柴森[19]基于Web Services設(shè)計與實現(xiàn)了教務(wù)信息發(fā)布平臺;李冬睿[20]和袁新坤[21]基于XML和Web Services實現(xiàn)數(shù)據(jù)交換平臺的設(shè)計和實現(xiàn);楊勁松[22]介紹了MOOC(慕課)的信息整合與共享模式。
2存在問題和解決方法
經(jīng)過10余年的討論,資源整合在目的、方法、技術(shù)等方面進行的討論和研究較為豐富和全面,然而在筆者看來,依然存在許多問題未能解決。
21存在問題
高校的數(shù)字資源利用者主要是教育工作者、科技工作者、管理工作者和學(xué)生。從筆者訪談的結(jié)果顯示,高校利用者需要大量各種各樣的資源,包括圖書、雜志、報紙、論文、網(wǎng)頁信息、實驗數(shù)據(jù)、公文、法律法規(guī)、專利、各種音頻視頻、圖片。以科技工作者為例,從事科研工作需要的數(shù)字資源主要有:科學(xué)數(shù)據(jù)、軟件工具資料、儀器設(shè)備資料、學(xué)術(shù)會議資源、交互資源、科研項目及資助信息和教育資源等[23]。而為了獲取這些資源,利用者不得不分別打開不同的網(wǎng)頁,使用不同的搜索引擎,使用和管理不同的賬號和密碼,以獲得各種不同的信息,同時還需要向相關(guān)部門申請各種各樣的服務(wù)。
對于現(xiàn)有的資源整合平臺來說,在圖書、期刊、論文、專利、公文、法律等幾類數(shù)字資源上,筆者分析了國內(nèi)的幾大整合系統(tǒng)如讀秀、CNKI、E讀、超星發(fā)現(xiàn)、清華同方USP、中國高等教育文獻保障系統(tǒng)CALIS、國家科學(xué)數(shù)字圖書館(CSDL)跨庫集成檢索系統(tǒng)Cross Search等多家檢索平臺,雖然各平臺間在檢索圖形界面(GUI)、檢索范圍、檢索結(jié)果顯示等方面存在各種各樣的區(qū)別,但對于已經(jīng)公開發(fā)布的數(shù)字資源如書、報、雜志和論文,一站式檢索在上述的檢索平臺上已然基本實現(xiàn)。
筆者訪問了艾瑞深中國校友會網(wǎng)公布的中國大學(xué)排名靠前的學(xué)校[24],北京大學(xué)與清華大學(xué)使用了維普期刊資源整合平臺;中國科學(xué)院大學(xué)、復(fù)旦大學(xué)、浙江大學(xué)、上海交通大學(xué)和北京師范大學(xué)分別設(shè)計了屬于自己學(xué)校的如“資源集成發(fā)現(xiàn)”等整合系統(tǒng);北京師范大學(xué)使用“木鐸搜索”對數(shù)字資源進行一站式檢索,不僅將期刊、圖書、專利等數(shù)字資源進行收錄,更是將學(xué)校檔案資源也一并整合。各學(xué)校整合系統(tǒng)情況見表1。表1中國部分高校數(shù)字資源整合系統(tǒng)一覽表
排名大學(xué)名稱整合系統(tǒng)3中國科學(xué)院大學(xué)資源集成發(fā)現(xiàn)4復(fù)旦大學(xué)復(fù)旦大學(xué)圖書館資源發(fā)現(xiàn)系統(tǒng)-望道7浙江大學(xué)求是學(xué)術(shù)搜索9上海交通大學(xué)思源探索15北京師范大學(xué)木鐸搜索
筆者同時訪問了泰晤士高等教育發(fā)布的2016年世界大學(xué)排行榜(QS世界大學(xué)排名)中排名靠前的多所大學(xué)[25],發(fā)現(xiàn)其圖書情報文獻資源均已實現(xiàn)集成檢索,且前10名中除美國加州理工大學(xué)(California Institute of Technology)外,均設(shè)計了不區(qū)別文獻格式的檢索入口。且每個大學(xué)基本都使用了自己的整合系統(tǒng)對本校所屬的其它資源進行整合,如英國牛津大學(xué)(Oxford)使用SOLO(Search Oxford Libraries Online)檢索引擎來進行檢索一站式(One-stop)檢索,見圖1。其中論文可以閱讀摘要、作者信息等基本信息,如果需要原文,可能需要支付費用,一般為每篇35左右;書報可以閱讀摘要、作者信息、出版日期、出版商、ISBN號等基本信息,并提供索書號碼等信息。圖1牛津大學(xué)圖書館SOLO檢索引擎
綜合對比國外大學(xué)與國內(nèi)大學(xué)的資源整合系統(tǒng)情況,國外大學(xué)整合系統(tǒng)開發(fā)較早,普及程度比較高,現(xiàn)已基本實現(xiàn)各學(xué)校內(nèi)部數(shù)字資源的一站式檢索和利用。而國內(nèi)大學(xué)普遍開發(fā)較晚,學(xué)校內(nèi)部各種數(shù)字資源的整合才剛剛起步。
22解決方法
為了向利用者提供高效、優(yōu)質(zhì)的服務(wù),筆者認為,高校應(yīng)該建立統(tǒng)一的數(shù)字資源整合系統(tǒng)。對于公開出版的數(shù)字資源,可以采用協(xié)議或采購的方式接入資源整合系統(tǒng)。對于外網(wǎng)其它資源如政策法規(guī)、網(wǎng)頁鏈接、新聞博客等,采用內(nèi)置搜索引擎或向外購搜索服務(wù)來實現(xiàn)。對于學(xué)校內(nèi)部資源,則需要建立一個資源整合平臺,以提高服務(wù)質(zhì)量和效率。對學(xué)校內(nèi)部資源進行整合,筆者認為有以下兩種方案。
方案一:僅建立一站式檢索平臺,各職能部門數(shù)據(jù)庫管理系統(tǒng)依然使用,僅通過協(xié)議接受檢索平臺的跨庫檢索,然后由檢索平臺統(tǒng)一提供,但對檢索平臺對數(shù)據(jù)庫內(nèi)數(shù)據(jù)進行操作則需要另外的授權(quán),對于各部門數(shù)據(jù)庫來說,僅需要添加標識碼或關(guān)鍵詞即可。該方法的優(yōu)點是:①硬件投入少。僅需要增加檢索服務(wù)器即可,不需要配置大容量數(shù)據(jù)存儲器。②各部門自主性強。各部門仍能在相當程度上控制部門服務(wù)器的功能和服務(wù),出于保密或權(quán)力許可等因素的考慮,在一定程度上符合過渡的要求。③易于轉(zhuǎn)型和更改。因為系統(tǒng)架構(gòu)和技術(shù)而導(dǎo)致整合系統(tǒng)缺乏預(yù)期運行價值時,造成的損失比較小。
缺點是:①硬件故障不可控。各部門的數(shù)據(jù)資源服務(wù)器由各自獨立的數(shù)據(jù)庫管理系統(tǒng)進行管理,這些獨立的部門服務(wù)器其網(wǎng)絡(luò)連接或者服務(wù)器本身出現(xiàn)的任何故障都可能導(dǎo)致該部分功能不能提供服務(wù)。②軟件功能實現(xiàn)困難。數(shù)據(jù)庫行業(yè)內(nèi)的壟斷形成已久,加上對數(shù)據(jù)安全的考慮,各種異質(zhì)異構(gòu)數(shù)據(jù)再搭配各種加密方法和身份驗證方法,導(dǎo)致穿透各數(shù)據(jù)庫的檢索軟件開發(fā)困難。③整個系統(tǒng)穩(wěn)定性差。檢索平臺進行跨庫檢索時,尤其是跨異構(gòu)數(shù)據(jù)庫或者目的數(shù)據(jù)庫比較龐大或者查詢命令比較復(fù)雜的時候,進行檢索不可避免的會出現(xiàn)該命令無法在系統(tǒng)允許的最大時限內(nèi)完成,而幾乎所有服務(wù)器都不會允許一項進程長時間占用系統(tǒng)資源,目的服務(wù)器必然要掛起(Hang On)該請求,而導(dǎo)致檢索平臺響應(yīng)超時,請求被駁回,甚至系統(tǒng)服務(wù)崩潰。④服務(wù)項目少。只能實現(xiàn)檢索等少數(shù)功能,無法進一步操作,如檢索到空閑實驗室,很難直接實現(xiàn)一步到位的申請。⑤前景不明。資源整合符合數(shù)字資源服務(wù)發(fā)展方向,且不說國家層面,一旦省內(nèi)或者行業(yè)內(nèi)進行全局資源整合,且與學(xué)校建立的資源整合平臺異構(gòu)異質(zhì),則還需要花費更大開銷來進行轉(zhuǎn)換和對接。屆時數(shù)據(jù)庫含量更大,情況更復(fù)雜,難度會更高。當然,隨著科技的進步,更準確更穩(wěn)定的分布式檢索系統(tǒng)和分布式存儲系統(tǒng)的建立,也許跨異構(gòu)數(shù)據(jù)庫的資源整合會變得更簡單。
方案二:重新建立一個全校網(wǎng)絡(luò)整合平臺,將全校各職能部門的工作和數(shù)據(jù)全部并入該平臺,原有數(shù)據(jù)格式經(jīng)過格式轉(zhuǎn)換后,存儲至集中的數(shù)據(jù)倉庫中。該方法的優(yōu)點是:①起點高??梢灾苯硬捎米钚碌姆植际酱鎯Γ―istributed Storage)和分布式檢索(Distributed Retrieval)等技術(shù)。②發(fā)展快。各職能部門基于統(tǒng)一整合平臺進行辦公,新數(shù)據(jù)以統(tǒng)一格式形成和保存,可以在較短時間內(nèi)形成一個有規(guī)模的集成環(huán)境。③系統(tǒng)效率高。用戶通過一次檢索即可在結(jié)果界面中找到各部門對該關(guān)鍵詞的支持結(jié)果,而且還可以直接進入某項頁面,如檢索到課題申報或評獎申報相關(guān)內(nèi)容,進入該鏈接從而直接指向申報或評獎頁面,這樣可以極大地提高利用者的利用效率。④冗余度低。全部數(shù)據(jù)庫均處于“活躍”狀態(tài),避免某個獨立數(shù)據(jù)庫因為各種硬件或軟件原因而成為數(shù)據(jù)“孤島”。⑤前景廣闊。一旦成功整合并形成規(guī)模,將可以推廣至區(qū)域或行業(yè),以便快速形成多校整合系統(tǒng)或省際高校整合系統(tǒng)。無論是商業(yè)價值還是社會價值都十分巨大。
缺點是:①硬件設(shè)備昂貴。該平臺可能需要多臺高速檢索服務(wù)器來提供一站式檢索服務(wù),該服務(wù)器還必須配置高容量的緩存來存儲熱點關(guān)鍵詞以提升檢索效率,即便使用公布式存儲技術(shù)降低了存儲空間的成本,然而維護、備份、恢復(fù)以及硬件淘汰等升級費用也是極大一筆開銷;②軟件開發(fā)費用高。新系統(tǒng)需要按照統(tǒng)一格式構(gòu)建數(shù)據(jù)庫,這需要大量的權(quán)衡和比較工作,最終確定一種數(shù)據(jù)庫格式后,還需要將其它異構(gòu)數(shù)據(jù)庫進行數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)的轉(zhuǎn)構(gòu)和遷移已經(jīng)相當費時費力,更何況還存在可能造成的數(shù)據(jù)異常。綜合對比以上兩種方法,筆者更傾向先用方案一來建立高校數(shù)字資源整合系統(tǒng)。然后逐步轉(zhuǎn)換各部門的數(shù)字資源并吸收到整合系統(tǒng)中,最終完全淘汰各部門獨立服務(wù)器,使用全校統(tǒng)一的數(shù)字資源整合系統(tǒng)實現(xiàn)方案二。這樣在過渡時期還能在一定程度上兼顧各部門的保密或獨立等要求。對比情況見表2。
表2兩種方案對比表
方案花銷功能硬件系統(tǒng)穩(wěn)定性各服務(wù)有效性推廣可能前景方法一較少較少資源整合服務(wù)器+檢索服務(wù)器不可控不保證較小一般方法二很大齊全資源整合服務(wù)器+檢索服務(wù)器+存儲器穩(wěn)定有效〖〗較大較好
3高校數(shù)字資源整合系統(tǒng)設(shè)計
基于以上構(gòu)想,筆者設(shè)計了高校數(shù)字資源整合系統(tǒng),現(xiàn)簡要介紹如下。
31整合系統(tǒng)構(gòu)造
該系統(tǒng)主體框架網(wǎng)絡(luò)拓撲圖見圖2。圖2高校數(shù)字資源整合系統(tǒng)網(wǎng)絡(luò)拓撲圖
311面向用戶的界面設(shè)計
用戶通過終端設(shè)備進入整合后的圖形用戶界面(GUI)來訪問數(shù)字資源整合系統(tǒng)。用戶終端設(shè)備可以是普通電腦、可以是獨立終端機,甚至是手機瀏覽器,如果條件允許也可以開發(fā)相應(yīng)的手機APP。以圖書資源為例,目前檢索主頁上提供的檢索入口有兩種:一種是在頁面上提供一個或多個檢索入口,分別對應(yīng)多個目標數(shù)據(jù)庫服務(wù)器,通過指定的檢索入口選定特定的目標數(shù)據(jù)庫服務(wù)器進行關(guān)鍵詞檢索。目前多數(shù)圖書館的檢索入口形式為此種形式,根據(jù)宋敏等人對179家公共圖書館的統(tǒng)計,2013年主頁上無檢索入口或1個檢索入口的為144家,2個及以上檢索入口的為25家,最多的檢索入口為5個[26],這種整合實際上是形式上的整合,用戶的檢索需求實際上是直接提交給特定的數(shù)據(jù)庫服務(wù)器,僅僅是把檢索入口“整合”到同一個頁面而已。第二種是通過一個檢索入口即可對多個目標數(shù)據(jù)庫服務(wù)器進行檢索,甚至可以在檢索入口旁的數(shù)據(jù)庫服務(wù)器選擇區(qū)勾選一個或多個目標數(shù)據(jù)庫服務(wù)器進行自定義檢索。
312校級檢索服務(wù)器
校級檢索服務(wù)器是分布式數(shù)據(jù)庫管理系統(tǒng)的檢索核心,應(yīng)使用專用的檢索服務(wù)器,條件允許或檢索量大的應(yīng)使用中間件(Middle Ware)為服務(wù)器與數(shù)據(jù)庫之間的連接提供服務(wù)或交互式業(yè)務(wù)組件(Business Component)來提供檢索服務(wù)。校級檢索服務(wù)器的主要功能有:用戶信息審核、用戶權(quán)限控制、用戶檢索偏好收集、受理檢索資源的請求、對數(shù)據(jù)庫服務(wù)器定向發(fā)送檢索請求、回收檢索結(jié)果、整合并篩選檢索結(jié)果、向用戶終端顯示結(jié)果等。
313目標數(shù)據(jù)庫
目標數(shù)據(jù)庫服務(wù)器是校級檢索服務(wù)器的訪問目標,它響應(yīng)檢索服務(wù)器并返回檢索結(jié)果。就目前而言,目標數(shù)據(jù)庫多為異構(gòu)數(shù)據(jù)庫。檢索結(jié)果一般是指向特定資源服務(wù)器的資源鏈接。有的目標數(shù)據(jù)庫可以檢索多個資源服務(wù)器中的資源,有的目標數(shù)據(jù)庫僅能檢索單個資源服務(wù)器中的資源,多個目標數(shù)據(jù)庫可能會重復(fù)檢索某些資源,這樣,反饋回校級檢索服務(wù)器的結(jié)果就可能出現(xiàn)“超載與孤島”的遴選障礙,就需要校級檢索服務(wù)器對這些檢索結(jié)果進行校驗和分析。
314資源服務(wù)器
資源服務(wù)器的作用是按照用戶的選擇提供資源。資源服務(wù)器可以是一臺獨立的計算機,可以是大型數(shù)據(jù)中心,還可以是一個分布式存儲系統(tǒng),由資源提供者依照數(shù)據(jù)容量和用戶的連接數(shù)等要求進行選擇。資源服務(wù)器與目標數(shù)據(jù)庫服務(wù)器存在一對多、多對一和多對多的關(guān)系,即一個目標數(shù)據(jù)庫服務(wù)器可能管理著一個或多個資源服務(wù)器的資源鏈接,一個資源服務(wù)器也同樣可能映射到一個或多個目標數(shù)據(jù)庫服務(wù)器。資源可以是文本、圖片、音頻、視頻形式,也可以是文件、數(shù)據(jù)庫、動態(tài)鏈接庫、壓縮包等形式。其資源格式更是千差萬別,常用數(shù)字資源形式中,文本有DOC、CAJ、PDF等格式,圖片有BMP、JPG(JPEG)、TIFF等格式,音頻有WAV、MP3等格式,視頻有MPEGAVI、MP4等格式,不同格式的資源可能需要專用的解析軟件,這也對用戶終端解析和顯示這些數(shù)字資源提出了更高的要求。
32高校數(shù)字資源整合系統(tǒng)工作流程
筆者設(shè)計的高校數(shù)字資源整合系統(tǒng)工作流程見圖3。圖3高校數(shù)字資源整合框架運行圖
321用戶登陸
用戶通過電腦、智能終端、手機APP等方式登陸校級檢索服務(wù)器,用戶終端為該用戶建立用戶ID和CACHE(用于儲存檢索關(guān)鍵詞、檢索結(jié)果等信息),同時將登錄信息發(fā)送至校級檢索服務(wù)器等待審核。
322用戶身份認證
校級檢索服務(wù)器對用戶進行審核,確定用戶身份和對應(yīng)的權(quán)限。審核后向用戶終端返回認證信息。用戶終端顯示登錄成功,等待用戶下一步操作。
323用戶提交檢索需求
用戶通過終端GUI的搜索框輸入關(guān)鍵詞進行搜索,用戶終端根據(jù)網(wǎng)絡(luò)協(xié)議建立包含用戶ID和IP、檢索范圍、檢索關(guān)鍵詞等信息的數(shù)據(jù)包,向校級檢索服務(wù)器提交。
324受理檢索需求
檢索服務(wù)器接收檢索信息后,查詢協(xié)議或網(wǎng)絡(luò)數(shù)據(jù)字典,了解如何分解和使用其中的信息。通過查詢服務(wù)列表(INDEX),判定把它送到哪里,或必須訪問哪些計算機才能滿足該要求。如果目標數(shù)據(jù)存儲于系統(tǒng)的多個計算機上,就必須進行分布式處理,即按照分布式查詢協(xié)議向關(guān)聯(lián)目標數(shù)據(jù)庫服務(wù)器發(fā)送檢索指令。對不支持分布式查詢的目標數(shù)據(jù)庫服務(wù)器將依Z3950等協(xié)議向其發(fā)送檢索數(shù)據(jù)包。該檢索數(shù)據(jù)包內(nèi)容一般包括檢索ID(用于整理各數(shù)據(jù)庫服務(wù)器反饋的結(jié)果)、認證信息、檢索需求等。如果用戶指定了一個或多個數(shù)據(jù)庫,那么檢索服務(wù)器將僅向指定的目標數(shù)據(jù)庫服務(wù)器提交檢索數(shù)據(jù)包。與此同時,以該檢索信息建立和完善用戶偏好數(shù)據(jù)庫,用于用戶自定義檢索及統(tǒng)計分析。
325檢索并反饋
若目標數(shù)據(jù)庫服務(wù)器支持跨庫查詢,則直接允許校級檢索服務(wù)器進入其數(shù)據(jù)庫進行檢索,得到結(jié)果依協(xié)議進行封裝并反饋給校級檢索服務(wù)器。若目標數(shù)據(jù)庫不支持跨庫查詢,在接收到檢索數(shù)據(jù)包后,將對用戶進行身份認證,如身份認證未通過或檢索請求超出用戶權(quán)限,則拒絕該檢索請求。若符合檢索權(quán)限,數(shù)據(jù)庫服務(wù)器將按照本身的數(shù)據(jù)庫規(guī)則進行檢索,同時為檢索得到的結(jié)果進行處理,創(chuàng)建匹配用戶信息的特定鏈接,最后數(shù)據(jù)庫檢索結(jié)果按照Z3950等通訊協(xié)議進行封裝并向校級檢索服務(wù)器反饋,該反饋數(shù)據(jù)包內(nèi)容一般包括檢索ID、檢索結(jié)果信息、檢索結(jié)果指向的資源鏈接等。
326檢索結(jié)果處理
校級檢索服務(wù)器接收到來自各個數(shù)據(jù)庫服務(wù)器的反饋包后,首先解析數(shù)據(jù)包中的檢索ID,若該檢索ID已經(jīng)超期或被取消,則拋棄該反饋包;若該檢索ID仍處于活動狀態(tài),則按檢索ID對結(jié)果進行合并,并應(yīng)用整合協(xié)議進行結(jié)果篩選,剔除重復(fù)條目后將結(jié)果發(fā)送到用戶終端。
327顯示及申請資源
用戶終端接收校級檢索服務(wù)器的結(jié)果包后,首先與本機用戶ID進行驗證,若通過驗證,則將檢索結(jié)果存儲到緩存中供用戶調(diào)用,用戶可以自定義結(jié)果排序顯示,若對檢索結(jié)果不滿意,可以重新提交檢索需求。若用戶對某個檢索結(jié)果(文獻)感興趣,可以通過點擊鏈接目標數(shù)據(jù)庫服務(wù)器提交數(shù)字資源利用請求。
328受理資源申請
目標數(shù)據(jù)庫收到用戶通過資源鏈接提交的資源利用請求,首先驗證用戶登錄信息,如無登錄信息或用戶無權(quán)訪問,則返回第1步;如符合申請條件(如用戶ID、IP等)與提供的鏈接相符,則通知資源服務(wù)器。
329提供數(shù)字資源
資源服務(wù)器接收目標數(shù)據(jù)庫服務(wù)器轉(zhuǎn)交的利用請求,將按照資源服務(wù)器與目標數(shù)據(jù)庫之間的協(xié)議進行審核,審核通過后向用戶提供所需要的數(shù)字資源。
至此,資源整合平臺完成了一次數(shù)字資源服務(wù)進程。
4系統(tǒng)評估及可能存在問題
41系統(tǒng)評估
筆者從理論上對該系統(tǒng)進行評估,主要是按流程進行穩(wěn)定性檢測。
411從用戶角度
用戶登錄系統(tǒng)→驗證身份→提交申請→接收結(jié)果→選擇目標→獲取資源→完成一次工作循環(huán)。
412從整合平臺角度
接受用戶連接請求→要求用戶提交身份信息→驗證身份→受理申請→向目標服務(wù)器提交請求→接受目標服務(wù)器反饋結(jié)果→整理并篩選結(jié)果→顯示給用戶→受理資源申請→向資源服務(wù)器發(fā)送請求→接受反饋并記錄工作日志→完成一次工作循環(huán)。
413從目標服務(wù)器角度
接受整合平臺申請→驗證身份→驗證協(xié)議→驗證請求→受理請求→檢索資源→內(nèi)部篩選結(jié)果→向整合平臺回復(fù)結(jié)果→接受資源申請→驗證身份→驗證協(xié)議→驗證請求→受理請求→指令資源服務(wù)器提交資源→接受反饋并記錄工作日志→完成一次工作循環(huán)。
414從資源服務(wù)器角度
接受平臺或目標服務(wù)器請求→驗證身份→驗證請求→受理請求→檢索資源→整合/拆分資源→資源傳輸→接受反饋并記錄工作日志→完成一次工作循環(huán)。
42存在問題
從用戶連接到資源整合系統(tǒng),到最終用戶取得需要的資源,資源整合系統(tǒng)在工作循環(huán)上是完全可行的。然而,對資源整合系統(tǒng)的建立,筆者認為依然存在以下幾點困難需要解決:
421決策層面
校內(nèi)資源整合應(yīng)由高校統(tǒng)一部署,這要求高校決策機關(guān)重視數(shù)字資源整合工作,統(tǒng)一計劃、統(tǒng)一標準、統(tǒng)一部署,政策、標準和資金都是必須解決的問題。對于數(shù)字資源的整合可以會涉及著作權(quán)利侵犯、用戶隱私獲取以及企事業(yè)單位間的合同糾紛等諸多法律問題,還需要法律同仁提供理論支持,這同時也為著作權(quán)應(yīng)用與保護增加了更多挑戰(zhàn)。
422硬件層面
校級檢索服務(wù)器可能會有較大的訪問量,需要預(yù)設(shè)大量的用戶訪問接口,需要較高的系統(tǒng)配置來進行整合業(yè)務(wù),還需要較大的數(shù)據(jù)帶寬來吞吐大量的數(shù)據(jù)。所以校園的網(wǎng)絡(luò)鋪設(shè)、整合平臺的動態(tài)流量控制都需要預(yù)先安排。
423軟件層面
學(xué)校內(nèi)外各目標數(shù)據(jù)庫服務(wù)器可能受政府、企業(yè)或保密部門控制,其平臺多種多樣,服務(wù)器操作系統(tǒng)、DBMS、DB類型千差萬別,要對如此復(fù)雜的數(shù)字資源建立整合系統(tǒng),首先應(yīng)盡量實現(xiàn)校內(nèi)標準統(tǒng)一化,實現(xiàn)校內(nèi)資源高校整合,然后再依照分布式檢索協(xié)議和框架同外部數(shù)據(jù)進行對接。
5結(jié)語
隨著社會步入高速信息時代,數(shù)字資源服務(wù)正在逐步擴大影響,20年前,無紙化辦公還停留在概念界定和專家的討論稿中,如今,數(shù)字服務(wù)和數(shù)字辦公已經(jīng)無處不在。傳統(tǒng)的紙質(zhì)或?qū)嵨锏荣Y源也正在迅速轉(zhuǎn)變?yōu)閿?shù)字資源并以數(shù)字形式提供利用。對于高校來說,實現(xiàn)資源整合是資源服務(wù)的必經(jīng)之路。
高校圖書館、檔案館、網(wǎng)絡(luò)信息中心作為傳統(tǒng)的資源服務(wù)部門,本就掌握著大量資源,高校統(tǒng)一資源整合系統(tǒng)可以依托幾個大部門的管理平臺(如圖書管理系統(tǒng)、檔案管理系統(tǒng)、學(xué)校網(wǎng)絡(luò)辦公平臺)進行二次開發(fā),這樣便可以較快地在內(nèi)部實現(xiàn)數(shù)字資源整合。在此基礎(chǔ)上,可以繼續(xù)開展區(qū)域整合,逐步實現(xiàn)行業(yè)內(nèi)整合、地域內(nèi)整合、大區(qū)劃內(nèi)整合最終實現(xiàn)全國范圍內(nèi)資源整合。
參考文獻
[1]金燕.網(wǎng)絡(luò)信息資源整合研究[J].現(xiàn)代情報,2007,(7):40-43.
[2]郝欣,劉英濤.基于本體集成的數(shù)字資源整合研究[J].圖書館學(xué)研究,2011,(10):55-59.
[3]趙英,雷強.基于貝葉斯本體映射方法的數(shù)字資源整合[J].情報雜志,2008,(2):23-27.
[4]崔偉,徐愷英,王寧.基于知識鏈的數(shù)字資源整合研究[J].圖書館學(xué)研究,2010,(8):32-35.
[5]呂莉媛.基于復(fù)雜網(wǎng)絡(luò)的圖書館數(shù)字資源整合[J].情報科學(xué),2009,(12):11-15.
[6]郝樹魁.Hadoop HDFS和MapReduce架構(gòu)淺析[J].郵電設(shè)計技術(shù),2012,(7):37-42.
[7]譚黔林,莫春娟.基于MapReduce的海量文件檢索方法研究[J].河池學(xué)院學(xué)報,2016,(2):101-105.
[8]朱瑩芳.基于MapReduce的海量圖像檢索技術(shù)研究[J].長沙民政職業(yè)技術(shù)學(xué)院學(xué)報,2016,(1):121-123.
[9]柏雪.基于Hadoop的分布式搜索引擎設(shè)計與實現(xiàn)[J].圖書館學(xué)刊,2016,(2):108-111.
[10]宋敏.基于SOA圖書館數(shù)字資源整合平臺關(guān)鍵技術(shù)的研究與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2009,(9):22-27.
[11]呂希艷,張潤彤.基于SOA的企業(yè)信息資源整合[J].中國科技論壇,2006,(6):103-105.
[12]劉巧園,肖希明.基于XML中間件的公共數(shù)字文化資源整合研究[J].圖書情報知識,2015,(5):82-88.
[13]朱倩,王華麗.基于中間件的新疆農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺的體系構(gòu)建[J].天津農(nóng)業(yè)科學(xué),2016,(1):47-51.
[14]葛微,羅圣美,周文輝,等.HiBase:一種基于分層式索引的高效HBase查詢技術(shù)與系統(tǒng)[J].計算機學(xué)報,2016,(1):140-153.
[15]張秀華,趙偉,趙智博.基于Multi-Agent的圖書館網(wǎng)絡(luò)信息資源整合系統(tǒng)研究[J].情報理論與實踐,2006,(6):755-757,763.
[16]許愛軍,謝娟.基于Multi-Agent的教育資源整合平臺研究與設(shè)計[J].現(xiàn)代計算機:專業(yè)版,2008,(11):114-117.
[17]韓冬,彭馨儀.基于Multi-Agent技術(shù)的醫(yī)療信息整合研究[J].情報科學(xué),2012,(5):746-749,758.
[18]伍玉成,朱錦泉.基于SOA和Web Services架構(gòu)高校數(shù)字圖書館數(shù)據(jù)集成研究[J].情報科學(xué),2012,(7):1030-1033.
[19]柴森.基于Web Services的教務(wù)信息發(fā)布平臺的設(shè)計與實現(xiàn)[D].長春:吉林大學(xué),2013.
[20]李冬睿.基于XML與Web Service的電子政務(wù)數(shù)據(jù)交換模型的設(shè)計與實現(xiàn)[D].桂林:廣西師范大學(xué),2008.
[21]袁新坤.基于XML與Web Services數(shù)據(jù)交換平臺的研究與實現(xiàn)[D].太原:太原理工大學(xué),2008.
[22]楊勁松,謝雙媛,朱偉文,等.MOOC:高校知識資源整合與共享新模式[J].高等工程教育研究,2014,(2):85-88.
[23]馬建玲,王楠,張延敏,等.科研用戶對非文獻資源需求研究——以中國科學(xué)院科研用戶及研究生為例[J].情報理論與實踐,2011,(2):67-71.
[24]中國校友會網(wǎng)《2016中國大學(xué)評價研究報告》2016中國大學(xué)排行榜[EB/OL].http:∥www.cuaa.net/cur/2016/,2016-10-30.
[25]THE世界大學(xué)排名2016-2017[EB/OL].https:∥www.timeshighereducation.com/world-university-rankings/2017/world-ranking#!/page/0/length/25/sortby/rank/sortorder/asc/cols/stats,2016-08-19.
[26]宋敏,李映嫦,余愛嫦,等.公共圖書館數(shù)字資源整合現(xiàn)狀調(diào)查研究[J].圖書館論壇,2014,(8):91-95.
[27]徐明.高校數(shù)字資源網(wǎng)絡(luò)化整合與多路徑共享的研究[J].中國電化教育,2013,(8):77-82.
[28]肖希明.國外公共數(shù)字文化資源整合研究進展[J].中國圖書館學(xué)報,2015,(5):63-75.
[29]李廣建.數(shù)字資源整合的實現(xiàn)機制及關(guān)鍵技術(shù)——對國外數(shù)字資源整合系統(tǒng)的實證研究[J].中國圖書館學(xué)報,2007,(2):75-80.
[30]李明娟.數(shù)字時代檔案資源整合的理論研究與實踐模式評析[J].檔案建設(shè),2014,(5):4-8.
[31]南曉凡.基于跨庫檢索的數(shù)字圖書館資源整合方式研究[J].圖書館學(xué)刊,2016,(1):116-118.
[32]王效岳,王志玲.國內(nèi)外異構(gòu)數(shù)據(jù)庫統(tǒng)一檢索系統(tǒng)的比較研究[J].情報雜志,2005,(12):116-118.
[33]張振友,孫燕.分布式異構(gòu)數(shù)據(jù)庫同步技術(shù)研究與實現(xiàn)[J].電腦知識與技術(shù),2015,(28):16-19.
[34]曹寧,張煒.國家圖書館數(shù)字資源整合的探索與實踐[J].國家圖書館學(xué)刊,2015,(2):30-35.
(本文責(zé)任編輯:孫國雷)