王天虹
(天津師范大學圖書館,天津 300387)
基于超星發(fā)現(xiàn)系統(tǒng)的高校圖書館中文資源發(fā)現(xiàn)服務*
王天虹
(天津師范大學圖書館,天津 300387)
目前我國高校圖書館所使用的國外資源發(fā)現(xiàn)系統(tǒng)對于圖書館中文資源的整合、發(fā)現(xiàn)、獲取的效果都差強人意。北京超星公司于2012年推出了中文資源發(fā)現(xiàn)系統(tǒng)——超星發(fā)現(xiàn)。對基于超星發(fā)現(xiàn)系統(tǒng)的高校圖書館中文資源發(fā)現(xiàn)服務進行了初步評估,并比較了其與國外發(fā)現(xiàn)系統(tǒng)的不同之處。
超星發(fā)現(xiàn)系統(tǒng) 中文資源發(fā)現(xiàn)服務 高校圖書館
在當前高校圖書館的各類型學術信息資源激增的背景之下,發(fā)現(xiàn)服務得到了廣泛且迅速的推廣和應用。目前我國高校圖書館普遍使用的資源發(fā)現(xiàn)系統(tǒng)都是由國外的數(shù)據(jù)庫廠商或圖書館集成系統(tǒng)開發(fā)商推出的,其中主要包括Summon、Primo Central、EBSCO Discovery Service(EDS)等幾大發(fā)現(xiàn)系統(tǒng)。經過筆者的調研發(fā)現(xiàn),國外的資源發(fā)現(xiàn)系統(tǒng)對于高校圖書館中文資源的整合、發(fā)現(xiàn)并獲取的效果都差強人意,而CNKI學術搜索、CALIS的e讀學術搜索等雖然可以稱之為國內中文資源發(fā)現(xiàn)服務的雛形,但是無論是元數(shù)據(jù)覆蓋的范圍還是系統(tǒng)的運行機制與功能都存在著一定的欠缺,對單個圖書館的資源發(fā)現(xiàn)效果并不理想。因此,盡快開發(fā)擁有自主知識產權的網(wǎng)絡級中文發(fā)現(xiàn)服務依然受到了國內圖書館界的廣泛關注。北京超星公司于2012年推出了中文發(fā)現(xiàn)系統(tǒng)——超星發(fā)現(xiàn),超星發(fā)現(xiàn)旨在全面、準確地發(fā)現(xiàn)中文資源,并且能夠為用戶提供具有知識挖掘與情報分析功能的中文發(fā)現(xiàn)系統(tǒng)。超星發(fā)現(xiàn)系統(tǒng)是否可以稱之為中文資源發(fā)現(xiàn)服務的一種較為完善的解決方案,較之國外發(fā)現(xiàn)系統(tǒng)有何不同之處,筆者對此進行了初步的探討。
資源發(fā)現(xiàn)服務可視為一套系統(tǒng)[1],對于發(fā)現(xiàn)服務的概念并沒有統(tǒng)一的界定。筆者認為,對于高校圖書館來說,中文資源發(fā)現(xiàn)服務就是利用預索引元數(shù)據(jù)倉儲模式提供服務的資源發(fā)現(xiàn)系統(tǒng),將各類型中文資源內容包括圖書館的OPAC進行有效的整合,從而實現(xiàn)高校圖書館所有中文資源的無縫連接。同時幫助讀者迅速、準確地發(fā)現(xiàn)并可以直接獲取圖書館的各類型中文資源以及開放獲取資源,另外在此基礎上進行知識與情報的深入分析和挖掘,來幫助用戶發(fā)現(xiàn)高價值的中文學術文獻,以實現(xiàn)知識的進一步發(fā)現(xiàn)。
發(fā)現(xiàn)服務的特征正是基于海量的元數(shù)據(jù)中心倉儲數(shù)據(jù),采用先進的技術手段改善了圖書館用戶的檢索體驗,并有效地提升了檢索質量(見圖1)。在改善用戶檢索體驗方面,發(fā)現(xiàn)服務提供類似Google的單一檢索框,通過簡單、易操作的檢索入口對圖書館的所有資源進行檢索和獲取。發(fā)現(xiàn)服務的數(shù)據(jù)搜索主要是在一個索引數(shù)據(jù)庫中進行,因此可以實現(xiàn)迅速、快捷的檢索,再通過對檢索結果的相關度排序、分面導航等功能來幫助用戶發(fā)現(xiàn)最適合的資源。另外包括檢索詞提示和糾錯、標簽、評論、可視化等Web2.0功能的融入與支持,有效提升了網(wǎng)絡環(huán)境下的交互性用戶體驗;在提升檢索質量方面,發(fā)現(xiàn)服務可以實現(xiàn)對圖書館資源的全面覆蓋,特別是能夠實現(xiàn)對OPAC的有效整合,并通過預處理保證了元數(shù)據(jù)的質量,從而有效提高了檢索結果的查全率和查準率。
圖1 發(fā)現(xiàn)服務特征
筆者通過采取網(wǎng)站調研、系統(tǒng)調查、文獻調研等非介入式調查方法和訪談法,對國內幾所已經采用國外發(fā)現(xiàn)系統(tǒng)的重點高校圖書館的使用情況進行了調研,其中主要包括:Primo Central系統(tǒng)使用代表——上海交通大學圖書館(思源探索)和清華大學圖書館(水木搜索),Summon系統(tǒng)的使用代表——北京大學圖書館(未名搜索),EDS系統(tǒng)的使用代表——中山大學圖書館(智慧搜索)。通過調研發(fā)現(xiàn)國外資源發(fā)現(xiàn)系統(tǒng)在整合、處理中文資源的時候,都存在著如下一些不容忽視的問題。
2.1 對中文元數(shù)據(jù)的獲取不足
國外發(fā)現(xiàn)系統(tǒng)與國內的出版商或數(shù)據(jù)庫廠商合作簽約獲得元數(shù)據(jù)的進程非常艱難而緩慢,普遍收錄不足的現(xiàn)象比較明顯,因此中文元數(shù)據(jù)的不豐富或者質量不高直接導致的是中文資源發(fā)現(xiàn)率降低。比如:上海交通大學的“思源探索”中的中文電子圖書元數(shù)據(jù)厚度較弱,一般只有書名、作者、ISBN號和出版社信息,而沒有關鍵詞、摘要等信息。在中文期刊全文的獲取上,國外發(fā)現(xiàn)系統(tǒng)也都存在著一些障礙,比如通過“未名搜索”和“思源探索”檢索到相關的中文期刊文獻后,點擊查看全文,都是只能到達該期刊的目錄界面,需要采取進一步的檢索,才能找到該篇文獻的全文標題鏈接界面。中山大學的“智慧發(fā)現(xiàn)”甚至連常用的一些中文文獻資源都無法檢索到。另外,國外發(fā)現(xiàn)系統(tǒng)大都集成以文本形式為基礎的資源,對于視頻、音頻等多媒體資源則涉及較少,在這幾所高校圖書館的發(fā)現(xiàn)系統(tǒng)中能夠找到的中文多媒體資源通常只有本館自建的一些多媒體數(shù)據(jù)庫中的內容。
2.2 對中文數(shù)據(jù)的處理能力、漢化水平都有待提高
國外的資源發(fā)現(xiàn)系統(tǒng)對西文資源處理得比較好,但是對中文數(shù)據(jù)的處理卻不盡如人意。比如清華大學的“水木搜索”,查找中文期刊文獻時,分面導航功能中的中文期刊名稱仍然采用英文顯示。中山大學的“智慧搜索”,界面的漢化比較差,EDS發(fā)現(xiàn)系統(tǒng)在簡體版的漢化及中文數(shù)據(jù)的處理能力方面都有比較大的欠缺。
2.3 中文檢索技術不夠成熟
由于西文資源和中文資源在檢索的技術和方法上存在著差異,國外發(fā)現(xiàn)系統(tǒng)對于中文資源檢索的方法還有待進一步完善,比如在使用Primo系統(tǒng)檢索中文資源時,檢索詞加引號和不加引號,檢索結果的數(shù)量和相關性都有較大的差距[2]。另外,也存在著無法有效地辨識與處理繁體中文的問題。
2.4 知識深入分析的功能欠缺
通過調研發(fā)現(xiàn),自定義標簽等國外發(fā)現(xiàn)系統(tǒng)比較側重的Web2.0功能,圖書館用戶卻對此并不感興趣,這也是圖書館用戶與一般網(wǎng)絡用戶在功能感知上的不同[3]。而國外發(fā)現(xiàn)系統(tǒng)對于知識的深入分析與挖掘方面的功能并不突出,這恰恰是高校圖書館用戶特別是高級用戶群體比較關注的部分,他們期望能夠從發(fā)現(xiàn)系統(tǒng)中找到并直觀、清晰地看到某個關鍵詞、某個主題甚至某個學科近幾年的研究發(fā)展態(tài)勢、相關文獻知識之間的關聯(lián)分析等。除清華大學圖書館利用Primo發(fā)現(xiàn)平臺的元數(shù)據(jù)進行了研究熱點、學科趨勢分析等可視化的二次開發(fā),在其他幾所高校的發(fā)現(xiàn)系統(tǒng)調研中并沒有看到相關的內容。
超星發(fā)現(xiàn)系統(tǒng)自2012年起已經在國內的諸多高校開始了推廣和應用,目前天津大學已經正式引進了該系統(tǒng),天津市其他高校也開始了對該系統(tǒng)的試用。從發(fā)現(xiàn)服務的特點出發(fā),通過實際的應用,對基于超星發(fā)現(xiàn)系統(tǒng)的中文資源發(fā)現(xiàn)服務進行了初步的評估。
3.1 用戶檢索體驗
3.1.1 用戶界面與檢索結果處理
超星發(fā)現(xiàn)系統(tǒng)的用戶界面是一般發(fā)現(xiàn)服務所采用的類似Google的單一檢索框,充分體現(xiàn)了簡單、易用的檢索理念,也提供高級檢索的功能來適應高校圖書館用戶傳統(tǒng)的檢索習慣,同時提供了圖書館員使用的專業(yè)檢索,均可實現(xiàn)與簡單檢索間的自由切換。
用戶界面的另一個功能是完成對檢索結果的顯示。對于檢索結果的排序,提供館藏優(yōu)先、出版日期降序、出版日期升序、本單位產出、相關性、學術性的多種排序功能。在結果的顯示上,超星中文發(fā)現(xiàn)系統(tǒng)提供精煉檢索和分面瀏覽功能,這也是發(fā)現(xiàn)服務必備的一個功能。在分面選項中,除內容類型、關鍵詞、年份、作者、作者機構、學科分類等常見選項,還設置了“不包括同位詞檢索”,讓用戶來自由擴充和縮減檢索結果。通過設置“檢索學術文章”和“不包含報紙文章”兩個分面選項來幫助高校用戶過濾掉非學術性的一些報紙雜志類信息。另外,設置了重要期刊的分面選項,可以勾選查找中文核心期刊、CSSCI中文社科引文索引、CSCD中國科學引文索引等收錄的期刊,更加符合中文學術發(fā)現(xiàn)的需要,滿足高校教師、研究生等高級用戶獲取中文學術信息的期望。
3.1.2 Web2.0功能的融入
作為發(fā)現(xiàn)服務又一顯著特點的Web2.0功能,在超星發(fā)現(xiàn)系統(tǒng)的用戶界面也有突出的表現(xiàn)。比如將檢索詞提示和糾錯功能進行了進一步的擴展即將常用檢索詞匯總并提示在檢索框之下,如果用戶的檢索切入點是某一個作者時,系統(tǒng)會主動推送作者的簡歷與相關文章。除標簽、評論、BLOG等功能得到充分運用之外,值得一提的是超星發(fā)現(xiàn)系統(tǒng)的可視化功能比較突出,將檢索結果進行數(shù)據(jù)分析后,通過可視化來展示各個知識點之間的關聯(lián),從而更容易幫助讀者發(fā)現(xiàn)新的知識,并能夠直接獲取該知識的相關文獻。同時提供包含某個檢索詞的圖書、期刊、學位論文、會議論文、專利及標準的學術發(fā)展趨勢曲線圖以及該檢索詞的報紙關注熱點趨勢曲線圖,在此基礎上還能實現(xiàn)多主題對比的可視化。另外,文章引證關系的可視化也是很多高校用戶所關注的內容。
3.2 檢索質量
3.2.1 元數(shù)據(jù)覆蓋范圍與質量
中文元數(shù)據(jù)的規(guī)模與質量是中文資源發(fā)現(xiàn)與獲取的關鍵。北京超星集團公司擁有目前世界上最大的中文圖書數(shù)據(jù)庫,并且始終致力于不斷擴充自己在各類型資源上的覆蓋率。根據(jù)超星公司在天津大學的超星發(fā)現(xiàn)系統(tǒng)發(fā)布儀式上的介紹,截至2013年2月1日,超星發(fā)現(xiàn)系統(tǒng)中的中文元數(shù)據(jù)及全文數(shù)據(jù)量達1.99億條,其中資源覆蓋452萬種圖書、7800萬篇期刊、370萬篇學位論文、400萬篇會議論文、1億篇報紙文章、52萬篇標準、770萬篇專利、10億個網(wǎng)頁和200萬部視頻[4]。由于超星公司是世界最大的中文電子書的出版商,因此不僅能夠保證中文電子書元數(shù)據(jù)的厚度,而且對于電子書的檢索可以深入到章節(jié)級,可以對全文進行索引。在中文期刊的元數(shù)據(jù)方面,除超星公司自身所獨有的1200萬中文期刊元數(shù)據(jù)外,其他中文期刊的元數(shù)據(jù)還是主要通過元數(shù)據(jù)收割的方式來獲取,但是通過這類方式獲取的元數(shù)據(jù)質量要稍差。在期刊元數(shù)據(jù)的厚度上,大部分可以達到期刊名、作者、ISSN號、關鍵詞、摘要級別。但是超星發(fā)現(xiàn)系統(tǒng)是否覆蓋了絕大多數(shù)的中文核心期刊,還有待進一步評估。另外,對于國外發(fā)現(xiàn)系統(tǒng)在中文多媒體元數(shù)據(jù)上的欠缺,超星發(fā)現(xiàn)系統(tǒng)則較好地保障了這類元數(shù)據(jù)的規(guī)模與質量。由于超星公司擁有國內最豐富的學術視頻資源,目前已制作完成了包括數(shù)十位兩院院士在內的眾多國內外知名專家、學者、教授講授的大量學術視頻內容,并且還以每年上萬集的速度增加,這使得超星發(fā)現(xiàn)系統(tǒng)能夠讓高校圖書館用戶去更多地發(fā)現(xiàn)與獲取具有學術價值的中文多媒體資源。
在提供中文文獻原文的鏈接與獲取上,為用戶提供本館館藏、電子全文和郵箱接收全文3種獲取全文的方式,對于本館擁有使用權限的商業(yè)數(shù)據(jù)庫資源,能夠直接鏈接到所需文獻的全文標題下載界面,對于本館所沒有的中文圖書或者期刊文獻全文,可通過發(fā)現(xiàn)系統(tǒng)中的全國參考咨詢服務平臺或者圖書館文獻咨詢服務系統(tǒng)來獲取。但是在期刊全文的獲取上,也存在著由于部分期刊的元數(shù)據(jù)沒有通過正式簽約方式來獲得內容商或者出版商的授權使用,從而導致期刊全文鏈接獲取不穩(wěn)定的情況時有發(fā)生。
3.2.2 與館藏公共目錄系統(tǒng)(OPAC)的整合
發(fā)現(xiàn)服務對OPAC的整合與發(fā)現(xiàn)是十分重要的,用戶可以從超星發(fā)現(xiàn)平臺的單一檢索框完成多種類型資源的發(fā)現(xiàn),包括對紙本館藏的發(fā)現(xiàn)。由于超星公司是中文圖書數(shù)據(jù)庫的翹楚,因此在對于高校館藏書目數(shù)據(jù)的處理上,首先進行數(shù)據(jù)對比,找到元數(shù)據(jù)倉儲中沒有的書目數(shù)據(jù),將這部分數(shù)據(jù)經過查重、修正等預處理,再上載到發(fā)現(xiàn)系統(tǒng)中,與龐大的元數(shù)據(jù)倉儲一起建立索引。由于只是單純的數(shù)據(jù)整合,沒有實現(xiàn)服務整合,即OPAC中個人記錄查詢、續(xù)借、預約等服務功能沒有在發(fā)現(xiàn)系統(tǒng)的讀者界面中呈現(xiàn),因此用戶必須進入原有的OPAC界面中完成上述服務功能的操作。
3.3 超星發(fā)現(xiàn)系統(tǒng)與國外發(fā)現(xiàn)系統(tǒng)的比較
超星發(fā)現(xiàn)系統(tǒng)與國外發(fā)現(xiàn)系統(tǒng)在技術上都是具有一個元數(shù)據(jù)的中心倉儲,可以向圖書館提供基于云計算的“軟件即服務”(SaaS)的服務方式。兩者之間最大的不同在于元數(shù)據(jù)中心索引覆蓋的資源范圍不同,前者是以中文資源為主,后者以外文資源為主。另外在具體的功能、服務、價格等方面也存在著一些不同。
①國外發(fā)現(xiàn)系統(tǒng)是開放式的,不對用戶檢索設限,而超星發(fā)現(xiàn)系統(tǒng)的檢索是受IP訪問權限限制的。
②對于大家所關注的發(fā)現(xiàn)服務對于OPAC的整合,國外的發(fā)現(xiàn)系統(tǒng)可以在數(shù)據(jù)整合的基礎上實現(xiàn)服務層面的整合,比如Primo Central發(fā)現(xiàn)系統(tǒng),而超星發(fā)現(xiàn)系統(tǒng)只能實現(xiàn)數(shù)據(jù)層面的整合。
③由于發(fā)現(xiàn)服務是基于海量元數(shù)據(jù)的搜索,檢索結果的相關度排序是十分重要的。國外的發(fā)現(xiàn)系統(tǒng)大都支持可以調節(jié)相關度算法的功能,允許提升一些條目的排序[5],而超星發(fā)現(xiàn)系統(tǒng)則不支持這樣的功能,也就不能針對圖書館用戶的需求來不斷優(yōu)化、調整檢索結果的相關度排序。
④對于高校圖書館自建數(shù)據(jù)庫及資源的整合,國外發(fā)現(xiàn)系統(tǒng)已經能夠比較好地處理這部分內容,而超星發(fā)現(xiàn)系統(tǒng)則沒有看到這方面整合的具體實例,不排除一些高校圖書館出于對自建資源數(shù)據(jù)保護的原因而放棄這部分內容的整合。但是超星發(fā)現(xiàn)系統(tǒng)能否處理MARC、EXCELL、XML等多種數(shù)據(jù)格式,能否較好地對這部分數(shù)據(jù)進行收割和獲取,還有待評估。
⑤超星發(fā)現(xiàn)系統(tǒng)在具備一般發(fā)現(xiàn)系統(tǒng)所具有的檢索、發(fā)現(xiàn)與獲取的功能外,更加側重對整合后的大量數(shù)據(jù)資源進行知識挖掘與情報分析處理。即通過分析高校用戶的知識需求,從而揭示出各信息資源之間相互關聯(lián)的立體知識體系,并應用可視化技術來動態(tài)、直觀地為用戶展現(xiàn)海量信息資源中潛在的規(guī)律和發(fā)展趨勢。
⑥超星發(fā)現(xiàn)系統(tǒng)與國外發(fā)現(xiàn)系統(tǒng)相比較,在訂購價格方面具有較大的優(yōu)勢。由于超星發(fā)現(xiàn)系統(tǒng)必須要搭建于超星公司的另外一個產品——百鏈系統(tǒng)的基礎之上,因此高校圖書館在購買超星發(fā)現(xiàn)系統(tǒng)的時候必須購買配套的百鏈系統(tǒng),但即便如此,超星發(fā)現(xiàn)系統(tǒng)的訂購價格也遠低于國外發(fā)現(xiàn)系統(tǒng)的價格。
超星發(fā)現(xiàn)系統(tǒng)可以實現(xiàn)對高校圖書館中文資源的深度整合和便捷獲取,符合發(fā)現(xiàn)服務的特征,但與國外的發(fā)現(xiàn)系統(tǒng)相比,由于國內對于中文元數(shù)據(jù)合法性的模糊界定、對于開放獲取理念的接受度較低以及數(shù)據(jù)庫商自身商業(yè)利益等原因,在開放式服務、元數(shù)據(jù)質量、相關度排序等方面還存在著一些問題,然而價格的優(yōu)勢、對中文資源更為全面的覆蓋率、側重知識挖掘、情報分析的功能特點,也使超星發(fā)現(xiàn)系統(tǒng)在中文資源發(fā)現(xiàn)服務方面的優(yōu)勢得以顯現(xiàn),這也是很多高校圖書館在引進了國外的發(fā)現(xiàn)系統(tǒng)后又引進超星發(fā)現(xiàn)系統(tǒng)的原因。隨著國外發(fā)現(xiàn)系統(tǒng)對中文資源覆蓋范圍的日益擴大及對中文數(shù)據(jù)處理能力的逐步改善與強大,國內自己的中文發(fā)現(xiàn)系統(tǒng)將面臨更多的挑戰(zhàn)。在不斷擴大各類型中文學術資源的覆蓋率,特別是提高中文元數(shù)據(jù)質量的同時,面向用戶的需求,提供更具有個性化的服務功能是中文資源發(fā)現(xiàn)服務的發(fā)展方向。
[1]陳麗冰.讀者服務視角下的圖書館資源發(fā)現(xiàn)服務[J].情報資料工作,2012(4):66-70.
[2]包凌,蔣穎.圖書館統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)的比較研究[J].情報資料工作,2012(5):67-72.
[3]劉頡頏,陳定權,郭嬋.用戶對圖書館資源發(fā)現(xiàn)系統(tǒng)功能的期望——基于廣州大學城高校圖書館學生用戶的調研[J].圖書情報工作,2012(7):27-31.
[4]天津大學圖書館[DB/OL].[2013-05-27].http://www.lib. tju.edu.cn/n17397/n17631/87720.html.
[5]Vaughan J.EBSCO discovery services[J].Library Technology Reports,2011(1):30-38.
王天虹女,1980年生。碩士,館員。
G258.6
2014-02-24;責編:張欣。)
*本文系天津師范大學青年基金項目“大數(shù)據(jù)環(huán)境下大學生數(shù)據(jù)素養(yǎng)培養(yǎng)模式研究——以天津師范大學圖書館為例”(項目編號:52WU1309)研究成果之一。