翟中會 (西安交通大學圖書館 陜西 西安 710061)
資源發(fā)現(xiàn)系統(tǒng)存在的問題及其對策
翟中會 (西安交通大學圖書館 陜西 西安 710061)
圖書館的資源發(fā)現(xiàn)系統(tǒng)存在排序結(jié)果不一致、缺乏高級檢索功能、不能滿足查全率、不利于用戶信息素養(yǎng)技能提高、鏈接全文功能不穩(wěn)定等問題。這些問題可通過改變資源發(fā)現(xiàn)系統(tǒng)的默認設(shè)置、提供最好的推薦及“便當盒”樣式加以改進。
資源發(fā)現(xiàn)系統(tǒng) 檢索相關(guān)性 高校圖書館
資源發(fā)現(xiàn)系統(tǒng)打破了圖書、論文和其他文獻類型之間的“筒倉”,為用戶提供了類似于Google“單盒子”的檢索體驗[1]。雖然資源發(fā)現(xiàn)系統(tǒng)為用戶提供了良好的檢索體驗,但其仍存在一些問題,如排序結(jié)果不一致、缺乏高級檢索功能、不能滿足查全率、不利于用戶信息素養(yǎng)技能提高、鏈接全文功能不穩(wěn)定等。其中,用戶認為最嚴重的一個問題是查詢結(jié)果的不相關(guān)性[2]。筆者在對資源發(fā)現(xiàn)系統(tǒng)的測試和使用過程中,總結(jié)出了資源發(fā)現(xiàn)系統(tǒng)存在的7個問題,并以此為基礎(chǔ),提出了高校圖書館解決資源發(fā)現(xiàn)系統(tǒng)可用性的3種對策。
1.1 缺乏數(shù)據(jù)庫高級檢索功能
資源發(fā)現(xiàn)系統(tǒng)的檢索功能有兩種發(fā)展趨勢,一是數(shù)據(jù)庫最常用的標準功能+資源發(fā)現(xiàn)系統(tǒng)特有的功能,這種資源發(fā)現(xiàn)系統(tǒng)定位為數(shù)據(jù)庫的補充檢索工具,如Summon;二是資源發(fā)現(xiàn)系統(tǒng)中盡可能多地融入數(shù)據(jù)庫的檢索功能,用資源發(fā)現(xiàn)系統(tǒng)替代數(shù)據(jù)庫,如EDS(Ebsco Discovery Service,Ebsco發(fā)現(xiàn)服務(wù))。各種資源發(fā)現(xiàn)系統(tǒng)不斷加強其高級檢索功能,但仍不及專業(yè)數(shù)據(jù)庫。存在這個問題的主要原因是資源發(fā)現(xiàn)系統(tǒng)包括了各種類型的資源,因此不能建立一個統(tǒng)一的控制詞匯系統(tǒng)(如MESH詞表),也就不能像專業(yè)數(shù)據(jù)庫那樣以學科水平進行細顆粒過濾。
1.2 目標人群定位不統(tǒng)一
不同資源發(fā)現(xiàn)系統(tǒng)有不同的目標人群定位。Serials Solutions指出,Summon不能代替?zhèn)鹘y(tǒng)數(shù)據(jù)庫(無論是全文或索引)[3],其用戶定位為剛開始檢索資料的大學生。Ebscohost在2014年高校圖書館發(fā)展論壇上宣稱,EDS加入了各種索引數(shù)據(jù)庫,所以EDS不但適用于本科生而且適用于研究生及研究人員[4]。筆者認為,EDS除了加入了大量索引數(shù)據(jù)庫外,其本身內(nèi)置于Ebsco平臺,有許多類似于數(shù)據(jù)庫的高級檢索功能,因而EDS比Summon更適合高級用戶。
1.3 匹配算法不統(tǒng)一
當前,許多索引數(shù)據(jù)庫都加入了資源發(fā)現(xiàn)系統(tǒng),如Summon現(xiàn)在支持ERIC(Education Resource Information Center,教育資源信息中心)、MLA(Modern Language Association of America,美國現(xiàn)代語言協(xié)會)等100多個索引數(shù)據(jù)庫[5]。EDS覆蓋更多的索引數(shù)據(jù)庫,并且建立了一個融合平臺[5]。EDS供應(yīng)商宣布其擁有一些獨一無二的索引數(shù)據(jù)庫,如Psycinfo、EconLit等。
用戶檢索時是匹配“全文+元數(shù)據(jù)”還是僅僅匹配“元數(shù)據(jù)”,理論上,“元數(shù)據(jù)+全文”匹配更加強大。但是在資源發(fā)現(xiàn)系統(tǒng)中,由于算法的問題導致用戶經(jīng)常檢索到許多不相關(guān)的條目。EDS中有一個設(shè)置“searched full of matching”,用戶可以打開或關(guān)閉這個選項。Summon沒有限制元數(shù)據(jù)檢索設(shè)置,但是后來Summon改進了算法,將全文匹配限制在前200單詞內(nèi),這種限制主要是把全文匹配限制在關(guān)鍵詞出現(xiàn)的頁面,減少了檢索結(jié)果的不相關(guān)性。
1.4 檢索結(jié)果顯示不一致
有些資源發(fā)現(xiàn)系統(tǒng)將用戶定位于本科生,本科生主要通過資源發(fā)現(xiàn)系統(tǒng)查找圖書館目錄,因此,其如果列出圖書館不能獲取的文獻,將不利于缺乏檢索經(jīng)驗的本科生使用。Summon本身默認顯示訂購或能夠免費訪問的資源。但是,如果資源發(fā)現(xiàn)系統(tǒng)包含了索引數(shù)據(jù)庫、機構(gòu)庫、Open Access(開放獲取)等資源,用戶可以看到“citation only”標識,即表示這些條目用戶沒有權(quán)限訪問。Summon的“citation only”包括pre-login和post-login兩種類型,典型的pre-login檢索結(jié)果一般不會顯示“citation only”條目,但有時會發(fā)生一些例外,這是由于資源發(fā)現(xiàn)系統(tǒng)包含了機構(gòu)僅訂購部分內(nèi)容的數(shù)據(jù)庫(如一些單位只訂購了Proquest dissertation and thesis數(shù)據(jù)庫的部分內(nèi)容),但是資源發(fā)現(xiàn)系統(tǒng)包含了這個數(shù)據(jù)的所有內(nèi)容。雖然用戶在檢索結(jié)果中可以看到該數(shù)據(jù)庫的所有條目,但是用戶對有些條目不能看到詳細的信息。為了減少不可訪問資源對用戶的干擾,Serials Solutions設(shè)置了“Exclude Citation Online Content”檢索,用戶可以利用這項功能排出不能訪問的資源。在Summon中,大多數(shù)摘要數(shù)據(jù)庫在沒有授權(quán)下不允許顯示在結(jié)果中,如Web of Science、MLA等數(shù)據(jù)庫。也就是說,要在資源發(fā)現(xiàn)系統(tǒng)結(jié)果中顯示W(wǎng)eb of Science的結(jié)果,用戶必須有訪問Web of Science的權(quán)限。因此,用戶有時會發(fā)現(xiàn),在不同的網(wǎng)絡(luò)環(huán)境下使用資源發(fā)現(xiàn)系統(tǒng)會出現(xiàn)檢索結(jié)果不一致的現(xiàn)象。Ebscohost采用了post-login模型,用戶的檢索結(jié)果中能夠顯示包含的索引數(shù)據(jù)內(nèi)容,但是用戶訪問詳細內(nèi)容時也需要授權(quán)。
1.5 顯示OPAC記錄問題
資源發(fā)現(xiàn)系統(tǒng)收割了館藏目錄的MARC(Machine Readable Catalogue,機器可讀目錄)記錄,但是當用戶點擊檢索到的書目信息時,資源發(fā)現(xiàn)系統(tǒng)又將鏈接轉(zhuǎn)到館藏目錄界面。這將導致用戶突然從資源發(fā)現(xiàn)系統(tǒng)界面切換到傳統(tǒng)OPAC(Online Public Access Catalogue,聯(lián)機公共目錄查詢系統(tǒng))界面,用戶可能會感覺到一些不適應(yīng)。筆者認為,有3種方法來解決這一問題:①資源發(fā)現(xiàn)服務(wù)供應(yīng)商本身就是ILS(Integrated Library System,圖書館集成系統(tǒng))供應(yīng)商,如Ex Libris和Primo Central聯(lián)合提供服務(wù)。②資源發(fā)現(xiàn)服務(wù)供應(yīng)商與ILS供應(yīng)商合作。③高校圖書館采用開源軟件接口,如以Vufind作為資源發(fā)現(xiàn)服務(wù)索引用戶接口。美國麻省理工大學在這方面具有成功的經(jīng)驗,該校圖書館直接在資源發(fā)現(xiàn)系統(tǒng)中顯示館藏信息及圖書狀態(tài),這也保證了OPAC目錄和資源發(fā)現(xiàn)系統(tǒng)同步,不會出現(xiàn)館藏目錄和資源發(fā)現(xiàn)系統(tǒng)數(shù)據(jù)不一致的現(xiàn)象[6]。
1.6 內(nèi)容提供商與資源發(fā)現(xiàn)系統(tǒng)的合作問題
JSTOR、Sage、Science Direct等數(shù)據(jù)庫已經(jīng)加入Summon的索引,越來越多的索引數(shù)據(jù)庫(如Web of Science、MLA、ERIC)也被加進授權(quán)用戶的資源發(fā)現(xiàn)系統(tǒng)中,但是也有一些索引數(shù)據(jù)庫僅和E bsco合作(如Psycinfo、EconLit等);同時,仍有一些聚合數(shù)據(jù)不愿意與資源發(fā)現(xiàn)系統(tǒng)合作(如Proquest和Ebscohost)。
1.7 全文鏈接丟失問題
資源發(fā)現(xiàn)服務(wù)依靠openURL獲取全文,但openURL鏈接全文并不是百分之百可靠,因此,資源發(fā)現(xiàn)系統(tǒng)采取了一些替代方法鏈接全文。例如,Summon實現(xiàn)了“Index-Enhanced Direct Linking”,EDS實現(xiàn)了“smart links”和“custom links”,其中“smart links”主要解決Ebscohost 數(shù)據(jù)庫的全文鏈接問題。但是,一些報紙文章、非期刊條目及免費內(nèi)容仍存在一些問題。
高校圖書館的目錄系統(tǒng)大約有幾百萬條書目記錄,加之期刊論文、報紙文章和一些其他類型的文獻,其館藏記錄數(shù)量將比原來至少增加50~100倍,西安交通大學(以下簡稱西安交大)圖書館資源發(fā)現(xiàn)系統(tǒng)的館藏記錄數(shù)量已超過4億條[7]。隨著館藏記錄數(shù)量和類型的增加,用戶在檢索時系統(tǒng)會顯示大量不相關(guān)的結(jié)果。目前,四大資源發(fā)現(xiàn)系統(tǒng)(Summon、Primo、EDS、Worldcat Local)都不允許用戶更改相關(guān)排序算法,不同需求的用戶只能采用相同且唯一的等級算法。另外,即使系統(tǒng)允許高校圖書館館員更改相關(guān)等級算法,這對高校圖書館館員來說也是一個非常復(fù)雜且困難的事情。因此,高校圖書館館員只能在不改變資源發(fā)現(xiàn)系統(tǒng)排序算法的前提下,修改資源發(fā)現(xiàn)系統(tǒng)的其他方面以提升其可用性。
2.1 改變資源發(fā)現(xiàn)系統(tǒng)的默認設(shè)置
高校圖書館館員雖然不能改變資源發(fā)現(xiàn)系統(tǒng)的排序算法,但是能通過調(diào)整系統(tǒng)的默認設(shè)置影響檢索結(jié)果的顯示。西安交大圖書館從2012年開始部署了Summon,該系統(tǒng)包含了大量的報紙文章和書評,目前資源數(shù)量已達到1 568 872條[8]。Summon對報紙文章和書評的排序等級非常高,在用戶檢索時,其報紙文章和書評排在檢索結(jié)果列表的最前面。為了滿足用戶需求,Summon在方面檢索欄里設(shè)置了“不顯示新聞報紙中的文章”以排除這類資源,并將這一檢索限制的位置提升到了更醒目的位置,下調(diào)了“內(nèi)容類型”、“出版時間”等方面檢索的位置。通過方面檢索,用戶能夠很好地排除一些不相關(guān)文獻,但是筆者根據(jù)資源發(fā)現(xiàn)系統(tǒng)日志分析發(fā)現(xiàn),用戶很少使用資源發(fā)現(xiàn)系統(tǒng)的方面檢索。因此,許多高校在部署資源發(fā)現(xiàn)系統(tǒng)時直接排除了新聞文章和書評。通過這種默認設(shè)置,用戶對系統(tǒng)的抱怨明顯降低。例如,在Summon中輸入“galdwell outliers”(全名是outliers:the story of success by galdwell),如果將新聞和書評過濾掉,檢索結(jié)果是第6條;而如果沒有過濾新聞和書評,檢索結(jié)果為第17條。資源發(fā)現(xiàn)系統(tǒng)服務(wù)商在Summon2.0中已經(jīng)注意到報紙文章這方面的問題,其將報紙文章單獨排序顯示在一個獨立的News組中。
EDS和Summon相同,也不允許用戶修改等級排序算法。E D S中允許用戶更改的設(shè)置包括應(yīng)用相關(guān)關(guān)鍵詞(apply related word)、在全文中檢索(also search with the full text of the articles)、限制圖書館館藏(available in library collection)。
2.2 最好的推薦
筆者對資源發(fā)現(xiàn)系統(tǒng)的可用性進行了測試并對其研究發(fā)現(xiàn),在“知道”條目的搜索中,資源發(fā)現(xiàn)系統(tǒng)的表現(xiàn)非常差[9]。例如,用戶在資源發(fā)現(xiàn)系統(tǒng)中輸入期刊名“Urban Geography”,其本意是找到該期刊的鏈接,但是Summon卻將報紙文章、書評、圖書排在了最前面,導致用戶很難找到該期刊的鏈接。這一問題直到Summon2.0發(fā)布了“best bets”后才得以解決,即允許系統(tǒng)管理員在某一個關(guān)鍵詞匹配后手動創(chuàng)建消息和鏈接。與Summon相同,EDS也提供了類似“best bets”的配置。Primo采用了美國伊利諾伊大學香檳分校的建議系統(tǒng),應(yīng)用算法自動對期刊標題或數(shù)據(jù)庫名稱進行完全或部分匹配,然后推薦期刊或數(shù)據(jù)庫鏈接。資源發(fā)現(xiàn)系統(tǒng)在測試過程中,用戶輸入只有一個單詞的期刊名稱如“science”或“nature”,資源發(fā)現(xiàn)系統(tǒng)便可以很好地顯示結(jié)果。但是,當用戶輸入兩個單詞的期刊名稱時,則仍會出現(xiàn)排序異常的現(xiàn)象,這一問題還需筆者進一步探明原因。
2.3 “便當盒”樣式
資源發(fā)現(xiàn)系統(tǒng)的最初動機是為用戶提供一個類似Google“單盒子”的檢索系統(tǒng),即將所有類型的資料放在一起,打破原來不同數(shù)據(jù)庫之間的“筒倉”。這一動機的實現(xiàn)有兩個難點:一是將本機構(gòu)所有的資源建立一個單一的索引(許多內(nèi)容需要供應(yīng)商的許可) ;二是將不同類型資源按照相同的等級算法統(tǒng)一排序顯示。這種將不同內(nèi)容統(tǒng)一顯示的方式越來越受到人們的懷疑,一些人指出,即使像Google這樣卓越的搜索引擎也存在“筒倉”,如Google搜索并沒有混入Google books、Google scholar及Google news中的內(nèi)容。
“單盒子”類型的檢索系統(tǒng)將不同類型的記錄展現(xiàn)在同一個列表中,但是將圖書、書評、報紙文章、期刊論文等資料類型全部放在一張列表中,會使用戶難以找到其所需資料。因此,筆者認為,“便當盒”樣式的檢索系統(tǒng)更適合資源發(fā)現(xiàn)系統(tǒng)在高校圖書館的應(yīng)用,即在資源發(fā)現(xiàn)系統(tǒng)的同一個頁面顯示不同的“盒子”,每個“盒子”中存放不同類型的文獻。目前,美國普林斯頓大學、哥倫比亞大學和維拉諾瓦大學等高校圖書館的資源發(fā)現(xiàn)系統(tǒng)都實現(xiàn)了這種“便當盒”樣式[10]。其中,維拉諾瓦大學圖書館是將頁面分為3個“盒子”:第一個“盒子”的內(nèi)容為圖書,第二個“盒子”的內(nèi)容為期刊論文和其他,第三個“盒子”的內(nèi)容為學校圖書館網(wǎng)站內(nèi)容[11]。美國北卡羅來納州大學圖書館在資源發(fā)現(xiàn)的基礎(chǔ)上實現(xiàn)了全圖書館發(fā)現(xiàn),該館將資源發(fā)現(xiàn)系統(tǒng)的結(jié)果列表分為5個“便當盒”,包括期刊論文、圖書和多媒體、數(shù)據(jù)庫、主題數(shù)據(jù)庫、學校圖書館網(wǎng)站和FAQ[12]。
“便當盒”樣式在資源發(fā)現(xiàn)系統(tǒng)的配置中變得越來越流行,其具有如下優(yōu)點:①“便當盒”將資源按照類型分類,方便用戶按照資源類型選擇資源,這對檢索經(jīng)驗較少的用戶尤其重要。②“便當盒”樣式有利于高校圖書館將其服務(wù)整合進資源發(fā)現(xiàn)系統(tǒng),方便高校圖書館從資源發(fā)現(xiàn)進展到服務(wù)發(fā)現(xiàn)。③資源發(fā)現(xiàn)系統(tǒng)將不同類型的資源整合在一起,而且使用同一種排序算法,這是影響檢索結(jié)果相關(guān)性最重要的一個因素。如果資源發(fā)現(xiàn)系統(tǒng)能將檢索結(jié)果按照“便當盒”樣式分類顯示,不同類型資源的排序采用不同算法(如書目信息可以采用ILS等級排序,期刊論文可以采用另外一種算法排序),這就將大大提高資源發(fā)現(xiàn)系統(tǒng)檢索結(jié)果的相關(guān)性。④通過實現(xiàn)本地用戶接口的開發(fā),未來無論資源發(fā)現(xiàn)系統(tǒng)如何改變都不會影響本地用戶接口,只要通過API(Application Programming Interface,應(yīng)用程序編程接口)將檢索結(jié)果接入接口層即可,從而實現(xiàn)了索引層和接口層的分離[13]。目前,四大資源發(fā)現(xiàn)系統(tǒng)仍沒有將其原生接口改為“便當盒”樣式。Summon2.0僅對報紙文章進行了高亮顯示,如果用戶進一步點擊報紙文章,檢索結(jié)果最終只顯示報紙文章的內(nèi)容[14]。Serials Solutions已宣布將實現(xiàn)其他類型資料的高亮顯示[15]。資源發(fā)現(xiàn)系統(tǒng)實現(xiàn)“便當盒”樣式的主要方式是將資源發(fā)現(xiàn)系統(tǒng)的索引裝載在一些開源軟件(如VuFind、Blacklight、Xeres等)中,也有機構(gòu)獨立開發(fā)用戶接口,如美國維拉諾瓦大學采用VuFind實現(xiàn)了其用戶接口的開發(fā)[16]。資源發(fā)現(xiàn)系統(tǒng)實現(xiàn)“便當盒”樣式還可以使用收費軟件,如機構(gòu)可以使用SciVerse配置資源發(fā)現(xiàn)系統(tǒng)的各種檢索功能,方便用戶在使用時可以隨時關(guān)閉不需要的功能。
[1]包 凌, 蔣 穎. 圖書館統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)的比較研究[J]. 情報資料工作, 2012(5): 67-72.
[2]張 蒂. 非熟練用戶對于兩種資源發(fā)現(xiàn)系統(tǒng)的體驗分析:基于焦點小組的調(diào)研[J]. 圖書館工作與研究, 2014(1):104-108.
[3]劉頡頏, 陳定權(quán), 郭 嬋. 用戶對圖書館資源發(fā)現(xiàn)系統(tǒng)功能的期望:基于廣州大學城高校圖書館學生用戶的調(diào)研[J]. 圖書情報工作, 2012(7):27-31.
[4]趙 媛, 張 鵬. 數(shù)字時代 資源為王:2014中國高校圖書館發(fā)展論壇綜述[J]. 中國現(xiàn)代教育裝備, 2014(11): 88-91.
[5] 陳定權(quán), 盧玉紅, 楊 敏. 圖書館資源發(fā)現(xiàn)系統(tǒng)的現(xiàn)狀與趨勢[J]. 圖書情報工作, 2012(7):44-48.
[6] 羅 彬, 張 健, 馮 勤. VuFind功能與技術(shù)創(chuàng)新給我們的啟示[J]. 圖書館學研究, 2013(6):53-55.
[7] 宋 敏. 2010-2013年資源發(fā)現(xiàn)系統(tǒng)在大學圖書館應(yīng)用的對比分析[J]. 知識管理論壇, 2013(12):18-24.
[8] 鞏林立. 高校圖書館資源發(fā)現(xiàn)服務(wù)系統(tǒng)體系構(gòu)建[J]. 圖書館學研究, 2013(9):69-71.
[9] 翟中會, 韓維棟. 資源發(fā)現(xiàn)系統(tǒng)用戶可用性測試研究[J]. 圖書館學研究, 2014(15):58-64.
[10]Phetteplace E,Darrington J. A Hybrid Approach to Discovery Services[J]. Reference & User Services Quarterly, 2014, 53(4): 291-295.
[11]Lown C, Sierra T, Boyer J. How Users Search the Library from a Single Search Box[J]. College & Research Libraries, 2013,74(3): 227-241.
[12]UNC Libraries. Articles+Catalog Search Results[EB/OL].[2014-10-01].http://library.unc.edu.
[13]竇天芳, 姜愛蓉. 資源發(fā)現(xiàn)系統(tǒng)功能分析及應(yīng)用前景[J]. 圖書情報工作, 2012(7): 38-43.
[14]FindMore@NUSL[EB/OL]. [2014-10-01]. http://libportal.nus. edu.sg/frontend/index.
[15]Summon2.0[EB/OL]. [2014-10-01]. http://www.proquest.com/ libraries/.
[16]Houser J. The VuFind Implementation at Villanova University[J]. Library Hi Tech, 2009,27(1):93-105.
Problems of the Resource Discovery System and Its Strategies
The resource discovery system of the library has many problems, such as the inconsistent sorting result, the lack of the advanced retrieval function, not meeting the recall ratio, going agaist improving information literacy skills of users, the unstable function of linking the full text. These problems could be improved by changing the default setting of the resource discovery system, providing the best bet and the ''bento box'' style.
Resource discovery system; Retrieval relevance; University library
G254.929.1
B
2014-10-09 ]
翟中會 男,碩士,館員,已發(fā)表論文10篇。