□高昆栓/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
/ 北京萬方數(shù)據(jù)股份有限公司 北京 100038
文獻(xiàn)資源數(shù)據(jù)庫(kù)的個(gè)性化服務(wù)探析
□高昆栓/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
/ 北京萬方數(shù)據(jù)股份有限公司 北京 100038
文章從文獻(xiàn)數(shù)據(jù)庫(kù)及個(gè)性化定義出發(fā),論述了數(shù)據(jù)庫(kù)個(gè)性化服務(wù)的興起和發(fā)展,以及文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)開展個(gè)性化服務(wù)的意義,歸納了文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)獲取用戶個(gè)性化需求的方法及服務(wù)模式,總結(jié)了文獻(xiàn)數(shù)據(jù)庫(kù)與個(gè)性化服務(wù)的未來發(fā)展方向。
文獻(xiàn)數(shù)據(jù)庫(kù),個(gè)性化服務(wù),信息推送,定制服務(wù)
數(shù)據(jù)庫(kù)簡(jiǎn)單地說就是一組(某種)海量信息數(shù)據(jù)的集合。文獻(xiàn)數(shù)據(jù)庫(kù)就是指以包含文獻(xiàn)信息的海量數(shù)據(jù)集合,并能通過多種檢索手段提取出其中用戶所需文獻(xiàn)信息的倉(cāng)庫(kù)。文獻(xiàn)信息數(shù)據(jù)庫(kù)個(gè)性化服務(wù)就是數(shù)據(jù)庫(kù)系統(tǒng)給予用戶針對(duì)性的、點(diǎn)對(duì)點(diǎn)的信息服務(wù)。數(shù)據(jù)庫(kù)開發(fā)者利用多種信息技術(shù):數(shù)據(jù)挖掘、智能搜索、智能代理、信息過濾、數(shù)據(jù)推送等手段,在文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)中根據(jù)用戶的興趣、愛好、習(xí)慣、個(gè)性需求或者用戶自己設(shè)定的信息內(nèi)容、范圍以及服務(wù)方式,主動(dòng)為用戶及時(shí)提供或推送對(duì)應(yīng)信息。從數(shù)據(jù)庫(kù)角度看,它是一種推送或存儲(chǔ)服務(wù)、一種主動(dòng)服務(wù);從用戶的角度看它是一種需求定制、一種自主和個(gè)性化需求的實(shí)現(xiàn)。其實(shí)質(zhì)是文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)把用戶的個(gè)性定制信息自動(dòng)推送出去的一種智能化服務(wù)。具體地講,文獻(xiàn)數(shù)據(jù)庫(kù)利用其信息自動(dòng)化技術(shù)把用戶使用該數(shù)據(jù)庫(kù)的行為特點(diǎn),包括用戶名稱、登錄地點(diǎn)、網(wǎng)址、使用的檢索詞以及頻率、學(xué)科內(nèi)容、范圍等自動(dòng)跟蹤并記錄下來,把數(shù)據(jù)庫(kù)中的信息進(jìn)行分類和智能過濾,有選擇地及時(shí)保存或推送到用戶在該數(shù)據(jù)庫(kù)系統(tǒng)內(nèi)建立的個(gè)人門戶中或個(gè)人空間,包括用戶的網(wǎng)站、個(gè)性化主頁(yè)及用戶郵箱等。
自上世紀(jì)60年代因特網(wǎng)誕生以來,文獻(xiàn)數(shù)據(jù)庫(kù)個(gè)性化服務(wù)發(fā)展速度迅猛異常。短短數(shù)年間,世界進(jìn)入網(wǎng)絡(luò)時(shí)代,人們的信息交流突破了時(shí)空的限制,在獲取信息速度快的同時(shí),也出現(xiàn)了信息量的爆炸性膨脹。不要說在浩瀚的因特網(wǎng)中查找需要的信息,就是在專業(yè)化的數(shù)據(jù)庫(kù)中查找需要的科研論文、科學(xué)數(shù)據(jù),同樣出現(xiàn)信息選擇困難。傳統(tǒng)的“輸入——檢索——選擇”的大眾化服務(wù)模式,已經(jīng)無法滿足用戶專指的個(gè)性化需求。盡管各種信息檢索技術(shù)的日益成熟和優(yōu)化,在不斷地提高用戶檢索信息的專指度,然而,所得到的不一定是用戶心理預(yù)期的個(gè)性化的信息。面對(duì)海量信息而卻難以高效率選擇自己個(gè)性化的信息,成為人們信息獲取的主要矛盾,人們選擇信息比獲取信息更加困難。此時(shí),“用戶迫切需要一種能夠根據(jù)用戶的特點(diǎn)自動(dòng)組織和調(diào)整信息的服務(wù)模式”[1],個(gè)性化服務(wù)開始萌芽,之后,個(gè)性化的服務(wù)被信息需求者所強(qiáng)烈呼喚和期待,個(gè)性化的信息服務(wù)越來越被人們提上了“議事日程”。
1995年,美國(guó)率先發(fā)表了研究個(gè)性化服務(wù)的論文;1999年,在美國(guó)圖書館界與信息技術(shù)聯(lián)合會(huì)(LITA)10位著名的數(shù)字圖書館專家在研討會(huì)上,把個(gè)性化定制服務(wù)列為數(shù)字圖書館發(fā)展的7大趨勢(shì)之首,提供資金支持個(gè)性化服務(wù)研究,并出版?zhèn)€性化服務(wù)???;同年4月,美國(guó)成立了專門的研究機(jī)構(gòu)和個(gè)性化服務(wù)協(xié)會(huì);繼之,美國(guó)各大型網(wǎng)站、電子出版商、大學(xué)圖書館及研究機(jī)構(gòu)推出了以“My Library系統(tǒng)”為代表的個(gè)性化服務(wù),較早的有Yahoo!、CNN、康奈爾大學(xué)圖書館、北卡羅來納州立大學(xué)圖書館、華盛頓大學(xué)圖書館等。
與美國(guó)比較,我國(guó)個(gè)性化服務(wù)的探索和研究起步較晚,1999年“中國(guó)數(shù)字圖書館示范系統(tǒng)”項(xiàng)目中提到了數(shù)字圖書館的個(gè)性化服務(wù)問題;2000年僅有2篇相關(guān)內(nèi)容的文章發(fā)表,及至2005年,360網(wǎng)站、中國(guó)國(guó)家科學(xué)圖書館、浙江大學(xué)圖書館、廈門大學(xué)圖書館等才相繼開展了“我的圖書館”、“MyLibrary@ZJU”、“個(gè)人定制”的個(gè)性化服務(wù),國(guó)內(nèi)的萬方醫(yī)學(xué)網(wǎng)(Wanfang med online)的“個(gè)人館”、“機(jī)構(gòu)館”、“作者空間”、“機(jī)構(gòu)空間”等,在數(shù)據(jù)庫(kù)的個(gè)性化服務(wù)方面也進(jìn)行了探討。
隨著個(gè)性化服務(wù)技術(shù)日趨成熟,以及個(gè)性化服務(wù)在廣大用戶中受到青睞,文獻(xiàn)數(shù)據(jù)庫(kù)開發(fā)商也把個(gè)性化服務(wù)技術(shù)集成運(yùn)用到數(shù)據(jù)庫(kù)系統(tǒng)中,為文獻(xiàn)數(shù)據(jù)庫(kù)贏得了又一次重大商機(jī)??梢哉f,文獻(xiàn)數(shù)據(jù)庫(kù)個(gè)性化服務(wù),實(shí)際就是因特網(wǎng)及各網(wǎng)站的個(gè)性化服務(wù)功能在文獻(xiàn)數(shù)據(jù)庫(kù)中的實(shí)現(xiàn),也是個(gè)性化服務(wù)在文獻(xiàn)數(shù)據(jù)庫(kù)中的移植。
傳統(tǒng)的文獻(xiàn)資源數(shù)據(jù)庫(kù)服務(wù),都是由用戶輸入檢索詞,然后獲得檢索信息,這種被動(dòng)式的服務(wù),需要耗費(fèi)用戶的大量時(shí)間,服務(wù)效率低下。而個(gè)性化服務(wù)則由于數(shù)據(jù)庫(kù)系統(tǒng)能根據(jù)用戶興趣、愛好或個(gè)人的定制,及時(shí)主動(dòng)地向用戶推送或存儲(chǔ)讀者需要的信息,這是數(shù)據(jù)庫(kù)服務(wù)由被動(dòng)向主動(dòng)轉(zhuǎn)變的一個(gè)標(biāo)志。由于其能及時(shí)推送和存儲(chǔ)用戶所定制的專指性信息,滿足了用戶的個(gè)性化需求,實(shí)現(xiàn)了再次檢索和瀏覽的便利,是數(shù)據(jù)庫(kù)以數(shù)據(jù)為中心向以用戶需求為中心轉(zhuǎn)變的根本性變化,是服務(wù)理念的升華。同時(shí),也提高了用戶獲取信息的時(shí)效性,提高了數(shù)據(jù)庫(kù)的使用效益。
數(shù)據(jù)庫(kù)出現(xiàn)以來,各個(gè)數(shù)據(jù)庫(kù)商為了獲得最大商機(jī),一直在不斷完善數(shù)據(jù)庫(kù)的功能,以便能吸引眾多的用戶。但是,數(shù)據(jù)庫(kù)功能的改善多出現(xiàn)在檢索途徑、收錄內(nèi)容、結(jié)果分析、相關(guān)性鏈接,以及在收錄時(shí)間上更大地延長(zhǎng)回溯時(shí)間。然而,在服務(wù)功能上卻始終未見突破,個(gè)性化服務(wù)的出現(xiàn),為數(shù)據(jù)庫(kù)的功能的完善帶來耳目一新的感覺[4],為數(shù)據(jù)庫(kù)添加了附加值,增加了用戶對(duì)數(shù)據(jù)庫(kù)依附性。所以,主動(dòng)地、智能化地為用戶提供個(gè)性化服務(wù)是數(shù)據(jù)庫(kù)服務(wù)功能的一個(gè)重大的擴(kuò)展和突破。
自從數(shù)據(jù)庫(kù)出現(xiàn)以來,圍繞如何購(gòu)買一個(gè)具有權(quán)威性、學(xué)科覆蓋面廣、針對(duì)性強(qiáng)、更新速度快、檢索功能強(qiáng)大的文獻(xiàn)數(shù)據(jù)庫(kù),是每個(gè)圖書館、情報(bào)所、企事業(yè)單位以及所有為讀者提供文獻(xiàn)服務(wù)單位的期望。為此,在圖書情報(bào)學(xué)術(shù)研究中,數(shù)據(jù)庫(kù)評(píng)價(jià)成為一項(xiàng)重要內(nèi)容,為數(shù)據(jù)庫(kù)的購(gòu)買提出了理論上的參考標(biāo)準(zhǔn)。不同的研究者從各自不同的角度出發(fā),提出評(píng)價(jià)文獻(xiàn)數(shù)據(jù)庫(kù)的各項(xiàng)指標(biāo),主要包括從內(nèi)容質(zhì)量、權(quán)威性、覆蓋面和收錄時(shí)間四個(gè)方面進(jìn)行評(píng)價(jià),還有的研究者對(duì)上述評(píng)價(jià)的內(nèi)容進(jìn)行了補(bǔ)充,提出還應(yīng)從數(shù)據(jù)庫(kù)的檢索系統(tǒng)、數(shù)據(jù)庫(kù)的使用、數(shù)據(jù)庫(kù)的性價(jià)比、數(shù)據(jù)庫(kù)的服務(wù)等這些指標(biāo)來評(píng)價(jià),也還有的文獻(xiàn)作者通過對(duì)評(píng)價(jià)數(shù)據(jù)庫(kù)研究論文的調(diào)查,特別補(bǔ)充了數(shù)據(jù)庫(kù)使用上“并發(fā)用戶數(shù)”和“用戶不活動(dòng)時(shí)限”兩個(gè)指標(biāo)[3]。然而,隨著數(shù)據(jù)庫(kù)的不斷發(fā)展,對(duì)數(shù)據(jù)庫(kù)評(píng)價(jià)的研究也在不斷地深化,其評(píng)價(jià)的指標(biāo)越來越完善。然而,從目前評(píng)價(jià)體系來看,在服務(wù)評(píng)價(jià)方面尚缺乏系統(tǒng)全面的指標(biāo)。所以文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)能不能為用戶提供主動(dòng)的智能化服務(wù)——也就是能不能為用戶提供個(gè)性化的服務(wù),就成了評(píng)價(jià)數(shù)據(jù)庫(kù)的一個(gè)重要的參量,也成為圖書館界選擇購(gòu)買文獻(xiàn)數(shù)據(jù)庫(kù)的一個(gè)重要依據(jù)。
文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)通過人機(jī)交互獲取用戶個(gè)性化需求,完成定制·通告·推送服務(wù)。用戶根據(jù)數(shù)據(jù)庫(kù)系統(tǒng)提供的一個(gè)交互界面,填寫自己的個(gè)性資料,包括用戶的興趣愛好、專業(yè)特長(zhǎng)等,或系統(tǒng)給用戶列出可供選擇的一些表單,用戶根據(jù)自己的愛好、興趣、特長(zhǎng),選定自己需要的內(nèi)容,成為個(gè)性化定制。支持這個(gè)界面的背后資源就是數(shù)據(jù)庫(kù)的全部信息數(shù)據(jù)。在用戶自己的定制中,諸如我的圖書館、My library、我的圖書、我的書架、我的訂閱、我的頻道等,建立起用戶個(gè)人檔案。數(shù)據(jù)庫(kù)系統(tǒng)根據(jù)用戶的個(gè)人檔案資料,采用智能挖掘、知識(shí)發(fā)現(xiàn)、知識(shí)分析和知識(shí)組織技術(shù),把與用戶相匹配的信息或數(shù)據(jù)組織起來,進(jìn)行篩選、分類擇優(yōu),采用推送技術(shù)——以通告、郵件、專門的軟件方式或閱讀器把用戶需要的信息傳遞推送給用戶。這種方法和模式簡(jiǎn)單方便,可為用戶提供真實(shí)、準(zhǔn)確的信息,但主動(dòng)性差。
文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)通過用戶的訪問記錄,跟蹤挖掘用戶信息需求,完成存儲(chǔ)·檢索·瀏覽服務(wù)。數(shù)據(jù)庫(kù)系統(tǒng)通過跟蹤用戶登錄數(shù)據(jù)庫(kù)的行為習(xí)慣、查詢數(shù)據(jù)庫(kù)的學(xué)科類別、提交的關(guān)鍵詞、檢索策略等,進(jìn)行訪問跟蹤,搜尋訪問印記,存儲(chǔ)檢索歷史等。通過智能挖掘、知識(shí)過濾、知識(shí)發(fā)現(xiàn)、智能分析等技術(shù),提取用戶信息存入數(shù)據(jù)庫(kù)系統(tǒng),再把數(shù)據(jù)庫(kù)中與用戶(同類用戶)相匹配的信息及時(shí)存儲(chǔ)在文獻(xiàn)系統(tǒng)中,以便用戶隨時(shí)點(diǎn)擊瀏覽和下次檢索使用,也可主動(dòng)推送與存儲(chǔ)匹配的信息。此種方法和模式主動(dòng)及時(shí),但涉嫌侵犯用戶個(gè)人隱私。
文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)通過用戶門戶建立,可滿足用戶全方位和聚類的專業(yè)化信息需求,是文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)個(gè)性化集成服務(wù)的體現(xiàn)。
門戶技術(shù)實(shí)際是人機(jī)界面技術(shù)的一支,可包容目前所有的個(gè)性化服務(wù)的內(nèi)容與技術(shù),在數(shù)據(jù)庫(kù)系統(tǒng)內(nèi)建立的門戶中,用戶可獲得較高的智能化服務(wù),因?yàn)殚T戶技術(shù)具有自主性和可擴(kuò)展性,門戶涉及的領(lǐng)域較廣,通過門戶可以自主設(shè)置界面功能和結(jié)構(gòu),可以訪問數(shù)據(jù)庫(kù)以外不同結(jié)構(gòu)和內(nèi)容的信息和數(shù)據(jù)。所以在系統(tǒng)門戶內(nèi),通過智能化技術(shù)能為用戶提供專業(yè)的聚類信息的垂直門戶服務(wù)是文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)個(gè)性化服務(wù)的深化。
由于查詢數(shù)據(jù)庫(kù)的用戶一般都對(duì)自己的信息需求有明確的專指性,所以,數(shù)據(jù)庫(kù)系統(tǒng)通過門戶技術(shù)在為用戶建立起一個(gè)全面提供個(gè)性化服務(wù)的人機(jī)界面時(shí),要為用戶提供“垂直門戶服務(wù)”。要使數(shù)據(jù)庫(kù)系統(tǒng)致力于某一特定領(lǐng)域內(nèi)信息的全面和內(nèi)容的深入搜索與算法分析,達(dá)到為用戶提供專業(yè)、具體、深入的縱向服務(wù),這才是目前數(shù)據(jù)庫(kù)個(gè)性化服務(wù)的較高水平。這就要求數(shù)據(jù)庫(kù)的開發(fā)者能有更寬廣的視角,不僅要為用戶提供自己系統(tǒng)內(nèi)的個(gè)性化信息,還能著眼于因特網(wǎng)上的個(gè)性化信息。
表1 國(guó)內(nèi)外幾個(gè)著名文獻(xiàn)數(shù)據(jù)庫(kù)個(gè)性化服務(wù)模式表
隨著信息化時(shí)代的到來,人們?cè)絹碓秸宫F(xiàn)出自主性和個(gè)性化的一面。人們不僅在社會(huì)生活、文化生活方面突出自身的個(gè)性化色彩,同時(shí)也在信息需求上,努力展現(xiàn)自己的個(gè)性需求。更為重要的是,在從事科學(xué)研究的人群中,個(gè)性化的研究是突出個(gè)人研究成就的必然途徑,個(gè)性化越突出,成果也就會(huì)更突出,所以數(shù)據(jù)庫(kù)的個(gè)性化服務(wù)就必然成為用戶所期待的重要功能[5]。未來數(shù)據(jù)庫(kù)能不能順應(yīng)信息時(shí)代發(fā)展的要求,能不能為用戶所青睞,很大程度上在于數(shù)據(jù)庫(kù)系統(tǒng)能否為用戶提供全方位的個(gè)性化服務(wù),個(gè)性化服務(wù)將成為數(shù)據(jù)庫(kù)建設(shè)優(yōu)化與否的主要方面,提供個(gè)性化服務(wù)是文獻(xiàn)數(shù)據(jù)庫(kù)未來發(fā)展的必然趨勢(shì)。
數(shù)據(jù)庫(kù)的個(gè)性化服務(wù)不僅是數(shù)據(jù)庫(kù)未來發(fā)展趨勢(shì),而且個(gè)性化在其種類上將進(jìn)一步拓展,在服務(wù)功能上將進(jìn)一步改進(jìn),在操作上將進(jìn)一步智能化、人性化。諸如數(shù)據(jù)庫(kù)系統(tǒng)在用戶參數(shù)設(shè)置、用戶設(shè)置分享、鏈接賬戶設(shè)置、鏈接顯示設(shè)置等方面,將更加滿足用戶的個(gè)性化的心理需求;在檢索組配、智能鏈接、知識(shí)篩選上更加符合用戶心理期待;文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)還可通過提供過濾器和外部鏈接服務(wù),實(shí)現(xiàn)用戶跨系統(tǒng)訪問,再增加檢準(zhǔn)設(shè)置,在文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)的門戶功能上就更加具備了廣度和深度。用戶在一個(gè)文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)中,所獲得的個(gè)性化信息的范圍在拓寬的同時(shí),個(gè)性化的專業(yè)信息也更加精準(zhǔn)。
通過對(duì)中外文獻(xiàn)數(shù)據(jù)庫(kù)的調(diào)查,大多數(shù)數(shù)據(jù)庫(kù)都開辟了個(gè)性化服務(wù),只是服務(wù)種類不同、功能強(qiáng)弱各異,無論如何都對(duì)數(shù)據(jù)庫(kù)的利用起到了促進(jìn)作用。然而這種優(yōu)化數(shù)據(jù)庫(kù)利用的舉措,在圖書館員和用戶當(dāng)中的認(rèn)可度還處于低位。鑒于此,一是要加大對(duì)文獻(xiàn)數(shù)據(jù)庫(kù)個(gè)性化服務(wù)功能的宣傳,使之充分認(rèn)識(shí)個(gè)性化服務(wù)的意義和價(jià)值;二是要加強(qiáng)對(duì)文獻(xiàn)數(shù)據(jù)庫(kù)的培訓(xùn),既要培訓(xùn)館員,更要培訓(xùn)用戶,達(dá)到館員和用戶在利用數(shù)據(jù)庫(kù)時(shí)以個(gè)性化功能為首要選擇,如此,數(shù)據(jù)庫(kù)的效益才能最大限度地發(fā)揮出來。
[1]段其憲,等.Internet個(gè)性化服務(wù)簡(jiǎn)介[J].情報(bào)科學(xué),2002(12).
[2]廖鳳,周靜怡.國(guó)內(nèi)外文獻(xiàn)數(shù)據(jù)庫(kù)個(gè)性化服務(wù)研究[J].2010,54(13):67-70,146.
[3]趙春旻.并發(fā)用戶數(shù):一個(gè)評(píng)價(jià)和使用時(shí)間的一個(gè)重要參量[J].圖書館論壇,2007,(1).
[4]樊國(guó)萍.我國(guó)個(gè)性化服務(wù)研究綜述[J].新世紀(jì)圖書館,2005(5).
[5]杜文巒.數(shù)字圖書館網(wǎng)絡(luò)個(gè)性化定制服務(wù)現(xiàn)狀分析[J].情報(bào)資料工作,2003(1).
On Personalized Service Documentation Resources Database
Gao kunshuan / Institute of Scientific and Technical Information of China, Beijing, 100038
Beginning with the definition of literature databases and personalization, this article discusses the rise and development of personalized service database, and the importance of personalized service of database system. It also summarizes how database system gets the personalized needs of users and its service mode, and sums up the future development direction of literature database and personalized service.
Literature database, Personalized service, Information notification, Custom service
2013-06-26)
10.3772/j.issn.1673—2286.2013.10.014
高昆栓(1964- ),中國(guó)科技信息研究所副研究館員,萬方數(shù)據(jù)股份有限公司客戶服務(wù)中心主任,研究方向:文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)、數(shù)字圖書館資源開發(fā)與市場(chǎng)銷售。E-mail: gaoks@wanfangdata.com.cn