曹璘琳
摘 要:數(shù)字策展(Digital Curation)是大數(shù)據(jù)時(shí)代下圖書館領(lǐng)域的研究熱點(diǎn)。文章介紹了數(shù)字策展概念的內(nèi)涵,通過實(shí)例闡述了數(shù)字策展服務(wù)的主要方式和內(nèi)容,最后從圖書館的角度考察了數(shù)字策展信息服務(wù)的具體內(nèi)容。
關(guān)鍵詞:大數(shù)據(jù);數(shù)字策展;圖書館;信息服務(wù)
過去,圖書館是針對(duì)非特定人群進(jìn)行信息服務(wù),如今在大數(shù)據(jù)的時(shí)代背景下,圖書館基于使用者的關(guān)注內(nèi)容、個(gè)人喜好等,能夠提供個(gè)性化信息服務(wù)。數(shù)字策展(Digital Curation)在許多方面影響著我們的生活。
進(jìn)入2010年以來,最受大眾矚目的詞之一就是“大數(shù)據(jù)(Big Date)”。無論是企業(yè)、公共機(jī)構(gòu),還是健康、醫(yī)療、廣播、教育等社會(huì)領(lǐng)域,大數(shù)據(jù)的實(shí)用性和價(jià)值均受到廣泛關(guān)注。隨著信息技術(shù)(IT)的持續(xù)發(fā)展、智能手機(jī)的普及、物聯(lián)網(wǎng)(IoT)浪潮的到來,大數(shù)據(jù)的關(guān)注度進(jìn)一步提高。
對(duì)于大數(shù)據(jù)尚未有一個(gè)公認(rèn)的定義,不同的定義基本是從大數(shù)據(jù)的特征出發(fā),通過這些特征的闡述和歸納試圖給出其定義。在這些定義中,比較有代表性的是3V定義,即認(rèn)為大數(shù)據(jù)需滿足3個(gè)特點(diǎn):規(guī)模性(volume)、多樣性(variety)和高速性(velocity)[1]。大數(shù)據(jù)作為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的總和,其種類繁多、數(shù)量龐大,有文檔、圖像、音樂、視頻等各種數(shù)據(jù)類型。在快速增長(zhǎng)的大數(shù)據(jù)環(huán)境下,人們?cè)絹碓诫y直接獲取自己想要的信息,為使用戶在海量數(shù)據(jù)中快捷、簡(jiǎn)便搜索到喜愛和滿意的信息,數(shù)字策展信息服務(wù)顯得非常必要。
1 數(shù)字策展(Digital Curation)的含義
17世紀(jì)中葉,“Curation”一詞被引入博物館學(xué),當(dāng)時(shí)出現(xiàn)了“the Curator of the Royal Society”類似說法,其中“Curator”意為“對(duì)于博物館、藝術(shù)館、圖書館或類似機(jī)構(gòu)的主要負(fù)責(zé)人的正式稱呼”,“館長(zhǎng)”。20世紀(jì)以來,隨著對(duì)博物館藏品相關(guān)知識(shí)發(fā)掘和傳播的重視,學(xué)界產(chǎn)生了“一流的Curator是一個(gè)學(xué)者,也是一個(gè)老師,更是一個(gè)向外界展示的窗口”的觀點(diǎn)。牛津英語詞典在1993年的修訂版中增加了“管理者對(duì)一系列保存或展出藏品的監(jiān)管(Supervision)”這種釋義。Dallas將“Curation”和“Curator”的含義歸納為兩個(gè)方面:其一,取“領(lǐng)域?qū)<摇焙汀梆^長(zhǎng)”之意;其二,取“展覽策劃人”也即“策展人”之意,“根據(jù)館藏或某種需求確立主題、遴選展品、設(shè)計(jì)展覽效果、完成展覽制作和與之相配套的學(xué)術(shù)研究、宣傳出版等”。 下面列舉幾個(gè)國(guó)內(nèi)外具有代表性的觀點(diǎn)。
Harvey(2010)指出,為了實(shí)現(xiàn)數(shù)據(jù)的再現(xiàn)、再利用和增值,從數(shù)據(jù)產(chǎn)生之初到其不再有用,數(shù)字策展涉及對(duì)學(xué)術(shù)科研、行政管理和/或符合個(gè)人興趣數(shù)據(jù)的主動(dòng)管理,用以確保數(shù)據(jù)長(zhǎng)期的易用性、保存、可信性和完整性。數(shù)字策展比數(shù)字歸檔和數(shù)字保存的外延更廣。它處理數(shù)據(jù)全生命周期全程的所有環(huán)節(jié)。通過制定數(shù)據(jù)采集的標(biāo)準(zhǔn),進(jìn)而產(chǎn)生“Curation-ready”(數(shù)據(jù)處于能夠確保其在未來維護(hù)和利用的最佳狀態(tài))的數(shù)據(jù),數(shù)字策展開始于數(shù)據(jù)產(chǎn)生之前,并強(qiáng)調(diào)通過附加元數(shù)據(jù)或標(biāo)注的方式促使數(shù)據(jù)集增值和再利用。
維基百科(2013)[2]中寫到,數(shù)字策展是對(duì)數(shù)字資產(chǎn)的選擇、保存、維護(hù)、收集和歸檔。為了當(dāng)前和未來之用,數(shù)字策展建立和維護(hù)數(shù)字?jǐn)?shù)據(jù)倉(cāng)儲(chǔ),并促使其增值。這種活動(dòng)通常需要檔案學(xué)者、圖書館學(xué)者、科學(xué)家、歷史學(xué)家和其他學(xué)者的通力合作。企業(yè)在運(yùn)營(yíng)和戰(zhàn)略環(huán)節(jié)中利用數(shù)字策展來提高信息和數(shù)據(jù)的質(zhì)量。成功的數(shù)字策展能夠延緩數(shù)字老化,能夠保證用戶對(duì)信息的永久存取。以往“Curation”一詞通常用于博物館和圖書館專家之間,現(xiàn)在它已經(jīng)被應(yīng)用到數(shù)字影像、網(wǎng)絡(luò)鏈接和視頻文件等社交媒體的保存之中。
根據(jù)DCC(Digital Curation Center, 2014),數(shù)字策展包含對(duì)數(shù)字科研數(shù)據(jù)整個(gè)生命周期的維護(hù)和保存,并促進(jìn)其增值。對(duì)科研數(shù)據(jù)的主動(dòng)管理可以減輕對(duì)長(zhǎng)期研究?jī)r(jià)值的威脅并減緩數(shù)字老化的進(jìn)程,還可以實(shí)現(xiàn)更大范圍內(nèi)的整個(gè)英國(guó)科學(xué)界對(duì)可信數(shù)字倉(cāng)儲(chǔ)中數(shù)據(jù)的共享,同時(shí)減少生產(chǎn)科研數(shù)據(jù)的重復(fù)勞動(dòng)。通過使現(xiàn)有數(shù)據(jù)可以被未來更高水平研究獲取,數(shù)字策展提升了現(xiàn)有數(shù)據(jù)的長(zhǎng)期價(jià)值。
2 數(shù)字策展(Digital Curation)服務(wù)
數(shù)字策展(Digital Curation)服務(wù)依據(jù)不同參與者進(jìn)行信息過濾,分為“數(shù)據(jù)策展(Data Curation)”和“社會(huì)化策展(Social Curation)”兩個(gè)種類。數(shù)據(jù)策展是服務(wù)提供方運(yùn)用信息或產(chǎn)品屬性、使用者和顧客個(gè)人喜好等,提供相關(guān)服務(wù)。亞馬遜(Amazon)網(wǎng)站和音樂推薦潘多拉(Pandora)網(wǎng)絡(luò)電臺(tái)就是數(shù)據(jù)策展服務(wù)的典型成功事例。
線上書城亞馬遜網(wǎng)站將所有顧客的購(gòu)買信息存儲(chǔ)到數(shù)據(jù)庫(kù),并對(duì)存儲(chǔ)記錄進(jìn)行分析研究,從而掌握顧客的消費(fèi)趨向和個(gè)人喜好。也就是說,通過分析顧客喜好,自動(dòng)提供與分析結(jié)果一致的個(gè)性化產(chǎn)品。美國(guó)最大的個(gè)性化網(wǎng)絡(luò)電臺(tái)潘多拉創(chuàng)立了音樂基因組計(jì)劃,并在此基礎(chǔ)上發(fā)展出音樂自動(dòng)推薦系統(tǒng)及網(wǎng)絡(luò)電臺(tái)服務(wù)。如果用戶輸入歌曲或歌手的名字,潘多拉的音樂信息數(shù)據(jù)庫(kù)會(huì)將音源分類為400個(gè)不同屬性,幫助確定聽眾偏好,做出播客推薦。用戶可以對(duì)每首推薦歌曲選擇“我喜歡”或“我不喜歡”字樣的拇指圖標(biāo),聽歌期間還可進(jìn)入亞馬遜網(wǎng)站或iTunes商城購(gòu)買歌曲和專輯。亞馬遜網(wǎng)站尤其圖書板塊是“長(zhǎng)尾(Long-tail)”商業(yè)模式的代表性成功事例,它通過文章推薦、主題分類、顧客喜好分類等多種方式,自動(dòng)推薦相關(guān)圖書產(chǎn)品,多樣化滿足各類人群需求,大幅提高銷售額。
與之相反,社會(huì)化策展中篩選、過濾產(chǎn)品的主體是消費(fèi)者。與一般數(shù)字策展的區(qū)別是消費(fèi)者或產(chǎn)品用戶可以訂閱他人過濾的產(chǎn)品信息,同時(shí)也可以與他人共享自己的產(chǎn)品內(nèi)容。拼趣(Pinterest)是社會(huì)化策展的成功事例,其以圖片為基礎(chǔ),用戶自己收集圖片并與他人分享,被稱為圖片形式的信息共享服務(wù)。拼趣采用的是瀑布流的形式展現(xiàn)圖片內(nèi)容,高效而具有吸引力,無需用戶翻頁(yè),新的圖片不斷自動(dòng)加載在頁(yè)面底端,讓用戶更樂于沉浸在探索與瀏覽當(dāng)中。