陽廣元?。ㄎ髂厦褡宕髮W(xué)圖書館 四川 成都 610041)
Web Archive研究現(xiàn)狀與熱點分析*
陽廣元(西南民族大學(xué)圖書館 四川 成都 610041)
Web Archive在2003年左右被引入我國,引起了國內(nèi)相關(guān)研究者的關(guān)注和重視。目前,國內(nèi)Web Archive研究領(lǐng)域所涉及的研究內(nèi)容主要分布在Web Archive定義、Web Archive工作流程與環(huán)節(jié)研究、國外研究成果和實踐經(jīng)驗介紹以及綜述或其他研究等方面。相關(guān)研究已取得一定成效,但仍應(yīng)加強對其概念的研究、國外最佳實踐和重要實例的分析研究以及國內(nèi)實踐研究。
Web Archive網(wǎng)絡(luò)信息資源文化遺產(chǎn)
Web Archive(也作Web Archiving,以下簡稱WA)隨著Internet Archive在1996年的建立而被提出[1],隨即在國外掀起了一股理論與實踐的研究熱潮。WA在2003年左右被引入我國,引起了國內(nèi)相關(guān)研究者的關(guān)注和重視,并產(chǎn)生了許多理論成果,同時積累了豐富的實踐經(jīng)驗。本文以中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫[2]為來源數(shù)據(jù)庫,采用的檢索式為:題名=中英文擴展(Web Archive) or題名=中英文擴展(Web Archiving)or關(guān)鍵詞=中英文擴展(Web Archive)or關(guān)鍵詞=中英文擴展(Web Archiving),時間截止到2015年3月20日,以“精確匹配”方式在所有學(xué)科專題中進行檢索,對檢索結(jié)果作匯總、去重及剔除非相關(guān)文獻(如會議通知、編輯寄語等)等處理,合并這些論文參考文獻中涉及WA研究的論文后,最終得到關(guān)于WA研究的期刊論文73篇。筆者試圖通過對這些研究文獻的梳理分析,全面厘清和把握國內(nèi)該領(lǐng)域的研究現(xiàn)狀與熱點,分析其研究特點、不足與發(fā)展對策,以促進我國該研究領(lǐng)域的進一步發(fā)展。
2.1WA定義
WA起源于國外,在引入國內(nèi)后,研究者首先應(yīng)做的是對其進行翻譯和明確界定。據(jù)筆者不完全統(tǒng)計,國內(nèi)關(guān)于WA的主要相關(guān)譯稱有Web檔案館、網(wǎng)絡(luò)信息資源保存、網(wǎng)絡(luò)信息存檔、網(wǎng)絡(luò)資源備份保存、Web檔案、網(wǎng)站典藏、網(wǎng)絡(luò)存儲、網(wǎng)頁檔案館、Web歷史等十余種??梢?,目前對這一概念的界定還不統(tǒng)一。典型的定義主要有以下幾種。
(1)楊道玲將WA譯為Web檔案館,特別強調(diào)了對Web資源(即“原生性”數(shù)字信息,除數(shù)字形式外別無其他形式)的管理:WA是指以現(xiàn)代信息技術(shù)為基礎(chǔ),利用Web采集、整理、保存和發(fā)布等技術(shù)實現(xiàn)Web資源管理,并通過網(wǎng)絡(luò)存取的超大規(guī)模、分布式數(shù)字信息系統(tǒng),這種新型Web資源管理模式將采集的Web資源按事先制定的標(biāo)準(zhǔn)和規(guī)范進行統(tǒng)一的管理與整合,從而改善目前網(wǎng)絡(luò)信息資源混亂無序的狀態(tài),便于系統(tǒng)永久地保存和利用Web文化遺產(chǎn),為用戶提供便利的查找路徑,提高Web資源的利用率[3]。
(2)孫敏杰等將其譯為網(wǎng)絡(luò)信息資源保存,指對目標(biāo)領(lǐng)域內(nèi)的網(wǎng)絡(luò)信息資源進行評價、采集、保存、組織、提供訪問服務(wù)的活動,其最終目標(biāo)是為用戶提供永久性的訪問服務(wù),因此除了Web 資源采集與保存外,還需對采集到的Web 資源做進一步加工和整理,將其整合到原有Web資源體系以提供Web 服務(wù),即(元數(shù)據(jù))編目工作[4]。
(3)周毅將其譯為網(wǎng)絡(luò)信息存檔,強調(diào)對網(wǎng)絡(luò)信息的歸檔、存檔或檔案化管理,指有關(guān)主體有選擇地對具有長遠保存價值的網(wǎng)絡(luò)信息進行捕獲、歸檔、存儲等檔案化管理的過程,其基本目標(biāo)是通過網(wǎng)絡(luò)信息資源的存檔,更全面真實地反映和再現(xiàn)社會活動的本來面貌,并滿足相關(guān)主體對網(wǎng)絡(luò)信息的長遠利用需求[5]。
(4)宋杰等將WA理解為一種基于Web的信息服務(wù),即每隔一定時間周期,根據(jù)服務(wù)要求從Internet中采集網(wǎng)頁并以快照方式保存,從而逐漸形成一個Web歷史網(wǎng)頁博物館,而且還要對這些網(wǎng)頁進行分類和處理以便永久保存、歷史瀏覽和檢索[6]。
(5)沈勁枝等將其譯為Web 檔案,指對互聯(lián)網(wǎng)進行備份、存檔、檢索的信息資源服務(wù),其每隔一定時間周期從互聯(lián)網(wǎng)抓取網(wǎng)頁并存儲,逐漸形成一個Web歷史網(wǎng)頁的檔案館,通常還需對抓取的網(wǎng)頁進行去重等處理工作[7]。
(6)朱天慧將其譯為網(wǎng)絡(luò)資源備份保存,指將網(wǎng)絡(luò)資源定期存檔備份并整理編目,以供公眾檢索過去的網(wǎng)站或網(wǎng)頁信息[8]。
綜合分析這些定義,筆者得出以下結(jié)論:①WA中的資源(resources)限定為“Web資源”,這些Web資源是有選擇性的、可靠的、增值性的資源,在進行WA工作前需要對某領(lǐng)域的Web資源的價值性進行有目的的評估。②WA是對Web資源整個生命周期的管理。③WA是一種基于Web的信息服務(wù)。④WA工作的目的是永久保存Web資源,以為用戶提供訪問服務(wù),并確保其當(dāng)前可用和未來的價值增值。⑤WA的主要工作包括對Web資源的評價、選擇、采集、分類、存儲、描述、元數(shù)據(jù)表示、維護和發(fā)布等系列活動。
2.2WA工作流程與環(huán)節(jié)研究
2.2.1選擇與采集
呂淑萍和朱兵概述了中國國家圖書館“網(wǎng)絡(luò)信息資源采集與保存實驗項目”(WICP)之子項目——“專題存檔”中資源采選的原則及其實踐,指出采選原則為:針對性、可靠性、權(quán)威性、系統(tǒng)性、實用性、全面性和時效性;具體方法和流程為:收集對象的發(fā)現(xiàn)、收集對象的調(diào)研、收集對象的評價、收集條件的設(shè)置、收集數(shù)據(jù)的校驗和整合;面臨的問題有收集對象的發(fā)現(xiàn)、跟蹤與調(diào)整、收集對象的評價和網(wǎng)頁的選擇[9]。仇壯麗和許冬玲通過對國內(nèi)外WA項目的研究分析,指出信息內(nèi)容、信息形式、主體需求、法律法規(guī)、成本等是影響WA選擇策略的主要因素[10]。仇壯麗和楊元香深入探討了WA中網(wǎng)絡(luò)信息價值判斷對信息生產(chǎn)者、網(wǎng)絡(luò)信息服務(wù)提供商和信息用戶等的重要意義,指出基于價值的網(wǎng)絡(luò)信息篩選不僅利于幫助WA機構(gòu)科學(xué)地確定保存對象,減少管理成本,也利于消除網(wǎng)絡(luò)信息資源高效利用的障礙,以滿足社會不同用戶對網(wǎng)絡(luò)信息的需求[11]。安興茹在對澳大利亞、瑞典、法國、美國和荷蘭5國WA項目分析的基礎(chǔ)上,歸納出5種采集策略:選擇性采集、全面采集、聯(lián)合采集、專題采集和與出版者協(xié)商合作采集,其指出首先應(yīng)認識到網(wǎng)絡(luò)信息流失的重要性,解決好相關(guān)的法律問題,采用專題與多種策略相結(jié)合的方法來開展我國WA的研究與實踐[12]。劉蘭和吳振新根據(jù)采集對象、目的和實施者的不同把WA的信息采集方式歸納為5類:面向長期保存的一次采集、基于Web倉儲的二次采集、面向采集服務(wù)的訂閱性采集、需求觸發(fā)的被動采集和時間驅(qū)動的網(wǎng)絡(luò)交易采集[13]。黃紅華在全面梳理丹麥WA研究現(xiàn)狀的基礎(chǔ)上指出,丹麥對Web采集主要有3種策略:快照采集、選擇性采集和事件采集[14]。劉蘭和吳振新通過對國際WA項目和系統(tǒng)的調(diào)研,歸納出WA的采集流程包括選擇、征求所有者許可、實施采集、抽取元數(shù)據(jù)、質(zhì)量審核和網(wǎng)絡(luò)存檔六大基本步驟,識別并分析了這些步驟中存在的關(guān)鍵問題[15]。劉蘭等分別從定義、面臨的關(guān)鍵問題、特點及典型案例等4個方面全面剖析了WA的3種采集策略:選擇性采集、完整性采集和混合型采集,指出采集策略的選擇受經(jīng)濟、技術(shù)、法律、人員及圖書館自身性質(zhì)和目標(biāo)的影響,并提出圖書館應(yīng)在借鑒已有經(jīng)驗的基礎(chǔ)上,結(jié)合自身的經(jīng)濟、技術(shù)條件、所處的法律環(huán)境和長期保存目標(biāo)來選擇合理的采集策略[16]。
2.2.2編目與存檔
王暢分析了國外主要WA項目所采用的資源組織與描述方法,深入探討了多元層次的組織與描述方法,指出該方法除提供整體及深入的描述內(nèi)容外,還有最高層整體網(wǎng)站的描述,以及對于網(wǎng)站來源的歷史性描述與整體網(wǎng)站內(nèi)容結(jié)構(gòu)關(guān)系的概述,更可作為網(wǎng)絡(luò)信息資源長期保存的管理基礎(chǔ)[17]。宋杰等針對常規(guī)存儲方式在支持增量存儲等方面的不足,提出了一種基于頁面Block的WA存儲方法,該方法便于WA的管理,對基于WA的查詢、搜索、知識發(fā)現(xiàn)和數(shù)據(jù)挖掘應(yīng)用提供了豐富的數(shù)據(jù)資源[6]。林穎等以實踐項目為例,從保存背景、策略應(yīng)用和實現(xiàn)特點3個方面全面剖析了WA中的4種典型存檔策略:基于外部索引的壓縮存檔、基于多文件服務(wù)的存檔、基于格式遷移的存檔、基于特征抽取的存檔[18]。孫敏杰等概述了WA編目研究的發(fā)展現(xiàn)狀,歸納出常見的3種編目方法:繼承傳統(tǒng)編目方法、基于Web2.0標(biāo)簽技術(shù)的編目方法和基于大規(guī)模WA自動編目方法[4]。
2.2.3檢索與應(yīng)用
孫志茹等在剖析以Wayback為訪問工具的WA項目的基礎(chǔ)上,歸納出5種典型的索引策略:基于本地訪問的索引策略、與訪問系統(tǒng)分離的索引策略、基于負載均衡的索引策略、基于分布資源的索引策略和基于異構(gòu)資源的索引策略,總結(jié)出這些策略的特征、優(yōu)缺點和適用集合[19]。吳振新等以現(xiàn)有WA項目為例,歸納出WA檢索策略主要有基于B/C的分布式檢索策略、可多維度擴展的分布式檢索策略、負載均衡的檢索策略和有效利用緩存的分布式檢索策略4種,指出如何利用新技術(shù)來提高WA搜索引擎的存儲性能、系統(tǒng)性能、檢索性能,提高檢索結(jié)果的準(zhǔn)確率和全面性以實現(xiàn)高效檢索,以及進行相應(yīng)的數(shù)據(jù)挖掘以用于學(xué)術(shù)研究、追蹤動態(tài)等將既是WA的長遠發(fā)展問題,又是未來WA檢索技術(shù)發(fā)展的重要關(guān)注點[20]。吳振新等人從網(wǎng)站重現(xiàn)、Web自身研究和基于數(shù)據(jù)挖掘的WA資源應(yīng)用3個方面剖析了WA資源應(yīng)用的研究現(xiàn)狀,以Web Library為例重點分析了基于數(shù)據(jù)挖掘的WA資源應(yīng)用,指出隨著各種新出現(xiàn)的內(nèi)容數(shù)據(jù)形式成為WA的新資源,針對不同數(shù)據(jù)源的融合和挖掘技術(shù)將是未來WA資源應(yīng)用研究領(lǐng)域的新挑戰(zhàn)[21]。
2.3國外研究成果和實踐經(jīng)驗介紹
2.3.1研究現(xiàn)狀
李華等在全面剖析國外WA的發(fā)展歷程和發(fā)展趨勢的基礎(chǔ)上提出,國內(nèi)應(yīng)充分借鑒國外WA發(fā)展的相關(guān)經(jīng)驗,把握WA的發(fā)展趨勢,重視WA的研究與實踐,重點做好WA保存的國家策略的制定、重視國家圖書館的保存作用、加強合作、建立健全有利于WA的法律環(huán)境、加強標(biāo)準(zhǔn)化和規(guī)范化研究及加強技術(shù)策略研究與保存系統(tǒng)的研發(fā)6方面的工作[22]。王芳和史海燕從Web采集、WA的保存、WA的訪問與使用3方面梳理了國外WA的研究與發(fā)展現(xiàn)狀,指出國內(nèi)WA的研究與實踐應(yīng)重點關(guān)注法律與倫理、新Web應(yīng)用內(nèi)容的歸檔保存、存檔內(nèi)容的長期保存和存檔內(nèi)容的多元化4方面的問題[23]。劉蘭從WA的內(nèi)涵、意義、責(zé)任和歷史進程4方面對國外WA的研究現(xiàn)狀進行梳理,指出WA的未來發(fā)展趨勢為:動態(tài)交互式網(wǎng)站的采集和長期保存將被關(guān)注,移動互聯(lián)網(wǎng)的存檔將引起學(xué)界和業(yè)界的研究與探索,存檔資源價值的評估和挖掘?qū)⒃絹碓奖恢匾昜24]。朱蓮花和劉春燕以韓國國家知識門戶網(wǎng)站為例,全面分析了韓國的WA實踐現(xiàn)狀,指出我國應(yīng)從制定WA管理的國家戰(zhàn)略、加強各機構(gòu)的合作和建立健全有利于WA管理的法律環(huán)境等方面推進我國WA管理事業(yè)的發(fā)展[25]。馮湘君從研究的主題、特點和未來趨勢3方面分析了國外WA的研究現(xiàn)狀,指出應(yīng)從研究主題、對策、工作流程與環(huán)節(jié)、新環(huán)境下的WA問題和學(xué)術(shù)交流平臺的構(gòu)建5方面深化國內(nèi)WA研究[26]。黃紅華從WA的法律依據(jù)、Web的采集策略和Web內(nèi)容的獲取與服務(wù)3方面剖析了丹麥WA研究現(xiàn)狀,指出我國應(yīng)從完善法律法規(guī)的建設(shè)、注重國際交流合作和強化多主體參與等方面深化WA工作[14]。馬寧寧等以韓國國立中央圖書館OASIS項目為例,全面分析了韓國WA研究與實踐現(xiàn)狀,指出我國應(yīng)采取以下措施促進和保障WA工作:健全法律法規(guī)、完善標(biāo)準(zhǔn)規(guī)范、制定WA國家戰(zhàn)略[27]。
2.3.2WA實踐項目介紹與分析
張耀蕾從保存目標(biāo)和對象、管理和開發(fā)團隊、技術(shù)支持、工作流程、成果和服務(wù)5個方面全面剖析了哈佛大學(xué)圖書館的WAX(Web Archive Collection Service)項目,并指出其對我國高校圖書館的啟示:技術(shù)門檻降低、項目運作成熟化、精選學(xué)術(shù)性保存對象、細化資金預(yù)算和重視保護知識產(chǎn)權(quán)等[28]。向菁等從國家、聯(lián)盟和項目3個層次對國外主要WA項目及聯(lián)盟進行剖析,指出我國應(yīng)從建立權(quán)責(zé)明確的國家層面的WA責(zé)任體系、構(gòu)建良好的合作機制、完善相關(guān)法律法規(guī)和遵循國際WA統(tǒng)一標(biāo)準(zhǔn)4方面促進WA的工作[29]。閆曉創(chuàng)從基本情況、采集策略、資源存檔、資源檢索、服務(wù)提供和技術(shù)架構(gòu)6方面全面剖析了澳大利亞的PANDORA實踐項目,指出我國應(yīng)從建立WA系統(tǒng)體系、實施WA國家戰(zhàn)略、加強機構(gòu)合作、建立分布式的WA中心和健全有利的法律環(huán)境5個方面促進國內(nèi)WA的工作并加快其發(fā)展步伐[30]。馬寧寧等從法律支持、建設(shè)模式、采集方法、資源展示、資源描述、服務(wù)方式和采集流程7個方面深入剖析了歐洲18個WA項目,提出應(yīng)從合作檢索、采集與保存標(biāo)準(zhǔn)、立法和人才培養(yǎng)4方面來促進國內(nèi)WA工作[31]。安琳以LCWA和IA兩個實踐項目為例,全面闡述了國外WA實踐研究現(xiàn)狀,指出應(yīng)從技術(shù)、經(jīng)濟、法律等方面對WA予以保障[32]。周林興梳理了國外WA實踐項目,指出WA既是網(wǎng)站復(fù)原的保障,又是研究Web及相關(guān)技術(shù)發(fā)展的最有力證據(jù),并提出國內(nèi)WA研究的發(fā)展策略:明確WA保存的責(zé)任、WA保存的范圍、WA保存的政策法律及配置合理的人員等[33]。任平在深入分析歐洲WA合作項目的基礎(chǔ)上,提出我國在開展WA工作時,應(yīng)重視總體的規(guī)劃與協(xié)調(diào)、合作與交流以及宣傳工作[34]。
2.4綜述或其他研究內(nèi)容
目前,國內(nèi)WA研究中已有一些是對國內(nèi)外WA相關(guān)研究現(xiàn)狀和存在的問題的綜述研究,并在此基礎(chǔ)上,提出了國內(nèi)WA未來發(fā)展建議或策略。劉蘭等在分析WA開源軟件的基礎(chǔ)上,指出隨著開源軟件的廣泛應(yīng)用和不斷完善,不僅推動了WA的發(fā)展,也促進了開源軟件的發(fā)展,未來WA在應(yīng)用開源軟件時應(yīng)重點考慮4方面的問題:加強對開源軟件易用性的關(guān)注、厘清WA需求與其他網(wǎng)絡(luò)信息采集的區(qū)別、弄清開源軟件的使用成本和加強開源軟件的本地化支持[35]。周毅在界定WA內(nèi)涵的基礎(chǔ)上,指出檔案部門是實現(xiàn)WA的主要責(zé)任者之一,并從分層定位、信息甑別、責(zé)任歸屬和依法歸檔4個方面提出了檔案部門開展WA的原則,以及從管理創(chuàng)新、全面保障和重視特色等角度分析了實施WA的相關(guān)策略[5]。趙麗琴在概述國內(nèi)WA研究文獻分布現(xiàn)狀和國外WA實踐項目現(xiàn)狀的基礎(chǔ)上,指出應(yīng)強化對WA工作的重視、完善相關(guān)法律法規(guī)和建立上下覆蓋、職責(zé)明確的保存體系[36]。陽廣元梳理了國內(nèi)外WA的內(nèi)涵、相關(guān)研究論文、相關(guān)研究項目及崗位設(shè)置等,指出國內(nèi)應(yīng)加強以下5方面的工作:建立統(tǒng)一領(lǐng)導(dǎo)與分布式協(xié)作的模式、完善相關(guān)法律法規(guī)、加快專業(yè)人才隊伍的建設(shè)、建立資金投入的長效機制和加快WA的應(yīng)用[37]。王婷等通過對國外重點WA合作項目的調(diào)研,指出目前主要有責(zé)任高度集中、責(zé)任平等和責(zé)任高度分散3種合作機制[38]。李丹歸納出WA的合作模式有3種類型:以合作目的為標(biāo)準(zhǔn)、以主體性質(zhì)為標(biāo)準(zhǔn)和以責(zé)任機制為標(biāo)準(zhǔn),指出合作化是WA的基本政策和未來應(yīng)堅持的重要原則,提出應(yīng)明確WA的主要責(zé)任承擔(dān)主體、制定WA合作的基本戰(zhàn)略目標(biāo)、建立適合WA的科學(xué)合作體系、加強合作成員之間的溝通交流和構(gòu)筑高級別的國家管理中心等來不斷深化合作以促進WA的發(fā)展[39]。
3.1特點
(1)從研究作者群來看,國內(nèi)WA研究已逐步形成了核心作者群和核心機構(gòu)。目前已有吳振新、趙俊玲、曲云鵬、劉蘭、馬寧寧等核心作者以及中國科學(xué)院國家科學(xué)圖書館、河北大學(xué)管理學(xué)院、中國科學(xué)院文獻情報中心、中國科學(xué)院研究生院等核心機構(gòu)對該主題進行持續(xù)不斷的跟蹤研究與實踐,這在一定程度上表明我國在WA研究領(lǐng)域已初步形成了較完備的科研體系和人才隊伍,其研究已具有一定的系統(tǒng)性、全面性和深入性。
(2)從研究主題來看,國內(nèi)WA的研究日趨深入,從剛開始的引進介紹、理論與實踐研究、經(jīng)驗總結(jié)等理論型研究逐步過渡到結(jié)合本國實際需求并構(gòu)建系統(tǒng)與平臺等實踐型研究。研究初期主要是對WA內(nèi)涵、WA帶來的影響與發(fā)展機遇(如對圖書館、檔案館、學(xué)術(shù)機構(gòu)等的影響與發(fā)展機遇等)的研究,然而隨著該領(lǐng)域研究的日趨深入,研究者開始探索WA平臺的建設(shè)、工作的開展、開源軟件的本地化等更細化的問題。
(3)從研究成果的期刊源來看,在檢索到的73篇學(xué)術(shù)論文中,有62篇學(xué)術(shù)論文發(fā)表在核心期刊,其中有60篇學(xué)術(shù)論文發(fā)表在圖書情報領(lǐng)域的核心期刊,占總數(shù)的82.19%,這表明國內(nèi)業(yè)界十分重視WA,并出現(xiàn)了泛化研究趨勢。同時也表明,業(yè)界研究者十分關(guān)注國內(nèi)外WA相關(guān)的理論研究與實踐,研究程度與實踐力度不斷加深。
(4)從研究主體來看,不僅有圖書情報領(lǐng)域的研究者,而且還有其他領(lǐng)域的研究者,并取得了不錯的研究成果,如《計算機工程與科學(xué)》《軟件學(xué)報》與《數(shù)字與縮微影響》等計算機領(lǐng)域的期刊也發(fā)表了許多該主題的研究成果。
3.2研究不足及建議
盡管國內(nèi)研究者對WA領(lǐng)域的理論與實踐研究十分重視并取得了豐富的理論成果和積累了大量的實踐經(jīng)驗,但還存在一些不足:對WA的概念還沒有形成統(tǒng)一的認識和界定;大多數(shù)文獻僅從理論角度提出了關(guān)于WA工作開展的一些建議或策略,缺乏對WA實際應(yīng)用的分析和理解;大多數(shù)研究還只停留在對國外WA相關(guān)研究成果和實踐案例的分析,缺乏本地化研究應(yīng)用等。結(jié)合上文對國內(nèi)WA相關(guān)研究內(nèi)容和不足之處的探討,筆者認為未來國內(nèi)WA研究需要重點考慮以下問題。
3.2.1加強WA概念的研究
WA概念的研究需要界定WA工作的邊界和主要內(nèi)容,避免引起業(yè)界研究、理解和實踐應(yīng)用的混淆[37],因此需要對WA進行明確的界定和認識,以給出一個簡潔易懂、清晰明了的概念,用于向WA工作的決策層解釋,也用于向各機構(gòu)(如圖書館、檔案館、學(xué)術(shù)機構(gòu)、出版商等)和人員(如用戶、員工等)的宣傳,提高其對WA工作的認識和意識,推動WA實踐的深入開展。正如前文所述,國內(nèi)研究者對WA概念的界定更多地是從國外WA相關(guān)研究成果翻譯和理解而來,缺乏對這些研究成果權(quán)威性的評判,而且國內(nèi)研究者之間對WA概念的界定也缺乏統(tǒng)一的認同。因此,國內(nèi)WA研究有必要強化對WA概念的研究。
3.2.2加強國外WA最佳實踐和重要實例的分析研究
WA是一個實踐性很強的研究領(lǐng)域,更需要的是解決好“如何做”的問題,而不能只停留在理論層次的研究,因此如何構(gòu)建符合需求的平臺,采用什么價值判斷標(biāo)準(zhǔn)來篩選和采集Web資源,如何對這些Web資源進行編目,如何組織和描述這些Web資源,如何跟蹤這些Web資源的動態(tài)更新,如何長期保存這些Web資源,如何實現(xiàn)這些Web資源的檢索與共享,如何展示和利用這些Web資源等實踐性問題迫切需要WA最佳實踐的指導(dǎo),這就需要國內(nèi)WA理論研究更關(guān)注國外那些優(yōu)秀實踐項目及重要成功案例已取得的最佳實踐經(jīng)驗。另外,這里的實踐除WA工作實踐外,還包括WA教育培訓(xùn)、隊伍建設(shè)和崗位設(shè)置等。
3.2.3加強國內(nèi)WA實踐的相關(guān)研究
WA作為實踐性極強的研究領(lǐng)域,雖離不開理論的指導(dǎo),但更強調(diào)其實踐應(yīng)用效果。因此,國內(nèi)WA在理論研究的基礎(chǔ)上,應(yīng)該更多地進行WA的宣傳推廣實踐,Web資源具體篩選、評價、采集、整理、保存與應(yīng)用管理實踐,或者開展相關(guān)的教育培訓(xùn)、隊伍建設(shè)和崗位設(shè)置等實踐應(yīng)用。雖然國外在WA領(lǐng)域已取得了大量值得借鑒的優(yōu)秀實踐經(jīng)驗,但鑒于我國的具體國情和Web資源對象的差異,國內(nèi)WA實踐中所遇到的問題與挑戰(zhàn)也不盡相同,只有結(jié)合具體實踐并符合國情開展深入的實踐研究,才能真正對國內(nèi)WA實踐應(yīng)用有更強的指導(dǎo)和借鑒,也才能真正有效地促進和推動我國WA工作的開展。
[1]Internet Archive[EB/OL].[2014-11-14].https://archive.org/.
[2]中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫[EB/OL].[2015-3-21].http://epub.cnki.net/KNS/brief/result.aspx?dbprefix=CJFQ.
[3]楊道玲.中文Web檔案館建設(shè)構(gòu)想[J].圖書情報知識, 2006(2): 28-34.
[4]孫敏杰, 吳振新, 孫志茹.網(wǎng)絡(luò)信息資源保存的編目方法與系統(tǒng)研究[J].數(shù)字圖書館論壇, 2009(7):12-16.
[5]周毅.網(wǎng)絡(luò)信息存檔:檔案部門的責(zé)任及其策略[J].檔案學(xué)研究, 2010(1): 70-73.
[6]宋杰, 王大玲, 鮑玉斌, 等.基于頁面Block的Web檔案采集和存儲[J].軟件學(xué)報, 2008(2):275-290.
[7]沈勁枝,寇文波,田晨耕.基于特征定位邊界預(yù)測的Web檔案正文采集[J].現(xiàn)代圖書情報技術(shù), 2009(12): 52-56.
[8]朱天慧.中文網(wǎng)絡(luò)資源備份保存的調(diào)查與思考[J].圖書館理論與實踐, 2010(7): 19-21.
[9]呂淑萍, 朱兵.網(wǎng)絡(luò)信息資源采集內(nèi)容的甄選:國家圖書館“專題存檔”的實踐[J].國家圖書館學(xué)刊, 2004(2): 30-33.
[10]仇壯麗, 許冬玲.歸檔網(wǎng)絡(luò)信息選擇策略的影響因素研究[J].檔案學(xué)研究, 2011(3): 63-66.
[11]仇壯麗, 楊元香.歸檔網(wǎng)絡(luò)信息價值判斷之意義研究[J].圖書館學(xué)研究, 2012(4): 2-5.
[12]安興茹.歐美國家圖書館網(wǎng)絡(luò)信息保存的收集策略研究及啟示[J].圖書館雜志, 2007(9): 52-55.
[13]劉蘭, 吳振新.網(wǎng)絡(luò)存儲信息采集方式研究[J].圖書館雜志, 2009(8): 28-31.
[14]黃紅華.丹麥Web Archive研究[J].公共圖書館, 2014(3): 35-38.
[15]劉蘭, 吳振新.Web Archive信息采集流程及關(guān)鍵問題研究[J].情報理論與實踐, 2009(8): 113-117.
[16]劉蘭, 吳振新, 張智雄,等.Web Archive的采集策略研究[J].現(xiàn)代圖書情報技術(shù), 2009(1): 10-15.
[17]王暢.網(wǎng)絡(luò)信息資源保存:基于多元層次描述的構(gòu)建方法探析[J].圖書情報工作, 2010(21): 80-83.
[18]林穎, 吳振新, 張智雄.Web Archive存檔策略分析[J].現(xiàn)代圖書情報技術(shù), 2009(1):16-21.
[19]孫志茹, 吳振新, 曲云鵬.基于Wayback的索引策略研究[J].現(xiàn)代圖書情報技術(shù), 2009(4): 14-18.
[20]吳振新, 向菁.Web Archive檢索系統(tǒng)架構(gòu)分析[J].現(xiàn)代圖書情報技術(shù), 2009(1): 22-27.
[21]吳振新, 張智雄, 孫志茹.基于數(shù)據(jù)挖掘的Web Archive資源應(yīng)用分析[J].現(xiàn)代圖書情報技術(shù), 2009(1): 28-33.
[22]李華, 吳振新, 郭家義,等.Web Archive發(fā)展歷程與發(fā)展趨勢研究[J].現(xiàn)代圖書情報技術(shù), 2009(1): 2-9.
[23]王芳, 史海燕.國外Web Archive研究與實踐進展[J].中國圖書館學(xué)報, 2013(2):36-45.
[24]劉蘭.Web Archive的內(nèi)涵、意義與責(zé)任、發(fā)展進程及未來趨勢[J].圖書館建設(shè), 2014(3): 28-34.
[25]朱蓮花, 劉春燕.韓國的國家知識門戶網(wǎng)站與Web Archive現(xiàn)狀研究[J].情報理論與實踐, 2010(7):120-123.
[26]馮湘君.國外網(wǎng)絡(luò)信息存檔研究述評[J].情報資料工作, 2014 (6): 55-60.
[27]馬寧寧, 張煒, 曲云鵬.韓國網(wǎng)絡(luò)信息保存現(xiàn)狀研究與啟示:以韓國國立中央圖書館OASIS項目為例[J].情報理論與實踐, 2015(2): 141-144.
[28]張耀蕾.哈佛大學(xué)圖書館網(wǎng)絡(luò)資源保存服務(wù)項目的研究和啟示[J].圖書館建設(shè), 2015(1): 88-93.
[29]向菁, 吳振新, 司鐵英, 等.國際主要Web Archive項目介紹與評析[J].國家圖書館學(xué)刊, 2010(1): 64-68.
[30]閆曉創(chuàng).國外Web Archive項目對我國的借鑒和啟示:以澳大利亞的PANDORA項目為例[J].檔案學(xué)研究, 2012(5):79-83.
[31]馬寧寧, 曲云鵬, 謝天.歐洲主要網(wǎng)絡(luò)資源采集項目研究與啟示[J].圖書情報工作, 2013(12):10-15.
[32]安琳.國外網(wǎng)頁信息存檔項目及相關(guān)問題研究[J].圖書館建設(shè), 2009(12):107-110.
[33]周林興.Web Archive保存研究:現(xiàn)狀、意義與發(fā)展策略[J].檔案管理, 2009(5):26-28.
[34]任平.歐洲數(shù)字信息長期保存研究及其啟示[J].大學(xué)圖書館學(xué)報, 2005(4):26-30.
[35]劉蘭, 吳振新, 向菁, 等.網(wǎng)絡(luò)信息資源保存開源軟件綜述[J].現(xiàn)代圖書情報技術(shù), 2009(5):11-17.
[36]趙麗琴.我國網(wǎng)絡(luò)信息保存研究述評[J].圖書館學(xué)研究, 2011 (4): 5-7.
[37]陽廣元.國內(nèi)外Web Archive研究綜述[J].圖書館雜志, 2014 (10):88-94.
[38]王婷, 吳振新, 高凡.國際網(wǎng)絡(luò)信息資源保存的合作機制分析[J].圖書館建設(shè), 2009(3):6-9.
[39]李丹.國外網(wǎng)絡(luò)信息資源保存的合作模式研究[J].檔案, 2010 (4):42-44.
陽廣元 男,1982年生,碩士,現(xiàn)工作于西南民族大學(xué)圖書館技術(shù)服務(wù)部,館員,研究方向為數(shù)字圖書館、科學(xué)計量學(xué)、信息科學(xué)、信息安全。
Review of Research Situation and Hotspots of Web Archive
Web Archive has been attracting domestic researchers' concern and attention since 2003.At present, researches on Web Archive mainly focus on following aspects: the basic concept of Web Archive, the work flow and link of Web Archive, the introduction of research results and practical experience abroad, and the summary of Web Archive.The relative researches have made some progress, while research should be enhanced on the conception, analyse of the best and the most important cases abroad, and domestic practice research.
Web archive; Web information resource; Culture heritage
G273
B
*本文系西南民族大學(xué)中央高?;究蒲袠I(yè)務(wù)費專項資金項目“云時代民族高校圖書館的服務(wù)創(chuàng)新研究”的成果之一,項目編號:2015SZYQN181。
2015-05-11 ]
2015-06-02 ]