丁 然/上海大學(xué)圖書情報(bào)檔案系
網(wǎng)絡(luò)資源長(zhǎng)期保存(Web Archive, 下簡(jiǎn)稱WA)指將采集到的網(wǎng)絡(luò)資源歸檔,之后將這些已歸檔Web資源用于存取和使用[1]。自20世紀(jì)90年代初,以美英加澳為首的歐美國(guó)家就開始了網(wǎng)絡(luò)資源信息的采集研究工作,并開展不同的WA實(shí)踐項(xiàng)目。早在1993年,加拿大國(guó)家圖書館就開始探討和研究如何建立網(wǎng)頁歸檔項(xiàng)目,并建立了電子出版物試點(diǎn)項(xiàng)目[2]。1996年,澳大利亞國(guó)家圖書館發(fā)起了網(wǎng)絡(luò)資源存檔項(xiàng)目PANDORA項(xiàng)目,并于2001年建立了網(wǎng)絡(luò)資源歸檔系統(tǒng)PANDAS[3]。2010年,美國(guó)國(guó)會(huì)圖書館(Library of Congress,下簡(jiǎn)稱LC)啟動(dòng)Twitter存檔項(xiàng)目The Twitter Archive,Twitter承諾將成立以來的所有公開推文捐贈(zèng)給LC,LC也表示會(huì)對(duì)所有的Twitter檔案進(jìn)行有效的開發(fā)利用[4]。2003年,英國(guó)國(guó)家檔案館啟動(dòng)了政府網(wǎng)頁存檔項(xiàng)目,至今已保存包括5000多個(gè)網(wǎng)站和政府社交媒體賬戶中的推文、視頻,截至2018年保存的檔案數(shù)據(jù)量超過120TB[5]。
我國(guó)對(duì)網(wǎng)絡(luò)資源存檔工作有初步的探索與實(shí)踐。如2001年,北京大學(xué)發(fā)起中國(guó)Web信息博物館項(xiàng)目,項(xiàng)目旨在采集我國(guó)絕大多數(shù)的靜態(tài)網(wǎng)頁,并提供在線查詢的功能;2003年,中國(guó)國(guó)家圖書館啟動(dòng)網(wǎng)絡(luò)信息資源采集與保存項(xiàng)目,項(xiàng)目旨在發(fā)現(xiàn)網(wǎng)頁資源采集過程中的問題并提出相應(yīng)的解決方案,但目前該項(xiàng)目已經(jīng)停滯[6]。相較于歐美國(guó)家,我國(guó)的網(wǎng)絡(luò)資源存檔工作依然存在差距。筆者介紹了荷蘭皇家圖書館開展的荷蘭華人社群網(wǎng)頁存檔項(xiàng)目,突出項(xiàng)目在內(nèi)容建設(shè)、功能導(dǎo)向和價(jià)值展現(xiàn)方面的特點(diǎn),以期對(duì)推進(jìn)我國(guó)網(wǎng)絡(luò)資源存檔項(xiàng)目有所裨益。
2007年開始,荷蘭皇家圖書館(KoninklijkeBibliotheek-National Library of the Netherlands,下簡(jiǎn)稱KB-NL)選擇性地采集全國(guó)的網(wǎng)頁啟動(dòng)了WA項(xiàng)目,并建立特色專題網(wǎng)絡(luò)資源館藏,截至2019年6月KB-NL共收錄15400個(gè)網(wǎng)站,包含36TB數(shù)據(jù)[7]。
到20世紀(jì)初,華人移民荷蘭已有100多年的歷史,但荷蘭主流社會(huì)對(duì)華人社群的文化了解依然十分有限,華人群體在荷蘭的社會(huì)中處于被忽視的狀態(tài)。在荷蘭“多元文化社會(huì)”的公共話語體系中,年輕華人幾乎沒有話語權(quán),他們被隱藏于占據(jù)主導(dǎo)地位的少數(shù)族群之下[8]。這種不可見性導(dǎo)致華人隱沒在荷蘭社會(huì)多元性中,失去了其形象的獨(dú)立性與其文化的獨(dú)特性。KB-NL在反思這一問題之后意識(shí)到,荷蘭對(duì)在荷華人的認(rèn)知缺陷是因?yàn)槿笔Ш商m華人的記錄和檔案,無法從相關(guān)資源中形塑表明華人身份的文化進(jìn)程,更無法得知華人在荷蘭社會(huì)中是如何被理解的。為此,KB-NL在WA項(xiàng)目下建立荷蘭華人社群網(wǎng)頁專題特色資源館藏,通過一名在荷中國(guó)留學(xué)生Kitty Lin的幫助來識(shí)別出有效的荷蘭華人網(wǎng)頁,借助多媒體與文化的手段活化這些網(wǎng)絡(luò)資源,并描繪出荷蘭華人在荷蘭網(wǎng)絡(luò)上的社會(huì)行為,讓其更容易被荷蘭社會(huì)所了解與接納,同時(shí)為將來的研究人員提供有價(jià)值的數(shù)據(jù)信息。
首先,網(wǎng)頁選取需滿足兩個(gè)條件之一:發(fā)布者是荷蘭華人社群成員之一,發(fā)布內(nèi)容與荷蘭華人相關(guān)[9]。由于荷蘭華人個(gè)體存在差異性,因此網(wǎng)頁選取的覆蓋面將涉及每一位社群成員。又由于網(wǎng)頁不限語言,不少荷蘭華人使用中文或在中文網(wǎng)站上發(fā)言,因此中文網(wǎng)站的選取是必不可少的。其次,社交媒體資源不在存檔范圍之中。根據(jù)KB-NL的遴選政策,所選擇的網(wǎng)站必須是對(duì)公眾開放且無需登錄的,所以雖然Facebook、Twitter、微信等都是荷蘭華人常用的社交媒體平臺(tái),但這些平臺(tái)均需要用戶登錄授權(quán)才能審閱,因此目前無法通過社交媒體上的活動(dòng)軌跡來建構(gòu)對(duì)荷蘭華人的認(rèn)知。
荷蘭華人社群網(wǎng)絡(luò)資源集合展現(xiàn)了荷蘭華人文化的進(jìn)程。荷蘭華人社群由不同生存地域、不同職業(yè)背景的華人組成,每個(gè)華人的行為都是一種文化的表現(xiàn),個(gè)體行為的多樣性不斷豐富著荷蘭的華人文化。存檔項(xiàng)目在實(shí)質(zhì)上是漢語敘事在荷蘭傳統(tǒng)話語中的書寫和重構(gòu),荷蘭華人社群網(wǎng)絡(luò)資源集合是荷蘭人了解中華文化的一種工具,能不斷加強(qiáng)華人文化在荷蘭地域的影響力,并提升荷蘭華人文化在荷蘭話語體系中的話語權(quán)。
荷蘭暫無相關(guān)法律條文支持網(wǎng)頁存檔項(xiàng)目,因此KB-NL在抓取任一網(wǎng)頁前都要取得權(quán)利人某種形式的同意。大部分的網(wǎng)頁都有聯(lián)系地址,查找聯(lián)系地址最常見和直接的方法是通過網(wǎng)頁的聯(lián)系鏈接[10]。網(wǎng)頁的聯(lián)系鏈接以兩種方式呈現(xiàn),即電子郵件或發(fā)送郵件的聯(lián)系表單,電子郵件是首選的聯(lián)系方式。還有一些網(wǎng)站沒有聯(lián)系鏈接,但有社交媒體頁面或賬戶,因此在Facebook或Twitter上尋找聯(lián)系地址也是較為主流的方式。由于微信是中國(guó)最為主流的社交媒體和移動(dòng)應(yīng)用程序之一,通過微信公眾號(hào)訂閱也能獲取相關(guān)的聯(lián)系地址。為了防止網(wǎng)頁存檔項(xiàng)目的開展陷入困境,KB-NL采用了一種靈活的方式來處理版權(quán)問題,即選擇退出方法,這種方法假定了對(duì)網(wǎng)絡(luò)存檔的隱式許可,即在采集網(wǎng)頁前的4個(gè)星期內(nèi)聯(lián)系授權(quán)獲取,若4個(gè)星期內(nèi)無任何回應(yīng),則默認(rèn)授權(quán)成功[11]。
荷蘭華人社群網(wǎng)頁存檔項(xiàng)目是一個(gè)延展性極強(qiáng)的項(xiàng)目,可以從其本身出發(fā)做深入研究,也可以使用館藏中的內(nèi)容進(jìn)行各種課題研究。荷蘭華人社群網(wǎng)絡(luò)資源集合包含有17個(gè)類目,因此研究主題可以從既有集合中的類別出發(fā),也可以與KB-NL館藏中的其他網(wǎng)絡(luò)集合相關(guān)聯(lián)。若研究主題是關(guān)于荷蘭華人的在線行為活動(dòng),延伸研究可以是借助相關(guān)技術(shù)比較現(xiàn)有的在線活動(dòng)與過去的在線活動(dòng),以此展現(xiàn)荷蘭華人近幾十年來的線上活動(dòng)變化,這將有助于研究荷蘭華人在線活動(dòng)的趨勢(shì)。若研究主題有關(guān)宗教、新聞、健康,其他網(wǎng)絡(luò)資源集合參與研究的契合性就大大增加。
除了對(duì)現(xiàn)有主題展開深入研究外,還可通過荷蘭華人社群網(wǎng)絡(luò)資源集合中的現(xiàn)有鏈接進(jìn)行滾雪球式的拓展分析。但由于網(wǎng)絡(luò)資源集合中的鏈接通常僅是網(wǎng)頁快照,要進(jìn)行拓展分析必須找到網(wǎng)頁快照所對(duì)應(yīng)的源鏈接,因此賦予研究人員盡可能多的權(quán)限來獲取荷蘭華人社群網(wǎng)絡(luò)資源集合中的元數(shù)據(jù),有助于推進(jìn)各類研究工作的開展。
荷蘭華人社群檔案是荷蘭社會(huì)了解、研究荷蘭華人的關(guān)鍵,同時(shí)也是留存荷蘭華人社會(huì)記憶、喚醒族群認(rèn)同的載體。荷蘭華人社群網(wǎng)絡(luò)資源是荷蘭華人社群通過自發(fā)性的行為形成的,是基于自我身份認(rèn)知的一種表現(xiàn)形式。將荷蘭華人社群網(wǎng)頁存檔,有助于從檔案的角度敘述真實(shí)的歷史事件與人物,并同時(shí)留存公眾記憶,這里的公眾記憶不同于在中國(guó)境內(nèi)留存的公眾記憶。第一代荷蘭華人跨越國(guó)界并在新的土地上扎根后,首先將原生民族的社會(huì)記憶與認(rèn)同帶到了新的生活環(huán)境中,這一階段的社會(huì)認(rèn)同源于中國(guó)傳統(tǒng)文化。第二代的荷蘭華人已經(jīng)適應(yīng)荷蘭的生活環(huán)境,但在第一代人的影響下,社會(huì)認(rèn)同一半來源于中國(guó)傳統(tǒng)文化,一半植根于荷蘭社會(huì)。第三代及之后的荷蘭華人植根于荷蘭社會(huì),即將完全失去對(duì)中國(guó)傳統(tǒng)文化、祖輩族群的認(rèn)同感,認(rèn)同感的丟失正是源于敘事記憶的丟失。在荷華人的總數(shù)不及荷蘭總?cè)丝?%,如此小的社群其文化在代際相傳中極其容易被同化。因此荷蘭華人社群存檔項(xiàng)目致力于對(duì)荷蘭華人網(wǎng)絡(luò)行為、內(nèi)容進(jìn)行跟蹤,以梳理出荷蘭華人社會(huì)行為的歷史脈絡(luò),通過真實(shí)存在的歷史脈絡(luò)喚起全體荷蘭華人的族群認(rèn)同。
荷蘭社會(huì)是一個(gè)多元文化、多種族群共存的社會(huì)。當(dāng)公眾的物質(zhì)生活水平發(fā)展到一定程度的時(shí)候,就會(huì)產(chǎn)生精神文化層面的更高追求[12]。荷蘭華人社群網(wǎng)頁存檔項(xiàng)目就是荷蘭群眾追求更高精神文化的產(chǎn)物。長(zhǎng)久以來,年輕華人在荷蘭社會(huì)處于被邊緣化的狀態(tài),缺少話語權(quán)的他們很難融入當(dāng)?shù)匚幕?,也難以對(duì)當(dāng)?shù)匕l(fā)展作出更多貢獻(xiàn)。荷蘭社會(huì)開始關(guān)注被主流敘事系統(tǒng)遺忘的少數(shù)族群的生活背景與活動(dòng)軌跡,開始關(guān)注社會(huì)構(gòu)成主體的多樣性。在這個(gè)項(xiàng)目中,對(duì)荷蘭華人社群成員的網(wǎng)絡(luò)行為脈絡(luò)進(jìn)行跟蹤,以期通過了解荷蘭華人社群的行為動(dòng)機(jī),幫助他們?nèi)谌攵嘣幕鲎驳纳鐣?huì)生活,提升他們?cè)诙嘣獢⑹孪到y(tǒng)中的話語權(quán),消解社群之間溝通的壁壘,最終實(shí)現(xiàn)荷蘭社會(huì)的和諧與包容。
荷蘭華人社群網(wǎng)頁存檔項(xiàng)目既留存了荷蘭華人的社會(huì)記憶,又拓寬了荷蘭數(shù)字遺產(chǎn)的范疇。該項(xiàng)目的收錄對(duì)象均為虛擬網(wǎng)絡(luò)資源,分類條目繁多。這些虛擬網(wǎng)絡(luò)資源是荷蘭華人的精神活動(dòng)產(chǎn)物,是個(gè)人數(shù)字遺產(chǎn)的重要組成。荷蘭華人的特殊身份使得這些數(shù)字遺產(chǎn)既隸屬于個(gè)人,又能以一種“反哺”的方式豐富荷蘭既有的數(shù)字遺產(chǎn)。同時(shí)荷蘭華人社群網(wǎng)頁存檔項(xiàng)目是對(duì)數(shù)字遺產(chǎn)有組織有規(guī)律的收集整合,有助于數(shù)字遺產(chǎn)的長(zhǎng)期保存與提供利用,進(jìn)而提升數(shù)字遺產(chǎn)的價(jià)值內(nèi)涵。
首先,應(yīng)加強(qiáng)相關(guān)法律頒布,賦予KB-NL抓取網(wǎng)絡(luò)資源的自主性。由于缺乏相關(guān)法律的支撐,KB-NL在抓取網(wǎng)頁時(shí)需要提前4個(gè)星期與網(wǎng)站所有者聯(lián)系并獲得授權(quán),然而網(wǎng)頁是動(dòng)態(tài)變化的,“轉(zhuǎn)瞬即變”,太長(zhǎng)的抓取周期容易導(dǎo)致網(wǎng)頁信息失效。如能獲得法律支持,收錄荷蘭華人社群網(wǎng)絡(luò)資源工作的效率會(huì)大大增加。其次,網(wǎng)站所有者有權(quán)拒絕KB-NL的網(wǎng)站抓取請(qǐng)求,但一旦拒絕收錄的比例占多數(shù),數(shù)字文化遺產(chǎn)的保護(hù)、學(xué)術(shù)研究的開展以及公共利益之間的平衡將被打破,并陷入僵局。在法律的調(diào)和下,網(wǎng)絡(luò)信息多為公開信息,有義務(wù)作為國(guó)家數(shù)字遺產(chǎn)而進(jìn)入數(shù)字遺產(chǎn)保護(hù)內(nèi)容之中。再者,只有在政策的引導(dǎo)之下,相關(guān)的資金、技術(shù)才會(huì)加大投入,那么社交媒體的歸檔將不再因?yàn)榫W(wǎng)頁復(fù)雜的歸檔要求而被KB-NL拒之門外。
荷蘭華人社群網(wǎng)頁存檔范圍有較大的局限性,不利于對(duì)荷蘭華人的網(wǎng)絡(luò)行為展開精細(xì)化的研究工作。KB-NL應(yīng)該將由荷蘭華人發(fā)布的社交媒體及其相關(guān)內(nèi)容作為館藏的收錄對(duì)象,在網(wǎng)絡(luò)交流日益頻繁的時(shí)代,社交媒體顯然擁有不可替代的地位,美英加澳早已將Facebook、Twitter等社交媒體作為網(wǎng)絡(luò)資源存檔的對(duì)象。社交媒體的發(fā)布是即時(shí)且隨性的,基于一定體量的社交媒體內(nèi)容能夠完整刻畫出發(fā)布人的行為特征與活動(dòng)軌跡,是不可或缺的研究材料。
在荷蘭WA項(xiàng)目開展初期,KB-NL是以獨(dú)立團(tuán)隊(duì)形式推動(dòng)項(xiàng)目進(jìn)程的,且荷蘭華人網(wǎng)絡(luò)資源集合的建立僅僅依靠一名在校的中國(guó)實(shí)習(xí)生[13]。該實(shí)習(xí)生是荷蘭華人社區(qū)成員,對(duì)遺產(chǎn)和記憶的相關(guān)內(nèi)容有一定的研究基礎(chǔ),但與荷蘭華人社區(qū)群體相比,KB-NL目前的團(tuán)隊(duì)力量是保守且微不足道的。在未來的工作推進(jìn)中,KB-NL應(yīng)當(dāng)適時(shí)改變工作理念,打破封閉內(nèi)向的工作姿態(tài),加強(qiáng)聯(lián)合荷蘭華人社群的力量,鼓勵(lì)荷蘭華人主動(dòng)參與到荷蘭華人社群網(wǎng)頁存檔項(xiàng)目中去,提高社會(huì)參與的積極性,發(fā)揮他們的主觀能動(dòng)性,保證WA項(xiàng)目與荷蘭華人社群網(wǎng)頁專題特色資源館藏的可持續(xù)性。
雖然存檔內(nèi)容是經(jīng)過選擇的,但KB-NL發(fā)布的網(wǎng)頁歸檔鏈接中依然存在一些非正統(tǒng)的中華文化,KB-NL應(yīng)對(duì)存檔內(nèi)容的正當(dāng)性與規(guī)范性引起足夠重視,致力于傳播正統(tǒng)中華文化并引導(dǎo)正確主流的價(jià)值觀。