楊存林
摘 ? 要: 清水江文書是明清以來黔東南地區(qū)苗族、侗族人民生產(chǎn)生活產(chǎn)生的歷史文獻,不但記錄少數(shù)民族地區(qū)人民的經(jīng)濟生活形態(tài),而且記錄明朝以來少數(shù)民族地區(qū)政治形態(tài),是苗族、侗族人民的文獻“寶庫”,如何保護好、利用好這一重要的文獻“寶庫”是擺在人們面前的重要課題。本文從清水江文書數(shù)字化的角度對這一課題進行了探究,期待引起大家的共鳴,進一步推進清水江文書的數(shù)字化建設工作。
關鍵詞: 清水江文書 ? 整理 ? 保護 ? 數(shù)字化
清水江文書是黔東南地區(qū)苗族、侗族人民生產(chǎn)生活的真實記錄,是苗族、侗族人民在漫長歲月中形成的歷史檔案,也是學界研究苗族和侗族人文、經(jīng)濟和社會發(fā)展的第一手資料。從二十世紀六十年代中期第一次進入學界視野以來,幾經(jīng)消沉后再次躍入學者視線,并得到了學術界的高度評價。清水江文書學不但成為黔籍旅臺作家姜穆先生所期冀的“黔學的一門顯學”[1](269),而且被北京大學趙世瑜教授等認為對“重建中國歷史敘述”起到重要作用[2]??梢娗逅臅鴮γ缱濉⒍弊迦嗣竦闹匾?。
1.清水江文書保護模式現(xiàn)狀
長期以來眾多學者都在探索清水江文書的保護模式,到目前為止有兩種模式得到學界的認可。
1.1集中保護模式
自2001年貴州省錦屏縣率先開展大規(guī)模收集清水江文書工作以來,截至2016年上半年,黔東南州各縣收集到檔案館的清水江文書共21.98萬份(件)[3]。之后各縣征集的文書量有所減少,但還是有一定數(shù)量的增加。這部分文書進入檔案館后由所在檔案館開展修復、數(shù)字化、入藏等工作。雖然由于專業(yè)技術人員與資金缺乏,導致這些保護措施都進行得略為粗略,但至少這部分清水江文書能集中到檔案館里從而避免火災。
1.2分散就地保護模式
有學者提出了“分散就地保護”模式。這一模式是以村為單位,組織人員將農(nóng)戶手中的清水江文書“登記造冊”,對每戶契約文書建立份級目錄,然后將清水江文書原件退回農(nóng)戶手中,并將目錄復制一式三份,農(nóng)戶手中一份,村集體一份,縣檔案館一份。國家配置能防火、防潮的存儲設備給農(nóng)戶保存清水江文書,培訓農(nóng)戶保護清水江文書的技能技法,既能保護清水江文書,又能保留清水江文書的“活態(tài)性”(作為調(diào)解集體山林糾紛的憑證)。
筆者認為,這一模式是“集中保護”模式遇到了瓶頸,無法繼續(xù)開展之后的無奈之舉,可操作性。理由有三,一是防火、防潮的保險柜一定要具有絕熱功能,與飛機黑匣子或太空返回艙一樣,在高溫的環(huán)境里能保護里面的物品完好無損,否則發(fā)生火災時保險柜里面的清水江文書也會被高溫碳化??墒蔷邆溥@種防護功能的保險柜價格必定高昂,無法達到文書持有者每戶一柜的要求。二是清水江文書雖然具有一定的“活態(tài)性”,但這樣的“活態(tài)性”相對有限,一旦發(fā)生火災,人們必定不會首先搶救清水江文書,而是搶救一些生活必需品。如此,遺留在民間的清水江文書將逐漸消亡,留下的目錄冊子也失去了實際意義。三是散藏于民間的清水江文書造成了時間與空間的阻隔,不利于開發(fā)與利用。
2.清水江文書數(shù)字化建設的必要性
2.1清水江文書永久性保存的必然要求
黔東南遺存清水江文書之處,是盛產(chǎn)林木之地,人們就地取材,所建房屋多為木質(zhì)結(jié)構(gòu)。加之苗族、侗族屬于聚居性民族,房屋一棟挨著一棟建造,一旦發(fā)生火災,木質(zhì)房屋就會成片焚毀,存于屋內(nèi)的清水江文書會與房屋一同消亡,這種火災在黔東南地區(qū)時有發(fā)生。如:1980年文斗下寨的寨火,因發(fā)生在中午,人們大多在山上干農(nóng)活,導致大多數(shù)人家的契約文書被焚毀;1996年10月發(fā)生在錦屏縣偶里鄉(xiāng)八臘村一組的火災,在短短一個小時內(nèi)三十多棟木質(zhì)樓房全部燒盡,一同燒毀的還有長期積累的清水江文書;2005年7月17日,發(fā)生錦屏河口鄉(xiāng)文斗上寨村一場山林火災,當時就燒毀了幾十戶人家,被一同燒毀的還有3000份至4000份清水江文書;2016年5月30日午夜,發(fā)生在錦屏縣平秋鎮(zhèn)石引村的火災燒毀了仁海濱等四戶人家的房屋與仁海濱家族遺留下來的清水江文書400余份。在“集中保護”模式遇到瓶頸,探索的“分散就地保護”模式又不能完全解決清水江文書安全性的情況下,只能探索“清水江文書數(shù)字化建設”,利用現(xiàn)代計算機技術,將清水江文書數(shù)字化后多處備份,多地保存。即使清水江文書發(fā)生不可挽回的損毀,也不會危及數(shù)字化文書的存在,因此清水江文書數(shù)字化建設是清水江文書永久保存的必然選擇。
2.2有效解決清水江文書“藏與用”的矛盾
清水江文書藏于農(nóng)戶家中的木匣子中、布包里,如非必要,或許幾十年都沒有人去翻動。學者要研究,還要走村串寨、挨家挨戶地查訪,有甚者還不輕易示人。再者查閱人次增多,也會給文書帶入汗?jié)n、霉菌等加速文書的損毀的不安全因素,磨損文書,縮短文書的存世壽命。這些都不符合清水江文書的保護原則,勢必會造成“重藏輕用”的現(xiàn)象。要徹底解決這一問題,就要將文書數(shù)字化,學者在不翻動文書原件的情況下通過網(wǎng)絡查閱到相關文書信息,既保護了清水江文書,又滿足了學者的信息需求,能夠有效解決清水江文書藏與用的矛盾。
2.3突破清水江文書征集的瓶頸
清水江文書是土地可以自由買賣流轉(zhuǎn)時期的產(chǎn)物。新中國成立后,土地收歸集體所有并把使用權重新分配給人民。這種私有制下起到調(diào)解產(chǎn)權糾紛的契約文書在同一集體里面就失去了調(diào)解的作用。但在不同集體、村寨之間發(fā)生山林糾紛時人們還能翻出塵封的老契作為憑據(jù),起到調(diào)解民間糾紛的作用。經(jīng)歷十多年的大規(guī)模征集,雖然取得豐碩的成果,但據(jù)專家估計,清水江文書總量應在50萬件—60萬件,除去目前征集到的21.98萬件,還有30萬件—40萬件散藏于民間,這些文書該怎么辦呢?過去之所以能征集到如此大量的清水江文書,主要是因為新中國成立之后,土地所有制的改變,使農(nóng)戶認為遺存在手中的清水江文書已經(jīng)沒有用了的基礎上得以征集。隨著時間的推移,農(nóng)戶不情愿將手中的清水江文書上交。主要原因有三:其一,清水江文書是祖?zhèn)鬟z存,晚輩應該流傳下去不能輕易交出;其二,清水江文書在調(diào)解集體山林土地歸屬時還能起到憑證作用;其三,清水江文書是黔東南地區(qū)苗族、侗族人民所獨有的一大特色,在發(fā)展旅游業(yè)上也是一大亮點?;谝陨显颍r(nóng)戶不愿再上繳手中的清水江文書。再者,清水江文書既是文物,又是農(nóng)戶祖?zhèn)魑臅?,按照《中華人民共和國物權法》的有關規(guī)定,群眾所收藏的祖?zhèn)魑臅鴮儆谒接胸敭a(chǎn),他們享有處置權,任何組織和個人都無權強行讓他們上交。因此,征集清水江文書就遇到了瓶頸,工作的開展步履維艱。
2.4擴大清水江文書的影響、引入更多學者研究
清水江文書是黔東南境內(nèi)清水江流域獨有的歷史文獻,一些國內(nèi)外學者即使有研究的期望,也受到時間和空間的限制,未能參與到清水江文書的研究中,對擴大《清水江學》的影響是不利的。數(shù)字化的清水江文書能有效打破時間和空間的限制,讓國內(nèi)外學者可以通過網(wǎng)絡零距離接觸到清水江文書,挖掘這座“寶庫”的學術價值與歷史價值。
3.清水江文書數(shù)字化建設的原則
3.1古籍整理原則
清水江文書數(shù)字化不僅僅是文書形式的轉(zhuǎn)換,還屬于少數(shù)民族古籍整理的范疇。對此,有學者做了明確闡述:“古籍數(shù)字化是對古籍的深度開發(fā),是古籍整理的一部分,不僅涉及諸如標點、???、注解、今譯、輯佚等古籍整理的知識和技能,還涵蓋網(wǎng)絡技術、信息技術等現(xiàn)代技術,代表未來古籍整理的發(fā)展方向”[4](6)。因此,我們要將古籍整理的各個環(huán)節(jié)融入清水江文書數(shù)字化過程中。
3.2版權保護原則
清水江文書數(shù)字化版權主要涉及兩個方面。首先,清水江文書數(shù)字化是基于古籍整理原則的,期間涉及對清水江文書的標點、???、注解、今譯、輯佚等,凝聚了大量整理者的心血。依據(jù)我國《著作權法》第12條規(guī)定(改編、翻譯、注釋、整理已有作品而產(chǎn)生的作品,著作權由改編、翻譯、注釋、整理人享有,但行使著作權時不得侵犯原作品的著作權),如果整理的新作品具有獨創(chuàng)性,就應該納入著作權法保護范疇。因此清水江文書數(shù)字化成果應給予版權保護。其次,清水江文書持有人的權利問題。按理說清水江文書持有人不再享有任何權利,但清水江文書在過去是物權的象征,是祖輩相傳的文書,至今還起到調(diào)解民間糾紛的作用。按照《中華人民共和國物權法》規(guī)定“祖?zhèn)魑臅鴮儆谒接胸敭a(chǎn)”,從《物權法》角度來說,文書持有人還是具有權利的。清水江文書數(shù)字化前,應該與文書持有人簽署文書圖片使用協(xié)議,取得持有人的授權。
4.清水江文書數(shù)字化的構(gòu)想
4.1清水江文書數(shù)字化層次
針對古籍文獻數(shù)字化的建設層次,學者們有不同的觀點,王立清認為古籍數(shù)字化可以分為四個層次,即古籍書目的數(shù)字化、古籍載體的數(shù)字化、古籍圖文的數(shù)字化、古籍知識及關聯(lián)的數(shù)字化[5](25)。徐清等人認為古籍數(shù)字化的深度開發(fā)具體包括以下三方面內(nèi)容:提供超文本的閱讀環(huán)境、建立強大的智能化檢索系統(tǒng)、提供精準的數(shù)據(jù)和信息[6](95-97)。馬創(chuàng)新等人基于深度差異將古籍數(shù)字化分為“表層數(shù)字化”與“深層數(shù)字化”[7](104-106)。筆者認為清水江文書數(shù)字化分兩個層次,即多途徑網(wǎng)絡檢索服務與全文閱讀。
4.2清水江文書數(shù)字化的具體措施
2001年錦屏縣率先征集保護清水江文書以來,清水江文書的保護工作進展緩慢,各縣各自為政,沒有形成統(tǒng)一的領導與技術標準。期間學者提出了“集中保護”與“分散就地保護”兩種保護模式,但不管哪種保護模式都存在不小的缺陷,解決文書保護問題。也有學者提出“清水江文書數(shù)字化”,但只是書面文字,沒有具體的操作與標準。2012年筆者有幸參與國家社會科學基金重大項目招標課題“清水江文書整理與研究”子課題“清水江文書全文數(shù)據(jù)庫”建設,此后進行了幾年的田野調(diào)查和數(shù)字化工作,不僅收集了一定數(shù)量的清水江文書,還積累了一些數(shù)字化建設的實踐經(jīng)驗。
清水江文書數(shù)字化工作應該在政府統(tǒng)一領導下成立“清水江文書數(shù)字化項目”,采取高校加地方的模式開展數(shù)字化建設。
首先,清水江文書的掃描數(shù)字化。對于入館集中保護部分,高校與檔案館合作,在高校古籍整理人員的指導下由檔案館將清水江文書掃描轉(zhuǎn)換為JPG圖片格式;散藏于農(nóng)戶手中的清水江文書,應以鄉(xiāng)(鎮(zhèn))為單位,培訓專門人員接待文書持有人、造冊并掃描清水江文書,清水江文書原件掃描后退回持有人手中實施“分散就地保存”。給予持有人一定圖片使用費后簽訂文書圖片使用協(xié)議,取得文書圖片的使用授權,并且持有人往返鄉(xiāng)村的食宿車程等相關費用。這一措施起到避免權益糾紛與激勵持有人提供文書掃描的作用,持有人在不喪失清水江文書原件的基礎上還能得到一定的經(jīng)濟回報,筆者認為這不失為一種有效的激勵辦法。
其次,數(shù)字化清水江文書時必須遵循的標準和程序。數(shù)字化清水江文書必須做到統(tǒng)一的標準與要求。為保障文書的清晰度,圖片分辨率必須達到300DPI以上;為了后續(xù)的《清水江文書全文數(shù)據(jù)庫》建設,在數(shù)字化清水江文書的同時必須收集每份文書的基本信息,每份清水江文書圖片名稱必須標明文書的尺寸(長×寬)CM與載體材質(zhì)(毛邊紙、皮紙、草紙等),每戶對應一個文件夾存放,文件夾采用“縣+鄉(xiāng)(鎮(zhèn))+村+戶”進行命名。
最后,將收集到的文書圖片統(tǒng)一上繳“清水江文書數(shù)字化項目”組,由項目組建立《清水江文書全文數(shù)據(jù)庫》(網(wǎng)絡版)。因《清水江文書全文數(shù)據(jù)庫》的獨特性,數(shù)據(jù)庫應具備多種檢索途徑(題名、關鍵詞、文書產(chǎn)生年代、歸戶性導航檢索等)、多種檢索結(jié)果排序方式、文書的載體形態(tài)、文書的來源地、文書的收藏地及文書的點校摘錄等項目;版權保護方面,數(shù)據(jù)庫里每一張文書圖片數(shù)據(jù)必須加載水印(不干擾到文書文字),監(jiān)控或限制數(shù)據(jù)下載等措施。
5.面臨的問題與對策
5.1清水江文書數(shù)字化人才匱乏
清水江文書數(shù)字化是一項宏大的工程,涉及的人員比較多,不僅需要具備歷史古籍文獻鑒別與保護的專業(yè)人才,還需要古籍點校專家、文獻著錄、計算機數(shù)字化與計算機網(wǎng)絡等相關人員的參與。苗族、侗族是只有語言沒有文字的民族,所有清水江文書都是通過“漢字”書寫的,產(chǎn)生大量的“俗字”“套語”“生僻詞”等語言文字,且書寫不規(guī)范,錯字、別字較多,導致清水江文書的點校與著錄花費大量的人力、時間。針對這一問題,我們可以發(fā)揮高校的人才優(yōu)勢,招募“漢語言文學”與“歷史學”專業(yè)的學生進行初步點校與著錄,由清水江文書數(shù)字化項目組人員審查、復核,通過審核無誤的數(shù)據(jù)才能發(fā)布供國內(nèi)外學者研究,擴大《清水江文書》的研究隊伍,拓寬《清水江文書》的研究視野?!扒逅臅鴶?shù)字化項目”通過學生加入加快了建設進度,解決了人才匱乏的問題,學生通過加入項目建設得到了實踐鍛煉的機會,促進了研學的成長。
5.2經(jīng)費短缺
經(jīng)費短缺是限制“清水江文書數(shù)字化”工作的主要原因。據(jù)專家估計,清水江文書存世量近60萬份,以每份10元的圖片使用費來計算就需要600萬元的圖片使用費,還不包括掃描、后續(xù)點校、著錄等數(shù)據(jù)庫建設等相關費用。為了解決這個問題,可以通過政府撥款資助、企業(yè)捐款、社會眾籌與國家項目申報等多種途徑加以解決。
清水江文書因特殊的地域性、歸戶性,在“集中保護”與“分散就地保存”模式都無法盡善盡美的前提下,數(shù)字化建設勢在必行。
注釋:
①清水江文書(又稱錦屏文書),2010年2月被列入《中國檔案文獻遺產(chǎn)名錄》.
參考文獻:
[1]王宗勛.清水江歷史文化探微[M].昆明:云南美術出版社,2013.
[2]趙世瑜.清水江文書在重建中國歷史敘述上的意義[J].原生態(tài)民族文化學刊,2015(4).
[3]王宗勛.清水江文書收集整理研究問題的思考[J].原生態(tài)民族文化學刊,2017(1).
[4]毛建軍.古籍數(shù)字化理論與實踐[M].北京:航空工業(yè)出版社,2009.
[5]王立清.中文古籍數(shù)字化研究[M].北京:國家圖書館出版社,2011.
[6]徐清,石向?qū)?,王?古籍數(shù)字化資源的深度開發(fā)[J].圖書情報工作,2007(3).
[7]馬創(chuàng)新,曲唯光,陳小荷.中文古籍數(shù)字化的開發(fā)層次和發(fā)展趨勢[J].圖書館,2014(2).