張全海/中國人民大學(xué)信息資源管理學(xué)院
近年來隨著古文獻數(shù)字化和商業(yè)數(shù)據(jù)庫建設(shè)的長足發(fā)展,檢索的快捷性給學(xué)術(shù)研究帶來了極大的便利,文獻挖掘能力已發(fā)生了革命性改變,同時也對海量材料的駕馭和分析能力提出了新要求。筆者在讀研期間(2001—2004)開始接觸這個領(lǐng)域。早期研究文獻挖掘技術(shù)的網(wǎng)絡(luò)論壇叫“網(wǎng)上讀書園地”(www.readfree.net),一大批“發(fā)燒友”聚集于此,他們十幾年來一直醉心于文獻挖掘技術(shù)的研發(fā)、數(shù)據(jù)庫的應(yīng)用等。早期的中文文獻數(shù)據(jù)庫主要為“超星數(shù)字圖書館”,后來開發(fā)出“讀秀學(xué)術(shù)搜索引擎”等一系列產(chǎn)品,至今仍是這個領(lǐng)域的龍頭老大,網(wǎng)上流傳的各種掃描版電子書多源于此。后又有“中美百萬”(www.cadal.zju.edu.cn)等公益性數(shù)字圖書館面世,豐富了數(shù)字化中文文獻的來源。早期的數(shù)字化文獻交流論壇有“國學(xué)數(shù)典論壇”“愛如生論壇”“先秦史論壇”“讀書中文網(wǎng)”等,來自全世界的愛好者長期活躍在這些論壇上,現(xiàn)在很多單位購買的“愛如生”系列數(shù)據(jù)庫資源就是來自這里。
筆者在撰寫碩士學(xué)位論文時就已經(jīng)開始應(yīng)用數(shù)據(jù)庫挖掘史料,后不斷將這種手段運用于諸多學(xué)科研究領(lǐng)域,如姓氏譜牒、武術(shù)史、戲曲史、檔案史、史前文化、區(qū)域歷史文化等,取得了非常好的效果。如先后對“巫”字的起源[1]、架閣庫[2]、史前八角紋[3]、蘭臺[4]、同安監(jiān)[5]等多個重要問題做過探索性考證,都獲得了突破性研究結(jié)果。
臺灣的黃一農(nóng)先生將這種研究手段方法總結(jié)叫作“E考據(jù)”,雖然學(xué)界對此還存在爭議,甚至有人認為所謂“E考據(jù)”就是在數(shù)據(jù)庫里“簡單一搜”,但不可否認的是,這種方法已經(jīng)越來越多地為人所接受。“E考據(jù)”絕不是“簡單一搜”而已,它首先需要研究者在該領(lǐng)域有一定的學(xué)術(shù)積淀,在研究某個問題時借助于文獻數(shù)據(jù)庫來挖掘所需材料,然后對所獲得的材料進行深入分析研究,從而推進解決問題。這就像在碎片化閱讀的當代,我們不能將碎片化閱讀作為全部,而應(yīng)該是首先要有某領(lǐng)域比較完備的知識結(jié)構(gòu),然后在碎片化閱讀中獲取知識的補充,絕不能“反客為主”。
在文書學(xué)、秘書學(xué)、檔案學(xué)及行政管理學(xué)等諸多學(xué)科中,“文件”都是其核心名詞之一,但學(xué)界對于“文件”詞源的考證較少,且目前多認為此詞清晚期才出現(xiàn)[6],雖然同行付出了較多努力,但長久沒有得到明顯的推進。雖然這種考證是有限的,因為沒有人能夠窮盡文獻,即使是存世文獻也難以窮盡,但這種有限的考證又是必要的,因為它會使得我們更進一步接近真相。
就目前來說,“超星數(shù)字圖書館”是世界上最大的中文書刊數(shù)據(jù)庫,其“讀秀學(xué)術(shù)搜索引擎”可以實現(xiàn)全文檢索,但超星沒有開發(fā)針對古文獻檢索的專門產(chǎn)品,所以當用普通關(guān)鍵詞進行檢索時,往往會得出數(shù)量驚人的結(jié)果。如用“文件”檢索,結(jié)果高達1000萬多條。除非是檢索特殊的關(guān)鍵詞,或者使用組合檢索,否則太多的結(jié)果讓人無法使用。愛如生數(shù)據(jù)庫則主要是針對古文獻開發(fā)的產(chǎn)品,其“中國基本古籍庫”“中國方志庫”“中國譜牒庫”等基本涵蓋了傳世中文典籍,如在“中國基本古籍庫”檢索“文件”可得535條結(jié)果、“中國方志庫”733條、“中國譜牒庫”2874條,雖然從這些子庫中檢索所得的結(jié)果也不少,但愛如生提供了檢索年代限定(不夠完善),如經(jīng)過進一步篩選,會發(fā)現(xiàn)以上檢索結(jié)果均為明代以后的文獻,也就是說以上數(shù)據(jù)庫所收清代以前的文獻中沒有“文件”一詞。再檢索“書同文”“瀚堂典藏”“鼎秀古籍”“中國金石總錄”“中國地方歷史文獻”等更多數(shù)據(jù)庫,結(jié)果也基本是這樣。
由于愛如生開發(fā)的子庫很多,其他比較重要的還有“中國金石庫”“敦煌文獻庫”“明清檔案庫”,而要么一般機構(gòu)單位不會購買這么多產(chǎn)品,要么有些子庫尚在建設(shè)中,暫時不能提供利用。所以要檢索愛如生所有子庫中的數(shù)據(jù),存在一定的難度。
筆者在對愛如生“永樂大典”子庫進行檢索后得到1條結(jié)果,出自第一四五七五卷:“每上下半月,開具遞過文件及各各日時?!痹谄渌虡I(yè)數(shù)據(jù)庫中檢索也可得到同樣的結(jié)果。
《永樂大典》正本早已失蹤,現(xiàn)今存世的真品皆為嘉靖年間抄錄的副本,其總量不及原書的4%,在失蹤的1萬多冊副本中是否還有“文件”不得而知。此外,還有一些明代文獻沒有被愛如生收錄,如《中國明朝檔案總匯》《萬歷邸鈔》《萬歷起居注》《國朝典故》等。筆者粗略翻閱了101冊《中國明朝檔案總匯》沒有發(fā)現(xiàn)線索,全文檢索了《明實錄》也沒有查到“文件”??梢娋凸P者目力所及,《永樂大典》中的“文件”屬于孤例。
雖然說“孤證不立”,但卻不能排除孤證成立的可能性,所以需要在有限的條件下對這則孤例詳加考據(jù)。《永樂大典》第一四五七四卷至第一四五七六卷為“鋪”,前兩卷專講“急遞鋪”的歷史情況。為研究之方便,現(xiàn)將其中涉及“文件”一節(jié)的內(nèi)容迻錄如下(標點為筆者所加):
英宗皇帝至治三年,兵部奉中書省劄付,海北廣東道肅政廉訪司照磨言,隨處急遞鋪反匿損壞公文、有失設(shè)法等事送本部,議得置郵傳命,古今良法,行之既久,不能無弊。蓋其法每十里設(shè)置一鋪,排列道次,凡遞文字,止憑一鋪司承受發(fā)遣,其鋪司率皆村野愚民,不知利害,不通文理,一鋪歷尚然不整,豈能表率鋪兵,使之依法走遞?其鋪兵人數(shù),老幼充應(yīng),多不堪役,州縣官司視同泛常,又不依期親歷整點,遂致文字稽遲損壞,至于沉匿,無從追究,為弊至此,豈宜坐視不加整治?其元立程式,非有可以更張者,但為別無專管之人,以致如斯。所據(jù)上項長引隔眼,固是可用,未能悉救其弊。又相離數(shù)千里去處,亦難每鋪摽寫,以此參詳,擬合每十鋪設(shè)一郵長,于州縣籍記司吏內(nèi)差充,一周歲交承,其拘該兩州縣去處,從鋪多者差設(shè),相等者遞年輪差,使之專督其事,時常于所管鋪分往來廵視,務(wù)要修置亭舍,什物完備,附寫鋪歷明白,照依元立程式走遞,但有老幼鋪兵,隨即申覆補換。凡入遞文字從始發(fā)官司,約量地里遠近,印帖長引隔眼于上,明白摽寫件數(shù)、發(fā)行日時,至各各郵長去處,摽寫發(fā)放轉(zhuǎn)遞。每上下半月,開具遞過文件及各各日時,申覆提調(diào)官,依期親歷刷勘整點,署押文案,具報廉訪司照刷。若各鋪稽遲損壞文字,或附寫不明不實,本管郵長就便治罪。其在別管鋪分,亦須互相舉呈,所屬上司行移究治。若郵長不能盡職,致有稽遲者,提調(diào)官量事輕重議罪。三犯者替罷,仍出去州縣籍記姓名。其于一歲之內(nèi),克盡乃役,略無稽遲者,即許從優(yōu)先行補用。若提調(diào)官吏,不行依期用心刷勘整治者,廉訪司嚴加究治,仍于年終將斷過此等官吏,通類另行呈臺,備呈都省驗事,別議黜降。如此責(zé)委既專,自能盡心于事,前弊可得漸除。如蒙準呈,宜從都省移咨各處行省,劄付御史臺,照會本部依上施行。今將再立到隔眼樣式粘連在前,具呈照詳都省,仰遍行合屬依上施行。
“急遞鋪”在先秦時期已經(jīng)起源,其主要功能是傳遞官方文書,因此《永樂大典》“急遞鋪”中大量涉及“公文”“文書”“文字”等名詞,還較多涉及“文冊”“文歷”“文案”“文卷”“文簿”“文卷簿籍”“文檄”“文牒”“文解”“文狀”“咨文”“文匣”等名詞,而“文件”僅一見。
筆者在傳世元代文獻《元典章》《文獻通考》《通制條格》等典籍中沒有找到該段文字,僅在“四部叢刊”影印涵芬樓藏元至正本《國朝文類》(即《元文類》)中發(fā)現(xiàn)其別本(標點為筆者所加):“至治三年,以反匿損破公文有失設(shè)法,兵部議:每十鋪設(shè)郵長一人,于州縣籍記司吏內(nèi)差充,一歲交承,兩州縣相接之處,鋪多者差,相等者遞年輪差,使之專督其事,于所管鋪分往來廵視,務(wù)要修置亭舍,什物完備,附寫鋪歷明白,依程式走遞文字,從始官司,量地遠近,印帖長引隔眼于上,明白標寫件數(shù)、發(fā)行日時,至各各郵長去處,標寫發(fā)放轉(zhuǎn)遞。上下半月,具遞過文字及各各日時,申提調(diào)官,依期親歷刷勘整點,署押文案,報廉訪司照刷。各鋪稽滯損失文字,或附寫不明不實,郵長罪之。罪在別鋪,亦須互相舉呈,上司行移究治。郵長不能盡職,提調(diào)官罪之。三犯替罷,仍去州縣籍記姓名。一歲之內(nèi),克盡乃役,略無稽違者,即從優(yōu)先補?!?/p>
《永樂大典》《國朝文類》所輯該內(nèi)容都是出自元《經(jīng)世大典》,但篇幅長短及文字內(nèi)容均有所不同,《永樂大典》中的“開具遞過文件”在《國朝文類》中卻是“具遞過文字”。雖然《經(jīng)世大典》原書已佚失,很難判定誰更接近原文,但綜合考之,似當以《國朝文類》的“文字”為是。不過要弄清《經(jīng)世大典》原文到底是哪個,還需進一步考證。
然而如果中華書局與臺灣大化書局影印的《永樂大典》確為明嘉靖時所抄副本的話,那么可以說最晚在明嘉靖時已有“文件”(如果副本此處文字與《永樂大典》正本一致的話,時間則要提前到明初),雖然有誤寫的可能性(也有“文字件數(shù)”簡寫的可能性),但畢竟已經(jīng)存在事實。且不能完全排除它對后世“文件”一詞的出現(xiàn)存在影響,如乾隆朝在編修四庫全書時就極為重視《永樂大典》的??迸c輯佚工作。
另外值得注意的是,在明代及以前的文獻中有較多“文字名件”“公文件數(shù)”“文書物件”等復(fù)合詞(這類詞可以同時在“讀秀”中檢索)。名詞的產(chǎn)生往往有其演變過程,如筆者在蘭臺考中研究“佩蘭”詞源時就發(fā)現(xiàn)其是從“佩戴蘭草”簡寫發(fā)展而成?!拔募笔遣皇怯梢陨蠌?fù)合詞(及“文字件數(shù)”)演變而來值得關(guān)注,再者曾被廣泛使用的文書學(xué)名詞“文字”“名件”后來失傳,而“文件”一詞的出現(xiàn)與勃興又是否與之有關(guān)也值得思考。
在明代及之前的文獻中沒有發(fā)現(xiàn)更多的“文件”線索,進一步研究則需要考察清初是否出現(xiàn)了這個名詞。通過檢索“愛如生”“書同文”等諸家數(shù)據(jù)庫,沒有發(fā)現(xiàn)清雍正朝及之前的文獻中有“文件”一詞,但同時發(fā)現(xiàn)“文報”“報匣”等詞使用頻率很高。在乾隆朝文獻中發(fā)現(xiàn)有三條“文件”記錄:《皇清奏議》卷六十七的鄂輝、成德《議西藏善后事宜疏(乾隆五十四年)》第一條中有“所安各塘不過以備馳遞文件之用”;乾隆五十七年《八旬萬壽盛典》卷八十四有“近以各直省咨部文件往復(fù)稽延,命分別設(shè)立月限,以清庶務(wù)”;乾隆三十九年《瓊州府志》卷三“鈔課”中有“附知府于霈詳請豁免雜稅文件”。另外在《高宗純皇帝實錄》中找到兩條記錄:乾隆十八年六月己酉,“軍機大臣議覆,盛京兵部侍郎卞塔海奏稱,來歲巡幸盛京,凡經(jīng)由程站,驛馬、車輛俱應(yīng)豫行飭備……往來馳送文件,請飭盛京將軍,于八旗驍騎校內(nèi)挑十二員,兵二十四名,分撥各站備?!保磺∪昃旁滦梁?,“諭軍機大臣等,巴爾品奏,近日哈薩克阿布勒比斯來文,殊欠明晰,且有交付字樣,業(yè)經(jīng)所呈文件,分別申飭等語,所辦甚是”。
對于以上檢索結(jié)果,須再加考證。關(guān)于《瓊州府志》,經(jīng)查超星數(shù)字圖書館,收有故宮所藏刻本的影印本,經(jīng)比對發(fā)現(xiàn),愛如生等數(shù)據(jù)庫里該卷次為抄配本,年代不詳,而刻本中無相應(yīng)內(nèi)容。因此這條記錄存疑,可結(jié)合康熙、道光兩朝府志進行綜合考訂,這兩種府志在“超星數(shù)字圖書館”里均有資源,經(jīng)初步比對,發(fā)現(xiàn)康熙府志中有“鈔課”一節(jié)但無相應(yīng)內(nèi)容,道光府志中無相關(guān)節(jié)目及內(nèi)容,所以對于此抄配本的相關(guān)問題需要進一步考證,但這已不屬于本文的關(guān)鍵任務(wù),因此從略。
關(guān)于《議西藏善后事宜疏》,通過使用“鄂輝”“馳送文件”等多個關(guān)鍵詞在“讀秀”中進行全文檢索發(fā)現(xiàn),此奏疏有多種別本存世,除《皇清奏議》外,《欽定巴勒布紀略》《明清史料·庚編》及中國社會科學(xué)院近代史所藏清乾隆年間毓奇、福康安、鄂輝等大臣奏折底稿抄本中均有輯錄。但《欽定巴勒布紀略》為節(jié)錄本,無“所安各塘不過以備馳遞文件之用”一句。社科院所藏抄本原件筆者未寓目,據(jù)魯波點校《清初各邊疆大臣奏折底稿(續(xù))》(載《清史研究》1996年第2期)顯示,該句內(nèi)容與《皇清奏議》一致,但因該抄本的出處及年代均未詳,故不能遽下定論。
而《明清史料·庚編》所錄該文情況比較復(fù)雜,其文為“□安各塘不過以備持備(疑誤)遞文□之用”,在關(guān)鍵處竟是表示不可釋讀的“□”。該書所給的題名是“內(nèi)閣抄出鄂輝等奏折(移會抄件)”,其文首句為“乾隆五十四年七月初十日內(nèi)閣抄出”,這些內(nèi)容均為別本所無。又因鄂輝奏折第一條中還有“所駐官兵不過防范地方、接送文報之用”一句,諸本皆同,所以此處“文□”是否也應(yīng)為“文報”?《明清史料》雖然是依據(jù)檔案轉(zhuǎn)錄而成,但因其編輯加工比較粗糙,內(nèi)容雜亂、錯訛較多,況且其關(guān)鍵文字處闕如,所以也不能輕易作為實據(jù)。要想弄清這個問題,可能需要查檢臺灣版《宮中檔乾隆朝奏折》《明清檔案》等大型叢書,其中或許影印了這件奏折。
另外通過檢索“讀秀”還發(fā)現(xiàn),對于學(xué)界稱之為“鄂輝章程”的這件奏疏,已有相當多的關(guān)注和研究,如鄧銳齡《清前期治藏政策探賾》、張羽新《清朝治藏典章研究》《元以來西藏地方與中央政府關(guān)系檔案史料匯編第2冊》等論著或史料匯編中都有相關(guān)內(nèi)容的收錄或研究,但都沒有涉及本文關(guān)注的這個細節(jié)問題。雖然他們注意到了版本的不同,但均未予深究。
《八旬萬壽盛典》有武英殿活字本和四庫全書本傳世,為乾隆時期原文獻無疑,所以本書中的“文件”是為確證。且從文句語意上看,此處“文件”一詞的運用相當嫻熟,說明當時此詞已經(jīng)通行。
需要特別指出的是,《高宗純皇帝實錄》并非乾隆時期形成的文獻,而是修于嘉慶朝,所以嚴格意義上講,它不是乾隆時期的原文獻。但其文字內(nèi)容形成于乾隆時期的可能性較大,因此乾隆實錄中的兩條“文件”記錄,可做參考佐證之用,如有條件,還可查閱相關(guān)檔案文獻加以核實確定。
由于清代文獻存世量巨大,尤其是與“文件”關(guān)系密切的歷史檔案還有大量原件沒有公開,已經(jīng)影印出版的奏折、諭旨等也多無商業(yè)數(shù)據(jù)庫提供專業(yè)檢索(“讀秀”全文檢索可能會指向這類文獻,但仍因結(jié)果太多而無法利用),所以目前如要進一步弄清乾隆朝之前“文件”是否已出現(xiàn)的問題,可能仍需采用古老的手工查檢方法。
另外目前各種文獻數(shù)據(jù)庫較多,除少數(shù)提供全文檢索的外,還有大量目錄庫、提要庫和影像庫等,甚至是很多個人和項目建設(shè)的內(nèi)部文獻數(shù)據(jù)庫,中國港臺地區(qū)及美國、日本等區(qū)域也都有建設(shè),研究者很難做到逐一嘗試,但這其中肯定還有更多的線索待查。
通過檢索部分數(shù)據(jù)庫還可以發(fā)現(xiàn),乾隆朝之后“文件”已較多出現(xiàn),到晚清時普遍使用,同時還發(fā)現(xiàn)“文件”一詞的使用似與軍機處有著較大的關(guān)聯(lián)[7],另外與公文有關(guān)的名詞在古代驛遞文獻中出現(xiàn)的頻率較高[8],這些問題都值得進一步探索研究。
對于從數(shù)據(jù)庫檢索所得的記錄,一定要核對原文,有的數(shù)據(jù)庫是文字和影像對照可以查證,有的數(shù)據(jù)庫只提供文本內(nèi)容,這就需要另找原文核對,可以是掃描的影像,也可以是紙質(zhì)影印本,甚至找古籍原本。這里試舉一例,在“國學(xué)大師”網(wǎng)絡(luò)數(shù)據(jù)庫中用關(guān)鍵詞“文件”進行全文檢索可得899條結(jié)果,經(jīng)粗略瀏覽發(fā)現(xiàn),其《全遼備考》中有這樣一段文字(標點為筆者所加):“牌檔:邊外文字,多書于木,往來傳遞者曰牌子,以削木片若牌故也。存貯年久者曰檔案,曰檔子,以積累多,貫皮條掛壁,若文件故也……”其中赫然出現(xiàn)了“文件”一詞!《全遼備考》一名《金遼備考》,為《柳邊紀略》的別本,內(nèi)容基本相同而略有差異。查續(xù)修四庫全書所收筠石山房本《柳邊紀略》[9]對應(yīng)內(nèi)容為:“邊外文字,多書于木,往來傳遞者曰牌子,以削木片若牌故也。存貯年久者曰檔案,曰檔子,以積累多,貫皮條掛壁,若檔故也……”另查“遼海叢書”所輯《全遼備考》中相應(yīng)段落也是“若檔故也”。另外“國學(xué)大師”中《柳邊紀略》的相應(yīng)段落中兩處“檔”字亦為“文件”,不知是錄入致誤還是其數(shù)據(jù)來源的問題。
以上是筆者用“以案說法”的形式來討論在人文社科研究中如何應(yīng)用“E考據(jù)”的問題,囿于篇幅的限制、數(shù)據(jù)庫權(quán)限的不足及紙質(zhì)文獻借閱的不易等因,本探討無法實現(xiàn)更為全面的鋪陳,僅為有限示例而已。但僅此足以說明“E考據(jù)”并非“簡單一搜”而已,更不是“偽考據(jù)”[10],要想將“E考據(jù)”更好地應(yīng)用于學(xué)術(shù)研究,除了要有相應(yīng)的學(xué)術(shù)積累外,還要有一定的材料駕馭能力和分析能力,有時候還要結(jié)合運用其他的方法手段[11]?!癊考據(jù)”是“立體性”的,絕不是單純仰賴于數(shù)據(jù)庫,切不可把數(shù)據(jù)庫檢索當作攻無不克的利器,而在有限的數(shù)據(jù)庫中檢索到有限的信息后就急于下斷語。
在本文撰寫完成后,筆者看到《光明日報》刊登了這樣一篇報道《“新文科”要培養(yǎng)什么樣的人才》[12],其中引用馬費成教授的一段話:“當代信息技術(shù)高度發(fā)展和廣泛應(yīng)用帶來了全新研究場景,全新的研究工具和研究方法的應(yīng)用,使整個文科的研究方式正在發(fā)生深刻變化,使得過去許多不能開展的人文社會問題都有了新的研究手段?!笨梢姟癊考據(jù)”被主動引入人文社科研究中已是不可逆轉(zhuǎn)的大趨勢。