邱志鵬 高建輝 黃天嬌
摘 要?少數(shù)民族口述歷史檔案對民族歷史傳承和民族社會記憶有跨時代的意義和價值,是各族人民世代相傳并視為其文化遺產組成部分的各種傳統(tǒng)文化表現(xiàn)形式。該文分析了少數(shù)民族口述歷史檔案的理論研究和實踐情況,提出基于數(shù)據庫建設的少數(shù)民族口述歷史檔案整理原則和流程,探索出一套完整的整理方法和要求,在一定程度上推動我國少數(shù)民族口述歷史檔案的數(shù)字化保護和研究工作。
關鍵詞 數(shù)據庫 少數(shù)民族 口述歷史檔案 整理
中圖分類號 G270.7 文獻標識碼 A 收稿日期 2020-03-26
★基金項目:國家社會科學基金項目“西南彝族口述歷史資料搜集整理及其有聲數(shù)據庫建設”(項目編號:16XTQ008)。
★作者簡介:邱志鵬,云南大學博士研究生在讀,主要研究方向為檔案學、歷史文獻學、民族檔案管理等領域;高建輝,云南大學博士研究生在讀,楚雄師范學院圖書館副研究館員,主要研究方向為圖書館學、歷史文獻學、數(shù)字化與數(shù)據庫建設等領域;黃天嬌,云南大學碩士研究生在讀,主要研究方向為民族檔案學。
Abstract The oral historical archives of ethnic minorities have epoch-making significance and value for the inheritance of national history and the memory of national society. They are expressions of various traditional cultures that have been passed down from generation to generation and regarded as part of their cultural heritage. This paper analyzes the theoretical research and practice of the oral historical archives of ethnic minorities, puts forward the principles and procedures for the compilation of oral historical archives of ethnic minorities based on database construction, and explores a complete set of compilation methods and requirements, which promotes the digital protection and research work of ethnic minority oral historical archives in China to a certain extent.
Keyword database; ethnic minority; oral historical archives; compilation
一、少數(shù)民族口述歷史檔案整理工作概述
1.理論研究述評。近年來,隨著口述史和口述檔案研究的逐步深入,國內檔案界的一些專家學者開始關注少數(shù)民族口述歷史文化的傳承與整理研究等熱點問題。傳統(tǒng)的少數(shù)民族口述歷史檔案整理工作方面,2013年,習曉耀闡述了納西族東巴口述文獻分類整理的發(fā)展、納西族東巴口述文獻分類整理的特點[1]。2018年,雷魯嘉在其碩士論文中提出,少數(shù)民族口述檔案整理工作不單單是對口述音頻、視頻的轉錄工作,同時也包括對采集到的相關資料,例如文字、照片等資料,進行整理[2]。2015年,解曉麗對裕固族口述檔案進行分類整理,將其分為歷史口述檔案、倫理口述檔案和民俗口述檔案[3]。
基于數(shù)據庫建設的少數(shù)民族口述歷史檔案整理方面,2011年,趙局建對云南少數(shù)民族口述檔案數(shù)據庫構建的意義、內容和原則進行了探討[4]。2017年,馮云提出了在數(shù)字化語境下構建西藏自治區(qū)非物質文化遺產傳承人口述史數(shù)據庫搶救口述文化記憶的設想,并就數(shù)據庫資源的采集、存儲、管理、檢索與利用以及所涉及的知識產權等問題進行了探討[5]??梢姡壳皣鴥葯n案界對少數(shù)民族口述檔案的整理研究較為零散,研究也只是對整理工作的某一環(huán)節(jié)或幾個環(huán)節(jié)進行闡述,而沒有較為系統(tǒng)全面地研究少數(shù)民族口述檔案的整理工作。
2.實踐工作述評。新中國成立以后,黨和國家高度重視少數(shù)民族民間文藝的保護與整理工作。1958年,我國召開了第一次全國民間文學工作者代表大會,提出了我國少數(shù)民族口頭文學遺產搶救問題,廣泛收集與整理少數(shù)民族口述資料。20世紀60年代,湖南省成立“少數(shù)民族文學工作委員會”,收集了大量少數(shù)民族口述檔案,并對其進行整理加工。2000年9月,中國社會科學院的重大項目“中國少數(shù)民族文學資料庫”提出建立“少數(shù)民族口承史詩資料分庫”和“活態(tài)神話資料分庫”[6]。武陵山區(qū)少數(shù)民族口述歷史檔案豐富,目前已建立一個資源豐富、遠程搜索的口述歷史數(shù)據庫,該庫可為讀者探索武陵山少數(shù)民族歷史提供數(shù)據[7]。云南省少數(shù)民族口述歷史檔案豐富,經實地調研得知,云南省檔案館保存了15個少數(shù)民族口述歷史檔案,只有小部分進行后期整理,大多口述采訪資料,例如采訪錄音、錄像、原始照片等檔案,還未加以規(guī)范化整理。楚雄師范學院圖書館建立的西南彝族口述歷史資料數(shù)據庫,內容豐富,整理規(guī)范,在國內處于領先地位。該資料數(shù)據庫收錄了大量的彝族口述歷史資料,多以音頻、視頻呈現(xiàn)。數(shù)據庫共分七個欄目,包括歷史政治、語言與文學、歌謠與藝術等[8]??梢姡覈贁?shù)民族口述檔案實踐工作取得了一定的成果,但整理主體較為單一,相關部門未出臺系統(tǒng)的整理標準,且也未進行較為系統(tǒng)、全面的整理。
二、少數(shù)民族口述歷史檔案整理原則和流程
1.整理原則。少數(shù)民族口述歷史檔案整理工作應符合檔案的管理要求,為實現(xiàn)價值創(chuàng)造有利條件,在整理少數(shù)民族口述歷史檔案時要遵循以下原則:
(1)以事件或人物為整理單位。按照少數(shù)民族實體檔案的整理方法,口述訪談資料應單獨建立全宗,那么全宗內檔案應按“民族—人物”或“民族—事件”進行分類整理。少數(shù)民族口述歷史檔案內容主要涉及少數(shù)民族各種活動、少數(shù)民族歷史事件、少數(shù)民族上層人士經歷、少數(shù)民族非遺傳承人的手工藝或技術要點等。在整理工作中,以事件或人物為整理單位,與采集內容相對應,符合采集內容和主題。同時以事件或人物為整理單位,分類方案清晰,易于操作,便于整理,有利于保持檔案的原始性。
(2)保持口述記錄材料的原始性。我國檔案界在檔案整理工作中遵循“充分利用原有基礎,保持文件之間的歷史聯(lián)系”的原則。那么在整理少數(shù)民族口述歷史檔案時也要遵循該原則,還原“原汁原味”的記錄材料。保持材料原始性主要體現(xiàn)在兩個方面:第一是內容材料的原始性,第二是記錄形式的原始性。在原始稿整理時,整理者最好選擇最熟悉訪談情況和內容的專業(yè)人士,整理者不得任意增減口述者口述內容,需忠實口述者的原話,不可摻雜個人觀點和意圖,保持口述內容的原始性。記錄形式上,在口述抄本原稿整理時應保持采訪時的記錄形式。
(3)符合檔案管理要求,便于數(shù)據庫建設。少數(shù)民族口述歷史檔案的整理應借鑒檔案管理學的相關方法、措施、手段和原則,并根據少數(shù)民族口述歷史檔案的實際情況,探索出一套符合檔案管理要求、便于計算機管理的科學方法。2018年1月1日開始實施的《口述史料采集與管理規(guī)范》中規(guī)定:“口述史料整理應符合檔案管理要求,便于計算機管理或計算機輔助管理。”[9]隨著檔案信息化建設的發(fā)展,口述檔案的數(shù)字化、網絡化勢在必行。在整理收集到的口述檔案時,我們應按照國家檔案局發(fā)布的相關標準,例如《中國檔案機讀目錄格式》[10]《歸檔文件整理規(guī)則》《電子文件歸檔與管理規(guī)范》《數(shù)碼照片歸檔與管理規(guī)范》等,進行口述檔案的整理工作,為口述檔案數(shù)據庫的建設提供便捷的途徑。
2.整理流程。通過反復實踐和總結,基于數(shù)據庫建設的少數(shù)民族口述歷史檔案整理流程如圖1所示。該流程分為三個階段:準備階段、電子文件處理階段和元數(shù)據生成階段。在準備階段,要明確整理內容,準備好數(shù)字化相關的軟硬件設備,對原始檔案進行數(shù)字化處理,制作口述文字記錄稿,本階段是整理工作的基礎,為后續(xù)工作提供了原始材料。電子文件處理階段主要是對少數(shù)民族口述歷史檔案的電子文件進行編輯,形成適合于數(shù)據庫檢索和利用的新文件,處理環(huán)節(jié)包括規(guī)范化處理、按類分割和有序存儲,本階段可以決定數(shù)據庫的數(shù)據規(guī)模和全文質量,為后續(xù)的著錄工作奠定基礎。元數(shù)據生成階段是整理最重要的階段,包括存儲后檔案的標引著錄和數(shù)據的導入,其中著錄工作是所有環(huán)節(jié)中消耗人力物力最多的環(huán)節(jié),著錄的質量直接決定了數(shù)據庫檢索、統(tǒng)計和利用等主要功能的使用效果,著錄的詳細程度和規(guī)范程度是數(shù)據庫區(qū)別于數(shù)字資源庫的重要標志。
三、少數(shù)民族口述歷史檔案整理方法和要求
1.前期準備,明確整理內容。少數(shù)民族口述歷史檔案由不同形式的載體組成,主要包括采集過程中形成的文字、照片、錄音、錄像[11],具體內容參見表1(見下頁)。
少數(shù)民族口述歷史檔案按不同內容可分為基本信息記錄材料、主題事件內容記錄材料、實施情況材料[12],具體內容參見表2。
一份完整歸檔的少數(shù)民族口述歷史檔案還應包括訪談提綱、受訪者的背景資料、報紙雜志和廣播電視對受訪者的相關報道、訪談時受訪者提供的信函和受訪者對口述資料的處理意見、訪談工作總結等。
2.原始檔案的數(shù)字化處理。很多口述歷史檔案采集時就已經是數(shù)字化的,直接拷貝到計算機即可進行下一步的處理,但還有一部分歷史年代久遠的檔案存儲在磁帶、錄像帶和紙質材料上,需要先對這部分檔案進行數(shù)字化處理。對于磁帶、錄像帶上生成的檔案,利用u-matic、betacamd等錄像帶無損采集轉換技術將磁帶、錄像帶上的內容轉換到計算機上。數(shù)字化之后除了要保留口述檔案文件以外,還要記錄檔案的相關信息??谑黾堎|歷史檔案的數(shù)字化方式有掃描、拍照、文字識別和人工錄入,鑒于口述檔案的特點,采用人工錄入較為常見。此外,還有部分口述記錄稿是用少數(shù)民族文字撰寫的,這類檔案需要進行掃描和翻譯后再人工錄入為文本格式。數(shù)字化處理之后的文件保存目錄為“文件格式—收集時間”。
3.制作口述文字記錄稿。制作口述文字記錄稿是指將采訪時形成的原始錄音、錄像、臨時記錄稿等原始檔案通過語音識別或聽錄的方式轉錄為文字記錄材料,保存在計算機中。在這一過程中,采集者要對口述者的記錄和原始檔案進行認真核對、校正,避免由于口述者年齡、口齒、方言等因素造成的誤差。進行文字記錄整理時,對口述者以方言方音講述的重要地名、人名、風俗等,應采用國際音標注音法標注[13]。在轉錄文字記錄時,采訪者應基于檔案的原始性來進行轉錄,不得任意增減受訪者意愿,忠實于受訪者的原話,不得摻雜采訪者的個人觀點與意圖。即便受訪者談及的事件背景、內容與查核的資料不一致,或者訪談中出現(xiàn)前后不一致的情況,也應保持采訪者的客觀立場,對少數(shù)民族口述歷史史料進行比較分析,對采訪者的情緒、語氣進行正確的理解,并用文字做好恰當?shù)臉俗R[14]。
文字記錄應盡可能按照實際采訪過程中提問及回答的先后順序,采用一問一答的形式進行轉錄[15]。文字記錄的轉錄工作最好選擇專業(yè)人士,轉錄工作一般可選擇三種人選:第一是對采訪內容較為了解并精通采訪時所使用的民族語言的專業(yè)人士;第二是訪談者;第三是新聞傳媒專業(yè)或相關專業(yè)的學生[16]。對已整理好的文字記錄材料,應征求受訪者的意見或請受訪者校核,確定是否有需要補充或修改的地方,盡量尊重和保留口述者的意圖和表述。
4.數(shù)字檔案的規(guī)范化處理。數(shù)字檔案的規(guī)范化處理是指利用計算機和專業(yè)軟件對于數(shù)字化之后的少數(shù)民族口述歷史檔案電子文件進行編輯,為數(shù)據庫建設提供統(tǒng)一化規(guī)格的檔案數(shù)字資源,使其符合數(shù)據庫建設和互聯(lián)網傳播的要求。規(guī)范化處理時要根據不同類型的文件分別進行,處理前要對原文件進行備份,統(tǒng)一處理的內容包括文字編碼、文件格式、圖片尺寸、視頻分辨率、文件大小、音頻質量等。其中,圖片分辨率一般壓縮為1920*1080,文件大小控制在1M左右,圖片色彩明暗適中,處理后的文件采用JPG格式保存。音頻處理工具采用“Cool Edit Pro”,處理完之后的文件一般采用MP3(320K)格式進行保存。視頻處理工具采用“Adobe Premiere Pro CC”,處理內容主要包括色彩調節(jié)、人物美化、添加字幕、編碼格式轉換、封裝格式轉換等步驟,編碼一般采用H.264或H.265,封裝格式一般采用MP4,添加字幕時需參照口述檔案文字轉錄稿進行。
5.規(guī)范化檔案的按類分割。數(shù)字檔案的分割是指把一個完整的口述歷史數(shù)字檔案文件按照內容所描述的不同主題分割為若干片段,使下一步著錄的內容更加詳細和精準,使利用者能夠更好地挖掘檔案中的信息。文件分割一般按文件類型分別進行,在分割之前要對原文件進行備份。首先,文本口述檔案一般都經過了整理,邏輯性較強,對其進行分割的方式包括三種:一是按章節(jié)分割,適用于一般性口述檔案材料;二是按史詩、故事或歌謠分割,適用于記錄史詩故事的圖書和文章;三是按問題進行分割,適用于采用問答形式記錄的口述資料。其次,音視頻口述檔案的分割方式主要是按主題進行,分割時應以采訪人所提的問題和現(xiàn)場筆記為依據,仔細聽取被采訪人所講述的錄音內容,其間若有和采訪問題不相關的錄音內容應過濾刪除,同一個主題的內容出現(xiàn)在不同錄音時段時應剪切合并成同一段錄音,盡量做到分割出來的錄音內容和采訪問題的主題一致,最后把分割出來的音視頻另存為一個新的文件,新文件應按照分割的時間先后順序命名,但不能改變原有文件的格式屬性。為保證資源的最大化利用,同一個口述歷史檔案分割出的不同主題內容越多越好。
6.分割后檔案的有序存儲。對于分割后新產生的口述歷史檔案電子文件,需要進行有序化存儲和簡單標記,其目的是便于下一步的著錄標引,并與原文件進行區(qū)分,保存后的文件同樣需要進行備份。在文件保存時可以參照口述檔案的分類方法來設計文件夾目錄結構,分割后少數(shù)民族口述歷史檔案資源在計算機中存儲目錄結構一般為“民族——口述者——文件格式——處理時間——具體文件”。在進行文件有序化存儲時,要把不同處理日期或者不同批次采集的同一口述者的口述檔案合并到一個文件夾,并按處理日期分開存儲。
7.存儲后檔案的著錄標引。存儲后檔案的著錄是指對存儲后檔案的內容特征和形式特征進行分析、選擇和記錄的過程。著錄對存儲后檔案有介紹、登記、報道等功能,對利用者檢索少數(shù)民族口述歷史檔案數(shù)據庫有重要意義。存儲后檔案的標引是指對存儲后檔案的內容特征進行分析和選擇,并賦予其規(guī)范化檢索標識的過程。著錄的具體要求可參照國家檔案局的《口述史料采集與管理規(guī)范》和楚雄師范學院圖書館的《彝族口述歷史資料著錄標準》。著錄標引工作既要對檔案內容進行深度揭示與加工,也要多維度地描述少數(shù)民族口述歷史檔案的內容,同時還要通過著錄標引體現(xiàn)少數(shù)民族口述文化的歷史價值[17],為數(shù)據庫建設提供詳述信息。
8.相關數(shù)據導入數(shù)據庫。相關數(shù)據導入數(shù)據庫包括元數(shù)據的導入和分割后文件的導入。導入前需由技術人員檢查審核數(shù)據的規(guī)范性和完整性,并由特定(特殊授權)的專業(yè)人員操作數(shù)據庫后臺軟件,把EXCEL表格導入數(shù)據庫,其他人員一律不得進行該項操作;導入后要在前臺對導入的數(shù)據進行測試,核查各類數(shù)據的顯示、瀏覽、下載、檢索等功能是否正常。導入方式分為批量導入和單條導入:批量導入適用于一次性導入較多的數(shù)據;單條導入適用于急需上網的數(shù)據,一般在后臺直接把單條數(shù)據的信息錄入數(shù)據庫。分割后的文件按要求直接復制到服務器上指定的路徑即可,但要注意元數(shù)據的條目與該文件一一對應,分割后導入的文件的名稱按照一定的規(guī)律編號,與保存元數(shù)據的EXCEL文檔一起存放于同一文件夾中,文件夾按時間順序命名,便于該文件的查找。
參考文獻
[1]習曉耀.納西族東巴口述文獻的采集、整理與保護研究[D].昆明:云南大學,2013.
[2]雷魯嘉.我國少數(shù)民族口述檔案的采集及其保障研究[D].南京:南京大學,2018.
[3]解曉麗.裕固族口述檔案的構建與保護[J].蘭臺世界,2015(14):46-47.
[4]趙局建,康蠡,杜釗.構建云南少數(shù)民族口述檔案數(shù)據庫的若干思考[J].云南檔案,2011(11):35-37.
[5]馮云.西藏自治區(qū)非物質文化遺產傳承人口述史數(shù)據庫建設探討[J].西藏研究,2017(6):99-104.
[6]陳子丹.少數(shù)民族口述歷史檔案研究[M].昆明:云南大學出版社,2015:150-151.
[7]彭燕.少數(shù)民族口述歷史數(shù)據庫建設與研究——以武陵山區(qū)少數(shù)民族口述歷史數(shù)據庫為例[J].圖書館,2014(5):119-121.
[8]楚雄師范學院圖書館.師有福講述紅河州民族研究所成立過程[EB/OL].http://yzksls.cxtc.edu.cn:8081/info/6040.jspx,2019-03-21.
[9][11][12][13]DA/T 59-2017,口述史料采集與管理規(guī)范[S].北京:國家檔案局,2017.
[10]錢毅.檔案數(shù)據庫質量控制的內涵與策略[J].檔案學通訊,2015(6):56-60.
[14]朱麗梅.口述檔案整理與分析探討——以華南理工大學建立口述檔案為例[J].中國檔案,2012(6):53-54.
[15][16]陳子丹.少數(shù)民族口述歷史檔案研究[M].昆明:云南大學出版社,2015:114.
[17]彭燕.文化傳承視角下土家族口述史料編目研究[J].圖書館學研究,2019(3):68-77.