占春蓮+劉宇+楊智勇
摘 要:為了揭示我國檔案學知識生產的范式轉型,發(fā)掘檔案學研究在新世紀前15年的階段性特征,本研究采用詞頻分析和共詞分析兩種研究方法,選取檔案學權威期刊《檔案學通訊》為樣本,以5年為時間切片對2000年~2014年的載文進行統(tǒng)計分析;研究發(fā)現我國檔案學研究從側重歷史檔案的保護和開發(fā)向數字檔案的開放利用轉變,整個檔案學科的研究范式也在由人文歷史范式向管理范式轉變。
關鍵詞: 檔案學研究范式;人文歷史范式;管理學范式;詞頻分析;共詞分析
1 研究問題的提出
“我國古代檔案學,是以歷史主義思維,在史料學的基本預設下展開的,而當代檔案學則是側重信息資源管理的思維,在管理學的基本預設下展開的。”[1]新舊范式的分野,在我國檔案學學科制度建設上有明顯的體現,即我國檔案學教學單位的機構歸屬存在兩種基本模式:一是檔案學歸屬于“信息資源管理”或“信息管理”相關院系,和圖書館學、情報學等相關學科進行整合,屬于管理學范式;二是檔案學歸屬于歷史學院或文學院等相關院系,和歷史學、文學等進行整合,沿襲人文歷史主義范式。這兩種范式的研究視角也有很大的不同:管理范式強調信息技術對檔案工作的沖擊和改造,構建以應用信息技術改造檔案工作為主要內容的檔案學研究;人文歷史范式則堅持檔案資料的歷史憑證價值,構建基于檔案信息內容整理和史料整理為主要內容的檔案學研究。
隨著檔案工作信息化的不斷深入,信息技術對檔案學的研究內容和知識生產方式都產生了巨大的影響。盧小賓對國外檔案學研究熱點分析發(fā)現,檔案學研究傾向于應用性,研究的熱點主要集中在兩類,一是檔案材料的保護和修復,二是檔案管理與文件管理。[2]這兩類研究主題,都明顯屬于的技術驅動型的管理學范式主題。耿志杰對外國檔案學研究主題的關聯(lián)網絡分析發(fā)現,“檔案學與歷史學頗有淵源,在檔案信息化的潮流下,國外檔案工作者并沒有一味地追隨潮流,仍然對‘歷史相關主題進行了大量研究,另外諸如‘古文研究材料、‘文化遺產等研究主題的度值也較大”。[3]
新世紀以來,信息技術對國外檔案界也產生了巨大的影響,以至于很多檔案學研究人員形成一個大致的主觀印象:隨著傳統(tǒng)檔案工作的信息化不斷推進,管理學范式的檔案學研究日益強勢,人文歷史主義范式的檔案學研究逐步式微。當代檔案學的知識生產存在一個范式轉換的現象。這種范式轉換是否真實存在,或者我國檔案學研究在多大程度上完成了這一范式轉型,正是本文要驗證和討論的核心問題。本研究意義在于提供經驗資料展示檔案學研究的范式轉換過程,可以更為清晰地展示信息技術對檔案學研究的具體影響,以便更好展現檔案學研究的未來趨勢。
2 資料來源
《檔案學通訊》(以后簡稱《通訊》)是由教育部主管、中國檔案學會和中國人民大學聯(lián)合主辦的中央級權威學術期刊,是我國中文社會科學引文索引(CSSCI)來源期刊,《中文核心期刊要目總覽》確定的檔案學、檔案事業(yè)類的首位核心期刊,是檔案學界唯一一家“國家社科基金資助期刊”,堪稱我國檔案學領域最具權威的學術期刊。[4]因此,《通訊》是一個管窺我國檔案學研究發(fā)展的代表性窗口。基于此,本文以2000年~2014年《通訊》15年的發(fā)文為分析對象,采用詞頻分析和共詞分析挖掘檔案學的研究熱點和前沿,從宏觀角度總結檔案學研究在這15年間的演變。數據來源選擇CNKI總庫,檢索文獻來源為“檔案學通訊”,精確匹配,發(fā)表時間為2000年1月1日至2014年12月31日。累計得到2608條記錄,剔除通知等非研究性文獻,共得到研究性文獻2585篇,每年的發(fā)文量如圖1所示。
由圖可知,刊物的發(fā)文量呈現出比較明顯的線性下降趨勢,R平方的值為0.383。在刊物每期印張保持不變的情況下,發(fā)文量減少意味著單篇論文篇幅的上升。因此,可以在一定程度上推定,每篇論文擁有更多的空間對所研究的問題進行更為細致深入的論述,這也意味著論文的深度和水平都在不斷地提高。
3 研究方法和工具
本文使用的主要數據分析方法是詞頻分析和共詞分析,并通過可視化軟件展示分析結果。詞頻分析法是利用能夠揭示或表達文獻核心內容的關鍵詞或主題詞在某一研究領域文獻中出現的詞頻的高低來確定該領域研究熱點和發(fā)展動向的文獻計量方法。[5]在通常情況下,文章的關鍵詞或主題詞是文章核心內容以及作者學術觀點、思想的高度概括;在某一領域一個時期的期刊發(fā)文中,某一關鍵詞或者主題詞反復高頻出現,可以反映說明該關鍵詞或主題詞所表征的研究內容是研究熱點。共詞分析(Co-Word Analysis)是一種內容分析技術,主要是分析一對詞兩兩在同一篇文獻中出現的次數,以此為基礎對這些詞進行分層聚類,揭示出這些詞之間的親疏關系,進而分析它們所代表的學科和主題的結構變化。[6]
本文主要使用劉啟元開發(fā)的文獻題錄信息統(tǒng)計分析工具(Statistical Analysis Tool for Informetrics,SATI)對題錄數據進行提取,采用Excel、Nodexl等軟件進行統(tǒng)計分析和可視化展示。為了體現出《通訊》在時間維度上的變化,本文將15年的數據分為三個5年度的切片,分別對2000年~2004年、2005年~2009年、2010年~2014年三個切片的文獻外部特征進行比較分析,揭示15年來《通訊》的研究內容演變過程,以此管窺中國檔案學研究在新世紀頭15年發(fā)展歷程。
4 基于詞頻分析的檔案學研究熱點演變
使用Sati的關鍵詞提取統(tǒng)計輸出功能,以5年為一個時間段將《通訊》2000年~2014年載文中出現的關鍵詞進行提取,統(tǒng)計結果見表1。表1數據顯示,三個時間段中,2000年~2004年的關鍵詞數量和總詞頻數遠遠高于后兩個時間段,2005年~2014年10年間的關鍵詞數量和詞頻總體保持比較穩(wěn)定的態(tài)勢。這一方面可能是由于2000年~2004年檔案學界對關鍵詞的理解和界定不夠成熟,關鍵詞標引不準確所致;同時,也有可能是由于這5年是處在學科范式轉型的突進期,多元研究范式并發(fā)活躍所致。
圖2~4展示了15年間關鍵詞的詞頻分布特征。由圖可知,關鍵詞的詞頻分布符合冪律分布,而且R平方的值都在0.8以上。2010年~2014年的R平方值達到0.9以上,這體現了《通訊》載文的關鍵標引越來越趨于成熟、穩(wěn)定,也從一個側面可以反映出檔案學研究的內部一致性越來越高,新的學科范式可能正在形成。
表2以5年為時間段,分別列出三個時間段中詞頻排名前20的高頻關鍵詞。由于時間段不同,其絕對出現詞頻不具有可比性,但是我們可以通過關鍵詞排序位置的改變,考察檔案學研究關注焦點的細微變化。分析近15年的高頻關鍵詞不難發(fā)現,這些關鍵詞基本上都屬于管理學范式的檔案學研究?!皺n案工作”“檔案信息”“檔案利用”“檔案管理”“數字檔案館”“電子文件”等主題在三個時間段重復出現,一直保持著持續(xù)的研究熱度,這些研究主題是檔案學領域近15年的重點。但是,一部分關鍵詞的排序位置有明顯的升降波動。比如“檔案工作”呈現出明顯的持續(xù)下降趨勢;而“電子文件”“數字檔案館”等關鍵詞的位置明顯持續(xù)上升。有些主題隨著時間的推移逐步退出了人們的視線焦點,如在2000年~2004年時段出現的高頻關鍵詞“國家檔案局”“國家檔案館”等;也有些主題的重要性開始被學者們關注。如2005年~2009年時段“電子政務”成為熱點,這與政府上網工程的不斷發(fā)展緊密相連(電子公文歸檔管理暫行辦法),在之后的時段淡出了熱點區(qū)域;2010年~2014年時段“社會記憶”“檔案文化”等主題成為檔案學界關注的焦點;2005年~2009年時段出現的“檔案開放”問題,在2010年~2014年時段演變成“公共檔案館”這一主題。隨著政府信息公開的推進和發(fā)展,有理由相信檔案信息開放、公開將繼續(xù)成為檔案學者研究的重點。
總體看來,計算機與信息技術的發(fā)展,對傳統(tǒng)以紙質為主要載體的檔案工作產生了重大沖擊和改造,電子文件、數字檔案館的建設等基于信息技術驅動的管理學范式的檔案研究已經成為檔案學知識生產的主流。檔案信息化建設仍有很大的發(fā)展空間,因而可以認為檔案信息化建設的相關主題仍將是檔案學界今后或者很長的一個時期的研究熱點。
5 基于共詞分析的檔案學研究熱點演變
為了在類的層次上展現檔案學研究的主題集中與分散程度,本文采用共詞分析揭示關鍵詞之間的內在關系,以便進一步揭示檔案學研究主題的內在關聯(lián)性和學科領域的中觀結構。和詞頻分析的思路保持一致,根據圖2~4三個時間段關鍵詞的冪律分布,2000年~2004年的分布拐點是20,因此在共詞分析時本文選擇詞頻在25次以上的88個關鍵詞構建88×88的共詞矩陣;同理,得到2005年~2009年出現頻次在6次以上的73個關鍵詞構建73×73的共詞矩陣,2010年~2014年出現頻次在5次以上的81個關鍵詞構建57×57的共詞矩陣。由于檔案學者在使用關鍵詞時有一些不規(guī)范的現象,本文采用人工方式對關鍵詞進行了清理,去除沒有檢索意義的關鍵詞:“中國”“研究”“檔案”“信息” “對策”“管理”“服務”“保護”“建設”“問題”“策略”“特點”“模式”“進館”“中國檔案”“學術研究”“理論與實踐”;合并了一些關鍵詞:將“檔案數字化”和“數字化”合并為“數字化”,“檔案專業(yè)”和“檔案學專業(yè)”合并為“檔案學專業(yè)”。經過清洗后,2000年~2004年時段保留了78個關鍵詞,比原始矩陣少了10個關鍵詞;2005年~2009年時段保留了56個關鍵詞,比原始矩陣少了17個關鍵詞;2010年~2014年時段保留了53個關鍵詞,比原始矩陣少了4個關鍵詞。由此可見,在2010年之前,檔案學者給論文賦予關鍵詞時不夠規(guī)范,在2010年之后這種情況有了很大的改觀。
用Nodexl軟件導入共詞矩陣,采用Wakita-Tsurumi算法對關鍵詞進行聚類,三個時間段的聚類圖見圖5~7所示。圖中節(jié)點的大小由該節(jié)點在網絡中的中心度大小決定,中心度越大表明和該節(jié)點鏈接其他節(jié)點的書目越多;節(jié)點之間連線的粗細由兩個節(jié)點之間的共現次數決定,共現次數越多,連線越粗。從整體聚類效果來看,2000年~2004年時段的高頻關鍵詞形成9個類簇,2005年~2009年時段、2010年~2014年時段都只形成7個類簇。這在一定程度上表明檔案學的研究重點逐漸趨于集中,學科研究范式趨于穩(wěn)定。
類簇G1三個時間段的變化趨勢顯示:由單純的檔案教育和簡單的檔案學基礎理論研究逐漸轉向融入國家和社會發(fā)展背景的檔案文化和社會記憶研究;類簇G2三個時間段的變化趨勢顯示:由研究基礎的檔案館自身進行檔案信息開發(fā)利用轉向研究通過建設數字檔案館、檔案網站等網絡手段進行檔案信息資源開發(fā)利用;類簇G3三個時間段的變化趨勢顯示:由過去檔案行政管理體制下的檔案管理研究轉向去行政化的檔案理論與實踐研究;類簇G4三個時間段的變化趨勢顯示:由檔案信息管理轉向檔案知識管理和信息安全管理;類簇G5三個時間段的變化趨勢顯示:由檔案職業(yè)工作研究轉向檔案教育工作和文化事業(yè)研究;類簇G6三個時間段的變化趨勢顯示:由側重科技檔案管理研究轉向較為廣泛的檔案文化服務研究;類簇G7三個時間段的變化趨勢顯示:由側重以歷史檔案為對象的檔案保護研究轉向以數字檔案為對象的檔案開放和安全研究。
總體看來,在國家文化事業(yè)建設、互聯(lián)網技術以及信息技術的影響下,檔案學研究對象正在從傳統(tǒng)的紙質檔案向現代的電子檔案轉變,研究內容正在從以保護和管理為主向開發(fā)和服務轉變,研究范疇也在從側重歷史檔案的保護和開發(fā)向數字檔案的開放和利用轉變,整個檔案學科的研究范式也在由人文歷史主義范式向信息管理范式轉變。
6 結語
通過對《通訊》15年的載文進行詞頻分析和共詞分析發(fā)現,管理學范式的檔案學研究已經居于檔案學研究的指導地位;雖然社會記憶、檔案文化等研究主題屬于人文歷史范式的檔案學研究,但是從整體上看該范式的研究居于學科研究的邊緣地位。詞頻分析和共詞分析是一種常用的有效揭示學科研究主題的結構和發(fā)展動向的研究方法,在各個學科中都有所使用,[7]但是這種分析方法卻以損失詞與詞之間的關系信息為代價,[8]因此其分析結果不可能與所有情況完全吻合。除此之外,本文只采用了《通訊》一種期刊作為數據來源,樣本空間還有進一步擴展的空間,待以后的研究中加以完善。
參考文獻:
[1]丁華東,李珍.范式轉換:檔案學學術分期的新視點[J].浙江檔案,2008(7):14~17.
[2]盧小賓,高歡.基于Web of Science的檔案學研究熱點分析[J].檔案學通訊,2015(3):35~38.
[3]耿志杰,顏祥林,王婷婷.國外檔案學研究主題的關聯(lián)網絡分析——基于LISA數據庫[J].檔案學通訊, 2012(1):68~72.
[4]王云慶,徐芳.從作者分析看我國檔案學研究隊伍的狀況——基于2001-2010年《檔案學通訊》論文的統(tǒng)計分析[J].檔案學通訊,2011(4):19.
[5]馬費成,張勤.國外知識管理研究熱點——基于詞頻的統(tǒng)計分析[J].情報學報,2006,25(2):163~165.
[6]張紅春,卓越.國內社會保障研究的知識圖譜與熱點主題——基于文獻計量學共詞分析的視角[J].公共管理學報,2011(8):111~121.
[7]梁立明,謝彩霞.詞頻分析法用于我國納米科技研究動向分析[J].科學學研究,2003,21(2):138~142.
[8]萬昊,譚宗穎,魯晶晶,等.2001-2014年引文分析領域發(fā)展演化綜述[J].圖書情報工作,2015,59(6):120~136.
(作者單位:上海大學圖書情報檔案系 來稿日期:2015-10-08)