李江瑤 崔旭
(西北大學(xué)公共管理學(xué)院 陜西西安 710127)
2008年,《科學(xué)》雜志上發(fā)表文章《Big Data:Science in the Petabyte Era》,此后,“大數(shù)據(jù)”一詞開始廣泛傳播。一般意義上, 大數(shù)據(jù)是指無(wú)法在可容忍的時(shí)間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對(duì)其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合,其特點(diǎn)可以總結(jié)為4個(gè)V, 即Volume (體量浩大)、Variety (模態(tài)繁多) 、Velocity (生成快速) 和Value (價(jià)值巨大但密度很低)[1],而其組成要素則是開放、在線、關(guān)聯(lián)。由大體量數(shù)據(jù)推動(dòng)的數(shù)據(jù)計(jì)算、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)安全、可視化等理論與技術(shù)當(dāng)中蘊(yùn)含的關(guān)于數(shù)據(jù)的科學(xué),即是我們所稱的數(shù)據(jù)科學(xué)。檔案學(xué)作為信息管理學(xué)科的重要組成部分,數(shù)據(jù)科學(xué)的發(fā)展勢(shì)必給我們學(xué)科的理論與實(shí)踐帶來(lái)巨大影響。由此,筆者統(tǒng)計(jì)了近5年檔案類中文核心期刊(2017)的文章以及國(guó)家社會(huì)科學(xué)基金項(xiàng)目,探究數(shù)據(jù)科學(xué)驅(qū)動(dòng)下檔案學(xué)的研究熱點(diǎn)及動(dòng)態(tài)[2-4]。
本文選取中國(guó)學(xué)術(shù)期刊網(wǎng)CNKI期刊全文數(shù)據(jù)庫(kù),以刊名為檢索對(duì)象,檢索檔案學(xué)核心期刊《檔案學(xué)研究》、《檔案學(xué)通訊》、《中國(guó)檔案》、《檔案管理》、《檔案與建設(shè)》、《浙江檔案》、《北京檔案》自2014年1月1日至2019年6月13日發(fā)表的論文,共計(jì)10990篇,剔除會(huì)議通知、學(xué)會(huì)簡(jiǎn)介、征稿啟事等無(wú)關(guān)文章后,獲得有效論文9722篇。本文將下載的題錄信息采用ROST CM6進(jìn)行預(yù)處理后,對(duì)文章標(biāo)題進(jìn)行了分詞及詞頻分析。
標(biāo)題分詞使用了ROST CM6自帶的分詞詞表,并輔以筆者自己整理的檔案學(xué)常見關(guān)鍵詞表,整理出了檔案學(xué)核心期刊詞頻前100的關(guān)鍵詞(見表1)。筆者利用ROST CM6中的社會(huì)網(wǎng)絡(luò)與語(yǔ)義網(wǎng)絡(luò)分析功能,選取了詞頻前150位的關(guān)鍵詞,使用NetDraw繪制了語(yǔ)義網(wǎng)絡(luò)圖(見圖1)。
表1 檔案學(xué)核心期刊標(biāo)題詞頻前100的關(guān)鍵詞
筆者又以全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室官網(wǎng)公布的2014至2018各年度《國(guó)家社科基金重大項(xiàng)目立項(xiàng)名單》、《國(guó)家社科基金年度項(xiàng)目、青年項(xiàng)目和西部項(xiàng)目立項(xiàng)名單》為檢索來(lái)源,以“檔案”、“文件”、“記錄”、“歸檔”、“政府”、“政務(wù)”為關(guān)鍵詞,共檢索出了2014至2018年檔案學(xué)立項(xiàng)106項(xiàng)。筆者將其著錄信息導(dǎo)入Excel表格,并使用ROST CM6對(duì)其標(biāo)題進(jìn)行分詞與詞頻統(tǒng)計(jì),詞頻前30位的詞匯排列如下(見表2),又以NetDraw繪制了語(yǔ)義網(wǎng)絡(luò)圖(見圖2)。
表2 2014—2018國(guó)家社科基金項(xiàng)目詞頻前30位的詞匯
由此可見,國(guó)家社科立項(xiàng)項(xiàng)目的關(guān)注重點(diǎn)與核心期刊的發(fā)文重點(diǎn)基本符合,除了傳統(tǒng)的“保護(hù)”、“服務(wù)”、“歸檔”、“檔案法”、“信息資源”之類的長(zhǎng)期研究主題,還聚焦于“大數(shù)據(jù)”、“數(shù)據(jù)”、“數(shù)字”、“數(shù)字檔案”、“媒體”、“社交媒體”、“電子文件”等與計(jì)算機(jī)技術(shù)緊密相連的主題。將期刊論文與基金項(xiàng)目進(jìn)行比較,發(fā)現(xiàn)國(guó)家社科基金項(xiàng)目對(duì)于技術(shù)前沿的嗅覺更加敏銳,更善于對(duì)新興技術(shù)領(lǐng)域進(jìn)行探索,受到數(shù)據(jù)科學(xué)的影響也更加明顯。
通過(guò)上述的詞頻分析、語(yǔ)義網(wǎng)絡(luò)繪制,加之對(duì)相同主題的論文與項(xiàng)目的聚類,筆者總結(jié)出在數(shù)據(jù)科學(xué)的推動(dòng)下,檔案學(xué)近五年的研究熱點(diǎn)如下:
2008年大數(shù)據(jù)這一概念提出,2011年起研究熱度漸升,近五年以大數(shù)據(jù)為背景的研究依然熱度不減。檔案學(xué)領(lǐng)域研究的大數(shù)據(jù)主要是網(wǎng)絡(luò)環(huán)境中的大數(shù)據(jù),它有多源異構(gòu)、交互性、時(shí)效性、社會(huì)性、突發(fā)性和高噪聲等特性, 不僅非結(jié)構(gòu)化數(shù)據(jù)多, 而且數(shù)據(jù)的實(shí)時(shí)性強(qiáng), 大量數(shù)據(jù)都是隨機(jī)動(dòng)態(tài)產(chǎn)生的。鄭金月[5]、何嘉蓀[6]以思辨的方式從大數(shù)據(jù)的本質(zhì)、檔案是不是大數(shù)據(jù)、大數(shù)據(jù)是不是檔案、“檔案大數(shù)據(jù)”的內(nèi)涵等方面解讀了檔案與大數(shù)據(jù)的關(guān)系;安小米[7]、楊來(lái)青[8]、陶水龍[9]、肖秋會(huì)[10]宏觀上講述了大數(shù)據(jù)在檔案領(lǐng)域的應(yīng)用現(xiàn)狀與發(fā)展趨勢(shì)、數(shù)字檔案資源整合、社會(huì)化媒體信息挖掘、檔案信息化建設(shè)、信息安全等方面的問題;談清輝[11]、顧寧紅[12]、張婉瑩[13]、顧珂[14]等針對(duì)科技檔案、城建檔案、會(huì)計(jì)檔案、人事代理檔案等專門檔案領(lǐng)域展開研究;于英香[15]則另辟蹊徑,對(duì)檔案學(xué)的大數(shù)據(jù)研究熱進(jìn)行了冷思考,得出了大數(shù)據(jù)時(shí)代檔案信息化建設(shè)應(yīng)在創(chuàng)新中堅(jiān)守傳統(tǒng)的結(jié)論。國(guó)家社科基金項(xiàng)目方面,近五年有十個(gè)項(xiàng)目立項(xiàng),覆蓋了大數(shù)據(jù)環(huán)境的檔案管理理論、治理體系、平臺(tái)構(gòu)建、服務(wù)創(chuàng)新等諸多方面。
此外,大數(shù)據(jù)時(shí)代的編研工作創(chuàng)新受到了格外的重視。檔案的開發(fā)利用、編研是檔案館工作的最終目的和重要組成部分。大數(shù)據(jù)時(shí)代,不僅數(shù)據(jù)來(lái)源拓寬,支撐研究的硬件系統(tǒng)與應(yīng)用軟件也能輔助檔案工作人員進(jìn)行更高效、更有深度的編研。李莉[16]、阮發(fā)俊[17]、王永梅[18]等對(duì)信息時(shí)代編研工作的發(fā)展趨勢(shì)、管理體系構(gòu)建、編研與開發(fā)方式進(jìn)行了闡述;黃夏基[19]從“恒”與“變”的視角,結(jié)合實(shí)踐中的案例和數(shù)據(jù),分析了檔案編研的主體、客體、行為和成果產(chǎn)生的變化,但仍面臨檔案編研成果界定、檔案編研成果重“編”輕“示”、經(jīng)濟(jì)效益低下的問題。
社交媒體的廣泛應(yīng)用使得官方政務(wù)微博、微信開始遍地開花,社交媒體中的信息也更加具備了存檔價(jià)值。因此,對(duì)社交媒體檔案部門對(duì)社交媒體的利用研究以及社交媒體中信息的歸檔范圍和標(biāo)準(zhǔn)的確定兩大類型。張江珊[20]、蔡明娜[21]等作者對(duì)國(guó)外檔案部門應(yīng)用方式、狀況等進(jìn)行了概述;高晨翔[22]、蔣冠[23]、何思源[24]等作者則對(duì)社交媒體檔案的定位、歸檔、保存、鑒定、管理策略等全過(guò)程進(jìn)行了探討。近三年國(guó)家社科基金項(xiàng)目亦有五項(xiàng)針對(duì)于社交媒體歸檔、管理、資源聚合等方面展開研究。
數(shù)據(jù)時(shí)代,不僅是檔案類型拓展到文本之外的圖像、音頻和視頻等,檔案的來(lái)源平臺(tái)也已經(jīng)不止于紙質(zhì)檔案的收集,而是擴(kuò)展到了電子文件、政務(wù)網(wǎng)站、社交媒體、機(jī)構(gòu)數(shù)據(jù)庫(kù)等多平臺(tái)。因此,需要把各種類型文件、各個(gè)平臺(tái)的數(shù)據(jù)進(jìn)行有效的整合勢(shì)在必行。梁孟華[25]、呂元智[26]兩位學(xué)者依托其國(guó)家社科項(xiàng)目對(duì)數(shù)字檔案資源跨媒體、跨平臺(tái)的知識(shí)集成、語(yǔ)義關(guān)聯(lián)、資源架構(gòu)、檢索框架等方面進(jìn)行了全面的探討。
信息載體從紙質(zhì)轉(zhuǎn)向電子之后,數(shù)字載體、網(wǎng)絡(luò)環(huán)境下的信息安全保障也是一個(gè)新的研究重點(diǎn)。國(guó)家社科基金項(xiàng)目有三項(xiàng)專門針對(duì)數(shù)字檔案風(fēng)險(xiǎn)治理與生態(tài)安全的研究。在期刊論文方面,高晨翔[27]、吳曉紅[28]、管先海[29]等從檔案館的層面出發(fā),從宏觀角度對(duì)其安全體系建設(shè)、評(píng)估進(jìn)行研究;孫大東[30]、白茹花[31]、袁雙云[32]等使用區(qū)塊鏈等手段,對(duì)電子文件保密性、憑證性、流轉(zhuǎn)中的安全控制進(jìn)行了研究;聶云霞[33]則對(duì)數(shù)字檔案用戶信息安全保障問題加以關(guān)注。他們之中的共性認(rèn)識(shí)即信息安全的關(guān)鍵是在檔案管理的全過(guò)程中就進(jìn)行安全控制,而非事后再來(lái)彌補(bǔ)。
傳統(tǒng)互聯(lián)網(wǎng)時(shí)代, 人們主要使用PC機(jī)來(lái)獲取信息資源和相關(guān)服務(wù)。如今,移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)通信、無(wú)線網(wǎng)絡(luò)等移動(dòng)網(wǎng)絡(luò)技術(shù)迅速發(fā)展,手機(jī)、平板電腦等終端極大普及,開展移動(dòng)服務(wù)是順應(yīng)潮流的有益探索。黃麗華[34]、王協(xié)舟[35]對(duì)當(dāng)前檔案部門使用微信、手機(jī)APP等移動(dòng)服務(wù)的現(xiàn)狀進(jìn)行了調(diào)查;薛辰[36]、劉春年[37]、王曉雪[38]對(duì)移動(dòng)檔案館服務(wù)方式、服務(wù)體系、實(shí)現(xiàn)功能等進(jìn)行了框架構(gòu)建;國(guó)家社科項(xiàng)目也對(duì)檔案信息服務(wù)與移動(dòng)數(shù)據(jù)終端的融合進(jìn)行了研究。
物聯(lián)網(wǎng)是一個(gè)基于互聯(lián)網(wǎng)、傳統(tǒng)電信網(wǎng)等信息承載體,讓所有能夠被獨(dú)立尋址的普通物理對(duì)象實(shí)現(xiàn)互聯(lián)互通的網(wǎng)絡(luò)[39]。物聯(lián)網(wǎng)技術(shù)的核心和基礎(chǔ)仍然是互聯(lián)網(wǎng)技術(shù),它是一種在互聯(lián)網(wǎng)技術(shù)基礎(chǔ)上延伸和拓展的網(wǎng)絡(luò)技術(shù),它將互聯(lián)網(wǎng)技術(shù)的終端由傳統(tǒng)的信息技術(shù)設(shè)備延伸和擴(kuò)展到了任意物體,并使任意物體之間可以通訊[40]。具體在檔案學(xué)領(lǐng)域,學(xué)者們將物聯(lián)網(wǎng)技術(shù)與檔案館建設(shè)相結(jié)合,搭建出一套智能檔案館的構(gòu)建體系。楊智勇[41]提出檔案館提供的“智慧服務(wù)”應(yīng)是網(wǎng)絡(luò)化、感知化、系統(tǒng)化和智能化的服務(wù);陳勇[42]指出了檔案自動(dòng)入庫(kù)、智能調(diào)節(jié)庫(kù)房環(huán)境、智能化追蹤管理、安全防盜自動(dòng)報(bào)警等能使物聯(lián)網(wǎng)技術(shù)融入到檔案管理實(shí)踐當(dāng)中;另有學(xué)者將檔案館建設(shè)置于智慧城市、智慧養(yǎng)老的大背景下進(jìn)行探討,并引入了人工智能、邊緣計(jì)算等新技術(shù)、新理論發(fā)展智慧檔案館的技術(shù)與實(shí)踐。三項(xiàng)國(guó)家社科基金項(xiàng)目研究對(duì)物聯(lián)網(wǎng)環(huán)境下檔案信息化以及資源建設(shè)進(jìn)行了新的思考。
在數(shù)據(jù)科學(xué)的推動(dòng)之下,檔案學(xué)的研究視野越來(lái)越寬,不止于文件領(lǐng)域的管理,而是將目光投射于更廣闊的網(wǎng)絡(luò)平臺(tái)、數(shù)據(jù)環(huán)境。檔案服務(wù)不停留于檔案館當(dāng)中,走向了網(wǎng)絡(luò)服務(wù)、社交媒體、移動(dòng)終端,越來(lái)越想走進(jìn)尋常百姓的生活。傳統(tǒng)檔案學(xué)研究主要是面向資源的研究,現(xiàn)如今,電子商務(wù)等領(lǐng)域推出了更多面向用戶的服務(wù)之后,也更加激發(fā)了檔案學(xué)的服務(wù)意識(shí),檔案領(lǐng)域?qū)τ谟脩舻难芯恳查_始跟進(jìn),更加注重面向用戶的優(yōu)化服務(wù),在“管”“用”關(guān)系的平衡之間向著便于社會(huì)公眾利用的方向邁進(jìn)。
身處于這樣一個(gè)技術(shù)領(lǐng)域發(fā)生著巨變的時(shí)代,盲目追求新技術(shù)與執(zhí)著固守老觀念,二者都不可取?;蛟S認(rèn)清發(fā)展潮流,找到技術(shù)前沿與檔案學(xué)最恰當(dāng)?shù)钠鹾宵c(diǎn),取長(zhǎng)補(bǔ)短充實(shí)檔案學(xué)理論與實(shí)踐,才能在保持本學(xué)科相對(duì)獨(dú)立性的基礎(chǔ)上實(shí)現(xiàn)檔案學(xué)在數(shù)據(jù)科學(xué)時(shí)代的融合性、跨越式發(fā)展。