李 冬
(大慶油田檔案館,黑龍江 大慶 163002)
步入大數(shù)據(jù)時代,數(shù)據(jù)貫穿于企業(yè)管理的計劃、組織、領(lǐng)導(dǎo)、控制和創(chuàng)新之中,如何更好地利用海量數(shù)據(jù)為企業(yè)管理和發(fā)展服務(wù)已成為不可回避的問題。企業(yè)檔案作為企業(yè)重要信息資源,其管理理論、管理手段、管理環(huán)節(jié)發(fā)生了根本性的變化,企業(yè)檔案資源體系建設(shè)正面臨著新的機(jī)遇和挑戰(zhàn)。大數(shù)據(jù)時代企業(yè)檔案資源體系建設(shè)應(yīng)注意哪些問題,采取何種手段?加強(qiáng)檔案資源科學(xué)配置和高效利用,對提高企業(yè)檔案管理水平和服務(wù)企業(yè)發(fā)展具有怎樣的現(xiàn)實意義?
企業(yè)檔案資源體系指對企業(yè)在生產(chǎn)經(jīng)營中形成的、企業(yè)有保存價值的全部檔案的管理,要做到由分散到集中、由無序到有序,更重要的是要按照我國檔案工作“統(tǒng)一領(lǐng)導(dǎo),分級管理”的原則,通過對企業(yè)各級檔案機(jī)構(gòu)的歸并及合理分工和檔案資源的整理與組合,使檔案機(jī)構(gòu)和檔案資源結(jié)構(gòu)合理、配置優(yōu)化。
企業(yè)加強(qiáng)檔案資源體系的建設(shè),是企業(yè)檔案工作“三納入”“四同步”的重要體現(xiàn),同時也是降低企業(yè)檔案管理成本和檔案實體安全的需要。
大數(shù)據(jù)時代發(fā)展的需要。隨著大數(shù)據(jù)時代的到來,企業(yè)現(xiàn)代化、國際化程度越來越高,檔案利用者對信息需求呈現(xiàn)專業(yè)性、知識性、多樣性、高效性等特點(diǎn)。現(xiàn)有進(jìn)館查借閱或網(wǎng)上系統(tǒng)查詢檢索的利用方式,已無法滿足現(xiàn)實的需求,迫切需要運(yùn)用數(shù)據(jù)挖掘等有效的技術(shù)手段對龐雜零散的檔案信息資源進(jìn)行分析、整合,從中抽取有價值的信息和知識,滿足檔案利用者對檔案信息產(chǎn)品和服務(wù)越來越高的需求。
企業(yè)可持續(xù)發(fā)展的需要。大慶油田作為采掘型企業(yè),與其他類型企業(yè)相比,其科研、生產(chǎn)、經(jīng)營管理過程中對檔案信息資源的依賴程度更高。企業(yè)成立初期,檔案數(shù)量少、利用率低,依靠“活字典”或手工查找,就能滿足企業(yè)日常管理的需要;隨著時間的推移,檔案數(shù)量增大,利用率也越來越高,“活字典”越來越滿足不了需要。新形勢新任務(wù)對企業(yè)檔案資源體系建設(shè)提出了新要求。我們要清醒地認(rèn)識到,要承擔(dān)起為企業(yè)可持續(xù)發(fā)展提供集成化的檔案信息支持的工作使命,這迫切要求企業(yè)檔案部門具有高度的責(zé)任感和全局眼光,積極開展檔案資源體系建設(shè)。
檔案工作自身發(fā)展的需要。檔案工作在信息化的快速推進(jìn)中迎來了大數(shù)據(jù)時代,檔案管理由紙質(zhì)文獻(xiàn)管理為主向數(shù)據(jù)化信息管理轉(zhuǎn)變,電子檔案、檔案信息系統(tǒng)數(shù)據(jù)等成為檔案管理工作的主要內(nèi)容;檔案信息由分散、龐雜向系統(tǒng)、知識型轉(zhuǎn)變,集成化、網(wǎng)絡(luò)化、智慧型服務(wù)成為企業(yè)檔案館服務(wù)的方向;檔案管理、整合、挖掘,都將在數(shù)字化環(huán)境中進(jìn)行,不斷地開發(fā)、提供、推廣集成化的檔案信息產(chǎn)品,構(gòu)建主動的、開放式的檔案信息服務(wù)體系;檔案收集、整理、利用由傳統(tǒng)的手工操作向檔案信息系統(tǒng)等現(xiàn)代化管理手段轉(zhuǎn)變,檔案載體及檔案開發(fā)、研究,更是發(fā)生了根本性的變化。在這種情況下,推進(jìn)企業(yè)檔案資源體系建設(shè),則是新時期企業(yè)檔案工作的當(dāng)務(wù)之急。如果我們?nèi)狈@種意識,不但會阻礙檔案自身發(fā)展、資源開發(fā)和利用,甚至?xí)绊憴n案工作的地位。
企業(yè)檔案館普遍存在館藏檔案門類多、數(shù)量大,但“含金量”低、價值少的現(xiàn)象。具體表現(xiàn)為:一是年代斷缺,缺乏連續(xù)性。如大慶油田開展“三基”工作崗位責(zé)任制大檢查編研工作,由于油田會戰(zhàn)初期,檔案機(jī)構(gòu)不健全,管理不規(guī)范,使得部分具有查考利用價值的原件散失,甚至有些年代的檔案資料出現(xiàn)空白。二是內(nèi)容不全,缺乏系統(tǒng)性。企業(yè)管理部門日常工作中形成的檔案,不是某個業(yè)務(wù)節(jié)點(diǎn)產(chǎn)生的內(nèi)容不全,就是反映同一內(nèi)容的其他相關(guān)材料不全。檔案資料沒有“顆粒歸倉”,如企業(yè)有些部門形成的業(yè)務(wù)報表等。三是載體單一,缺乏完整性。特別是重要事件重大活動形成的檔案資料,只留存了部分文字材料,而反映事件活動的其他相關(guān)載體資料不全,如沒有照片、音像等資料,不能多種載體立體地反映歷史全貌。四是信息滯后,缺乏時效性。文件材料等從形成到入館整理,再到提供利用,完成整個工作流程需要一定時間周期,檔案資料時效性受到影響,信息的滯后,使得檔案資料難以形成獨(dú)特的信息資源優(yōu)勢。
檔案信息資源體系建設(shè)是現(xiàn)階段檔案數(shù)字化建設(shè)的重點(diǎn)。館藏歷史檔案數(shù)字化是檔案信息資源的重要來源。檔案數(shù)字化是指利用數(shù)據(jù)庫技術(shù)、數(shù)據(jù)壓縮技術(shù)、掃描技術(shù)等現(xiàn)代信息技術(shù),將傳統(tǒng)介質(zhì)的檔案轉(zhuǎn)化為數(shù)字信息,并系統(tǒng)組織成為具有有序結(jié)構(gòu)的檔案信息庫。目前,對歷史館藏檔案數(shù)字化工作逐年推進(jìn),但以PDF文件格式為主要掃描生成的電子文件是圖像型文件,其將文字、圖片等封存在一“頁”或多“頁”中,無法實現(xiàn)全文檢索和查詢,不能進(jìn)行加工和利用,成為大數(shù)據(jù)時代企業(yè)檔案資源體系建設(shè)的瓶頸,必須引起高度重視。
企業(yè)檔案是企業(yè)一種重要的信息資源,又不同于一般信息資源,是最具憑證性、權(quán)威性的核心信息資源。企業(yè)檔案是企業(yè)資產(chǎn)的證明,是企業(yè)的知識資產(chǎn),還是企業(yè)發(fā)展歷史記憶。其中,企業(yè)涉密檔案是企業(yè)檔案的一部分,由國家秘密和企業(yè)商業(yè)秘密等組成。長期以來,由于保密安全意識不強(qiáng),制度規(guī)定執(zhí)行不利,檢查監(jiān)管考核不嚴(yán),企業(yè)涉密檔案無密定密、有密高密、定密不解密,客觀上造成了企業(yè)涉密檔案文件越積越多,數(shù)量龐大,混雜管理,造成企業(yè)保密成本越來越大,管理手段相對滯后,嚴(yán)重影響了企業(yè)檔案資源體系建設(shè)。
集約化管理是整合企業(yè)檔案資源,實現(xiàn)檔案資源集中管理的新模式。大數(shù)據(jù)技術(shù)為企業(yè)檔案信息開發(fā)利用奠定基礎(chǔ),企業(yè)檔案集約化管理也為實施大數(shù)據(jù)管理提供便利條件。采油二廠科學(xué)組織,規(guī)范有序地開展檔案集約化工作。他們深入所屬基層單位開展調(diào)研,核清館藏情況、利用情況、設(shè)施設(shè)備和人員狀況,形成整體運(yùn)行方案。抽調(diào)專門力量組織協(xié)調(diào),對18個基層單位6大類檔案,總館藏量達(dá)10萬卷、52萬件實行集約化管理,通過上下齊動、逐級核查、規(guī)范移交、異地備份等措施,全面完成檔案集約化管理工作。
豐富的館藏資源,是實現(xiàn)企業(yè)檔案資源體系建設(shè)的根本保證,是為企業(yè)提供信息支持的命脈和基石,而征集工作則是豐富和充實館藏的一個重要途徑。大力開展向社會各界的檔案征集工作,制定企業(yè)檔案征集制度,明確具體征集范圍,規(guī)范征集辦法;同時還可借助信息化的機(jī)會,創(chuàng)建企業(yè)檔案征集成果展覽平臺,擴(kuò)大企業(yè)檔案館的社會影響,進(jìn)一步豐富館藏,拓寬檔案來源,爭取社會各界認(rèn)同和關(guān)注。
企業(yè)檔案部門開展歷史館藏檔案的數(shù)據(jù)化工作,切忌盲目性,應(yīng)綜合分析檔案價值,兼顧利用需求,統(tǒng)一數(shù)字化標(biāo)準(zhǔn)和規(guī)范,逐步激活“封存”的檔案,全面推進(jìn)企業(yè)檔案數(shù)據(jù)化工作。所謂檔案數(shù)據(jù)化是指應(yīng)用計算機(jī)技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)等產(chǎn)生的新型信息形態(tài)。它把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,利用計算機(jī)系統(tǒng)進(jìn)行管理,通過網(wǎng)絡(luò)實現(xiàn)資源共享。檔案數(shù)字化是一項技術(shù)性和專業(yè)性很強(qiáng)的工作,其主要方式之一就是對檔案進(jìn)行掃描加工,從而形成一個有序結(jié)構(gòu)的檔案信息庫。
一是進(jìn)行雙層PDF文件加工。對已經(jīng)完成數(shù)字化的歷史館藏數(shù)據(jù),結(jié)合本企業(yè)實際情況,經(jīng)過去污、糾偏和OCR識別,轉(zhuǎn)化生成雙層PDF文件,其上層是原始圖像,下層是識別結(jié)果,這樣可以100%保留原始版面效果,并且支持選擇、復(fù)制、檢索等功能,這樣的PDF文件最后可以存儲在光盤、硬盤或磁盤陣列中,并通過建立索引數(shù)據(jù)庫進(jìn)行科學(xué)的管理。雙層PDF的出現(xiàn)有效地解決了識別成本和閱讀利用的矛盾,是一種較有潛力的資源格式。
二是調(diào)整數(shù)字化方式。在今后開展數(shù)據(jù)化工作時,有條件的企業(yè)檔案部門,直接改變原有數(shù)字化方式,應(yīng)用RFID技術(shù),對文本資料進(jìn)行掃描,然后對圖像文件進(jìn)行分析處理,獲取文字及版面信息。RFID,Radio Frequency Identification,即無線射頻識別,是一種通信技術(shù),通過無線射頻技術(shù)實現(xiàn)檔案信息的雙向傳導(dǎo)的非接觸式的自動識別技術(shù)。RFID俗稱電子標(biāo)簽,具有非接觸式快速掃描,抗污力強(qiáng)、耐久性好,存儲容量大、可重復(fù)使用,形狀多、體積小、安全性高等優(yōu)點(diǎn)。在檔案數(shù)字化工作中,應(yīng)用RFID技術(shù)解決了掃描數(shù)據(jù)失真,保障檔案數(shù)字化、檔案利用和保管更加安全便利。[1]
統(tǒng)一領(lǐng)導(dǎo),分級管理。企業(yè)設(shè)置檔案商業(yè)秘密保密工作領(lǐng)導(dǎo)機(jī)構(gòu),即企業(yè)檔案商業(yè)秘密保密委員會,全面監(jiān)督指導(dǎo)企業(yè)檔案密級管理工作。在堅持保密委員會的領(lǐng)導(dǎo)和管理下,企業(yè)檔案部門、歸檔部門分工明確、各司其職、密切配合,共同推進(jìn)企業(yè)檔案密級管理工作。
分清主體,職責(zé)明確。企業(yè)檔案密級管理工作,涉及檔案資料的形成者、歸檔者和管理者等方面,需要各方在檔案資料運(yùn)行的各個環(huán)節(jié)各負(fù)其責(zé)。在文件形成環(huán)節(jié),由文件形成者擬定密級并按公文格式要求進(jìn)行標(biāo)注;在歸檔環(huán)節(jié),由立卷部門負(fù)責(zé)對有無密級的文件材料進(jìn)行確定,要在案卷封面及歸檔文件目錄中做出具體密級標(biāo)識;保密文件歸檔后,要進(jìn)行密級變更和解密工作,需要由檔案部門、檔案形成部門和保密工作部門共同協(xié)作完成,即:檔案部門對已滿保密期限的檔案資料,未接到延期保密通知的,可以按“自行解密”處理;定密單位對保密文件的提前或推后解密,需要向檔案部門做相應(yīng)變更說明,企業(yè)保密工作部門應(yīng)負(fù)責(zé)對定密與解密工作進(jìn)行業(yè)務(wù)指導(dǎo)和監(jiān)督。
創(chuàng)建格局,規(guī)范業(yè)務(wù)。企業(yè)檔案部門應(yīng)建立健全企業(yè)檔案密級管理制度,根據(jù)工作實際需要,加強(qiáng)企業(yè)檔案密級管理工作,做好本企業(yè)從文件密級初始擬定、歸檔確認(rèn)及進(jìn)館鑒定等各項工作。為了降低企業(yè)檔案密級管理成本,提高工作效能,可以將企業(yè)檔案密級管理納入“檔案鑒定”工作體系,同時將檔案開放鑒定融于“檔案密級確定工作”同步進(jìn)行,以便在維護(hù)保密檔案安全利用的前提下,發(fā)揮開放檔案的利用價值。
大數(shù)據(jù)時代,檔案信息將沿著多元性、知識性、先進(jìn)性發(fā)展,企業(yè)檔案資源管理、儲存、整合、挖掘等在數(shù)字化環(huán)境中進(jìn)行。要利用好檔案信息,堅持檔案服務(wù)一站式,為企業(yè)發(fā)展服好務(wù)。
[1]呂元智.數(shù)字檔案資源體系的語義互操作實現(xiàn)研究[J].檔案學(xué)通訊,2013,(5).