李 芳 范海斌/國能神東煤炭集團有限責任公司檔案館
2014年6月,習(xí)近平總書記提出“四個革命,一個合作”能源安全新戰(zhàn)略,為我國能源行業(yè)轉(zhuǎn)型發(fā)展指明了方向。為深入貫徹落實國家全面深化供給側(cè)改革的精神,推進國務(wù)院關(guān)于中國工業(yè)4.0的部署,全面貫徹《促進大數(shù)據(jù)發(fā)展行動綱要》和《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》有關(guān)要求,筆者所在的神東煤炭公司大力推廣智能礦山建設(shè),在智能工作、快速掘井、礦用卡車無人駕駛、礦用機器人、智能一體化應(yīng)用平臺等方面加強科技研發(fā)投入,對礦山信息資源進行高效和有序的整合及管理,全面引入數(shù)字化、虛擬化、集成化和智能化,依托計算機網(wǎng)絡(luò)綜合管理生產(chǎn)、經(jīng)營、環(huán)境、資源和安全等各個方面,優(yōu)化了企業(yè)整體協(xié)作,為提升企業(yè)效益和市場競爭力奠定了基礎(chǔ)[1][2]。
本文按照新修訂《檔案法》的要求和習(xí)近平同志關(guān)于檔案工作走向依法治理、走向開放、走向現(xiàn)代化的科學(xué)論斷,對接工業(yè)和信息化部關(guān)于工業(yè)數(shù)據(jù)分級管理的規(guī)定,落實國家檔案局及陜西省檔案局關(guān)于大數(shù)據(jù)歸檔體系研究的統(tǒng)一部署,立足現(xiàn)有智能礦山的成果,擬對業(yè)務(wù)系統(tǒng)電子數(shù)據(jù)歸檔及利用展開研究探索,促進檔案實體管理向信息管理轉(zhuǎn)型,為檔案電子數(shù)據(jù)的收集、梳理、利用制定合適的規(guī)則體系,為檔案資源開發(fā)奠定數(shù)據(jù)和規(guī)則基礎(chǔ),填補煤炭行業(yè)應(yīng)用和管理空白,為檔案事業(yè)發(fā)展做出探索,為企業(yè)價值發(fā)揮提供新的助力[3]。
中共中央辦公廳、國務(wù)院辦公廳聯(lián)合下發(fā)的《關(guān)于加強和改進新形勢下檔案工作的意見》,將檔案管理工作提高到“推動經(jīng)濟社會科學(xué)發(fā)展、維護國家安全和社會穩(wěn)定、維護人民群眾合法權(quán)益、提高黨的執(zhí)政能力和政府管理水平”的高度,要求“檔案收集模式、管理手段、服務(wù)機制需要進一步創(chuàng)新”,“建立健全覆蓋人民群眾的檔案資源體系、方便人民群眾的檔案利用體系、確保檔案安全保密的檔案安全體系”。圍繞檔案資源、利用、安全“三個體系”推進檔案建設(shè)工作,以信息化手段加快檔案管理現(xiàn)代化轉(zhuǎn)型,充分發(fā)揮檔案工作服務(wù)大局、服務(wù)經(jīng)濟、服務(wù)民生支撐作用,是檔案工作今后一個階段的主要任務(wù)[4]。
2 0 2 1 年5 月,中國煤炭工業(yè)協(xié)會印發(fā)《煤炭工業(yè)“十四五”高質(zhì)量發(fā)展指導(dǎo)意見》,預(yù)計“十四五”末,國內(nèi)煤炭產(chǎn)量控制在41億噸左右,全國煤炭消費量控制在42億噸左右,年均消費增長1%左右?!兑庖姟分赋觯斍昂徒窈筝^長時期內(nèi),煤炭在我國能源體系中的主體地位和“壓艙石”作用不會改變?!兑庖姟愤M一步明確“十四五”發(fā)展目標,即全國煤礦數(shù)量將控制在4000處以內(nèi),大型煤礦產(chǎn)量占85%以上,大型煤炭基地產(chǎn)量占97%以上;建成煤礦智能化采掘工作面1000處以上;建成千萬噸級礦井(露天)數(shù)量65處,產(chǎn)能超過10億噸/年。煤炭行業(yè)在加速向“智能礦山”轉(zhuǎn)型,“智能礦山”大數(shù)據(jù)治理成為行業(yè)未來必須面臨的問題[5]。
創(chuàng)建歸檔規(guī)則,完善檔案資源建設(shè)。通過對煤礦安全系統(tǒng)、設(shè)備管理系統(tǒng)等信息系統(tǒng)的研究,構(gòu)建大數(shù)據(jù)歸檔利用平臺,實現(xiàn)數(shù)據(jù)實時采集,解決業(yè)務(wù)系統(tǒng)中結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)歸檔問題,打破業(yè)務(wù)系統(tǒng)信息孤島,消除信息和檔案間隔,打通機房至庫房的道路,實現(xiàn)檔案大數(shù)據(jù)的構(gòu)建。從數(shù)據(jù)層面解決智能礦山檔案管理系統(tǒng)實時數(shù)據(jù)采集問題;解決各類系統(tǒng)產(chǎn)生的數(shù)據(jù)(主要是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))不便管理、不能實現(xiàn)實時共享問題。最終形成綜合數(shù)據(jù)資源庫,實現(xiàn)數(shù)據(jù)鑒定、管理、組織和利用,達到企業(yè)全面感知、智能聯(lián)動、精益管控、綠色低耗和安全高效的目的。
創(chuàng)立存儲標準,規(guī)范檔案數(shù)據(jù)資源管理。從現(xiàn)有規(guī)范和技術(shù)入手,系統(tǒng)分析和規(guī)劃現(xiàn)有實體檔案和數(shù)據(jù)檔案,實踐數(shù)據(jù)檔案和傳統(tǒng)檔案相結(jié)合進行管理的路徑。對數(shù)據(jù)進行清洗、固化,實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)合理存儲,解決多系統(tǒng)數(shù)據(jù)不便管理、不能實時共享的問題。對結(jié)構(gòu)化數(shù)據(jù)進行整合,提煉數(shù)據(jù)的分類規(guī)則,實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)的有效管理。在此基礎(chǔ)上建立智能礦山大數(shù)據(jù)智能歸檔利用管理體系,通過優(yōu)化集成創(chuàng)新,滿足智能礦山一體化管理平臺數(shù)據(jù)信息交換共享的需要。降低紙質(zhì)文件歸檔工作量,實現(xiàn)電子管理“單套制”,減少資源重復(fù)浪費,減少庫房面積,減少檔案保存裝備的購置,節(jié)約檔案保管成本,為企業(yè)生產(chǎn)運營及領(lǐng)導(dǎo)決策提供服務(wù)[6]。
實踐知識挖掘,釋放檔案價值。結(jié)合傳統(tǒng)檔案管理中業(yè)務(wù)數(shù)據(jù)管理,在參考國內(nèi)外典型企業(yè)檔案知識挖掘和應(yīng)用的基礎(chǔ)上,綜合考慮業(yè)務(wù)管理與創(chuàng)新中對企業(yè)檔案的知識需求、企業(yè)檔案資源建設(shè)情況、知識挖掘技術(shù)的發(fā)展水平,從需求驅(qū)動、資源驅(qū)動和技術(shù)驅(qū)動視角入手,系統(tǒng)分析企業(yè)檔案賦能業(yè)務(wù)管理與創(chuàng)新中知識挖掘技術(shù)的應(yīng)用價值;立足企業(yè)檔案資源信息化現(xiàn)狀,從檔案資源數(shù)據(jù)化、算法模型設(shè)計、系統(tǒng)平臺構(gòu)建、業(yè)務(wù)流程再造、跨部門協(xié)同等方面提出基于知識挖掘的企業(yè)檔案資源管理與服務(wù)推進路徑,為數(shù)智賦能思維下基于知識挖掘的企業(yè)檔案資源價值釋放提供參考[7]。
發(fā)達國家檔案管理完善,社會重視度高。美國、德國以及澳大利亞在此方面的發(fā)展最有成效,其依托本國的工業(yè)基礎(chǔ)和資本驅(qū)動,在煤礦自動化數(shù)據(jù)歸集和管理方面,管理模式已向電子化、數(shù)字化和信息化方向轉(zhuǎn)變。從1990年開始,電子文件歸檔和電子檔案管理成為其檔案工作的重點,并逐步完善。2011年,NARA(National Archives and Records Administration,美國國家檔案與文件管理署)建設(shè)完成電子文件檔案館(ERA)。2022年,NARA與美國行政管理與預(yù)算局發(fā)布《M-19-21備忘錄》,規(guī)定只接收符合要求的電子格式文件及附帶的元數(shù)據(jù),其在智能礦山領(lǐng)域的數(shù)據(jù)歸檔體系基本建立。
澳大利亞從20世紀末開始嚴格依據(jù)GLAM標準,對數(shù)字檔案的保存進行審核,澳大利亞國家檔案館(National Archives of Australia)啟動“數(shù)字文件保存”戰(zhàn)略,設(shè)計并建造了電子檔案管理信息系統(tǒng),在煤炭工業(yè)數(shù)據(jù)采集中精準捕獲書寫文件屬性,確保電子檔案完整性以及真實性。
西方國家在智能礦山和工業(yè)數(shù)據(jù)領(lǐng)域的檔案管理和探索上已經(jīng)走在了前列,在數(shù)據(jù)檔案的發(fā)展上發(fā)達國家已經(jīng)進入信息存儲、信息挖掘和價值創(chuàng)造的時代,信息承載體的管理已經(jīng)延伸到信息本身的管理,信息的存儲和利用的規(guī)則研究是其重點方向。以光和電磁為存儲中介的模式正在成為主流,信息解析規(guī)則也在趨向于基本的物理規(guī)則,傳統(tǒng)信息解析規(guī)則的解析偏差在逐漸減小。
在我國,新修訂《檔案法》將檔案信息化的建設(shè)明確納入法律要求的范疇,新法增加一章共計七條內(nèi)容,明確了電子檔案的建設(shè)、利用和發(fā)展的要求,鼓勵企業(yè)推動傳統(tǒng)載體檔案數(shù)字化和企業(yè)信息化工作。
在應(yīng)用層面的數(shù)據(jù)檔案的研究,目前只有浙江省檔案館在政務(wù)系統(tǒng)上做了初步的嘗試,也多集中在電子文件本身的管理。基于企業(yè)數(shù)字工業(yè)背景下的檔案管理研究,目前尚無先例可以遵循[8]。
針對煤礦企業(yè),實現(xiàn)完全數(shù)字化、智慧化并進行高度“互聯(lián)網(wǎng)+”融合的企業(yè)并不多,智能化礦山建設(shè)在行業(yè)內(nèi)也是在逐步落地和完善,可提供完整的智能礦山模型供檔案管理進行研究的例子也不多,所以完整的電子文件歸檔體系和數(shù)據(jù)歸檔體系建設(shè)在國內(nèi)尚無先例。相對而言,研究結(jié)構(gòu)化數(shù)據(jù)采集、清洗、壓縮、解析等的成果還不夠深入;智能礦山的結(jié)構(gòu)化數(shù)據(jù)、基于煤礦傳感設(shè)備直接生成和工控軟件以及決策軟件的數(shù)據(jù)采集匯總并未進入檔案的轉(zhuǎn)換階段;對智能礦山建設(shè)背景下結(jié)構(gòu)化數(shù)據(jù)的歸檔范圍、保管期限確定的原則、分類方法、實施策略、接口規(guī)范等研究并不多[9]。
在智能礦山建設(shè)的背景下,通過對智能礦山業(yè)務(wù)系統(tǒng)歸檔大數(shù)據(jù)的特性進行分析,研究大數(shù)據(jù)技術(shù)對業(yè)務(wù)大數(shù)據(jù)歸檔規(guī)則及檔案利用價值的影響,初步建立業(yè)務(wù)系統(tǒng)大數(shù)據(jù)歸檔利用體系,最終為提升公司檔案智慧化管理能力及檔案數(shù)據(jù)價值探索出新的有效途徑。
具體包括電子數(shù)據(jù)檔案格式確定、電子數(shù)據(jù)檔案分類、歸檔范圍與保管期限表、數(shù)據(jù)歸檔范圍設(shè)定規(guī)則、數(shù)據(jù)抽取和清洗規(guī)則、數(shù)據(jù)管理權(quán)轉(zhuǎn)移規(guī)則、煤礦大數(shù)據(jù)集成數(shù)據(jù)分析和煤礦大數(shù)據(jù)存儲規(guī)則的實現(xiàn)[10]。
研究大數(shù)據(jù)挖掘工具對大數(shù)據(jù)歸檔規(guī)則(范圍及期限)以及檔案利用價值及方式的影響(基礎(chǔ)理論研究),發(fā)現(xiàn)大數(shù)據(jù)價值密度相對較低,其與數(shù)據(jù)的規(guī)模呈反向關(guān)聯(lián),即數(shù)據(jù)規(guī)模越大,數(shù)據(jù)價值密度越低。應(yīng)研究如何從大量低價值密度數(shù)據(jù)中挖掘?qū)Ψ治龊皖A(yù)測等有價值的信息;應(yīng)研究傳統(tǒng)檔案和業(yè)務(wù)系統(tǒng)中生產(chǎn)、經(jīng)營、管理活動中記錄(大數(shù)據(jù))價值,依托大數(shù)據(jù)挖掘、人工智能等技術(shù)來挖掘大數(shù)據(jù)的價值;應(yīng)研究數(shù)據(jù)挖掘技術(shù)對業(yè)務(wù)大數(shù)據(jù)歸檔規(guī)則(范圍及期限)及大數(shù)據(jù)檔案價值的影響[11]。
對智能礦山系統(tǒng)中安全管理系統(tǒng)、設(shè)備管理系統(tǒng)的數(shù)據(jù)資源進行調(diào)研分析,制定分類體系,梳理歸檔范圍,確定保管期限,探索大數(shù)據(jù)檔案利用方法,總結(jié)電子數(shù)據(jù)歸檔流程、管理及利用方式,編制業(yè)務(wù)大數(shù)據(jù)歸檔利用體系相關(guān)制度規(guī)范,為技術(shù)平臺的開發(fā)提供制度規(guī)范依據(jù)。
在上述研究成果的基礎(chǔ)上,對智能礦山系統(tǒng)中的安全管理系統(tǒng)、設(shè)備管理系統(tǒng)進行數(shù)據(jù)結(jié)構(gòu)分析整理,梳理出業(yè)務(wù)系統(tǒng)歸檔數(shù)據(jù)類型和數(shù)據(jù)量,制定數(shù)據(jù)采集、清洗、過濾的規(guī)則;完成大數(shù)據(jù)歸檔數(shù)據(jù)采集接口及平臺設(shè)計及開發(fā);將業(yè)務(wù)系統(tǒng)大數(shù)據(jù)導(dǎo)入大數(shù)據(jù)檔案管理系統(tǒng),提供大數(shù)據(jù)檔案的利用,實現(xiàn)大數(shù)據(jù)資源的深度利用[12]。
主要針對現(xiàn)有比較成熟的智能礦山應(yīng)用系統(tǒng),選擇智能礦山系統(tǒng)中的安全管理系統(tǒng)、設(shè)備管理系統(tǒng),進行具有探索性、實驗性的數(shù)據(jù)研究,研究對象為電子數(shù)據(jù),包括單一來源的工業(yè)數(shù)據(jù)、依托現(xiàn)有載體的電子數(shù)據(jù)和數(shù)字化加工過程中產(chǎn)生的電子檔案。通過數(shù)據(jù)研究獲取數(shù)據(jù)形成和分布的規(guī)律,形成規(guī)則,并通過軟件開發(fā),使用軟件對數(shù)據(jù)接收、存放和利用進行技術(shù)驗證,為下一步智能礦山各業(yè)務(wù)系統(tǒng)大數(shù)據(jù)總體管理提供驗證性數(shù)據(jù)和成熟經(jīng)驗。
第一,成立科研攻關(guān)項目組進行實地調(diào)研、編制方案;與行業(yè)內(nèi)電子文件及大數(shù)據(jù)方面的專家對方案進行論證、破解難題,初步確立數(shù)據(jù)歸檔模型。第二,引用現(xiàn)有國家、行業(yè)關(guān)于智能礦山大數(shù)據(jù)管理的相關(guān)標準規(guī)范,對數(shù)據(jù)模型進行修正,確保在依法合規(guī)的基礎(chǔ)上有所創(chuàng)新。第三,開發(fā)大數(shù)據(jù)歸檔利用平臺,研究現(xiàn)有智能礦山各業(yè)務(wù)系統(tǒng)與檔案大數(shù)據(jù)系統(tǒng)的功能與接口關(guān)系,梳理數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)流程,對模型進行測試和驗證[13][14]。第四,總結(jié)驗證工作,對涉及智能礦山檔案管理的標準規(guī)范和數(shù)據(jù)治理成果進行整合,形成基本的歸檔大數(shù)據(jù)管理規(guī)范。第五,建立健全現(xiàn)有檔案工作體系,確立大數(shù)據(jù)管理制度,解決紙質(zhì)檔案與大數(shù)據(jù)管理的沖突點,創(chuàng)新檔案管理理念與管理手段,并優(yōu)化管理流程。
采用迭代改進的方法進行研究,從價值發(fā)揮和規(guī)范管理出發(fā),在充分收集系統(tǒng)數(shù)據(jù)及調(diào)研的基礎(chǔ)上完成數(shù)據(jù)歸檔利用的理論模型構(gòu)建,根據(jù)理論模型搭建軟件系統(tǒng),利用軟件系統(tǒng)驗證模型結(jié)構(gòu),根據(jù)驗證中發(fā)現(xiàn)的問題重復(fù)修正模型和系統(tǒng),通過反復(fù)實驗研究,得到最符合目標要求的模型、系統(tǒng)。最后梳理數(shù)據(jù),對研究過程進行總結(jié),形成完善可行的大數(shù)據(jù)歸檔利用體系[15][16]。
本文研究背景為信息時代下的檔案管理轉(zhuǎn)型,研究方向為基于智能礦山的建設(shè)和檔案的資源化管理大數(shù)據(jù)歸檔利用體系建設(shè)。在理念和與實際應(yīng)用上屬于填補行業(yè)空白,在研究中將新理念及多項新技術(shù)引入檔案管理領(lǐng)域,包括資源管理、標準制定、接口規(guī)范、價值挖掘、安全體系等,產(chǎn)生多項創(chuàng)新成果,具體如下。
一是確定智能礦山業(yè)務(wù)系統(tǒng)數(shù)據(jù)的歸檔范圍、保管期限和分類規(guī)則,確保有價值的數(shù)據(jù)檔案可以有效歸檔、規(guī)范管理。二是制定智能礦山業(yè)務(wù)系統(tǒng)數(shù)據(jù)的采集、清洗規(guī)則,可有效篩選數(shù)據(jù)檔案。三是基于弱人工智能,完善對非結(jié)構(gòu)化數(shù)據(jù)的歸檔和智能化處理規(guī)則,完成電子文件歸檔全自動化管理,提升效率,降低檔案人員工作強度,在技術(shù)層面實現(xiàn)檔案管理自動化[17]。四是做好安全防控,試驗跨平臺數(shù)據(jù)管理,保障數(shù)據(jù)安全。試驗封閉的數(shù)據(jù)管控架構(gòu)和數(shù)據(jù)傳輸檢測機制,確保數(shù)據(jù)的“四性”,做到進入檔案容器的數(shù)據(jù)完整有效,數(shù)據(jù)不可更改、不受攻擊,配合版本控制和溯源機制,保障數(shù)據(jù)的絕對安全,為檔案“單軌制”管理提供數(shù)據(jù)基礎(chǔ)保障,擬定數(shù)據(jù)保障標準[18]。五是確定智能礦山業(yè)務(wù)數(shù)據(jù)存儲文件結(jié)構(gòu),支持業(yè)務(wù)大數(shù)據(jù)無限量存儲,相比源數(shù)據(jù)庫數(shù)據(jù)存儲和占用空間的比率大幅提高。試驗建立一個容量可無限擴展、數(shù)據(jù)可長久保存的數(shù)字資源存儲平臺,支持從傳統(tǒng)載體到電子檔案的業(yè)務(wù)發(fā)展和變化,確保符合企業(yè)管理各類資源的需求。六是構(gòu)建學(xué)習(xí)型挖掘工具,針對智能礦山業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換的檔案和實體檔案的電子版本檢索進行優(yōu)化,可以跨庫檢索,不斷學(xué)習(xí)挖掘規(guī)則,有效提升檔案的價值[19]。七是將智能礦山業(yè)務(wù)系統(tǒng)數(shù)據(jù)檔案和實體檔案管理融入同一個平臺,初步建立檔案大數(shù)據(jù)。
一是完成了智能礦山大數(shù)據(jù)歸檔利用平臺建設(shè),解決了各業(yè)務(wù)系統(tǒng)數(shù)據(jù)無法歸檔的問題,且平臺實現(xiàn)全程自動運作,工作效率顯著提升。二是完成《業(yè)務(wù)系統(tǒng)電子文件和數(shù)據(jù)歸檔及管理規(guī)范》編制,在制度層面為業(yè)務(wù)系統(tǒng)電子文件(數(shù)據(jù))的規(guī)范管理提供了保障。三是測試并確定了業(yè)務(wù)系統(tǒng)數(shù)據(jù)清洗與歸檔規(guī)則,為業(yè)務(wù)數(shù)據(jù)和電子文件歸檔提供了依據(jù),為自動歸檔奠定了基礎(chǔ)。四是優(yōu)化設(shè)計了電子文件存儲結(jié)構(gòu),加強了業(yè)務(wù)數(shù)據(jù)保存和管理,提升了數(shù)據(jù)利用的效率。五是采用集中存儲方案對海量電子數(shù)據(jù)集中存儲管理,實現(xiàn)信息資源高度共享;系統(tǒng)自動將各級單位的資料數(shù)據(jù)進行唯一過濾與集中共享,避免了數(shù)據(jù)重復(fù)保存,避免了浪費存儲空間。六是完成檔案大數(shù)據(jù)建設(shè),對跨庫跨類型的數(shù)據(jù)檢索進行了測試,并研發(fā)了專門的挖掘工具,進一步研究實體檔案和業(yè)務(wù)數(shù)據(jù)檔案融合狀態(tài)下檔案價值的發(fā)揮。
檔案管理已從傳統(tǒng)模式向大數(shù)據(jù)管理模式轉(zhuǎn)變,構(gòu)建覆蓋企業(yè)的文件資源管控體系,形成對海量電子文件管理的能力、具備“單軌制”“單套制”管理的能力;檔案管理對象已從傳統(tǒng)歸檔范圍的實體檔案向電子文件數(shù)據(jù)轉(zhuǎn)變,管理范圍得到擴展,從檔案“后端”走向業(yè)務(wù)“全程”,這將形成自動捕獲、自動分類組織、可持續(xù)建設(shè)數(shù)字資源的能力;檔案服務(wù)方式已從被動服務(wù)向主動服務(wù)轉(zhuǎn)變,從“幕后”走向“臺前”,服務(wù)的質(zhì)量和效率得到提高,數(shù)據(jù)挖掘與服務(wù)的能力得以形成。通過實現(xiàn)“三個轉(zhuǎn)變”、形成“三個能力”,充分發(fā)揮檔案業(yè)務(wù)的專業(yè)優(yōu)勢,在科學(xué)分類、長久保存、資源整合、數(shù)據(jù)規(guī)范等方面發(fā)揮重要作用[20]。