黎昌鑫 楊晨 尹海波
1. 湖南天河國云科技有限公司 湖南 長沙 410000;2. 湖南省檔案館 湖南 長沙 410000
大數(shù)據(jù)時代,檔案管理工作迎來了嶄新的變化,在“存量電子化,增量數(shù)字化”等戰(zhàn)略要求的統(tǒng)籌指導(dǎo)下,國家檔案局接連發(fā)布了一系列的指導(dǎo)文件,各地方積極創(chuàng)新檔案管理模式,共同推進數(shù)字檔案館的建設(shè)。根據(jù)國家檔案局政策法規(guī)司公布的數(shù)據(jù)顯示,截至2020年底,通過省級及以上檔案主管部門認證的數(shù)字檔案館323個[1],檔案信息化應(yīng)用層次得到顯著提升,相關(guān)的檔案管理技術(shù)化標準得到進一步完善。
當前,我國區(qū)塊鏈產(chǎn)業(yè)高速發(fā)展,區(qū)塊鏈應(yīng)用遍地開花,成為數(shù)字經(jīng)濟發(fā)展與數(shù)字化轉(zhuǎn)型的重要組成部分。2021年,中國工程院《中國區(qū)塊鏈發(fā)展戰(zhàn)略研究》項目發(fā)布“發(fā)現(xiàn)100個中國區(qū)塊鏈創(chuàng)新應(yīng)用”欄目之“區(qū)塊鏈+數(shù)字檔案館”應(yīng)用案例,標志著區(qū)塊鏈技術(shù)在數(shù)字檔案管理領(lǐng)域的應(yīng)用已經(jīng)相當成熟。
概括而言,數(shù)字檔案館是以數(shù)字化為核心、基于互聯(lián)網(wǎng)而構(gòu)建的文獻信息資源庫,它是內(nèi)容管理系統(tǒng)、集成系統(tǒng)和數(shù)字信息長期保存系統(tǒng)的有效融合[2]。數(shù)字檔案館將多種類型的檔案資源進行數(shù)字化集中處理,以數(shù)字信息化的途徑進行保存,以互聯(lián)網(wǎng)的形式相連,利用計算機系統(tǒng)進行協(xié)調(diào)管理,從而形成一個條理清晰的檔案信息庫,能實現(xiàn)館內(nèi)數(shù)據(jù)資源的利用與共享。
數(shù)字檔案館不是簡單地將檔案資源進行數(shù)字化之后,將其封閉在一個閉環(huán)的空間,它的目的是利用現(xiàn)代化的信息技術(shù),能夠?qū)崿F(xiàn)檔案資源的有效存儲、及時調(diào)用、安全共享與準確分析。數(shù)字檔案館一定程度上解決了傳統(tǒng)檔案館過于中心化管理的缺陷,但也受到了網(wǎng)絡(luò)世界的沖擊,軟硬件設(shè)施不能實時滿足使用需求,尤其是安全屬性備受考驗。區(qū)塊鏈技術(shù)的應(yīng)用,為數(shù)字檔案館工作的升級與優(yōu)化提供了一個新的選擇。
新時代的檔案管理工作,必然依托于數(shù)字檔案館。數(shù)字檔案館具備了傳統(tǒng)檔案館的功能效應(yīng),并能很好地適應(yīng)時代發(fā)展的需要,讓檔案信息的利用效能最大化,避免由于人為管理的不足而造成不必要的損壞與遺失,在信息的共享上超越時空限制。
數(shù)字檔案館的檔案資源主要源于傳統(tǒng)檔案館,它利用計算機技術(shù)、掃描技術(shù)、多媒體技術(shù)、OCR技術(shù)與數(shù)據(jù)庫技術(shù)等將各種載體的存量檔案信息轉(zhuǎn)化為數(shù)字化的檔案信息,然后由人工處理的方式,對檔案原件及數(shù)據(jù)進行審核,通過之后再將數(shù)據(jù)進行歸檔處理,確保數(shù)據(jù)信息的準確性與可靠性[3]。技術(shù)化采集是數(shù)字檔案數(shù)據(jù)采集的最大優(yōu)勢,可進行大批量快操作化處理,在數(shù)字化辦公的背景下,符合館藏要求的文檔資料,可直接移交給數(shù)字檔案館,無須打印成紙質(zhì)版。
數(shù)字檔案館本質(zhì)上是一個極為巨大的數(shù)據(jù)資源庫,其數(shù)據(jù)資源可以以多種文件格式保存,并能通過互聯(lián)網(wǎng)傳輸及共享。它最顯著的存儲特點是“無紙化”,載體主要包括磁盤、光盤等,能有效降低傳統(tǒng)檔案存儲時所需的物理空間,杜絕檔案實體的物理損毀。隨著數(shù)字技術(shù)的進一步發(fā)展,我們的數(shù)據(jù)存儲方式也會發(fā)生巨大變革,比如“云存儲”的出現(xiàn),就讓數(shù)字檔案館的存儲有了上云的空間,并在現(xiàn)實中開始逐步嘗試,“云上數(shù)字檔案館”將是數(shù)字檔案館建設(shè)的大勢所趨[4]。
數(shù)字檔案館的信息查詢以館內(nèi)組織系統(tǒng)專用網(wǎng)絡(luò)為基礎(chǔ),通過互聯(lián)網(wǎng)技術(shù)將分散的信息數(shù)據(jù)庫串聯(lián),采用瀏覽器或服務(wù)器模式架構(gòu),改變了傳統(tǒng)的信息查閱方式,不需要查閱人前往某個固定的場所,而是隨時隨地進入數(shù)字檔案館的搜索系統(tǒng),直接檢索想要的信息,實現(xiàn)遠程查檔與閱檔的功能。在查閱權(quán)限上,數(shù)字檔案館可對不同的查閱人進行嚴格的授權(quán)控制,有效避免了傳統(tǒng)權(quán)限管控中的人情漏洞[5]。此外,在文檔的可查閱時間、日期等都可設(shè)置權(quán)限,并對查閱過程進行實時詳細的記錄,將其作為查閱人的使用信息而保存下來。
數(shù)字檔案館與傳統(tǒng)檔案館在管理上的顯著區(qū)別,在于前者是線上操作,需要利用計算機技術(shù)對信息進行整理,后者則是線下操作,使用一系列的分類管理技巧。數(shù)字檔案館的數(shù)字技術(shù)屬性,決定了它對管理人員的要求比較高,除了要熟稔傳統(tǒng)的管理方法外,必須具有相當?shù)木€上操作能力,對數(shù)據(jù)庫、互聯(lián)網(wǎng)技術(shù)、操作系統(tǒng)等有一定的了解,也適當具備對設(shè)備的維護與檢查能力。與此同時,數(shù)字檔案館改變了查閱文檔時的低效率,顯著提高了檔案事業(yè)的發(fā)展速率,使之更能滿足社會發(fā)展的需要。
區(qū)塊鏈是一個去中心化的分布式數(shù)據(jù)庫,在共識機制、分布式存儲、隱私計算與智能合約技術(shù)的加持下,具有不可篡改與可溯源的特性,可無須第三方進行信任認證?;趨^(qū)塊鏈的數(shù)字檔案館,有效解決了以往數(shù)字檔案管理中的真實性與信任性的問題,在技術(shù)上確保數(shù)字檔案管理工作的有序推進。
各級檔案館、檔案部門的檔案信息彼此獨立、流通不暢,同時跨部門共享機制尚未有效建立,數(shù)據(jù)積壓缺乏共享渠道,容易造成信息孤島現(xiàn)象。區(qū)塊鏈技術(shù)的去中心化、防篡改和可追溯的特性,既能保障數(shù)據(jù)產(chǎn)出方主動參與信息共享,又能促使數(shù)據(jù)使用方合規(guī)分享。在區(qū)塊鏈的架構(gòu)下,文檔信息變得公開透明,在智能合約的執(zhí)行下,各方義務(wù)自動執(zhí)行且不可撤銷,從而有利于打破檔案館、檔案部門與跨部門之間的信息孤島,實現(xiàn)檔案信息的可信共享。
數(shù)字檔案的存放以中心形式化為主,只有相關(guān)管理部門與授權(quán)使用者有權(quán)查看與使用,檔案監(jiān)管途徑缺失,檔案存在人為刪改、造假、丟失等風(fēng)險?;趨^(qū)塊鏈技術(shù)的數(shù)字檔案館系統(tǒng),采用的是分布式存儲架構(gòu),同時在非對稱加密和共識算法的加持下,每個節(jié)點都能保存完整的信息數(shù)據(jù),單個節(jié)點是不可能完成信息篡改的,除非有超過50%的節(jié)點同時篡改,這樣的成本代價太大,不具備可行性。一旦局部發(fā)生變化,區(qū)塊鏈可進行驗證。所以,檔案信息一旦上鏈將永久儲存,且任何操作信息都將留痕,檔案的安全存儲得以保障。
檔案信息包含大量機密與隱私數(shù)據(jù),在缺乏加密保護的情況下,容易導(dǎo)致重要信息被非法竊取,用戶隱私被泄露,造成安全隱患。區(qū)塊鏈技術(shù)通過采用多種加密算法,檔案信息一旦上鏈便永久保存,任何人員的操作、信息的共享、文檔的使用,都會留下痕跡,以便追蹤溯源,是一種強制性的安全保障技術(shù),從主觀上消除非法操作。同時為檔案設(shè)定保護層級,為人員設(shè)定操作權(quán)限,能有效保護檔案的安全與用戶的隱私。
基于區(qū)塊鏈的數(shù)字檔案館的優(yōu)越性,目前已得到多方認證,區(qū)塊鏈數(shù)字身份的加入,通過加強權(quán)限控制及數(shù)字檔案安全防護,顯著增強了數(shù)字檔案的流通能力及保護能力,使其升級為智慧型數(shù)字檔案館。
4.1.1 區(qū)塊鏈數(shù)據(jù)保護系統(tǒng)。將數(shù)字檔案通過加密技術(shù)處理后,分別存儲在數(shù)據(jù)庫和分布式存儲系統(tǒng)中,系統(tǒng)數(shù)據(jù)如果發(fā)生變更,區(qū)塊鏈數(shù)據(jù)保護系統(tǒng)將記錄其不同版本,便于事后追溯和審計,滿足涉密數(shù)字檔案的安全性需求。
4.1.2 區(qū)塊鏈安全監(jiān)控系統(tǒng)?;趨^(qū)塊鏈的系統(tǒng)監(jiān)控管理包括實時狀態(tài)監(jiān)控、異常過程監(jiān)控和業(yè)務(wù)流程監(jiān)控三部分。通過記錄應(yīng)用系統(tǒng)和數(shù)據(jù)庫的操作日志,并加密存儲在區(qū)塊鏈系統(tǒng)上,提供日志預(yù)警功能,對于異常情況通過區(qū)塊鏈瀏覽器展示出來,便于及時發(fā)現(xiàn)違規(guī)的操作和提供證據(jù)。
4.1.3 區(qū)塊鏈智能合約系統(tǒng)。將事先約定的規(guī)則寫入智能合約,滿足條件時則自動執(zhí)行合約內(nèi)容。比如智能合約應(yīng)用在當前政務(wù)清單管理中,將年初的督查督辦計劃寫入智能合約,觸發(fā)一定條件后,自動提醒督查督辦事項。
4.1.4 數(shù)字檔案區(qū)塊鏈瀏覽器。區(qū)塊鏈瀏覽器將區(qū)塊鏈中的數(shù)據(jù)進行可視化,對節(jié)點、區(qū)塊、交易、資產(chǎn)等賬本信息進行實時展示,方便用戶以Web頁面的方式,獲取當前區(qū)塊鏈中的信息。
4.2.1 權(quán)限控制。利用區(qū)塊鏈核心特性,為存儲于數(shù)字檔案館的檔案數(shù)據(jù)進行確權(quán),明確數(shù)據(jù)所有權(quán)人,同時確定數(shù)據(jù)權(quán)限級別及初始權(quán)限范圍,實現(xiàn)對數(shù)據(jù)訪問的授權(quán)等功能。
4.2.2 分級管理。組織機構(gòu)分級管理、操作人員權(quán)限分級管理和系統(tǒng)菜單的分級管理,做到每個操作員僅分配其權(quán)利管轄范圍之內(nèi)的權(quán)限,其進入數(shù)字檔案管理系統(tǒng)之后也僅能見到權(quán)限范圍內(nèi)的操作界面。
4.2.3 身份認證。通過CA數(shù)字證書認證密鑰,用此密鑰在數(shù)字檔案館中的內(nèi)容管理、通用交互、網(wǎng)上辦事子系統(tǒng)中登陸,并使用其密鑰對采編的信息、對辦事流程中的操作進行數(shù)字簽名,實現(xiàn)防抵賴。
4.2.4 隱私管理。通過多重簽名技術(shù)開發(fā)的用戶隱私保護多重簽名算法,可以在確保監(jiān)管可實施性的基礎(chǔ)上,最大限度的保護數(shù)字檔案館用戶的隱私信息。
4.3.1 技術(shù)化信任機制??尚怒h(huán)境的構(gòu)建,有利于明確多方的權(quán)利與義務(wù),在不需要中心化管理的前提下,自動行使各自的使命,驅(qū)使系統(tǒng)生態(tài)的平穩(wěn)運行。區(qū)塊鏈是一種自帶信任機制的技術(shù),通過采用數(shù)字簽名、時間戳和哈希運算技術(shù),將檔案信息按時間順序逐條串接成鏈式結(jié)構(gòu),將前一個區(qū)塊的哈希值放入第二個區(qū)塊中,首尾相連環(huán)環(huán)相扣[6]。區(qū)塊鏈通過將數(shù)據(jù)的真實性維護捆綁在一起,任何檔案的任何篡改變動,都會引發(fā)其他區(qū)塊哈希值的改變,從而形成去中心化的技術(shù)信任機制。
4.3.2 可信化操作環(huán)境。在技術(shù)信任機制的推動下,所有區(qū)塊鏈的節(jié)點共同營造出可信化的環(huán)境,不存在中心化的權(quán)力中心,任何失信節(jié)點都將被踢出在區(qū)塊鏈的框架之內(nèi)。區(qū)塊鏈采用去中心化維護機制,在存儲檔案時對數(shù)據(jù)進行分片處理、多點備份,實現(xiàn)具有成本低、靈活部署、安全性強、海量存儲、主動備份、節(jié)點認證、權(quán)限控制、高可靠性及激勵機制等特點的分布式存儲,為數(shù)字檔案互聯(lián)互通營造一個可信的操作環(huán)境。
區(qū)塊鏈技術(shù)與數(shù)字檔案管理的融合,利用技術(shù)手段確保了信任源的真實可靠,極大地提高了檔案管理工作的效率與安全性,目前已在上海、重慶、寧夏、沈陽、長沙縣等多個機構(gòu)應(yīng)用。隨著“政府上網(wǎng)工程”和“全國檔案信息化建設(shè)”的全面實施,檔案信息化建設(shè)是檔案事業(yè)適應(yīng)社會信息化發(fā)展的必然趨勢,這就要求檔案管理部門做好數(shù)字人才、區(qū)塊鏈技術(shù)人才的培養(yǎng)與引進,從而確?!皡^(qū)塊鏈+數(shù)字檔案館”為我國的數(shù)字化進程和社會治理貢獻一分力量。