楊中營
在北京數(shù)字檔案館(電子文件中心)建設項目(以下簡稱北京數(shù)字檔案館)中,應用系統(tǒng)建設是整個建設項目的重點,它為北京數(shù)字檔案館提供系統(tǒng)功能支撐,是各項檔案業(yè)務信息化的具體實現(xiàn),是數(shù)字檔案館建設水平的直接體現(xiàn)。
一、建設目標
北京數(shù)字檔案館應用系統(tǒng)建設的目標是建立“四個平臺”:即,建立全市統(tǒng)一的電子文件中心平臺,實現(xiàn)市、區(qū)檔案移交單位對列入進館范圍的電子文件的綜合管理;建立全市統(tǒng)一的檔案接收平臺,轉(zhuǎn)變現(xiàn)有的電子檔案接收模式,實現(xiàn)對市、區(qū)檔案移交單位電子檔案的網(wǎng)絡移交接收;建立全市統(tǒng)一的檔案管理平臺,轉(zhuǎn)變現(xiàn)有電子檔案的管理模式,建立電子檔案憑證價值保護機制,實現(xiàn)檔案數(shù)字資源長期保存;建立全市統(tǒng)一的檔案利用平臺,轉(zhuǎn)變檔案利用模式,實現(xiàn)檔案數(shù)字資源的有效整合和分層次、多渠道的共享利用。
二、體系框架
北京數(shù)字檔案館是覆蓋市和區(qū)檔案局(館)、檔案移交單位以及普惠社會公眾的區(qū)域性檔案數(shù)字資源綜合管理平臺。平臺可通過在線或離線的方式與中央檔案館國家檔案局、各省級檔案局(館)和其他機構(gòu)實現(xiàn)檔案數(shù)字資源共享交換。
三、總體邏輯架構(gòu)
北京數(shù)字檔案館的總體邏輯架構(gòu)包括基礎設施支撐層、數(shù)據(jù)資源層、應用支撐層、應用層、展現(xiàn)層和服務對象層6個層次,以及貫穿于各個層次的標準規(guī)范和安全保障2大體系。
(一)基礎設施支撐層:包括市檔案館專網(wǎng)基礎設施支撐層、政務外網(wǎng)與因特網(wǎng)基礎設施支撐層,是系統(tǒng)運行的基礎環(huán)境層。在市檔案館專網(wǎng)基礎設施支撐層上,采用虛擬化技術(shù),構(gòu)建存儲資源池,通過對資源池全生命周期管理和資源池運維監(jiān)控,提供數(shù)據(jù)存儲、容災備份等服務,采用傳統(tǒng)方式構(gòu)建服務器和網(wǎng)絡系統(tǒng),并在專網(wǎng)進行相應的安全管理。在政務外網(wǎng)與因特網(wǎng)基礎設施支撐層上,政務外網(wǎng)系統(tǒng)采用虛擬化技術(shù),構(gòu)建相應的計算資源池(不包括數(shù)據(jù)庫服務器、安全管理相關(guān)服務器)、網(wǎng)絡資源池(只包括虛擬化服務器上虛擬出來的VM的網(wǎng)絡資源,基礎網(wǎng)絡系統(tǒng)采用物理部署方式)和存儲資源池,并通過對資源池全生命周期管理和資源池運維監(jiān)控,提供計算服務、數(shù)據(jù)存儲、負載管理、備份容災服務、安全域劃分和網(wǎng)絡服務等服務。因特網(wǎng)采用傳統(tǒng)的方式構(gòu)建服務器和網(wǎng)絡系統(tǒng),并與政務外網(wǎng)共享存儲資源池。
(二)數(shù)據(jù)資源層:包括基礎信息庫、檔案內(nèi)容庫、業(yè)務過程庫、輔助信息庫、標準規(guī)范庫、運行維護庫、電子檔案身份證庫和統(tǒng)計信息庫等數(shù)據(jù)庫。
(三)應用支撐層:包括憑證性保障支撐、流媒體服務、工作流引擎、格式轉(zhuǎn)換、文件傳輸中間件、應用中間件、OCR識別服務、報表管理、認證授權(quán)支撐、全文檢索和授時服務支撐等組件,以及用于用戶定制所需的組件管理、配置管理和業(yè)務流程管理等標準接口。
(四)應用層:包括電子文件中心(數(shù)字檔案室)、檔案數(shù)字資源接收、檔案數(shù)字資源征集、檔案數(shù)字資源綜合管理、檔案數(shù)字資源利用服務、電子檔案身份證管理、元數(shù)據(jù)智能捕獲與封裝、查詢統(tǒng)計、數(shù)據(jù)交換、全面運行控制等應用。同時,通過用戶定制界面實現(xiàn)面向用戶的個性化定制功能。
(五)展現(xiàn)層:分別在政務外網(wǎng)、因特網(wǎng)、專網(wǎng)建設門戶系統(tǒng)。在政務外網(wǎng)和專網(wǎng)門戶主界面中集成應用系統(tǒng)的相關(guān)功能,實現(xiàn)對應用系統(tǒng)的功能整合。在因特網(wǎng)門戶提供信息發(fā)布、開放檔案查閱利用等相關(guān)功能。
(六)服務對象層:包括市、區(qū)兩級檔案局(館),檔案移交單位以及社會公眾。
(七)標準規(guī)范體系:包括指導原則、檔案業(yè)務、信息技術(shù)和運行管理等四類標準。
(八)安全保障體系:包括技術(shù)安全體系和管理安全體系。其中,技術(shù)安全體系包括物理、通信網(wǎng)絡、計算環(huán)境、區(qū)域邊界和安全管理中心等方面;管理安全體系包括安全管理機構(gòu)、安全管理制度、人員安全管理、系統(tǒng)建設管理和系統(tǒng)運維管理等方面。
四、總體技術(shù)架構(gòu)
在總體技術(shù)架構(gòu)上,遵循SOA標準,進行多層架構(gòu)設計,具有良好的靈活性和可擴展性。北京數(shù)字檔案館系統(tǒng)平臺分為9層,分別是基礎設施、技術(shù)平臺、安全服務、消息服務、數(shù)據(jù)服務、業(yè)務服務、展示服務、應用和用戶。具體如下圖所示:
(一)基礎設施:包括數(shù)據(jù)庫、網(wǎng)絡、服務器、操作系統(tǒng)、負載均衡、機房及配套設施,共同組成系統(tǒng)運行的基礎保障環(huán)境。
(二)技術(shù)平臺:提供公用的系統(tǒng)支撐工具、監(jiān)控管理以及相關(guān)組件。
(三)安全服務:提供身份認證、數(shù)字簽名、權(quán)限控制、安全審計、電子檔案身份證等安全管理服務。
(四)消息服務:提供統(tǒng)一的系統(tǒng)消息管理服務,包括消息生成、消息分發(fā)等。
(五)數(shù)據(jù)服務:提供統(tǒng)一的數(shù)據(jù)管理服務,包括元數(shù)據(jù)管理、報表服務、數(shù)據(jù)交換、格式轉(zhuǎn)換、在線瀏覽、數(shù)據(jù)存儲、介質(zhì)管理、數(shù)據(jù)備份和數(shù)據(jù)分析等。
(六)業(yè)務服務:提供統(tǒng)一的業(yè)務邏輯管理,包括計劃管理、檔案收集、檔案整理、歸檔入庫、移交接收、檔案征集、技術(shù)保護、檔案編研、數(shù)字化加工、專題管理、檔案鑒定、長期保存、檔案檢索、檔案統(tǒng)計、庫房管理、全宗卷管理、借閱管理、抵館利用、跨館利用、異地出證等。
(七)展示服務:提供客戶端訪問展示機制管理,根據(jù)不同情況提供不同的客戶端展現(xiàn)形式和應用形式。
(八)應用:為整個業(yè)務應用系統(tǒng)構(gòu)建的實例,包括電子文件中心系統(tǒng)(數(shù)字檔案室系統(tǒng))、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務系統(tǒng)、綜合統(tǒng)計查詢系統(tǒng)和電子檔案身份證管理系統(tǒng)等。endprint
(九)用戶:提供人機交互展示頁面。
五、應用架構(gòu)
根據(jù)建設目標和總體邏輯架構(gòu),項目設計開發(fā)了五大應用系統(tǒng),即電子文件中心系統(tǒng)(數(shù)字檔案室系統(tǒng))、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源征集系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務系統(tǒng)。
同時,項目還設計開發(fā)了電子檔案身份證管理系統(tǒng)、元數(shù)據(jù)智能捕獲系統(tǒng)、綜合統(tǒng)計查詢系統(tǒng)、數(shù)據(jù)交換管理系統(tǒng)、全面運行控制系統(tǒng)等核心子系統(tǒng),這些核心子系統(tǒng)分別從憑證性保障、元數(shù)據(jù)捕獲、查詢統(tǒng)計、數(shù)據(jù)交換、系統(tǒng)運維等不同方面為北京數(shù)字檔案館提供核心技術(shù)保障或系統(tǒng)支撐。應用架構(gòu)如下圖所示。
六、數(shù)據(jù)架構(gòu)
根據(jù)文件生命周期理論,項目規(guī)劃設計了檔案數(shù)據(jù)在形成、歸檔、銷毀、移交、長期保存等不同生命周期階段之間的流轉(zhuǎn)方向和流轉(zhuǎn)過程;同時也規(guī)劃設計了處于同一生命周期階段的檔案數(shù)據(jù)的存儲、備份、分布、共享交換和利用等。具體如圖5所示。
七、系統(tǒng)部署
在北京數(shù)字檔案館建設項目中,應用系統(tǒng)橫跨三個網(wǎng)絡,分別是因特網(wǎng)、政務外網(wǎng)和市檔案館專網(wǎng)。應用系統(tǒng)在三個網(wǎng)絡上的部署情況如表1所示。
八、檔案數(shù)字資源分庫管理方案
為確保檔案數(shù)字資源在安全保管和長久保存的同時提高利用效率,項目根據(jù)分庫管理的理念,在綜合考慮網(wǎng)絡劃分和應用系統(tǒng)部署的情況下,對檔案數(shù)字資源(包含原文和目錄)進行了分庫管理設計,將檔案數(shù)字資源分為長期保存庫、利用庫和管理庫(臨時庫)。具體如表2所示。
九、技術(shù)實現(xiàn)
(一)關(guān)鍵技術(shù)路線
項目基于Web Service的J2EE技術(shù)架構(gòu)開發(fā)建設,采取構(gòu)件技術(shù)進行系統(tǒng)搭建,便于后期不斷完善和擴展。采用XML和FTP技術(shù)相結(jié)合的方式,實現(xiàn)檔案數(shù)字資源的共享交換。
(二)高性能設計
針對大數(shù)據(jù)量并發(fā)的壓力,為保證系統(tǒng)的穩(wěn)定、高效運行,項目從數(shù)據(jù)傳輸、服務響應、數(shù)據(jù)訪問、數(shù)據(jù)存儲等多方面進行設計和開發(fā)建設,滿足高性能要求。在數(shù)據(jù)傳輸方面,采用HTTP壓縮和文件壓縮技術(shù);在服務響應方面,采用負載均衡和集群部署的技術(shù);在數(shù)據(jù)訪問方面,采用了緩存技術(shù);在數(shù)據(jù)存儲方面,對數(shù)據(jù)庫進行了優(yōu)化升級。
(三)統(tǒng)籌建設數(shù)字檔案室與數(shù)字檔案館
采用集約化建設理念,將數(shù)字檔案室納入數(shù)字檔案館項目一并建設,通過建設北京數(shù)字檔案館一個項目同時實現(xiàn)數(shù)字檔案館和數(shù)字檔案室兩大功能,一舉兩得,避免了各單位的重復建設,節(jié)約了政府投資。
(四)應用了電子檔案身份證技術(shù)
項目應用了一項保證電子檔案憑證性的核心技術(shù)——即電子檔案身份證技術(shù)。該技術(shù)通過為每一份電子檔案建立一個電子檔案身份證,將電子檔案身份證保存在電子檔案身份證庫中,當需要驗證電子檔案的原始性時,即可從身份證庫中取出其身份證對其進行驗證,從而為電子檔案的憑證性保障提供技術(shù)保證。
(五)虛擬檔案庫房管理
項目設計開發(fā)了虛擬檔案庫房技術(shù),通過建立虛擬檔案庫房,可以實現(xiàn)檔案實體的靈活排放和虛擬展示,檔案保管人員通過系統(tǒng)即可形象直觀地進行檔案庫房管理,極大提高了工作效率。
(六)四性檢測工具開發(fā)
項目研究制定了檔案數(shù)字資源四性檢測方案,設計開發(fā)了檔案數(shù)字資源四性檢測工具,可以實現(xiàn)對電子檔案和傳統(tǒng)載體檔案數(shù)字副本及元數(shù)據(jù)、目錄的準確性、完整性、可用性和安全性進行自動檢測,極大減少人工檢測的工作量,工作效率提升顯著。
(七)身份證識別和射頻IC卡技術(shù)應用
項目應用了二代身份證識別技術(shù),實現(xiàn)抵館利用人員身份信息的自動讀取登記,提高工作效率,避免操作失誤。項目還應用射頻IC卡技術(shù)。利用接待人員可為抵館利用人員建立自助查檔臨時賬戶,并將賬戶信息寫入IC卡,抵館利用人員可持IC卡實現(xiàn)自助查檔,極大減輕利用接待人員工作量的同時,還能提升利用者的查檔體驗和查檔效果。
(八)多重檢索
項目提供了模糊檢索、單庫檢索、跨庫檢索、組合檢索和全文檢索等多種檢索方式,滿足不同用戶的個性化檢索需求,實現(xiàn)檔案數(shù)字資源“準確、快速、全面”地查找和定位。
十、結(jié)語
北京數(shù)字檔案館已經(jīng)完成了電子文件中心系統(tǒng)、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務系統(tǒng)等應用系統(tǒng)(涉及41個業(yè)務流程,包含17個子系統(tǒng)、335個功能模塊)的設計開發(fā),基本實現(xiàn)了對檔案室、檔案館檔案業(yè)務工作的全覆蓋,對傳統(tǒng)載體檔案輔助管理以及電子檔案管理的全覆蓋。完成了與OA系統(tǒng)、媒資系統(tǒng)、CA系統(tǒng)電子檔案身份證系統(tǒng)等的集成,完成了系統(tǒng)安裝、系統(tǒng)部署、系統(tǒng)培訓、第三方測試以及等保三級測評等。目前系統(tǒng)正在全面試運行,我們將持續(xù)優(yōu)化完善應用系統(tǒng),以便更好地滿足檔案工作需要,更好地優(yōu)化檔案工作流程,更好地引領檔案工作發(fā)展。endprint