文/郭懷珍
在具體數(shù)據(jù)化實(shí)踐基礎(chǔ)上,參照人事檔案數(shù)據(jù)化的國(guó)際實(shí)踐與標(biāo)準(zhǔn),在分析構(gòu)建新時(shí)代基于內(nèi)容的人事檔案數(shù)據(jù)化內(nèi)容的基礎(chǔ)上,給出了相應(yīng)的原則和關(guān)鍵內(nèi)容
信息技術(shù)的突飛猛進(jìn)發(fā)展與風(fēng)生水起的廣泛應(yīng)用,推動(dòng)人類社會(huì)進(jìn)入了數(shù)字經(jīng)濟(jì)時(shí)代,并繼“物理空間”“人類社會(huì)”之后,又產(chǎn)生了“信息空間”。同時(shí),人事制度的改革也在不斷深入進(jìn)行,這些都不斷推動(dòng)和促進(jìn)著作為人事管理關(guān)鍵環(huán)節(jié)的人事檔案管理的數(shù)據(jù)化建設(shè)。利用數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)壓縮技術(shù)、高速掃描和照相錄像等數(shù)字化技術(shù)、計(jì)算機(jī)應(yīng)用技術(shù)、(移動(dòng))通訊技術(shù)、互聯(lián)網(wǎng)技術(shù)、人工智能、大數(shù)據(jù)等信息技術(shù)的最新成果,根據(jù)檔案管理理論與技術(shù)以及信息化時(shí)代檔案管理的新情況、新原則和新理論,確立信息化網(wǎng)絡(luò)社會(huì)中檔案管理、利用與服務(wù)的基本流程、框架和基本方法等,以紙質(zhì)文件、聲像文件等傳統(tǒng)介質(zhì)的實(shí)體文件和已歸檔保存的電子檔案文件等虛擬檔案,構(gòu)建、組織、開發(fā)具有有序結(jié)構(gòu)的、基于內(nèi)容的系統(tǒng)化檔案數(shù)據(jù)庫(kù),最終建立人事檔案管理信息系統(tǒng)(或平臺(tái)),最大限度地實(shí)現(xiàn)紙質(zhì)檔案和電子檔案信息的數(shù)據(jù)化管理,進(jìn)而實(shí)現(xiàn)人事檔案的個(gè)性化和社會(huì)化利用與服務(wù)。這便是人事檔案管理的數(shù)據(jù)化建設(shè)。其實(shí)質(zhì)是檔案管理、利用與服務(wù)從以檔案實(shí)體為中心的管理模式到以檔案數(shù)據(jù)化信息為中心的管理模式的轉(zhuǎn)變。
人事檔案的數(shù)據(jù)化管理、利用與服務(wù),符合中國(guó)特色新時(shí)代的發(fā)展潮流,并能在構(gòu)建智慧社會(huì)的浩蕩時(shí)代大潮中提升人事檔案現(xiàn)代化管理水平、智慧服務(wù)作用和基于知識(shí)的輔助決策功能。因此,人事檔案部門應(yīng)及時(shí)轉(zhuǎn)變?nèi)耸聶n案管理理念,加快數(shù)據(jù)化建設(shè),形成實(shí)體管理與數(shù)據(jù)化管理并舉的管理、利用與服務(wù)模式,最終實(shí)現(xiàn)人事檔案的數(shù)據(jù)化和智能化管理、利用與服務(wù),提高其相應(yīng)的水平、效能與作用。
圖1 人事檔案信息化建設(shè)基本過程與內(nèi)容
除了人事檔案數(shù)字化建設(shè)的意義之外,人事檔案數(shù)據(jù)化建設(shè)的主要意義在于:(1)便于人事檔案的安全利用和遠(yuǎn)程服務(wù),進(jìn)而切實(shí)為推動(dòng)人事檔案的信息化管理和社會(huì)化應(yīng)用建立基礎(chǔ);(2)真正起到保護(hù)紙質(zhì)人事檔案的作用;(3)根本轉(zhuǎn)變?nèi)耸聶n案的管理、利用與服務(wù)理念,轉(zhuǎn)變工作模式;(4)有利于進(jìn)一步融合人事檔案管理信息系統(tǒng)、人事管理信息系統(tǒng)和公務(wù)員信息庫(kù)等,便于對(duì)本單位的人事信息進(jìn)行統(tǒng)計(jì)、分析與挖掘,形成相應(yīng)的知識(shí),為人事管理提供可靠的決策科學(xué)數(shù)據(jù)。因此,人事檔案的數(shù)據(jù)化建設(shè),不僅具有提高管理效能的現(xiàn)實(shí)意義,而且可以進(jìn)一步為人事管理提供統(tǒng)計(jì)數(shù)據(jù)、處理分析結(jié)果和挖掘人事知識(shí),將無結(jié)構(gòu)的實(shí)體材料轉(zhuǎn)變?yōu)槿耸鹿芾碇械挠杏弥R(shí)。正因?yàn)檫@樣,研究新時(shí)代大數(shù)據(jù)基礎(chǔ)上的人事檔案的數(shù)據(jù)化建設(shè),不僅重要,而且具有時(shí)代迫切性。
隨著人事管理制度的不斷改革和完善,規(guī)范而科學(xué)化的人事管理制度建設(shè),與規(guī)范化和科學(xué)化的人事檔案管理,二者互相促進(jìn),相輔相成。如果建立基于內(nèi)容的人事檔案管理信息系統(tǒng),那么不但可以實(shí)現(xiàn)人事檔案的信息與載體之間的分離,而且還可以使人事檔案的管理更加規(guī)范、科學(xué)和準(zhǔn)確,可以杜絕人為的主觀篡改,從而顯著提高人事檔案的真實(shí)性和可靠性。
人事檔案的數(shù)字化是人事檔案的數(shù)據(jù)化的基礎(chǔ)和前提,人事檔案的數(shù)據(jù)化又是建立基于內(nèi)容的數(shù)據(jù)庫(kù)和數(shù)據(jù)化目錄的基礎(chǔ)。人事檔案信息化建設(shè)中這四個(gè)方面之間的關(guān)系如圖1所示。
1.數(shù)字化。紙質(zhì)、膠片等人事檔案數(shù)字化技術(shù)已經(jīng)比較成熟,而且國(guó)內(nèi)外都已經(jīng)有了成功的案例,并建立了標(biāo)準(zhǔn)、規(guī)范等。數(shù)字化是數(shù)據(jù)化的基礎(chǔ)和前提。為了進(jìn)行后續(xù)的數(shù)據(jù)化、建立數(shù)據(jù)庫(kù)等操作,對(duì)數(shù)字化后的圖像等多媒體數(shù)據(jù)需要進(jìn)行必要的處理,以圖像為例,需要對(duì)圖像進(jìn)行剪切邊框、糾偏、增強(qiáng)(高清轉(zhuǎn)換)、變換、優(yōu)化等處理,然后將處理后的圖像,按卷存入預(yù)先準(zhǔn)備好的存儲(chǔ)介質(zhì),例如按檔案的卷存入光盤或者磁盤中,妥善保存。需要說明的是,對(duì)于重要圖像,例如個(gè)人照片、公章等,需要進(jìn)行摳取圖像處理,分割出重要照片等。如果需要,還要將每卷的數(shù)字化文檔打包存儲(chǔ)。
有時(shí),也可使用已有的“干部檔案數(shù)字化軟件”完成干部職工實(shí)體檔案的數(shù)字化和部分?jǐn)?shù)據(jù)化,即利用已有的專用人事檔案數(shù)字化軟件,直接完成人事檔案實(shí)體的數(shù)據(jù)化。例如,使用北京航行公司開發(fā)的干部人事檔案數(shù)字化軟件、超星爾雅、智慧樹、百度云端等,以及一些大數(shù)據(jù)與云計(jì)算平臺(tái)等。
2.數(shù)字化檔案的數(shù)據(jù)化。經(jīng)過數(shù)字化后,人事檔案主要轉(zhuǎn)換成一些高清圖像或者其他多媒體數(shù)據(jù),其中的主要內(nèi)容圖像也只能依靠管理人員的閱讀識(shí)別,才能轉(zhuǎn)化為有用的人事檔案信息。數(shù)字化并進(jìn)行處理后的人事檔案文件實(shí)際上是電子文件——數(shù)字化電子文件——即這些以一定的數(shù)碼格式記錄于磁帶、磁盤、光盤、硬盤、固態(tài)硬盤等數(shù)字信息載體上,依賴于計(jì)算機(jī)系統(tǒng)等數(shù)字設(shè)備讀寫、處理、識(shí)別,并可以在通訊網(wǎng)絡(luò)上傳輸?shù)臄?shù)字代碼序列文件,也叫數(shù)字化檔案文件(或者電子文件)。如果要利用計(jì)算機(jī)進(jìn)行人事檔案信息的處理、統(tǒng)計(jì)、分析等,還必須將數(shù)字化后的以圖像為主的數(shù)字檔案信息進(jìn)一步轉(zhuǎn)化為內(nèi)容數(shù)據(jù)。就是人事檔案的數(shù)據(jù)化,即把數(shù)字化后的人事檔案信息變?yōu)閮?nèi)容數(shù)據(jù)。換句話說,人事檔案的“數(shù)據(jù)化”就是把數(shù)字化的人事檔案轉(zhuǎn)變?yōu)榭芍票砗头治龅牧炕袷綌?shù)據(jù)的過程。從而使得人事檔案數(shù)據(jù)不僅僅可以讀寫,而且還可以用計(jì)算機(jī)等機(jī)器對(duì)相應(yīng)的內(nèi)容數(shù)據(jù)進(jìn)行操作,或者使其可執(zhí)行(machine-actionable)。因此,將檔案數(shù)字化后,如果檔案部門希望進(jìn)一步提高人事檔案管理、利用、服務(wù)的水平,將人事檔案管理、利用和服務(wù)提升到相應(yīng)的知識(shí)層面,利用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、人工智能以及大數(shù)據(jù)分析方法處理、統(tǒng)計(jì)、分析人事檔案信息,那么還需要將這些電子文檔數(shù)據(jù)化。實(shí)現(xiàn)數(shù)據(jù)化后,人事檔案數(shù)據(jù)可能包含結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及全數(shù)據(jù)處理對(duì)象,此時(shí)可以用計(jì)算機(jī)對(duì)人事檔案數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析和深入的數(shù)據(jù)挖掘等,實(shí)現(xiàn)知識(shí)層面的服務(wù)與共享,并使檔案管理與服務(wù)深入到數(shù)據(jù)層面,真正推動(dòng)人事檔案的信息化建設(shè),改變管理理念和模式。
自然,人事檔案的數(shù)據(jù)化也包括人事檔案檢索工具(檔案目錄)和人事檔案全文內(nèi)容的數(shù)據(jù)化。從數(shù)字化到數(shù)據(jù)化的轉(zhuǎn)換過程,首先可以利用現(xiàn)有的圖像識(shí)別軟件進(jìn)行識(shí)別,確定基本數(shù)字內(nèi)容,然后進(jìn)行人工校對(duì)。而且必須遵循數(shù)據(jù)化后的檔案與原始檔案的一致性。
3.建立基于內(nèi)容的人事檔案數(shù)據(jù)庫(kù)。人事檔案信息化的終極目標(biāo)是將人事檔案的各種信息,在計(jì)算機(jī)中表示為結(jié)構(gòu)化和半結(jié)構(gòu)化的形式,按照所確定的標(biāo)準(zhǔn),建立人事檔案數(shù)據(jù)庫(kù),進(jìn)行統(tǒng)一存儲(chǔ)和管理,最后構(gòu)建人事檔案的管理信息系統(tǒng),按照技術(shù)性方法,實(shí)現(xiàn)新時(shí)代基于互聯(lián)網(wǎng)的信息化、網(wǎng)絡(luò)化、知識(shí)層次的管理、服務(wù)與共享。實(shí)現(xiàn)了人事檔案信息的內(nèi)容數(shù)據(jù)化以后,需要對(duì)多源異構(gòu)的多種源數(shù)據(jù)進(jìn)行抽取和集成,確定結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),然后進(jìn)行數(shù)據(jù)清洗,最后按照選定的數(shù)據(jù)庫(kù),建立完整的人事檔案數(shù)據(jù)庫(kù)。這樣,就可以進(jìn)一步開發(fā)出基于數(shù)據(jù)內(nèi)容的人事檔案管理信息系統(tǒng),運(yùn)用統(tǒng)計(jì)分析、語義分析、人工智能、機(jī)器學(xué)習(xí)、知識(shí)圖譜等數(shù)據(jù)分析與計(jì)算技術(shù),進(jìn)一步實(shí)現(xiàn)人事檔案信息的處理、統(tǒng)計(jì)、分析和挖掘,形成本單位人事檔案的知識(shí),讓數(shù)據(jù)分析與挖掘成為檔案館知識(shí)服務(wù)體系創(chuàng)新及完善的重要支撐,將人事檔案的管理、服務(wù)和共享提升到知識(shí)管理層面。從而使人事檔案管理與服務(wù)真正從傳統(tǒng)模式提升到基于數(shù)據(jù)分析和數(shù)據(jù)挖掘的知識(shí)服務(wù)體系。
4.建立人事檔案數(shù)據(jù)化目錄。為了能對(duì)已經(jīng)存入數(shù)據(jù)庫(kù)的人事檔案的各種信息進(jìn)行檢索與查詢,特別是內(nèi)容數(shù)據(jù)的檢索與查詢,按照人事檔案管理規(guī)范,還需要建立數(shù)據(jù)化的檔案目錄。即按照人事檔案編目條例、著錄規(guī)則,參照《中國(guó)文獻(xiàn)編目規(guī)則》,在原有人事檔案檢索工具(檔案目錄)的基礎(chǔ)上,以方便檢索、查詢?yōu)樵瓌t,著錄詳簡(jiǎn)級(jí)次得當(dāng)?shù)?、完整的人事檔案數(shù)據(jù)化目錄。
在人事檔案目錄數(shù)據(jù)化過程中,要在元數(shù)據(jù)中明確區(qū)分不同數(shù)據(jù)元素,并予以不同標(biāo)識(shí),以標(biāo)識(shí)不同性質(zhì)的資料及其屬性,例如插圖、個(gè)人照片、圖章等的屬性,影音資料的屬性以及食物材質(zhì)的不同特征的數(shù)據(jù)。
數(shù)據(jù)化是在數(shù)字化基礎(chǔ)上所進(jìn)行的,因此,除了要遵循數(shù)字化階段的基本原則外,還應(yīng)該做好數(shù)字化階段關(guān)鍵工作。下面主要說明新時(shí)代人事檔案數(shù)據(jù)化建設(shè)的關(guān)鍵內(nèi)容。
1.基本原則。中共中央辦公廳印發(fā)、并自 2018 年 11 月 20 日起執(zhí)行的《干部人事檔案工作條例》,具體規(guī)定了干部人事檔案工作應(yīng)當(dāng)遵循的基本原則,即:黨管干部、黨管人才;依規(guī)依法、全面從嚴(yán);分級(jí)負(fù)責(zé)、集中管理;真實(shí)準(zhǔn)確、完整規(guī)范;方便利用、安全保密。另外,2017年7月1日,國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)第15號(hào)公告頒布了關(guān)于批準(zhǔn)發(fā)布《干部人事檔案數(shù)字化技術(shù)規(guī)范》國(guó)家標(biāo)準(zhǔn)規(guī)定了技術(shù)性基本原則:真實(shí)性、完整性、可用性、安全性原則,并確保數(shù)字化檔案與紙質(zhì)檔案一致。這些都是人事檔案數(shù)據(jù)化建設(shè)的基本原則。
2.數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。為了建立基于內(nèi)容的數(shù)據(jù)化檢索工具,即著錄數(shù)據(jù)化目錄;建立基于內(nèi)容的數(shù)據(jù)化人事檔案數(shù)據(jù)庫(kù)。這都牽扯到人事檔案的主題詞、分類號(hào)、基礎(chǔ)知識(shí)庫(kù)、本體詞表等數(shù)據(jù)基礎(chǔ)設(shè)施的編制與建設(shè)。這不但要熟悉國(guó)內(nèi)的相關(guān)標(biāo)準(zhǔn)、規(guī)范等,還需要借鑒國(guó)際上相應(yīng)的標(biāo)準(zhǔn)、規(guī)范以及實(shí)踐,這對(duì)傳統(tǒng)的人事檔案管理與研究人員是一大挑戰(zhàn)。采取什么具體措施,相對(duì)簡(jiǎn)單、高效地進(jìn)行人事檔案數(shù)據(jù)化的基礎(chǔ)數(shù)據(jù)設(shè)施建設(shè),并滿足數(shù)字化或者數(shù)據(jù)化人事檔案管理信息系統(tǒng)的需求,是目前人事檔案數(shù)據(jù)化工作中的難點(diǎn)。
3.建立人事檔案數(shù)據(jù)化的模型、規(guī)則和格式。建立相應(yīng)的模型、規(guī)則和格式后,可以確定數(shù)據(jù)化后人事檔案信息的表示與處理方式。
4.人事檔案數(shù)據(jù)化的標(biāo)準(zhǔn)與規(guī)范。與數(shù)字化一樣,數(shù)據(jù)化也需要建立一系列的標(biāo)準(zhǔn)與規(guī)范。
5.人事檔案數(shù)據(jù)化建模。構(gòu)建人事檔案的元數(shù)據(jù)標(biāo)準(zhǔn),即數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)、數(shù)據(jù)取值標(biāo)準(zhǔn)和數(shù)據(jù)交換標(biāo)準(zhǔn)共4類。
6.人事檔案中實(shí)體及其名稱在計(jì)算機(jī)中的描述與表示。在人事檔案數(shù)據(jù)化后,要運(yùn)用數(shù)據(jù)統(tǒng)計(jì)與分析方法、機(jī)器學(xué)習(xí)、大數(shù)據(jù)的方法與技術(shù),用計(jì)算機(jī)等機(jī)器進(jìn)行自動(dòng)化處理、分析人事檔案的數(shù)據(jù)時(shí),必須區(qū)分人事檔案的實(shí)體及其名稱,并在計(jì)算機(jī)中描述和表示它們,并建立實(shí)體——關(guān)系模型等。這實(shí)際上是將人事檔案管理、利用與服務(wù)提升到知識(shí)化層次時(shí)必須進(jìn)行的工作,這是人事檔案數(shù)據(jù)化建模的關(guān)鍵內(nèi)容,是人事檔案數(shù)據(jù)化的關(guān)鍵,也是人事檔案信息化建設(shè)的基礎(chǔ)和關(guān)鍵一步。
干部人事檔案的數(shù)據(jù)化都是新時(shí)代干部人事檔案管理的關(guān)鍵環(huán)節(jié)。做好這些工作,可以提高人事檔案的管理水平、效率以及知識(shí)型服務(wù),轉(zhuǎn)變?nèi)耸聶n案管理與服務(wù)模式,增強(qiáng)檔案業(yè)務(wù)部門的管理與服務(wù)水平,為檔案內(nèi)部管理及面向客戶服務(wù)提供高效率、高深度、知識(shí)型的全面服務(wù)。