李京
關(guān)鍵詞:區(qū)塊鏈;學(xué)籍檔案管理;數(shù)據(jù)庫(kù);安全可信;高校學(xué)籍檔案管理系統(tǒng)
0 引言
高校學(xué)籍檔案是高校檔案的重要組成部分,是檔案管理工作中的一項(xiàng)基礎(chǔ)性工作。學(xué)籍檔案是學(xué)生在校期間形成的具有保存價(jià)值的文字材料,真實(shí)記錄了學(xué)生在校期間的學(xué)習(xí)過(guò)程及綜合表現(xiàn),是個(gè)人學(xué)習(xí)成績(jī)和學(xué)歷的見(jiàn)證材料,對(duì)學(xué)生、學(xué)校、社會(huì)都具有參考和憑證作用。隨著高校招生規(guī)模的擴(kuò)大、多種形式辦學(xué)、考研和出國(guó)人數(shù)增加、就業(yè)壓力和就業(yè)渠道的多樣化,學(xué)生對(duì)學(xué)籍檔案的利用需求與日俱增,學(xué)籍檔案的查詢利用工作量也隨之加大,給檔案管理部門帶來(lái)了前所未有的壓力和挑戰(zhàn),加強(qiáng)高校學(xué)生的學(xué)籍檔案的信息化管理,充分發(fā)揮學(xué)籍檔案的作用,是高校學(xué)籍檔案工作面臨的重要研究課題。
起初,我國(guó)的學(xué)籍檔案大多為紙質(zhì)檔案,不易保管,易丟失、損毀、造假、管理流程復(fù)雜、檢索緩慢等問(wèn)題十分普遍,一旦學(xué)籍檔案遺失或破壞將給當(dāng)事人的前途命運(yùn)造成不良影響。目前,大部分高校已建成學(xué)籍檔案管理系統(tǒng),其保存管理的高效性、查詢利用的便捷性大幅提升,但網(wǎng)絡(luò)環(huán)境下的學(xué)籍檔案管理系統(tǒng)面臨的安全問(wèn)題也日益凸顯,網(wǎng)絡(luò)攻擊導(dǎo)致學(xué)籍檔案系統(tǒng)崩潰,學(xué)籍檔案信息泄露、偽造或篡改等信息安全事件頻發(fā)。學(xué)籍檔案管理系統(tǒng)的安全問(wèn)題已引起高校檔案機(jī)構(gòu)的高度重視,保護(hù)電子學(xué)籍檔案不被竊取、篡改和破壞,保障電子學(xué)籍檔案信息的真實(shí)性和安全性,成為高校檔案館研究的熱點(diǎn)問(wèn)題。因此,構(gòu)建一個(gè)具有安全保護(hù)機(jī)制的電子學(xué)籍檔案管理系統(tǒng)已經(jīng)成為高校面臨的迫切問(wèn)題,具有重要的研究?jī)r(jià)值和現(xiàn)實(shí)意義。
區(qū)塊鏈作為比特幣底層技術(shù),結(jié)合哈希運(yùn)算、數(shù)字簽名、P2P網(wǎng)絡(luò)、共識(shí)算法以及智能合約等基礎(chǔ)技術(shù),成為一種全新的分布式基礎(chǔ)架構(gòu)和計(jì)算范式[1]。近年來(lái),將區(qū)塊鏈技術(shù)引入到檔案管理工作已成為檔案界研究的熱點(diǎn)。運(yùn)用區(qū)塊鏈技術(shù)開(kāi)發(fā)一個(gè)安全、高效、可靠的高校學(xué)籍檔案管理系統(tǒng)是本文研究的內(nèi)容。
1 區(qū)塊鏈技術(shù)為電子學(xué)籍檔案管理提供技術(shù)保障
1.1 電子學(xué)籍檔案的真實(shí)性、完整性和永久保存保障
電子文件的易修改性和信息與載體的可分離性,使電子文件在存儲(chǔ)的過(guò)程中存在著被改動(dòng)的可能,而且這種改動(dòng)在物理形態(tài)上是可以做到“不留痕跡”的。作為一項(xiàng)新興的信息技術(shù),區(qū)塊鏈?zhǔn)褂脮r(shí)間戳和數(shù)字密碼技術(shù),把數(shù)據(jù)信息記載在按時(shí)間序列組成的區(qū)塊中,并使用共識(shí)機(jī)制把數(shù)據(jù)存儲(chǔ)到分布式節(jié)點(diǎn)數(shù)據(jù)庫(kù)內(nèi),從而生成了永久保存、不可逆向篡改的數(shù)據(jù)記錄。容易驗(yàn)證的鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)、去中心化冗余保存、多方共同鑒證三者相結(jié)合,給區(qū)塊鏈上存儲(chǔ)的數(shù)據(jù)帶來(lái)“不可篡改”的特性,從而保證了學(xué)籍檔案數(shù)據(jù)的真實(shí)性。區(qū)塊鏈的不可篡改、永久不變的特性用于學(xué)籍檔案管理中,解決了學(xué)籍檔案的真實(shí)性、完整性和長(zhǎng)久保管問(wèn)題。
1.2 分布式數(shù)據(jù)存儲(chǔ)容災(zāi)備份保障
當(dāng)前高校檔案信息化建設(shè)中,學(xué)籍檔案的保存通常采用集中存儲(chǔ)模式,高校檔案館由于種種限制沒(méi)有能力對(duì)存儲(chǔ)的電子學(xué)籍檔案進(jìn)行全方位備份存儲(chǔ),一旦遇到自然災(zāi)害、重大事故等突發(fā)事件,電子學(xué)籍檔案數(shù)據(jù)很容易丟失,學(xué)籍檔案的安全性很難得到保障。而區(qū)塊鏈的分布式存儲(chǔ)是把全部數(shù)據(jù)分布式保存在整個(gè)網(wǎng)絡(luò)的多個(gè)節(jié)點(diǎn)上,單個(gè)節(jié)點(diǎn)的損壞或滅失并不會(huì)對(duì)其他節(jié)點(diǎn)造成影響,單個(gè)節(jié)點(diǎn)的數(shù)據(jù)錯(cuò)誤或篡改更不可能對(duì)整體數(shù)據(jù)產(chǎn)生什么破壞性的影響[2]。學(xué)籍檔案的區(qū)塊鏈分布式存儲(chǔ)可自動(dòng)完成全網(wǎng)多節(jié)點(diǎn)備份,實(shí)現(xiàn)有效的容災(zāi)與安全保障。
1.3 電子學(xué)籍檔案的安全保障
電子學(xué)籍檔案管理的核心目標(biāo)就是保障其安全。傳統(tǒng)的檔案管理系統(tǒng),學(xué)籍檔案存儲(chǔ)在中心化的數(shù)據(jù)庫(kù)中,面臨著更多的網(wǎng)絡(luò)攻擊的風(fēng)險(xiǎn),尤其可能被內(nèi)部管理人員和外部攻擊者偽造和篡改[3]。區(qū)塊鏈系統(tǒng)中,存儲(chǔ)在不同節(jié)點(diǎn)的數(shù)據(jù)信息都受到密碼學(xué)技術(shù)的嚴(yán)格保護(hù),即使獲得了相關(guān)信息,沒(méi)有合法授權(quán)也無(wú)法偷窺到數(shù)據(jù)信息的真實(shí)內(nèi)容。區(qū)塊鏈系統(tǒng)通過(guò)設(shè)置認(rèn)證規(guī)則、訪問(wèn)控制和審計(jì)機(jī)制,并利用密碼學(xué)技術(shù)實(shí)現(xiàn)學(xué)籍檔案信息存儲(chǔ)和訪問(wèn)的安全性。
1.4 便于監(jiān)管的公共信任體系保障
當(dāng)前檔案部門之間協(xié)調(diào)成本過(guò)高,利益保護(hù)現(xiàn)象嚴(yán)重,中心化的存儲(chǔ)技術(shù)和管理模式,使得學(xué)籍檔案的原始性、真實(shí)性和安全性問(wèn)題尚未得到妥善解決,導(dǎo)致檔案數(shù)據(jù)可信度降低。區(qū)塊鏈技術(shù)的安全性、不可逆、不可篡改性都已經(jīng)得到了證明,如果把學(xué)籍檔案業(yè)務(wù)建立在已被證明其可靠性的區(qū)塊鏈上,將極大降低安全和信用成本。從技術(shù)上應(yīng)用區(qū)塊鏈,就可以用較低的成本打破這些阻礙,建立一個(gè)公開(kāi)的社會(huì)公共信用系統(tǒng),成本將大幅降低,效率也將大幅提升,還便于監(jiān)管。
區(qū)塊鏈技術(shù)利用其所具備的分布式、透明性、可追溯、防篡改等特征,可提高學(xué)籍檔案數(shù)據(jù)的真實(shí)性和安全性,這些特征與學(xué)籍檔案管理要求十分契合,因此,區(qū)塊鏈技術(shù)可以為學(xué)籍檔案管理提供有力技術(shù)保障。
2 區(qū)塊鏈技術(shù)在學(xué)籍檔案管理的適用性分析
區(qū)塊鏈?zhǔn)且幌盗杏?jì)算機(jī)技術(shù)的新型應(yīng)用模式,其本質(zhì)上是一個(gè)通過(guò)加密算法保障的不可篡改和不可偽造的分布式數(shù)據(jù)庫(kù)。與其他數(shù)據(jù)信息相比,學(xué)籍檔案數(shù)據(jù)具有以下明顯特征:學(xué)籍檔案數(shù)據(jù)量巨大、來(lái)源渠道廣泛、數(shù)據(jù)類型多樣、查詢利用率高,不能隨意篡改,數(shù)據(jù)保密性要求高。下面根據(jù)學(xué)籍檔案管理的需求,將常規(guī)學(xué)籍檔案管理系統(tǒng)數(shù)據(jù)庫(kù)和區(qū)塊鏈做一個(gè)對(duì)比,具體分析如表1。
傳統(tǒng)的檔案管理系統(tǒng)主要側(cè)重檔案信息的收、管、用業(yè)務(wù)功能的實(shí)現(xiàn),對(duì)檔案數(shù)據(jù)的真實(shí)性、完整性、防篡改和保密性等檔案信息的安全防護(hù)顯得無(wú)能為力[4]。從上表看出,區(qū)塊鏈技術(shù)具有分布式存儲(chǔ)、可信任、防篡改、多節(jié)點(diǎn)冗余備份、檔案協(xié)同管理和查詢利用的便捷性以及數(shù)據(jù)真實(shí)性、完整性、可追溯、保密性等特有的安全特性,能夠滿足電子學(xué)籍檔案管理的多方面需求,是一種匹配度極高的技術(shù)解決方案。
3 構(gòu)建基于區(qū)塊鏈的學(xué)籍檔案管理系統(tǒng)
基于區(qū)塊鏈的學(xué)籍檔案管理系統(tǒng)及功能。為解決傳統(tǒng)學(xué)籍檔案管理系統(tǒng)的安全性差、易篡改、不易追溯的問(wèn)題,通過(guò)分析區(qū)塊鏈技術(shù)在學(xué)籍檔案管理的適用性,本文提出將區(qū)塊鏈技術(shù)應(yīng)用到現(xiàn)有的學(xué)籍檔案管理系統(tǒng),研究并設(shè)計(jì)了基于區(qū)塊鏈的學(xué)籍檔案管理系統(tǒng),實(shí)現(xiàn)學(xué)籍檔案數(shù)據(jù)完整性、安全性保護(hù)以及學(xué)籍檔案的安全有效管理。
基于區(qū)塊鏈的學(xué)籍檔案管理系統(tǒng)由學(xué)籍檔案管理子系統(tǒng)和區(qū)塊鏈數(shù)據(jù)保護(hù)子系統(tǒng)協(xié)同構(gòu)成,如圖1所示,各模塊分工明確,子系統(tǒng)間通過(guò)網(wǎng)絡(luò)調(diào)用進(jìn)行數(shù)據(jù)交互,在保障學(xué)籍檔案數(shù)據(jù)安全性的前提下,實(shí)現(xiàn)學(xué)籍檔案管理功能。
檔案管理子系統(tǒng)是整個(gè)區(qū)塊鏈學(xué)籍檔案管理系統(tǒng)的基礎(chǔ)與核心,包括學(xué)籍檔案的接收采集、存儲(chǔ)保護(hù)、查詢利用、驗(yàn)證恢復(fù)、用戶權(quán)限管理、操作日志管理等模塊。學(xué)籍檔案的接收采集以及查詢利用等操作信息不僅會(huì)存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù),還會(huì)通過(guò)RESTful接口同步到區(qū)塊鏈數(shù)據(jù)保護(hù)子系統(tǒng)。檔案的查詢操作不僅可以查詢本地?cái)?shù)據(jù)庫(kù),也可以查詢區(qū)塊鏈保護(hù)子系統(tǒng)。
區(qū)塊鏈保護(hù)子系統(tǒng)由聯(lián)盟區(qū)塊鏈、公有區(qū)塊鏈、RESTful接口、私有IPFS集群共同構(gòu)成。檔案管理子系統(tǒng)的請(qǐng)求通過(guò)RESTful接口傳送到區(qū)塊鏈保護(hù)子系統(tǒng)進(jìn)行處理。IPFS是一個(gè)分布式文件存儲(chǔ)系統(tǒng),具有去中心化、內(nèi)容可尋址、不可篡改等特點(diǎn)[5],通過(guò)與區(qū)塊鏈協(xié)同配合,能夠有效保障學(xué)籍檔案的真實(shí)性和完整性。
1) 學(xué)籍檔案接收采集模塊:接收學(xué)籍檔案相關(guān)部門產(chǎn)生的電子學(xué)籍文件及其元數(shù)據(jù)、對(duì)紙質(zhì)學(xué)籍檔案文件進(jìn)行數(shù)字化和采集重要數(shù)字學(xué)籍信息資源。例如從招生辦獲取新生入學(xué)登記信息;從教務(wù)處、研究生院等教務(wù)部門獲取學(xué)生學(xué)籍異動(dòng)信息,以及培養(yǎng)計(jì)劃、課程成績(jī)單、獎(jiǎng)懲記錄、學(xué)位論文、畢業(yè)證書、學(xué)位證書等信息;從就業(yè)辦獲取學(xué)生畢業(yè)信息??梢赃x擇在線或離線接收方式。該模塊具備目錄數(shù)據(jù)和全文數(shù)據(jù)等多種信息資源的采集功能。
2) 學(xué)籍檔案存儲(chǔ)保護(hù)模塊:用于存儲(chǔ)采集的學(xué)籍檔案數(shù)據(jù)和元數(shù)據(jù),以及用戶操作的日志信息不僅存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù),還會(huì)同步到區(qū)塊鏈數(shù)據(jù)保護(hù)子系統(tǒng)。區(qū)塊鏈不適合作為大數(shù)據(jù)存儲(chǔ)的基礎(chǔ)設(shè)施,所以區(qū)塊鏈一般不會(huì)用來(lái)存儲(chǔ)檔案原始數(shù)據(jù)[6],完整的學(xué)籍檔案數(shù)據(jù)加密存儲(chǔ)在私有IPFS集群,學(xué)籍檔案的IPFS地址和哈希值存儲(chǔ)在聯(lián)盟鏈上。為了充分保護(hù)聯(lián)盟鏈的檔案數(shù)據(jù),通過(guò)定期將聯(lián)盟鏈快照錨定到公有鏈的方式增強(qiáng)數(shù)據(jù)的原始性和真實(shí)性保護(hù),實(shí)現(xiàn)從公有鏈到聯(lián)盟鏈的雙重?cái)?shù)據(jù)保護(hù)。
3) 學(xué)籍檔案查詢利用模塊:提供日常的學(xué)籍檔案查詢、利用、打印輸出功能。查詢操作在查詢本地?cái)?shù)據(jù)庫(kù)的同時(shí),還會(huì)查詢區(qū)塊鏈保護(hù)子系統(tǒng)。即使本地?cái)?shù)據(jù)庫(kù)中的學(xué)籍檔案數(shù)據(jù)被惡意篡改,仍能通過(guò)區(qū)塊鏈數(shù)據(jù)保護(hù)子系統(tǒng)找回被篡改的檔案數(shù)據(jù)。每次查詢、利用操作都會(huì)產(chǎn)生操作日志,記錄操作用戶、操作時(shí)間以及具體的操作信息。
4) 學(xué)籍檔案驗(yàn)證恢復(fù)模塊:由于學(xué)籍檔案的存儲(chǔ)方式采用中心化的數(shù)據(jù)庫(kù)存儲(chǔ),容易遭受黑客攻擊,學(xué)籍檔案數(shù)據(jù)被篡改往往不易察覺(jué),需使用區(qū)塊鏈中的數(shù)據(jù)進(jìn)行校對(duì)發(fā)現(xiàn)安全風(fēng)險(xiǎn)。檔案的驗(yàn)證操作是將本地?cái)?shù)據(jù)庫(kù)的學(xué)籍檔案數(shù)據(jù)通過(guò)RESTful接口發(fā)送到區(qū)塊鏈數(shù)據(jù)保護(hù)子系統(tǒng)進(jìn)行數(shù)據(jù)比對(duì)的過(guò)程。具體來(lái)講,就是將本地?cái)?shù)據(jù)庫(kù)的學(xué)籍檔案哈希值與區(qū)塊鏈子系統(tǒng)中區(qū)塊鏈的哈希值進(jìn)行比較,由于區(qū)塊鏈的不可篡改特性,可以確定存儲(chǔ)在數(shù)據(jù)庫(kù)中的學(xué)籍檔案是否被篡改,并且在檢查到數(shù)據(jù)異常后,可以使用區(qū)塊鏈保護(hù)子系統(tǒng)IPFS集群中的學(xué)籍檔案數(shù)據(jù)重置本地?cái)?shù)據(jù)庫(kù)。
5) 用戶權(quán)限管理模塊:檔案管理子系統(tǒng)采用基于角色的訪問(wèn)控制方案,對(duì)用戶權(quán)限進(jìn)行控制。用戶角色分為系統(tǒng)管理員、檔案管理員和普通用戶。系統(tǒng)管理員是系統(tǒng)最高權(quán)限的擁有者,具備系統(tǒng)所有操作功能,能夠創(chuàng)建、修改和刪除用戶角色和角色權(quán)限。檔案管理員擁有學(xué)籍檔案的增加、修改、查詢和驗(yàn)證權(quán)限,以及學(xué)籍檔案的查詢利用申請(qǐng)和用戶注冊(cè)申請(qǐng)的審核批準(zhǔn)權(quán)限。普通用戶可以對(duì)學(xué)籍檔案進(jìn)行查詢和利用,檔案管理員可以對(duì)用戶權(quán)限和學(xué)籍檔案進(jìn)行管理操作。
6) 操作日志模塊:系統(tǒng)使用者進(jìn)行學(xué)籍檔案的新增、修改、查詢和利用等操作均會(huì)產(chǎn)生操作日志,對(duì)學(xué)籍檔案的操作行為進(jìn)行審計(jì)和追蹤。操作日志不僅存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù),還會(huì)記錄到區(qū)塊鏈中。一旦上鏈則無(wú)法更改,所有的操作都形成日志記錄在鏈上,因此可以進(jìn)行溯源。如發(fā)生學(xué)籍檔案的篡改和信息泄露,可以通過(guò)日志信息追蹤到惡意用戶。操作日志文件只能讀取,不可修改。只有管理員具有查閱權(quán)限。
4 結(jié)論
區(qū)塊鏈技術(shù)所具有的特點(diǎn)與電子檔案的四性要求相吻合,其“去中心化、不可篡改、可追溯”等技術(shù)特性可以構(gòu)建一種全新的信任機(jī)制和應(yīng)用模式,確保了電子學(xué)籍檔案的來(lái)源可靠,內(nèi)容可信,過(guò)程可溯。
本文提出的方案是在高?,F(xiàn)有學(xué)籍檔案管理系統(tǒng)基礎(chǔ)上進(jìn)行擴(kuò)展,以較低的經(jīng)濟(jì)成本和較少的系統(tǒng)修改,為學(xué)籍檔案管理系統(tǒng)中的檔案數(shù)據(jù)提供了更高的安全保障,防止不法分子對(duì)學(xué)籍檔案數(shù)據(jù)的惡意篡改和破壞,并提供學(xué)籍檔案數(shù)據(jù)的隱私保護(hù)、歷史追溯和驗(yàn)證恢復(fù)等多種功能。通過(guò)應(yīng)用區(qū)塊鏈技術(shù),提供一個(gè)高校學(xué)籍檔案信息系統(tǒng)運(yùn)行實(shí)踐的新思路新方法,擴(kuò)大高校學(xué)籍檔案管理的范圍,提供更加高效便捷的學(xué)籍檔案管理和利用方式,化解了高校與企業(yè)、院校與院校之間的信任危機(jī)。為學(xué)校和社會(huì)提供更加安全、高效的檔案信息資源服務(wù),具有很高的實(shí)用價(jià)值和推廣前景。