■袁少瓊,李秀麗
(1.廣東省特種設備檢測研究院珠海檢測院,廣東 珠海 519000;2.嶺南師范學院,廣東 湛江 524000)
數(shù)智賦能作為一種新興的技術方向,正在逐漸應用于檔案服務領域。通過運用先進的數(shù)字技術和數(shù)據(jù)分析方法,數(shù)智賦能可以提高檔案管理和服務的效率、準確性和可靠性,從而為用戶提供更加優(yōu)質的服務體驗。本文通過對數(shù)智賦能在檔案服務中的微觀機理和效應進行深入剖析,從數(shù)據(jù)數(shù)字化、智能化、可視化和安全性等方面入手,探討數(shù)智賦能對檔案服務的影響和作用。通過本文的研究,可以更加深入地了解數(shù)智賦能在檔案服務領域的應用和發(fā)展趨勢,為進一步推進數(shù)字化檔案管理和服務提供有益的參考。
檔案管理是指對構成檔案內(nèi)容信息的基本粒子及其形成、聚合、運動的深層機理進行分析和探索。因此,從微觀層面深入分析和研究檔案內(nèi)容信息的內(nèi)在機制,可以更好地認識檔案信息服務創(chuàng)新的緊迫性需求。同時,通過深入分析數(shù)據(jù)和記錄之間的因果關系,以及檔案和記錄的邏輯聯(lián)系和微觀結構,可以探究數(shù)據(jù)和檔案的共存機制和演化路徑,從而為當前中國的檔案數(shù)字化實踐提供基礎理論指導。
檔案的記錄殼層結構模型包含四個層次(見圖1),分別是記錄核、記錄幔、記錄殼和記錄表。這個模型類似于地球地質構造的殼層結構,由內(nèi)向外分別為:記錄核(Record Core) 是指檔案文本中承載著核心信息的部分,可以反映檔案形成者對于特定歷史時期社會系統(tǒng)各類實體及其屬性、關系的描述結果。記錄幔(Record Mantle)是指在記錄因子之外的檔案文本中存在但語義關系不明確的命名實體符號,如人名、機構名、地名、物品名等。這些命名實體雖然不屬于核心語義信息,但仍是檔案內(nèi)容信息的重要組成部分。記錄殼(Record Crus)是指記錄的物質載體,是任何可以承載語義符號的現(xiàn)實物質,在實踐中一般分為紙質載體和電子載體兩種類型。記錄表(Record Surface)是指附著于記錄載體之上的自然語言文本或其他符號,用于對特定歷史時期社會系統(tǒng)狀態(tài)特征及其演變過程進行表達和描述[1]。
圖1 檔案的記錄殼層結構模型
這個模型描述了檔案作為記錄載體的內(nèi)在結構和信息內(nèi)容,可以幫助人們更好地理解和使用檔案信息。
隨著歷史的不同階段,數(shù)據(jù)和檔案之間的關系會呈現(xiàn)不同的重要性和層次。在20 世紀80 年代前后,主要的技術驅動因素是辦公自動化,這促進了數(shù)據(jù)和檔案之間的數(shù)字化轉換,數(shù)據(jù)是輔助檔案管理的附屬資源;在20 世紀90 年代,計算機輔助檔案管理成為主要驅動因素,檔案管理元數(shù)據(jù)成為關注的焦點;而2000 年以后,隨著“檔案數(shù)字化”和“電子文件管理”的興起,數(shù)據(jù)和檔案的重要性逐漸平衡。檔案管理元數(shù)據(jù)仍然非常重要,但是現(xiàn)在它涉及更多的業(yè)務數(shù)據(jù)和檔案內(nèi)容信息。近年來,數(shù)據(jù)的重要性不斷凸顯,“檔案數(shù)據(jù)化”成為推動粗粒度檔案文件管理向細粒度檔案數(shù)據(jù)管理轉型的關鍵因素,數(shù)據(jù)成為整體性管理的中心,RDF 數(shù)據(jù)和檔案數(shù)據(jù)本體ADO 成為關鍵性資源。
總體上,數(shù)據(jù)與檔案的關系經(jīng)歷了三個階段,從以檔案為中心,數(shù)據(jù)為輔助資源,到數(shù)據(jù)與檔案并重,再到以數(shù)據(jù)為中心的整體性管理。這個演化過程打破了不同階段對用戶檔案利用的制約,使得用戶可以通過網(wǎng)絡直接獲取與其需求高度契合的精準化檔案內(nèi)容信息,不再需要以人工閱讀方式在相關檔案文件中查找所需內(nèi)容。同時,每一類新型檔案管理和檢索工具是在之前階段檔案信息化建設實踐基礎上實現(xiàn)的,不會影響原有檔案管理模式的正常運行。
波普爾在三個世界理論的基礎上提出的“信息三個世界”理論,該理論將現(xiàn)實世界、信息世界和機器世界三個層面聯(lián)系起來,為人們理解數(shù)據(jù)與檔案之間的關系提供了參照體系[1]。在過去,檔案管理活動主要是在“信息世界”中進行,依靠文本、圖像等類型的檔案,而數(shù)據(jù)庫等機器工具只是輔助資源。但隨著數(shù)據(jù)庫技術的應用,檔案管理活動開始在“信息世界”和“機器世界”中并存,成為一種非平衡型的共生形態(tài)。隨著大數(shù)據(jù)時代的到來,人們開始認識到數(shù)據(jù)與檔案是密不可分的資源,需要同時兼顧數(shù)據(jù)管理與檔案管理,呈現(xiàn)出相對平衡的雙軌共生關系。而在數(shù)智賦能下,將檔案文本轉化為機器可處理的數(shù)據(jù),例如,利用RDF 數(shù)據(jù)生成檔案數(shù)據(jù)本體ADO 等新技術,成為檔案管理的新趨勢。在未來,檔案管理活動可能會進入一個新的時代,以“機器世界”為中心、以“信息世界”為表征的雙軌融合型共生時代。這個時代下,機器和信息將會共同作為檔案管理活動的核心要素,并相互融合以達到更高效的管理目標。
數(shù)智賦能檔案服務的微觀機理主要是基于檔案的記錄殼層結構模型和三個世界理論,應用數(shù)智技術實現(xiàn)數(shù)智賦能。
檔案的記錄殼層結構模型提供了一個基于檔案的信息組織和管理的框架,包括不同層次的記錄單元、記錄組織和記錄關聯(lián)等內(nèi)容。這種結構模型可以使檔案信息的存儲、檢索、利用和分析更加高效和便捷。通過數(shù)智技術,如自然語言處理、機器學習、知識圖譜等,可以更好地理解和分析檔案信息的內(nèi)容和結構,實現(xiàn)檔案信息的智能化加工和應用。
三個世界理論提供了一個理論框架,用于描述信息的不同層次和類型,包括個體心智世界、符號交互世界和物理世界[2]。通過這個理論,可以更好地理解檔案信息的內(nèi)涵和意義,并在此基礎上實現(xiàn)檔案信息的知識化整合和智能化應用。
數(shù)智技術,如自然語言處理、機器學習、知識圖譜等,可以幫助檔案管理機構更好地理解和分析檔案信息,實現(xiàn)檔案信息的智能化加工和應用。例如,可以利用自然語言處理技術對檔案文本進行自動化處理和抽取,將其轉化為結構化數(shù)據(jù),方便后續(xù)的分析和利用;可以利用機器學習技術對檔案信息進行分類和推薦,實現(xiàn)個性化的信息服務;可以利用知識圖譜技術對檔案信息進行語義化整合,建立檔案信息之間的關聯(lián)關系,實現(xiàn)知識的跨領域應用[3]。
綜上所述,數(shù)智賦能檔案服務的微觀機理主要包括,檔案的記錄殼層結構模型、三個世界理論和數(shù)智技術的應用。通過這些機理的相互作用和協(xié)同,可以實現(xiàn)檔案信息的智能化加工和應用,為各個領域提供更加高效、更加便捷的信息服務。
為更全面地認識數(shù)智賦能技術在檔案服務領域的優(yōu)勢和局限性,分析應用場景與特點,從而更加客觀地評價數(shù)智賦能在檔案服務中的作用和價值。
數(shù)智賦能在檔案服務領域具有廣泛的應用場景,主要包括以下幾個方面。
1.數(shù)字化檔案管理
數(shù)智賦能可以將紙質檔案數(shù)字化,實現(xiàn)檔案信息的電子化管理和存儲。數(shù)字化檔案管理可以提高檔案信息的可訪問性和可用性,為用戶提供更加便捷的服務。隨著數(shù)字技術的不斷進步,數(shù)字化檔案管理逐漸成為檔案管理的主要形式。許多檔案服務機構已經(jīng)推廣數(shù)字化檔案管理,并逐步完善相關的技術和管理體系,提高了檔案管理的效率和質量。
2.檔案信息挖掘
數(shù)智賦能可以通過數(shù)據(jù)分析和挖掘技術,對檔案信息進行深入挖掘和分析,發(fā)掘出其中有價值的信息。檔案信息挖掘可以幫助用戶更好地了解檔案信息,為用戶提供更加精準的服務。
3.智能化檔案檢索
數(shù)智賦能可以通過人工智能等技術,實現(xiàn)智能化的檔案檢索和查詢。利用人工智能、自然語言處理等技術,智能化檔案檢索可以實現(xiàn)精準的檔案檢索和查詢,提高了檔案服務的效率和質量,為用戶提供更加高效的服務。
4.客戶化與可視化
數(shù)智賦能可以根據(jù)客戶的需求和要求,定制個性化的檔案服務方案,為用戶提供更加貼心的服務??蛻艋瘷n案服務可以提高用戶的滿意度和忠誠度,促進服務商與用戶的深入合作。數(shù)智賦能還可以將檔案信息以可視化的形式呈現(xiàn),讓用戶可以更加直觀地了解檔案信息。檔案信息可視化可以提高用戶對檔案信息的理解和認知,為用戶提供更加便捷的服務。
數(shù)智賦能檔案服務具有數(shù)字化管理、智能化服務、客戶化服務、數(shù)據(jù)挖掘和分析、高效性和安全性等特點,是檔案管理和服務的一種重要形式。一是實現(xiàn)數(shù)字化管理。數(shù)智賦能檔案服務具有數(shù)字化管理的特點。通過數(shù)字技術的應用,檔案管理和服務實現(xiàn)了全面數(shù)字化,實現(xiàn)了信息化管理和智能化服務。二是具有智能化服務。通過人工智能、自然語言處理等技術,實現(xiàn)了檔案信息的智能檢索、智能分析和智能推薦等服務,提高了服務效率和服務質量。三是數(shù)智賦能檔案服務具有數(shù)據(jù)挖掘和分析的特點。通過數(shù)據(jù)分析和挖掘技術,挖掘出有價值的信息和知識,為用戶提供更加精準的服務。四是數(shù)智賦能檔案服務具有高效性和安全性的特點。通過數(shù)字化管理和智能化服務,提高了服務效率和質量。同時,通過數(shù)據(jù)保護和安全管理等措施,保證了檔案信息的安全性和可靠性。
數(shù)字檔案平臺是利用數(shù)字技術手段,集成、管理、共享全社會數(shù)字化檔案資源的開放平臺。數(shù)字檔案平臺可以實現(xiàn)檔案資源的統(tǒng)一管理、全文檢索、多媒體展示、數(shù)字化保護和長期保存等功能,為檔案管理和服務提供了全方位的支持。通過構建數(shù)字檔案平臺,可以實現(xiàn)檔案的全生命周期管理,提高檔案服務效率和質量,同時也可以促進檔案資源的共享和利用。
1.建立數(shù)字化檔案管理系統(tǒng)
數(shù)字化檔案管理系統(tǒng)是數(shù)字檔案平臺的核心。該系統(tǒng)可以將紙質檔案數(shù)字化,實現(xiàn)檔案信息的電子化存儲、管理、查詢、共享和保護。在建設數(shù)字化檔案管理系統(tǒng)時,需要考慮系統(tǒng)的開發(fā)、數(shù)據(jù)安全、接口集成等方面的問題。智能化管理系統(tǒng)需要具備多維度的數(shù)據(jù)分析能力,包括數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化等功能,可以為檔案管理者提供數(shù)據(jù)分析和決策支持。
2.推行檔案數(shù)據(jù)基因系統(tǒng)建設
檔案數(shù)據(jù)基因系統(tǒng)建設可以確保數(shù)字化檔案的質量和可靠性?!皺n案數(shù)據(jù)基因系統(tǒng)”是建立國家檔案大數(shù)據(jù)體系的基礎規(guī)則,通過相關規(guī)章和技術規(guī)范作為行業(yè)標準,由國家檔案行政機關推行,以確保檔案數(shù)據(jù)化成果的規(guī)范性和邏輯的一致性,同時減少耗時費力的檔案數(shù)據(jù)整合任務。這些規(guī)范和標準的推行可以大幅提高檔案數(shù)據(jù)化的效率和質量,為檔案管理提供更好的支持和保障。具體內(nèi)容為:建立數(shù)字化檔案標準,包括數(shù)字化檔案的格式規(guī)范、數(shù)字化過程的標準流程和數(shù)字檔案管理的規(guī)范要求等。此外,還需要制定數(shù)字檔案質量控制標準和數(shù)字檔案的備份和恢復標準等,以保障數(shù)字檔案的可靠性和完整性。
3.實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通
數(shù)字化檔案平臺的最終目標是實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通,便于各部門之間的信息共享和協(xié)作。通過建立跨機構、跨地域的信息共享平臺,使得各個部門、單位之間能夠共享檔案信息和資源。同時,還需要加強檔案數(shù)字資源的共建共享,實現(xiàn)數(shù)字化檔案互聯(lián)互通,使得不同機構和地區(qū)的數(shù)字檔案資源能夠互相訪問和使用。實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通需要考慮到數(shù)字檔案的安全、數(shù)據(jù)格式兼容性等問題,可以通過建立數(shù)字檔案的交換平臺和制定數(shù)字檔案數(shù)據(jù)交換標準等來實現(xiàn)。
1.推廣數(shù)字簽名技術
數(shù)字簽名技術是一種基于密碼學原理實現(xiàn)的電子認證技術,可以用于保證電子文檔的完整性、真實性。傳統(tǒng)的紙質檔案具有簽名和印章來確保檔案的真實性,但是數(shù)字檔案在互聯(lián)網(wǎng)上的傳輸不具備這樣的功能,因此,需要借助數(shù)字簽名技術來實現(xiàn)身份驗證。在檔案服務中,數(shù)字簽名技術可以用于實現(xiàn)檔案鑒別、審計、檢索、傳輸和存儲等環(huán)節(jié)的電子認證。通過數(shù)字簽名技術,可以有效防止檔案篡改、丟失和偽造,提高檔案服務的可信度和安全性。有效解決檔案信息傳送的身份驗證問題,首先,建立數(shù)字簽名驗證體系。確保接收者能夠對文件上的簽名進行核實,如果雙方對于簽名的真?zhèn)未嬖诋愖h,則需要第三方進一步驗證簽名的真?zhèn)蝸泶_定事實。這樣可以保證數(shù)字檔案在傳輸過程中的真實性和完整性。其次,建立強制簽名確認機制。在文件發(fā)送完成后,要求發(fā)送者承認自己對文件的簽名,確保數(shù)字檔案在傳輸過程中不會被篡改。如果發(fā)送者不確認簽名,文件則無法傳輸,這樣可以有效地防止信息發(fā)送者否認簽名,保證檔案的安全性。最后,限制簽名權限。數(shù)字簽名技術確保只有信息發(fā)送者可以簽名,其他任何人皆不可偽造簽名或篡改傳送的信息。因此,在數(shù)字檔案服務中需要限制簽名權限,只有授權人員才能簽名。
2.構建云計算體系
云計算體系是一種基于互聯(lián)網(wǎng)的計算和數(shù)據(jù)服務體系,可以實現(xiàn)資源共享以及易擴展性等功能。在檔案服務中,云計算體系可以用于實現(xiàn)檔案數(shù)據(jù)的存儲、處理和分析,提高檔案服務的響應速度和質量。同時,云計算體系還可以實現(xiàn)檔案服務的數(shù)字化轉型,通過數(shù)據(jù)挖掘和分析等手段,為檔案管理和服務提供更加科學、精準的支持。
(1)建立云存儲體系
云存儲是一種基于云計算技術的存儲方式,它將數(shù)據(jù)存儲在互聯(lián)網(wǎng)上的遠程服務器上,用戶可以隨時隨地通過網(wǎng)絡訪問數(shù)據(jù)。建立云存儲體系可以實現(xiàn)檔案數(shù)字化存儲、共享和備份。同時,云存儲可以實現(xiàn)數(shù)據(jù)的冗余備份,保證數(shù)據(jù)的安全性和可靠性。在建立云存儲體系的過程中,需要選擇穩(wěn)定可靠的云服務提供商,保證存儲空間、訪問速度和數(shù)據(jù)安全。
(2)搭建云計算平臺
搭建云計算平臺可以為檔案管理工作提供更加高效、智能的服務。一是通過建立全文檢索引擎和搜索算法,用戶可以通過關鍵字、時間等多種檢索方式快速找到需要的電子檔案,提高檢索效率。二是提供大規(guī)模數(shù)據(jù)分析服務,使得檔案管理可以對檔案數(shù)據(jù)進行動態(tài)分析,例如,數(shù)據(jù)挖掘、關聯(lián)分析、預測分析等。這些分析結果可以為檔案管理提供更加準確、全面的數(shù)據(jù)支持。三是提供數(shù)據(jù)備份與恢復服務,保障檔案數(shù)據(jù)的安全性。一旦出現(xiàn)數(shù)據(jù)損壞、丟失等問題,可以及時通過云端備份的數(shù)據(jù)進行恢復。
3.開發(fā)云應用服務
云應用服務是指基于互聯(lián)網(wǎng)的一種軟件服務模式,通過網(wǎng)絡技術將軟件、硬件等資源提供給用戶使用,用戶無需安裝在本地計算機上,可以通過互聯(lián)網(wǎng)進行訪問和使用。在檔案管理中,云應用服務可以具有很多便利和優(yōu)勢,可以支持多種業(yè)務場景。開云應用服務可以包括,檔案數(shù)字化處理、檔案數(shù)據(jù)挖掘和分析、檔案共享和交流等。
首先,云應用服務可以提高檔案管理的靈活性和可擴展性。由于檔案管理涉及大量的數(shù)據(jù)和信息,需要相應的硬件和軟件支持。使用云應用服務可以避免購置和維護大量的硬件設備和軟件系統(tǒng),可以根據(jù)實際需求對服務進行擴展和收縮,從而降低檔案管理的成本和風險。其次,云應用服務可以提高檔案管理的安全性和可靠性。云服務提供商會投入大量的資源和技術保障數(shù)據(jù)的安全性和可靠性,例如,數(shù)據(jù)備份、災難恢復、安全認證等,可以有效防范數(shù)據(jù)泄露和數(shù)據(jù)丟失等風險。最后,云應用服務可以提高檔案管理的效率和協(xié)作性。云服務可以實現(xiàn)多人協(xié)作,不同部門和用戶可以通過網(wǎng)絡訪問同一份檔案資料,可以實現(xiàn)信息共享和協(xié)同處理,大大提高了工作效率和協(xié)作效果。