摘 要:該文探討了一種基于知識圖譜的檔案管理決策支持系統(tǒng),通過用戶需求分析、系統(tǒng)功能需求分析和系統(tǒng)性能需求分析,確定系統(tǒng)的設(shè)計目標(biāo)。在此基礎(chǔ)上,介紹了基于知識圖譜的系統(tǒng)模型設(shè)計,包括知識圖譜的構(gòu)建與檔案元數(shù)據(jù)、知識圖譜的查詢與分析、決策支持模塊、用戶交互模塊以及知識圖譜維護(hù)與更新模塊。這些模塊相互協(xié)作,實現(xiàn)了檔案管理的各項功能。最后從知識庫搭建和決策分項與計算兩方面探討了系統(tǒng)的實現(xiàn)。
關(guān)鍵詞:知識圖譜;檔案管理;決策支持;系統(tǒng)
大數(shù)據(jù)時代的到來促使檔案管理面臨著前所未有的挑戰(zhàn),探尋一種能夠高效、準(zhǔn)確地處理和利用海量數(shù)據(jù)的方法成為檔案管理領(lǐng)域的重要課題[1]。近年來,知識圖譜和決策支持系統(tǒng)在各種領(lǐng)域得到廣泛的應(yīng)用。知識圖譜以其獨特的數(shù)據(jù)表達(dá)形式和處理方式,可以有效地整合、組織、理解和利用數(shù)據(jù)。研究并建立基于知識圖譜的檔案管理決策支持系統(tǒng),不僅可以有效解決當(dāng)前檔案管理面臨的挑戰(zhàn),也有利于提高檔案管理的效率和質(zhì)量[2]。對于保護(hù)社會記憶、推動社會發(fā)展具有重要的意義。
1 基于知識圖譜的檔案管理決策支持系統(tǒng)的需求分析
1.1 用戶需求分析
1.1.1檔案查詢需求。在檔案管理中,用戶經(jīng)常需要查詢特定的檔案信息。傳統(tǒng)的查詢方式常常需要翻閱大量的檔案,非常耗時且效率低下。而基于知識圖譜的檔案管理決策支持系統(tǒng)能夠通過圖譜中的連接和關(guān)系快速定位到相關(guān)的檔案,大大提高了查詢效率[3]。
1.1.2決策支持需求。檔案管理者需要對檔案的歸檔、保管、利用等進(jìn)行決策。基于知識圖譜的檔案管理決策支持系統(tǒng)應(yīng)具備提供決策建議的能力,如基于檔案的屬性和關(guān)系對檔案的重要性進(jìn)行評估,為檔案的歸檔、保管提供依據(jù);通過分析檔案的利用情況,為檔案的利用決策提供參考。
1.1.3用戶交互需求?;谥R圖譜的檔案管理決策支持系統(tǒng)應(yīng)設(shè)計出直觀的用戶界面,并提供豐富的交互方式,如圖形化展示檔案的屬性和關(guān)系,支持用戶通過拖放、點擊等方式進(jìn)行操作[4]。同時,系統(tǒng)還需要提供及時的反饋,以提高用戶的使用體驗。
1.2 系統(tǒng)功能需求分析
1.2.1知識圖譜構(gòu)建與管理。知識圖譜是基于知識圖譜的檔案管理決策支持系統(tǒng)的核心部分,系統(tǒng)需要具有構(gòu)建和管理知識圖譜的能力。為了確保知識圖譜的有效性和準(zhǔn)確性,系統(tǒng)還需要具備處理不完整、不準(zhǔn)確數(shù)據(jù)的能力,如數(shù)據(jù)清洗、數(shù)據(jù)融合等。
1.2.2檔案信息處理與分析?;谥R圖譜的檔案管理決策支持系統(tǒng)需要能夠處理和分析檔案信息,以支持檔案查詢和決策支持。這包括對檔案的屬性信息、關(guān)系信息的處理,以及基于這些信息的分析。此外,系統(tǒng)還需要支持對檔案信息的可視化,以幫助用戶更好地理解和利用檔案信息。
1.2.3決策支持功能。系統(tǒng)應(yīng)具備提供決策支持的功能,支持用戶進(jìn)行決策模擬,即用戶可以輸入不同的決策方案,系統(tǒng)將根據(jù)知識圖譜模擬出可能的結(jié)果,幫助用戶進(jìn)行決策。
1.3 系統(tǒng)性能需求分析
1.3.1數(shù)據(jù)處理性能。基于知識圖譜的檔案管理決策支持系統(tǒng)需要處理大量的檔案數(shù)據(jù),包括檔案的屬性信息、關(guān)系信息等。系統(tǒng)需要有足夠的數(shù)據(jù)處理性能,能夠快速地讀取、寫入、查詢和分析數(shù)據(jù)。
1.3.2系統(tǒng)穩(wěn)定性。系統(tǒng)的穩(wěn)定性是保證用戶正常使用的前提。系統(tǒng)需要能夠持續(xù)穩(wěn)定地運(yùn)行,即使在處理大量請求或者數(shù)據(jù)時,也能保持良好的響應(yīng)速度和準(zhǔn)確性。此外,系統(tǒng)還需要具備一定的容錯能力,即當(dāng)系統(tǒng)出現(xiàn)錯誤或者故障時,能夠及時進(jìn)行恢復(fù)。
1.3.3系統(tǒng)安全性。檔案數(shù)據(jù)往往包含大量的敏感信息,因此,系統(tǒng)的安全性非常重要。系統(tǒng)需要有足夠的安全防護(hù)措施,防止數(shù)據(jù)被非法訪問或者修改。此外,系統(tǒng)還需要有數(shù)據(jù)備份和恢復(fù)機(jī)制,以防數(shù)據(jù)丟失。
2 基于知識圖譜的檔案管理決策支持系統(tǒng)的模型設(shè)計
基于上文的需求分析,提出基于知識圖譜的檔案管理決策支持系統(tǒng)的模型,設(shè)計如圖1所示的邏輯框架圖。
2.1 知識圖譜構(gòu)建與檔案元數(shù)據(jù)
首先,系統(tǒng)要處理的是大量的檔案元數(shù)據(jù),包括但不限于檔號、年代、文件題名、責(zé)任者、保管單位、載體形態(tài)、內(nèi)容描述等。這些元數(shù)據(jù)被作為知識圖譜中的實體和屬性進(jìn)行整合。對于檔案的內(nèi)容進(jìn)行深度文本分析和實體抽取,形成知識圖譜中的實體和關(guān)系。每個檔案的實體(如人物、組織、地點、事件等)都作為節(jié)點,其關(guān)系則作為邊。對于數(shù)據(jù)的不完整性和不準(zhǔn)確性,系統(tǒng)采用數(shù)據(jù)清洗和數(shù)據(jù)融合的技術(shù),對數(shù)據(jù)進(jìn)行預(yù)處理,以提高數(shù)據(jù)質(zhì)量。另外,為了保證知識圖譜的動態(tài)性和實時性,系統(tǒng)引入了增量更新策略,實現(xiàn)知識圖譜的實時更新。
2.2 知識圖譜的查詢與分析
檔案知識圖譜構(gòu)建后,系統(tǒng)將提供多種查詢接口,如SPARQL語言查詢,同時支持語義檢索,增強(qiáng)檢索的準(zhǔn)確性和用戶體驗。系統(tǒng)利用知識圖譜進(jìn)行多維度的檔案信息分析,如時間軸分析、空間分析、主題分析、情感分析等[5]。
2.3 決策支持模塊
決策支持模塊以知識圖譜為基礎(chǔ),通過機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù),分析檔案信息,提供數(shù)據(jù)驅(qū)動的決策支持。系統(tǒng)可通過分析檔案的引用次數(shù)、涉及主題的重要性等因素,對檔案的長期保存價值進(jìn)行評估,為檔案的永久保存或銷毀提供決策依據(jù)[6]。系統(tǒng)還會根據(jù)檔案的使用頻率、用戶評價等信息,對檔案的使用效率和使用滿意度進(jìn)行評估,以便持續(xù)改進(jìn)檔案服務(wù)。
2.4 用戶交互模塊
用戶交互模塊是系統(tǒng)的前端展示部分,提供友好的用戶界面。該模塊通過可視化的方式,將知識圖譜的內(nèi)容和分析結(jié)果展示給用戶。系統(tǒng)會提供互動式的知識圖譜視圖,用戶可以通過點擊節(jié)點和邊來瀏覽和查詢檔案信息。用戶交互模塊還提供多種自定義選項,如過濾條件、排序方式等,讓用戶能夠根據(jù)自己的需求定制查詢和分析結(jié)果。系統(tǒng)也會記錄用戶的操作和反饋,以支持用戶行為分析和系統(tǒng)優(yōu)化。
2.5 知識圖譜維護(hù)與更新模塊
為了保證知識圖譜的持久性和穩(wěn)定性,系統(tǒng)設(shè)計了知識圖譜維護(hù)與更新模塊。這個模塊主要負(fù)責(zé)數(shù)據(jù)的存儲、備份、恢復(fù)等操作,以防止數(shù)據(jù)丟失或損壞。另外,系統(tǒng)還引入了數(shù)據(jù)審計機(jī)制,對知識圖譜的操作進(jìn)行記錄和審查,以確保數(shù)據(jù)的完整性和一致性。同時,為了應(yīng)對檔案信息的變化,系統(tǒng)采用了增量更新策略,定期收集和處理新的檔案信息,更新知識圖譜。這個過程包括數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)融合、知識圖譜構(gòu)建等步驟,確保知識圖譜的實時性和準(zhǔn)確性。
3 基于知識圖譜的檔案管理決策支持系統(tǒng)的實現(xiàn)
3.1 知識庫的實現(xiàn)
知識庫管理是基于知識圖譜的檔案管理決策支持系統(tǒng)的核心組成部分。它負(fù)責(zé)收集、組織、存儲和維護(hù)大量的檔案信息,以便為系統(tǒng)用戶提供全面、準(zhǔn)確的知識支持。
3.1.1知識庫管理需要進(jìn)行檔案信息的收集。這包括從多個數(shù)據(jù)源獲取檔案信息,如文本文檔、數(shù)據(jù)庫、互聯(lián)網(wǎng)等。收集的信息可能以不同的格式和結(jié)構(gòu)存在,因此需要使用自然語言處理和信息抽取技術(shù)對其進(jìn)行解析和提取。這些技術(shù)可以幫助系統(tǒng)識別出關(guān)鍵詞、實體、屬性和關(guān)系等重要信息,并將其轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù)形式。
3.1.2知識庫管理需要將收集的檔案信息以圖譜的形式進(jìn)行表示。知識圖譜是一種利用圖結(jié)構(gòu)來表示實體和它們之間關(guān)系的方法。通過構(gòu)建知識圖譜,系統(tǒng)能夠更好地描述檔案信息之間的關(guān)聯(lián)性,幫助用戶理解和發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的潛在知識。在構(gòu)建知識圖譜時,需要定義合適的實體類型和關(guān)系類型,并使用圖數(shù)據(jù)庫等技術(shù)進(jìn)行存儲和管理。
3.1.3知識庫管理還需要考慮知識圖譜的更新和維護(hù)。由于檔案信息可能會隨著時間的推移而發(fā)生變化,知識庫需要及時更新以反映最新的信息。這可以通過定期的數(shù)據(jù)更新和監(jiān)控機(jī)制來實現(xiàn)。系統(tǒng)可以與外部數(shù)據(jù)源進(jìn)行連接,自動獲取最新的檔案信息并將其添加到知識庫中。還可以進(jìn)行知識庫的一致性檢查和修復(fù),包括處理重復(fù)信息、消除沖突和修正錯誤等。
3.1.4知識庫管理還可以提供一些輔助功能來提高系統(tǒng)的可用性和易用性。首先是搜索和查詢功能,用戶可以通過關(guān)鍵詞、屬性或?qū)嶓w進(jìn)行搜索,快速找到所需的檔案信息。其次是分類和標(biāo)簽功能,通過對檔案信息進(jìn)行分類和標(biāo)記,用戶可以更方便地進(jìn)行瀏覽和篩選。還可以實現(xiàn)推薦功能,根據(jù)用戶的偏好和行為,系統(tǒng)可以推薦相關(guān)的檔案信息或決策案例,幫助用戶發(fā)現(xiàn)新的知識。
3.1.5知識庫管理還需要與其他系統(tǒng)進(jìn)行集成和共享。通過將知識庫與其他系統(tǒng)無縫集成,實現(xiàn)知識的共享和交流,促進(jìn)團(tuán)隊協(xié)作和決策的合理性。
3.2 決策分享與計算
決策分享與計算是基于知識圖譜的檔案管理決策支持系統(tǒng)的重要組成部分。它包括建立決策任務(wù)、分享決策任務(wù)和決策結(jié)果計算三個關(guān)鍵步驟,旨在支持用戶在檔案管理過程中的決策需求。
3.2.1建立決策任務(wù)。在建立決策任務(wù)階段,用戶需要明確決策的目標(biāo)和需求,并將其轉(zhuǎn)化為系統(tǒng)可識別的決策任務(wù)。為了實現(xiàn)這一目標(biāo),可以進(jìn)行以下步驟:確定決策目標(biāo),明確檔案管理決策的目標(biāo),如改進(jìn)檔案組織、提高檢索效率等;確定決策問題,界定決策任務(wù)的具體問題,如確定最佳的檔案分類方法、選擇合適的存儲方案等;定義決策參數(shù),確定影響決策的關(guān)鍵參數(shù),如檔案數(shù)量、可用存儲空間、訪問頻率等;收集必要的數(shù)據(jù)和信息,確定決策所需的數(shù)據(jù)來源,并收集相關(guān)的檔案統(tǒng)計數(shù)據(jù)、用戶需求等信息;分析和評估,使用適當(dāng)?shù)臎Q策方法和技術(shù),對收集到的數(shù)據(jù)和信息進(jìn)行分析和評估,以支持決策的制定;制定決策方案,基于分析結(jié)果,生成候選的決策方案,并評估其在給定參數(shù)下的優(yōu)劣;選擇最佳決策方案,綜合考慮決策目標(biāo)和關(guān)鍵參數(shù),選擇最佳的決策方案,并確定實施計劃。
3.2.2分享決策任務(wù)。在分享決策任務(wù)階段,系統(tǒng)可以根據(jù)邀請和因素輸入選擇確定當(dāng)前用戶因素輸入列表,并支持相關(guān)用戶的協(xié)作和合作,主要包括以下步驟:輸入因素,用戶可以輸入與決策相關(guān)的因素,這些因素可以是決策任務(wù)中需要考慮的變量、條件或限制。用戶根據(jù)自己的知識和經(jīng)驗,輸入相關(guān)的因素,并指定其權(quán)重和重要性;決策報告,用戶可以選擇接受決策報告的人員,這些人員可以是與決策任務(wù)相關(guān)的利益相關(guān)者、決策團(tuán)隊成員或其他需要了解決策結(jié)果的人員;讀取因素值和權(quán)重值,如果存在決策模塊對應(yīng)的任務(wù)因素輸入數(shù)據(jù)文件,系統(tǒng)將讀取被邀請人的因素輸入選擇、權(quán)重和接受報告選擇數(shù)據(jù),并作為本次任務(wù)用戶當(dāng)前因素輸入的初始值;處理不存在的任務(wù)因素輸入數(shù)據(jù)文件,如果決策模塊對應(yīng)的任務(wù)邀請數(shù)據(jù)文件不存在,系統(tǒng)將根據(jù)當(dāng)前決策模塊的每個因素的第一個選擇值或因素序號值0,作為本次任務(wù)用戶當(dāng)前因素輸入值;處理存在的任務(wù)邀請數(shù)據(jù)文件,如果決策模塊對應(yīng)的任務(wù)邀請數(shù)據(jù)文件存在,系統(tǒng)將讀取被邀請人的因素輸入選擇、權(quán)重、接受報告選擇數(shù)據(jù)和其參與輸入的因素列表;確定當(dāng)前用戶因素輸入列表,根據(jù)邀請選擇和因素輸入選擇,系統(tǒng)確定當(dāng)前用戶的因素輸入列表。這將決定當(dāng)前用戶在決策過程中參與的因素和權(quán)重;分享決策任務(wù)和協(xié)作,根據(jù)確定的當(dāng)前用戶因素輸入列表,系統(tǒng)支持決策任務(wù)的分享和協(xié)作。被邀請人可以共同討論、編輯和更新因素輸入值,并在系統(tǒng)中交流和協(xié)作。
3.2.3決策結(jié)果計算。決策結(jié)果計算是基于知識圖譜的檔案管理決策支持系統(tǒng)的重要環(huán)節(jié)。在這個階段,系統(tǒng)根據(jù)已確定的決策任務(wù)和相關(guān)的因素輸入進(jìn)行計算和評估,以生成最終的決策結(jié)果。
參考文獻(xiàn)
[1]俞倫祥.大型研究院所檔案管理向知識智能輔助決策轉(zhuǎn)型研究[J].機(jī)電兵船檔案,2022(02):30-32.
[2]武凈煜.知識管理視域下政務(wù)檔案信息知識發(fā)現(xiàn)研究[D].遼寧大學(xué),2022.DOI:10.27209/d.cnki.glniu.2022.001670.
[3]鐘昊,郭永貞,宗孝鵬.基于知識圖譜的智能決策輔助系統(tǒng)研究[C]//中國指揮與控制學(xué)會.第九屆中國指揮控制大會論文集.第九屆中國指揮控制大會論文集,2021:133-138.DOI:10.26914/c.cnkihy.2021.011158.
[4]王阮.數(shù)字人文視域下口述歷史檔案資源知識發(fā)現(xiàn)研究[D].吉林大學(xué),2021.DOI:10.27162/d.cnki.gjlin.2021.000856.
[5]雷潔.基于知識圖譜的科研檔案管理研究[D].中國農(nóng)業(yè)科學(xué)院,2020.DOI:10.27630/d.cnki.gznky.2020.000122.
[6]雷潔,李思經(jīng),趙瑞雪,鮮國建,寇遠(yuǎn)濤.面向科研檔案管理的知識圖譜構(gòu)建與應(yīng)用研究[J].數(shù)字圖書館論壇,2020(05):8-15.
作者簡介:溫學(xué)鵬(1982— ),寧夏醫(yī)科大學(xué)檔案館館員,研究方向: 檔案信息化。