• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    檔案事業(yè)與新技術(shù)的雙向融合

    2024-09-20 00:00:00趙躍楊建梁司徒凌云蘇煥寧潘未梅
    檔案與建設(shè) 2024年7期

    主持人語:以大數(shù)據(jù)、云計算、區(qū)塊鏈、人工智能為代表的新興技術(shù)浪潮滾滾而來,大有變革千行百業(yè)之勢。在此背景下,強調(diào)檔案事業(yè)與新技術(shù)的雙向融合,既有助于推動檔案事業(yè)的現(xiàn)代化發(fā)展和升級,也有利于新興技術(shù)在實際場景中的落地應(yīng)用。檔案事業(yè)與新技術(shù)的雙向奔赴、相互融合必然會激發(fā)出新的活力與生命力,帶來新的機遇與挑戰(zhàn)。當前檔案事業(yè)的發(fā)展存在哪些問題?新技術(shù)給檔案事業(yè)的發(fā)展帶來了怎樣的影響?檔案事業(yè)與新技術(shù)的關(guān)系是什么?檔案事業(yè)與新技術(shù)如何雙向融合、相互賦能,以更好服務(wù)國家戰(zhàn)略需求?新技術(shù)融合是否有助于吸引檔案學(xué)生、培養(yǎng)檔案人才?此次對談圍繞上述問題展開,對談成果并非最終結(jié)論,旨在為檔案事業(yè)與新技術(shù)的雙向融合和共同發(fā)展提供一些思路,為檔案事業(yè)從業(yè)人員及新興技術(shù)研究人員提供一些啟示。(司徒凌云,南京大學(xué)信息管理學(xué)院)

    關(guān)鍵詞:檔案事業(yè);新興技術(shù);人工智能;區(qū)塊鏈;檔案管理;檔案開發(fā);南海檔案

    ▍趙 躍:

    在“數(shù)字中國”戰(zhàn)略引領(lǐng)下,我國檔案事業(yè)正處于轉(zhuǎn)型升級和創(chuàng)新發(fā)展的重要機遇期,數(shù)字化轉(zhuǎn)型也成為地方檔案工作應(yīng)對新環(huán)境新趨勢的必然之舉。綜合檔案館作為地方檔案工作數(shù)字化轉(zhuǎn)型的重要參與者,其轉(zhuǎn)型進程直接影響整個地方檔案工作數(shù)字化轉(zhuǎn)型的全面推進,但目前很多綜合檔案館在轉(zhuǎn)型推進當中面臨諸多困境和難題,亟待發(fā)現(xiàn)癥結(jié)所在并尋求解決之道。

    通過調(diào)研,筆者發(fā)現(xiàn)當前地方綜合檔案館在推進檔案工作數(shù)字化轉(zhuǎn)型進程中存在一些關(guān)鍵的影響因素。第一個因素,也是最關(guān)鍵的一個因素,是人才因素,領(lǐng)導(dǎo)型人才和專業(yè)復(fù)合型人才是未來檔案工作數(shù)字化轉(zhuǎn)型的關(guān)鍵。第二個因素是資金因素,數(shù)字化轉(zhuǎn)型是一個需要長期、大量投入的項目,但目前地方檔案部門能夠獲得的資金支持非常有限。第三個因素是觀念層面的因素,總體上看地方檔案部門思想還是有點僵化和保守,還沒有找到既能確保安全又能高效開放利用的路徑,且對數(shù)字化轉(zhuǎn)型的整體認識還不足,缺乏戰(zhàn)略思維。第四個因素是理論層面的因素,數(shù)字化轉(zhuǎn)型缺乏理論的支撐。到目前為止,檔案工作數(shù)字化轉(zhuǎn)型的一些基本的理論問題,包括什么是、為什么和怎么做等重要問題都沒有得到系統(tǒng)研究和解答。第五個因素是系統(tǒng)建設(shè)的問題,對于電子檔案的管理,前后端系統(tǒng)對接工作成本高、難度大。檔案業(yè)務(wù)系統(tǒng)(數(shù)字檔案館 / 室系統(tǒng))建設(shè)當中,有一些線下檔案業(yè)務(wù)流程轉(zhuǎn)到線上之后,因功能不完善還未真正發(fā)揮作用。另外,線上業(yè)務(wù)建設(shè)仍停留在收存管用等功能。第六個因素,技術(shù)層面的因素,地方綜合檔案館的數(shù)字技術(shù)應(yīng)用方式和場景還比較單一,未能從轉(zhuǎn)型角度重構(gòu)原有業(yè)務(wù)。數(shù)字化轉(zhuǎn)型涉及的系統(tǒng)和軟件的更新?lián)Q代和改造升級問題仍然是技術(shù)困擾之一。第七個因素,業(yè)務(wù)層面的因素,基礎(chǔ)業(yè)務(wù)底子薄,包括開放審核工作不到位、數(shù)字化質(zhì)量參差不齊等。第八個因素是組織層面的因素,組織準備度不足,目前地方綜合檔案館的職能定位、崗位設(shè)置、部門職責(zé)劃分無法滿足數(shù)字化轉(zhuǎn)型的要求,尤其是不能滿足數(shù)據(jù)治理和信息開發(fā)利用的需求。此外,還有安全層面的因素,如數(shù)據(jù)安全風(fēng)險大;利用層面的因素,如數(shù)據(jù)共享利用難等諸多因素。

    關(guān)于檔案事業(yè)與新技術(shù)的融合問題,筆者認為檔案部門應(yīng)保持清醒的頭腦,以業(yè)務(wù)需要為出發(fā)點,哪些技術(shù)能夠真正為檔案業(yè)務(wù)工作提質(zhì)增效,那就要敢于接受和使用,當然也得考慮技術(shù)應(yīng)用的成本效益問題。關(guān)于大語言模型為代表的人工智能技術(shù)對檔案學(xué)的影響,筆者覺得這可能會是加速推進企業(yè)檔案部門知識服務(wù)真正落地實現(xiàn)的機會,并且對檔案館智庫功能的發(fā)揮起到一些支撐作用。所以,從檔案學(xué)研究的角度來說,或許可以重點關(guān)注一下如何結(jié)合大模型和檔案領(lǐng)域小模型來更好地實現(xiàn)知識服務(wù)和智庫建設(shè)。對于區(qū)塊鏈技術(shù)的落地問題,筆者認為區(qū)塊鏈技術(shù)僅僅是用來保障檔案真實的一種方案,是否是最佳方案,尚無定論,但檔案部門不能把保障檔案真實性這一職業(yè)追求,僅僅寄托在區(qū)塊鏈技術(shù)上。關(guān)于當前檔案學(xué)人才培養(yǎng)面臨的問題,筆者認為最大挑戰(zhàn)就是數(shù)字化轉(zhuǎn)型的沖擊,最大的問題就在于檔案界被這種沖擊傷得不輕。在數(shù)字化轉(zhuǎn)型的沖擊下,檔案界還沒有很快地找到檔案學(xué)未來的方向和應(yīng)對沖擊的對策。到現(xiàn)在為止,學(xué)界都依然抱著一種僥幸心理,認為檔案學(xué)教育還沒有到一個必須求變的臨界點。但如果一定要以檔案部門對人才需求的角度去看的話,很多高校目前培養(yǎng)的檔案學(xué)專業(yè)人才已經(jīng)有點跟不上時代發(fā)展了?,F(xiàn)有的知識體系、課程體系都有點陳舊,已經(jīng)到了檔案學(xué)教育變革的臨界點了,需要進行新的教學(xué)方式方法和課程的設(shè)計。

    ▍楊建梁:

    第一,大語言模型的崛起與變革性影響。大模型與檔案事業(yè)正在同向發(fā)展,同頻共振。大語言模型的出現(xiàn)和發(fā)展為人工智能領(lǐng)域帶來了深遠的變革,特別是在任務(wù)處理、模型泛化和交互模式方面。大語言模型為人工智能領(lǐng)域帶來的系統(tǒng)性變革主要體現(xiàn)在三個方面。首先是從判別到生成的任務(wù)變革。傳統(tǒng)的人工智能任務(wù)多為判別任務(wù),例如人臉識別和檔案審核等。而大語言模型則主要執(zhí)行生成任務(wù),如根據(jù)輸入生成相應(yīng)的文本,且生成任務(wù)的復(fù)雜性和難度遠高于判別任務(wù)。通過生成任務(wù),大語言模型可以實現(xiàn)檔案的多維標注和語義分類。其次是從單一到通用的變革。傳統(tǒng)的人工智能模型通常針對特定任務(wù)進行訓(xùn)練,缺乏泛化能力。而大語言模型則具有強大的泛化能力,可以處理多種任務(wù),如翻譯、問答等。這種通用性使得大語言模型有望成為通用人工智能(AGI)的基礎(chǔ),能夠在各個領(lǐng)域達到人類智力水平。最后是從訓(xùn)練到交互的模式變革。傳統(tǒng)的人工智能模型需要大量高質(zhì)量的標注數(shù)據(jù)進行訓(xùn)練,而大語言模型則通過交互模式進行任務(wù)處理。用戶可以通過提示和增強方式與模型進行交互,使其根據(jù)需求生成相應(yīng)的結(jié)果。這種模式變革大大簡化了模型的使用過程,提高了效率。

    第二,大語言模型與檔案事業(yè)的相互賦能。大語言模型和檔案事業(yè)之間存在著相互賦能的關(guān)系,前者提升了檔案管理和開發(fā)的智能化水平,后者為大語言模型提供了寶貴的數(shù)據(jù)資源。大語言模型在檔案業(yè)務(wù)中的應(yīng)用主要體現(xiàn)在智能鑒定、開放審核、語義組織和庫房管理等方面。例如,通過大語言模型的語義理解和生成能力,可以實現(xiàn)檔案的智能分類和標注,提升檔案管理的效率和準確性。大語言模型能夠自動識別和提取檔案中的關(guān)鍵信息,生成詳細的標簽和分類,從而簡化檔案管理流程,減少人工干預(yù),提高工作效率。在檔案開發(fā)利用方面,大語言模型也發(fā)揮著重要作用。例如,通過大語言模型,可以實現(xiàn)智能編研、知識工程和數(shù)據(jù)化開發(fā)等任務(wù)。大語言模型能夠從海量檔案數(shù)據(jù)中提取有價值的信息,進行知識抽取和可視化展示,提升檔案開發(fā)利用的深度和廣度。通過大語言模型的知識圖譜構(gòu)建和語義分析能力,可以將分散的檔案信息整合成系統(tǒng)化的知識體系,便于用戶進行深度研究和應(yīng)用。檔案部門也能夠為大語言模型的發(fā)展提供重要支持。大語言模型的訓(xùn)練需要大量高質(zhì)量、可信的數(shù)據(jù),而檔案部門正是高質(zhì)量數(shù)據(jù)的重要來源。通過提供高質(zhì)量的檔案數(shù)據(jù),可以提升大語言模型的訓(xùn)練效果,增強其在特定領(lǐng)域的應(yīng)用能力,幫助模型更好地理解和處理檔案相關(guān)任務(wù)。

    第三,大語言模型在檔案領(lǐng)域的應(yīng)用實踐。大語言模型在檔案領(lǐng)域的應(yīng)用實踐中展現(xiàn)了強大的文本理解和生成能力,顯著提升了檔案管理和開發(fā)的智能化水平。大語言模型在檔案管理中的應(yīng)用,極大地提高了檔案的處理效率和準確性。通過智能化的文本理解和生成能力,大語言模型在檔案審核、標簽生成和知識問答等方面展現(xiàn)了強大的應(yīng)用潛力。利用大語言模型的文本理解能力,可以實現(xiàn)檔案的智能開放審核。傳統(tǒng)的開放審核需要大量標注數(shù)據(jù),而大語言模型通過無監(jiān)督學(xué)習(xí)和上下文理解,可以快速適應(yīng)不同場景,提供高準確度的審核結(jié)果。大語言模型能夠自動識別檔案中的敏感信息和隱私數(shù)據(jù),進行智能化審核和篩選,確保檔案的開放性和安全性。大語言模型還可以用于檔案標簽的生成和知識發(fā)現(xiàn)。例如,通過大語言模型,可以自動生成檔案的標簽,提取檔案中的實體關(guān)系,提升檔案管理的智能化水平。大語言模型能夠根據(jù)檔案內(nèi)容自動生成詳細的標簽和分類,幫助檔案管理人員更好地組織和檢索檔案信息。例如,通過檢索增強技術(shù),可以為大語言模型提供參考資料,使其回答更加準確和可信。大語言模型能夠根據(jù)用戶的提問,自動檢索和整合紅色檔案中的相關(guān)信息,提供準確詳盡的回答,幫助用戶更好地了解和研究紅色檔案。

    第四,大語言模型在檔案領(lǐng)域的挑戰(zhàn)與未來展望。盡管大語言模型在檔案管理中展現(xiàn)了巨大的潛力,但其應(yīng)用也面臨著不可信、不可靠和不可用的挑戰(zhàn)。通過信任數(shù)據(jù)、信任參考和信任推理等方法,可以有效解決這些問題,并進一步提升大語言模型在檔案領(lǐng)域的應(yīng)用效果。大語言模型在生成文本時,可能會出現(xiàn)AI幻覺,即生成不真實或不準確的內(nèi)容。為了解決這一問題,可以通過信任數(shù)據(jù)、信任參考和信任推理等方法,降低AI幻覺的可能性。例如,在訓(xùn)練模型時使用高質(zhì)量的數(shù)據(jù),在生成過程中提供真實的參考資料,確保推理過程的可信性。大語言模型生成的結(jié)果具有隨機性,同一問題的回答可能會有所不同。為了解決這一問題,可以通過人類反饋強化學(xué)習(xí)和參數(shù)設(shè)置,控制生成結(jié)果的隨機性,提高模型的可靠性。大語言模型的訓(xùn)練和部署需要大量計算資源,而檔案部門通常資源有限。為了解決這一問題,可以采用更小規(guī)模的模型,結(jié)合檔案業(yè)務(wù)的具體需求進行微調(diào),降低計算資源的消耗,提高模型的可用性。未來,大語言模型可以通過多智能體機制,實現(xiàn)更復(fù)雜的任務(wù)處理。隨著大語言模型技術(shù)的不斷進步,檔案事業(yè)將實現(xiàn)更高水平的智能化和信息化。

    ▍司徒凌云:

    基于前期研究多模態(tài)南海疆維權(quán)證據(jù)鏈問題,筆者更關(guān)注新技術(shù)如何應(yīng)用于多模態(tài)南海疆檔案資料的管理開發(fā),服務(wù)南海疆域的維權(quán)維穩(wěn),主要涉及四點內(nèi)容:

    第一,南海疆檔案資料的管理開發(fā)是支撐中國南海疆權(quán)益維護的迫切任務(wù)。大國博弈背景下,南海疆維權(quán)關(guān)乎國家安全、區(qū)域和平與亞太經(jīng)濟發(fā)展。隨著美、英等域外勢力的持續(xù)介入,南海局勢愈發(fā)緊張。美國政治上主導(dǎo)“南海新政”,實行南海安全多邊主義;外交上拉攏英、法、德拼湊“印太版北約”,將“四國機制”向南海蔓延;軍事上在南海區(qū)域部署優(yōu)勢兵力,實施“綜合威懾”。英國提出“不得損害第三方利益”的主張,阻撓中國主導(dǎo)的“南海行為準則”磋商。加之菲律賓挑起的“南海仲裁案”“仁愛礁非法坐灘”,以及聲索國的單邊行動等,使得中國南海疆維權(quán)工作面臨嚴峻挑戰(zhàn)。南海疆檔案資料作為一類特殊的數(shù)據(jù)資產(chǎn),對于論證中國擁有南海領(lǐng)土主權(quán)有著極其重要的價值。為此,收集整理南海疆檔案資料,進行有效的管理與開發(fā),挖掘有效證據(jù)、梳理證據(jù)關(guān)系、組織證據(jù)鏈條,構(gòu)建多模態(tài)南海疆維權(quán)證據(jù)鏈,已成為支撐南海疆維權(quán)的迫切需求與重要任務(wù)。

    第二,南海疆檔案資料的數(shù)字化是多模態(tài)南海疆維權(quán)證據(jù)鏈構(gòu)建的基礎(chǔ)前提。南海疆檔案資料的收集與整理已經(jīng)取得階段性成果。以南京大學(xué)中國南海研究協(xié)同創(chuàng)新中心沈固朝教授為代表的研究團隊,耗時十余年,在對南海疆檔案資料進行人工收集、整理、編碼以及數(shù)字化的基礎(chǔ)上,初步建立了文獻數(shù)據(jù)庫、法律數(shù)據(jù)庫、地圖數(shù)據(jù)庫、網(wǎng)絡(luò)信息數(shù)據(jù)庫、影像數(shù)據(jù)庫、民國檔案數(shù)據(jù)庫、索引數(shù)據(jù)庫以及外國檔案數(shù)據(jù)庫等眾多數(shù)據(jù)庫在內(nèi)的南海疆全文數(shù)字資料庫群,實現(xiàn)了南海檔案資料從“紙質(zhì)文獻”向“數(shù)據(jù)資產(chǎn)”的“數(shù)字化”轉(zhuǎn)型,為南海疆檔案資料的開發(fā)利用、南海疆維權(quán)證據(jù)鏈的構(gòu)建奠定了強有力的數(shù)據(jù)基礎(chǔ)。

    第三,南海疆檔案資料的圖譜化是多模態(tài)南海疆維權(quán)證據(jù)鏈構(gòu)建的關(guān)鍵核心。盡管數(shù)字化的全文數(shù)據(jù)庫群可在一定程度上減輕人們在傳統(tǒng)文獻中皓首窮經(jīng)的時間耗費,但要從成千上萬的圖書、論文、網(wǎng)頁、地圖等數(shù)字載體上高效、便捷地讀取所需的關(guān)鍵證據(jù)信息,仍然非常困難。南海疆檔案資料具有多時態(tài)、多樣態(tài)、多語言、多載體、多學(xué)科等多模態(tài)特征,以關(guān)系型數(shù)據(jù)庫技術(shù)為代表的南海疆檔案資料管理依舊存在“知識粒度粗”“關(guān)聯(lián)關(guān)系簡單”,以及“智能化程度低”等問題。為此,我們?nèi)诤锨閳髮W(xué)理論、領(lǐng)域知識組織與知識服務(wù)方法,以及多模態(tài)知識圖譜等技術(shù),研究了多模態(tài)證據(jù)實體的智能化抽取表示,包括證據(jù)實體的界定標準、抽取算法,以及結(jié)構(gòu)化表示;多層次證據(jù)關(guān)系的智能化識別鏈接,包括屬性層關(guān)系、邏輯層關(guān)系,以及證明層關(guān)系;多場景證據(jù)鏈條的智能化組織呈現(xiàn),包括司法維權(quán)場景下的證明鏈條組織、外交博弈場景下的邏輯鏈條組織,以及教育宣傳場景下的敘事鏈條組織。通過“迭代式、增量式、反饋制導(dǎo)”的方式進一步推進多模態(tài)南海疆維權(quán)證據(jù)鏈的構(gòu)建,開發(fā)了南海疆證據(jù)知識圖譜系統(tǒng),實現(xiàn)了南海疆檔案資料的“數(shù)字化”向“圖譜化”的升級,為南海疆權(quán)益維護以及南海疆史地研究提供工具與系統(tǒng)支撐。

    第四,南海疆檔案資料的模型化是多模態(tài)南海疆維權(quán)證據(jù)鏈應(yīng)用的重要形式。圖譜化的南海疆檔案資料管理保證了檔案資料的真實性、可靠性與結(jié)構(gòu)一致性,實現(xiàn)了“場景化、規(guī)則式”的細粒度知識鏈接,提供了“查詢式”的知識交互,但是面臨知識庫規(guī)模小、隱性知識關(guān)聯(lián)組織有限、交互方式傳統(tǒng)等問題。以ChatGPT為代表的大語言模型技術(shù),實現(xiàn)了變革式的知識組織與知識服務(wù)。依托海量數(shù)據(jù)、超強算力與學(xué)習(xí)算法訓(xùn)練的大語言模型,可以實現(xiàn)基于自然語言交互完成文本、圖像、視頻等多模態(tài)數(shù)據(jù)的生成、理解與管理,但同時也面臨“幻覺”“遺忘”,以及“可解釋性差”等挑戰(zhàn)。為了充分融合多模態(tài)知識圖譜與大語言模型兩種代表性技術(shù)的優(yōu)勢,我們基于LangChain框架設(shè)計并實現(xiàn)了南海領(lǐng)域大語言模型,實現(xiàn)了南海疆檔案資料的模型化,融合檢索增強生成(RAG)對大語言模型輸出進行優(yōu)化,使其在生成響應(yīng)內(nèi)容之前引用訓(xùn)練數(shù)據(jù)之外的權(quán)威數(shù)據(jù)庫,即我們前期構(gòu)建的多模態(tài)南海疆證據(jù)知識圖譜系統(tǒng),從而保證生成內(nèi)容的可信性與可解釋性。南海領(lǐng)域大語言模型強大的語言理解與交互能力,為多模態(tài)南海疆維權(quán)證據(jù)鏈的場景化應(yīng)用提供了更多的可能性。

    多模態(tài)南海疆檔案資料的管理開發(fā)之路經(jīng)歷了從數(shù)字化、圖譜化到模型化的變遷,每一步的管理開發(fā)都緊密融合了當時最先進的技術(shù)。相信只有通過檔案事業(yè)與先進技術(shù)的雙向融合,才能與時俱進的實現(xiàn)檔案資料的開發(fā)利用,讓檔案資料真正的“活起來、用起來”,切實服務(wù)國家重大戰(zhàn)略需要。

    ▍蘇煥寧:

    在數(shù)字時代做檔案工作和研究是無法回避信息技術(shù)的,但多數(shù)檔案工作者往往又不太擅長技術(shù),因此筆者從一個比較宏觀的視角來談?wù)劗斍暗募夹g(shù)對檔案工作的一些影響。

    第一,檔案事業(yè)與新技術(shù)究竟是雙向融合還是單向賦能?雖然目前各種技術(shù)普遍應(yīng)用于檔案領(lǐng)域,但這種融合的狀態(tài)更多是建立在信息技術(shù)賦能檔案工作的基礎(chǔ)上的,甚至有時可以說是技術(shù)對我們的滲透。檔案工作依靠技術(shù)得以提升是肯定的,反之檔案工作推動技術(shù)進步的案例好像并不多。檔案處于業(yè)務(wù)末端,加上較強的風(fēng)險管理意識,往往更傾向于成熟技術(shù)的直接應(yīng)用。傳統(tǒng)檔案保護修復(fù)時有新技術(shù)的研發(fā),但在信息領(lǐng)域透過檔案事業(yè)得以發(fā)明創(chuàng)造或者大幅提升的技術(shù)很少,相比之下更為適合的表達是檔案工作豐富了某項信息技術(shù)的應(yīng)用場景并使之不斷完善。因此所謂的融合需要以檔案業(yè)務(wù)需求為核心去考量,一方面,盡管現(xiàn)在注重交叉學(xué)科的人才培養(yǎng),但比起技術(shù)教學(xué)更需要的是對專業(yè)情懷和專業(yè)素養(yǎng)的培養(yǎng),這是我們的根基和初衷;另一方面,檔案部門和技術(shù)部門需要建立以檔案業(yè)務(wù)需求為核心的相互理解與支持。

    第二,從檔案管理目前采用的主流技術(shù)中分析其特征和問題。根據(jù)近三年國家檔案局立項的科技項目,檔案工作與技術(shù)的融合大概可以從三個方面來看:一是技術(shù)環(huán)境作為背景來研究工作的開展,例如互聯(lián)網(wǎng)+、大數(shù)據(jù)、人工智能、檔案云、BIM等;二是傳統(tǒng)檔案保護技術(shù)的研究,如紙張脫酸、字跡恢復(fù)等,占更大比重的是信息技術(shù)的應(yīng)用,如大家耳熟能詳?shù)膮^(qū)塊鏈、人工智能、知識圖譜、可視化等在檔案真實性保障、檔案鑒定、檔案開發(fā)利用等方面的應(yīng)用??梢钥吹?,技術(shù)應(yīng)用的目標在于服務(wù)不同的檔案管理工作,那么從整個檔案管理的全鏈條來看,就并非某一個單項技術(shù)能支撐的,而需要通過多種技術(shù)的疊加來保障。這一過程就會導(dǎo)致面對不同階段的檔案管理的需求,所采用的技術(shù)有所沖突。舉例來看,一方面,檔案真實性可以通過各種驗證技術(shù)的互證來保障,理論上驗證技術(shù)越多越強就越能保障檔案真實性,但各種技術(shù)本身的長期保存,就會成為檔案長期保存之外所要面臨的重要問題。另一方面如上海大學(xué)的于英香教授所提,固化技術(shù)對于檔案的真實性保障必不可少,但對于檔案資源的開發(fā)而言,檔案內(nèi)容的固化卻成為一種障礙。因此如何實現(xiàn)技術(shù)選用的邏輯平衡,是值得我們思考的一個問題。

    最后是對技術(shù)選用的探討,即面對日新月異的技術(shù),檔案部門與檔案工作者應(yīng)該怎樣應(yīng)對。調(diào)研發(fā)現(xiàn),很多時候技術(shù)對檔案工作的支撐是足夠的,而往往掣肘的是一些制度問題。例如在最容易碰到的單套制歸檔中,很多調(diào)研單位都反映開展單套制的技術(shù)條件已經(jīng)很完善了,但目前不敢放心大膽推進,原因就在于沒有獲得完全的政策支持。又如,在其他領(lǐng)域比較火的區(qū)塊鏈技術(shù),其最大的優(yōu)點在于分布式的信息存儲和驗證,但在我國集中統(tǒng)一的檔案管理體制要求下,區(qū)塊鏈的應(yīng)用成效或優(yōu)勢似乎沒能很好地體現(xiàn)。此外,對技術(shù)的選用還需要考慮兩個成本:一是試錯成本,檔案資源的原始性決定了它相比其他資源而言的稀缺性甚至是唯一性,這客觀決定了檔案工作中的容錯機制彈性不足。對此,針對檔案的副本或內(nèi)容開發(fā)的技術(shù)會更容易落地,而涉及檔案本身的一些技術(shù)選用就會十分謹慎。二是經(jīng)濟成本,盡管理論上看技術(shù)可以實現(xiàn),但需要花費的經(jīng)濟成本卻難以承受。還是以單套歸檔為例,“歸不全”的一個重要原因即只有一個檔案管理系統(tǒng)很難與各式各樣的業(yè)務(wù)系統(tǒng)對接。理論上講,只要建設(shè)的檔案管理系統(tǒng)包羅萬象,有適配多個業(yè)務(wù)系統(tǒng)的完善的接口,也包含各業(yè)務(wù)系統(tǒng)的核心功能,那么與業(yè)務(wù)系統(tǒng)的數(shù)據(jù)對接的問題即可迎刃而解。但事實上要建設(shè)這樣一個檔案管理系統(tǒng)的成本可能至少是各個業(yè)務(wù)系統(tǒng)成本的簡單相加,從經(jīng)濟成本來看,這種技術(shù)開發(fā)和應(yīng)用的必要性就大打折扣,因此經(jīng)濟成本是技術(shù)選用時影響決策的一個很重要的因素。

    總之,檔案事業(yè)和技術(shù)的融合是必然的也是必要的,但正所謂“合適的才是最好的”,我們無法做技術(shù)的追風(fēng)者,真正需要的是找準某一領(lǐng)域或某項技術(shù),切實地去推動和實現(xiàn)這種雙向的融合。

    ▍潘未梅:

    新一代人工智能與檔案事業(yè)雙向融合應(yīng)體現(xiàn)為:一方面,人工智能技術(shù)賦能檔案工作自動化與智能化發(fā)展;另一方面,檔案學(xué)理論、方法與實踐貢獻于人工智能技術(shù)的“向上”“向善”發(fā)展。

    第一,人工智能技術(shù)賦能檔案工作自動化與智能化發(fā)展。人工智能技術(shù)可以助力檔案工作的自動化與智能化轉(zhuǎn)型升級。在當前數(shù)字轉(zhuǎn)型持續(xù)推進的背景下,檔案工作面臨檔案數(shù)據(jù)體量大、非結(jié)構(gòu)化程度高、信息過載、利用不充分、傳統(tǒng)管理方式和方法效率低等問題,急需相關(guān)工具的輔助。因此,探討人工智能輔助檔案工作的開展十分必要。近年來,我國檔案領(lǐng)域針對人工智能在檔案領(lǐng)域的應(yīng)用已展開積極的探討。在此過程中,學(xué)者們普遍認為應(yīng)從“檔案+人工智能”逐漸向“人工智能+檔案”轉(zhuǎn)變,強調(diào)人工智能的應(yīng)用應(yīng)充分考慮檔案本身的性質(zhì)及檔案工作的特點,使之符合檔案行業(yè)的價值取向與工作原則。易言之,我們應(yīng)關(guān)注人工智能“如何”“更好地”與檔案工作融合。

    在對我國國家及27份省級“十四五”檔案事業(yè)發(fā)展規(guī)劃中人工智能相關(guān)內(nèi)容進行分析后發(fā)現(xiàn),19份分別在數(shù)字檔案館建設(shè)(13)、檔案信息深層加工和利用(5)、檔案開放審核(3)、檔案行政監(jiān)管(1)等工作領(lǐng)域的內(nèi)容中提及應(yīng)用“人工智能”;有10個省級規(guī)劃倡導(dǎo)探索人工智能等新一代信息技術(shù)在檔案全鏈路管理中的應(yīng)用研究,形成一批標志性成果,運用信息技術(shù)解決檔案工作中的堵點和難點問題。比如,上海市的規(guī)劃提到“大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈、機器學(xué)習(xí)、數(shù)字人文等在檔案收集、保管、共享利用領(lǐng)域的應(yīng)用等重點內(nèi)容開展科研攻關(guān)并取得成果”。

    在對我國37個人工智能技術(shù)應(yīng)用于檔案工作業(yè)務(wù)環(huán)節(jié)案例的分析中,發(fā)現(xiàn)目前人工智能技術(shù)的應(yīng)用在廣度上基本覆蓋了檔案管理的全部環(huán)節(jié),包括:收集(2)、整理(包括分類)(4)、歸檔(1)、修復(fù)(2)、著錄(3)、鑒定(包括確定保管期限、開放審核、保密)(9)、數(shù)字化(包括數(shù)據(jù)化、成果質(zhì)檢)(6)、檢索(9)、開發(fā)利用(包括編研、文化傳播、信息共享)(9)、檔案服務(wù)(包括查檔)(3)、檔案安全(包括門禁系統(tǒng)、元數(shù)據(jù)采集、“四性”檢測)(4)。

    具體到各個環(huán)節(jié)所應(yīng)用的具體的人工智能技術(shù),調(diào)查結(jié)果顯示,各個業(yè)務(wù)場景所應(yīng)用人工智能技術(shù)整體是一致的。例如,鑒定環(huán)節(jié)多應(yīng)用自然語言處理、機器學(xué)習(xí)、深度學(xué)習(xí)與計算機視覺技術(shù)。對于具體技術(shù)在各環(huán)節(jié)的使用情況,計算機視覺技術(shù)是覆蓋應(yīng)用場景最多的技術(shù),可能的原因是要進行數(shù)據(jù)化識別,首先需要數(shù)字化,做準備工作。

    在國際層面,芬蘭國家檔案館《2025戰(zhàn)略》指出:國家檔案館推進基于人工智能和現(xiàn)代科學(xué)方法的數(shù)據(jù)管理、數(shù)據(jù)開放獲取和可持續(xù)發(fā)展。瑞士聯(lián)邦檔案館《2021—2025年發(fā)展規(guī)劃》指出:在數(shù)據(jù)分析和歷史研究中探索人類專業(yè)知識與人工智能的結(jié)合,以便為客戶提供最好的支持。美國NARA《2020認知技術(shù)白皮書》指出:使用人工智能技術(shù)識別符合處置條件的文件,并自動將其銷毀或轉(zhuǎn)移到ERA。以上均是在特定環(huán)節(jié)提出探討人工智能技術(shù)的應(yīng)用。

    對國外39個人工智能技術(shù)的具體應(yīng)用的案例進行分析后發(fā)現(xiàn),其覆蓋的業(yè)務(wù)環(huán)節(jié)聚焦于檔案轉(zhuǎn)錄,即OCR識別。說明國外各國水平差距不大。在人工智能的應(yīng)用上,目前人工智能技術(shù)的應(yīng)用所覆蓋的領(lǐng)域、國家有一些差別,但較為全面。

    人工智能技術(shù)應(yīng)用于檔案工作時,須關(guān)注檔案學(xué)的理論與方法。開放鑒定、自動著錄、價值鑒定,不是一個單純依賴人工智能技術(shù)的過程,還需要人工介入,需要相關(guān)理論的支持。早在1987年,美國檔案工作者在做早期研究時即提到,應(yīng)用人工智能技術(shù)輔助檔案工作時,檔案工作者應(yīng)積極參與,包括技術(shù)的選擇、應(yīng)用,否則只能單純使用人工智能來解決檔案學(xué)的工作,檔案學(xué)理論和方法的相關(guān)性將逐漸降低。

    從另外一個角度講,關(guān)注檔案學(xué)理論和方法可以使人工智能技術(shù)更好地去做檔案工作。例如,在開展檔案分類時,如果是使用基于關(guān)鍵背景信息(古文書學(xué)范疇內(nèi))對人工智能進行訓(xùn)練,結(jié)果則優(yōu)于專家的人工分類。這顯示,關(guān)注檔案學(xué)的理論和方法會讓結(jié)果更準確。另外,相關(guān)研究也認為,著錄在內(nèi)的檔案管理工作是應(yīng)用機器學(xué)習(xí)算法的必要準備步驟。

    此外,人工智能技術(shù)在檔案領(lǐng)域的應(yīng)用會帶來檔案工作的整體轉(zhuǎn)型升級。比如檔案資源的數(shù)字化程度提高,對檔案著錄作用及檔案工作標準的思考以及檔案工作者職業(yè)框架的更新等。檔案工作者內(nèi)部就檔案學(xué)的理論存在分歧。人工智能的應(yīng)用將迫使我們重新思考我們的理論與方法。對于檔案著錄標準,需思考檔案著錄的元素是否有必要結(jié)合人工智能進行調(diào)整。由此帶來的不僅從是AI技術(shù)的原始吸納,還有檔案工作生態(tài)環(huán)境的系統(tǒng)變化,檔案工作的自我重塑。

    第二,檔案學(xué)理論、方法與實踐貢獻于人工智能技術(shù)的“向上”“向善”發(fā)展。新一代人工智能技術(shù)與檔案事業(yè)的雙向融合,從檔案學(xué)與人工智能的融合來看,其實應(yīng)該是檔案學(xué)如何貢獻一個學(xué)科的力量,利用其擅長之處推動人工智能向前發(fā)展。

    一方面,檔案數(shù)據(jù)是高質(zhì)量、可信的數(shù)據(jù),人工智能學(xué)習(xí)的數(shù)據(jù)如果存在偏差,就會直接帶來結(jié)果的偏差。檔案數(shù)據(jù)本身是真實的、可信的,可以為人工智能的發(fā)展做出貢獻。另外對于如何防止數(shù)據(jù)存在偏差,檔案學(xué)一直致力于全面記錄社會,保證數(shù)據(jù)記錄的全面性、包容性、透明度等,隱私的規(guī)范處理等。其在這些領(lǐng)域的積累可以為數(shù)據(jù)的收集、標注等提供參考。

    另一方面,對于可解釋人工智能的問題,在檔案學(xué)領(lǐng)域,“可解釋”的概念過于寬泛,例如,為誰解釋?解釋過程是什么?解釋的結(jié)果是什么?AI領(lǐng)域也在探索利用文件記錄相關(guān)過程以提高AI的可解釋性。檔案學(xué)領(lǐng)域認為文件可以被視為一種解釋,而文件管理職業(yè)應(yīng)作為信息第三方參與協(xié)助生成對AI的解釋并進行解釋的傳遞和闡明,這也體現(xiàn)為對AI的記錄與保存。

    (責(zé)任編輯:劉鴻浩 張 帆)

    武安市| 微博| 丹巴县| 广东省| 屯门区| 巴彦县| 宣威市| 邻水| 会同县| 循化| 荔波县| 丰原市| 根河市| 澄城县| 永丰县| 英山县| 棋牌| 上高县| 德江县| 岑巩县| 循化| 三都| 策勒县| 清水县| 南溪县| 海口市| 亳州市| 萝北县| 萨迦县| 南丹县| 正蓝旗| 屏南县| 桓台县| 海伦市| 新闻| 元谋县| 广东省| 青神县| 宁海县| 库尔勒市| 罗江县|