倪 榕
(廈門藍(lán)極檔案技術(shù)有限公司,福建 廈門 361000)
《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》提出“積極探索知識(shí)管理、人工智能、數(shù)字人文技術(shù)在檔案信息深層加工和利用中的應(yīng)用”,為檔案管理的智慧化標(biāo)準(zhǔn)化建設(shè)指明了方向。當(dāng)前,人工智能技術(shù)成為推動(dòng)社會(huì)治理效能的關(guān)鍵因素,要激發(fā)其在檔案服務(wù)體系建設(shè)中的作用,推動(dòng)檔案工作更好地服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展。
人工智能技術(shù)與檔案管理有天然的契合性,為二者融合開闊了空間,奠定了深度融合的物質(zhì)基礎(chǔ)。
一是檔案服務(wù)進(jìn)入轉(zhuǎn)型發(fā)展期。伴隨新技術(shù)廣泛應(yīng)用,催生了數(shù)字化、網(wǎng)絡(luò)化、智慧化的公共服務(wù)新模式和檔案治理新理念,為人們生活帶來(lái)了極大便利。同時(shí),人們對(duì)優(yōu)質(zhì)服務(wù)的需求也隨著提升,將人工智能技術(shù)應(yīng)用檔案服務(wù)已成為必然要求。比如,當(dāng)利用者進(jìn)行資料編研時(shí),機(jī)器學(xué)習(xí)技術(shù)根據(jù)利用者需求自動(dòng)推送相關(guān)內(nèi)容,提升利用者編研效率。再比如,數(shù)據(jù)挖掘技術(shù)可以按照不同用戶的需求,進(jìn)行檔案信息的收集和處理,保證了數(shù)據(jù)服務(wù)的個(gè)性化。二是傳統(tǒng)檔案服務(wù)模式的滯后性。隨著電子檔案的鋪開,檔案信息資源管理難度越來(lái)越大,大量結(jié)構(gòu)化的數(shù)據(jù)資源成為管理的主要對(duì)象。與之相對(duì)的是對(duì)電子檔案服務(wù)能力和效率的要求提升,需要借助知識(shí)管理工具開展科學(xué)管理。比如,《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》指出,檔案開放審核是檔案開放利用的基礎(chǔ),也是檔案工作中的難點(diǎn)問(wèn)題。在電子檔案開放中應(yīng)用人工智能的自動(dòng)審核優(yōu)勢(shì),將檔案人員從繁重任務(wù)中解脫出來(lái),提高檔案開放的準(zhǔn)確性和實(shí)效性。
目前,我國(guó)正處于向數(shù)字社會(huì)建設(shè)的轉(zhuǎn)型時(shí)期,檔案工作的環(huán)境、對(duì)象、內(nèi)容、方法都發(fā)生了根本性變化,檔案管理與人工智能相融合也將有助于更好發(fā)揮人工智能的優(yōu)勢(shì)。具體表現(xiàn)在:從管理來(lái)說(shuō),人工智能與物聯(lián)網(wǎng)技術(shù)相結(jié)合,通過(guò)射頻信號(hào)實(shí)現(xiàn)自動(dòng)識(shí)別管理對(duì)象獲取數(shù)據(jù),依托人工技術(shù)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí),從海量數(shù)據(jù)中提取有用價(jià)值,應(yīng)用較為廣泛的是智能庫(kù)房建設(shè),實(shí)現(xiàn)檔案位置、類別和庫(kù)房“九防”的跟蹤和感知;從服務(wù)來(lái)說(shuō),人工智能實(shí)現(xiàn)從低層次數(shù)據(jù)記錄到高層次知識(shí)聚合、圖像查詢由目錄級(jí)向內(nèi)容轉(zhuǎn)變,體現(xiàn)了人工智能在知識(shí)挖掘和開發(fā)利用中的獨(dú)特優(yōu)勢(shì),為檔案資政服務(wù)和公共服務(wù)打開了更為廣闊的空間。從資源來(lái)說(shuō),人們對(duì)電子檔案質(zhì)量和效率有了更高要求,人工智能通過(guò)搭建數(shù)據(jù)化管理系統(tǒng),依托計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等技術(shù),實(shí)現(xiàn)檔案的自動(dòng)化識(shí)別、分類、存儲(chǔ)和檢索,從而提高檔案管理的效率和準(zhǔn)確性。
根據(jù)《基于人工智能的接入網(wǎng)運(yùn)維和業(yè)務(wù)智能化場(chǎng)景與需求》(YD/T 4070-2022)和《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》,人工智能技術(shù)在檔案服務(wù)領(lǐng)域主要體現(xiàn)在利用、鑒定、安全、審核等方面,應(yīng)用場(chǎng)景廣闊。
電子檔案呈現(xiàn)海量增長(zhǎng)的趨勢(shì),對(duì)檔案利用提出了新要求。要突破傳統(tǒng)的人工檢索模式,降低人力、精力和時(shí)間的損耗,需要借助人工智能自然語(yǔ)言技術(shù)加以解決。自然語(yǔ)言處理就是用人工智能來(lái)處理、理解以及運(yùn)用人類語(yǔ)言,已在生產(chǎn)生活領(lǐng)域廣泛運(yùn)用。比如,機(jī)器語(yǔ)言翻譯、繁體字和手寫體字符識(shí)別,語(yǔ)音識(shí)別文字轉(zhuǎn)換、文本語(yǔ)義的抽取、過(guò)濾與分析等。它融合了語(yǔ)言處理中的語(yǔ)法、語(yǔ)義和篇章分析技術(shù),是人工智能方面最前沿的研究方法。時(shí)至今日語(yǔ)言分析技術(shù)已把識(shí)別準(zhǔn)確率從70%提高到了90%以上。電子檔案管理可以運(yùn)用語(yǔ)言分析技術(shù),實(shí)現(xiàn)某一內(nèi)容的智能化檢索服務(wù),尤其是對(duì)年代較為久遠(yuǎn)的檔案資料,比如手寫體、繁體字文檔,依靠人工模式出錯(cuò)率高、效率低,依托該種技術(shù),可極大提升文字識(shí)別的效率和準(zhǔn)確度,實(shí)現(xiàn)提升查詢利用的效果。比如,昆山市檔案館建立AI 智能校對(duì)系統(tǒng),將大量的檔案數(shù)據(jù)機(jī)器學(xué)習(xí)與人工智能服務(wù)的文字識(shí)別(OCR)服務(wù)、自然語(yǔ)言(NLP)分析服務(wù)進(jìn)行對(duì)接,實(shí)現(xiàn)檔案數(shù)據(jù)智能校對(duì)。
根據(jù)《人工智能知識(shí)圖譜技術(shù)框架》(GB/T 42 131-2022)人工智能賦能檔案編研的途徑有三種形式:一是自助編研。人工智能技術(shù)利用知識(shí)圖譜中的數(shù)據(jù),以可視化的方式結(jié)合語(yǔ)義檢索、推薦和大語(yǔ)言模型,打造自主編研模式,深度挖掘利用檔案內(nèi)容和知識(shí)。比如,有的檔案部門根據(jù)《數(shù)字檔案館室建設(shè)指南》《電子文件歸檔和電子檔案管理規(guī)范》,搭建智能編研模塊,只要輸入關(guān)鍵字、時(shí)間節(jié)點(diǎn)、事件等系統(tǒng)能夠自助按照模式進(jìn)行匯總,像大事記等都可以采用此方式。二是方式創(chuàng)新。人工智能和虛擬現(xiàn)實(shí)的發(fā)展,豐富檔案編研形式,使得展覽素材更加逼真,例如,該技術(shù)能夠?qū)险掌M(jìn)行色彩還原,結(jié)合歷史背景使得人物鮮活生動(dòng),增強(qiáng)虛擬現(xiàn)實(shí)的體驗(yàn),使虛擬環(huán)境更加智能和真實(shí)。同時(shí),該技術(shù)在展覽效果上突破了時(shí)空限制,通過(guò)虛擬現(xiàn)實(shí)參觀主題展覽、體驗(yàn)檔案文化,提高了教育效果和參與度。三是智能推送。人工智能能夠以語(yǔ)義分析利用者的需求,對(duì)關(guān)聯(lián)內(nèi)容進(jìn)行推送,提升利用者的查詢效率。同時(shí),也可基于海量檔案語(yǔ)言模型,對(duì)檔案內(nèi)容的事件抽取、文本摘要抽取,建立后臺(tái)事件數(shù)據(jù)庫(kù)和摘要數(shù)據(jù)庫(kù),為檔案編研利用進(jìn)行內(nèi)容創(chuàng)新服務(wù)。
檔案審核劃控是人工智能應(yīng)用最廣泛的領(lǐng)域,通過(guò)OCR 技術(shù)提取檔案全文,然后使用NLP 技術(shù)進(jìn)行語(yǔ)義分析,優(yōu)化訓(xùn)練一種基于規(guī)則和語(yǔ)義驅(qū)動(dòng)的開放審核模型,對(duì)關(guān)鍵檔案信息進(jìn)行識(shí)別標(biāo)注,并動(dòng)態(tài)更新關(guān)鍵詞庫(kù)和自動(dòng)分類,有效解決了審核數(shù)量多和人員少的結(jié)構(gòu)性矛盾。比如,福建省檔案館設(shè)計(jì)訓(xùn)練了深度神經(jīng)網(wǎng)絡(luò)輔助開放審核算法模型,編制了檔案開放審核關(guān)鍵詞表,提出了檔案開放審核工作流程,對(duì)規(guī)范檔案開放審核工作,提升檔案開放審核工作效率。人工智能在審核中應(yīng)加強(qiáng)人工抽檢力度,因?yàn)槿斯ぶ悄芟到y(tǒng)需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),但系統(tǒng)常出現(xiàn)“數(shù)據(jù)偏見”,如果這種重復(fù)出現(xiàn)“偏見”,就造成某一模塊審核準(zhǔn)確率較低。比如,在部分手寫稿或者繁體文檔中,對(duì)部分詞語(yǔ)識(shí)別準(zhǔn)確率較低,造成審核結(jié)果失真,會(huì)影響整體審核質(zhì)量。
人工智能技術(shù)已經(jīng)涵蓋了檔案物理層、網(wǎng)絡(luò)層、傳輸層和載體層的全方位安全保護(hù)與控制,具體而言主要有:一是智能庫(kù)房。人工智能建立環(huán)境監(jiān)測(cè)系統(tǒng)、中央空調(diào)系統(tǒng)、通風(fēng)設(shè)備、中央除塵系統(tǒng)、消防報(bào)警及聯(lián)動(dòng)控制系統(tǒng)、視頻監(jiān)控系統(tǒng)組成的一體化復(fù)合型智慧庫(kù)房管理模式,實(shí)現(xiàn)了庫(kù)房建設(shè)的更新迭代。目前,人工智能已實(shí)現(xiàn)全過(guò)程機(jī)器值守操作,減少人工干預(yù)。比如,上海靜安區(qū)檔案館建立數(shù)字孿生技術(shù)、三維建模,構(gòu)建技防與人防相結(jié)合、軟硬件同步發(fā)展的檔案實(shí)體安全管理體系,打造采用機(jī)器人實(shí)現(xiàn)檔案拿取功能的無(wú)人值守庫(kù)房。二是信息安全。人工智能可設(shè)置安全權(quán)限,利用人員只能查看安全權(quán)限以內(nèi)的信息;同時(shí),系統(tǒng)的安全風(fēng)險(xiǎn)感知、監(jiān)測(cè)預(yù)警、實(shí)時(shí)阻斷、追蹤溯源能力提升,防入侵技術(shù)有顯著提升,防火墻、防水墻的安全防護(hù)指數(shù)增強(qiáng),用技術(shù)進(jìn)步解決了安全風(fēng)險(xiǎn)難題。三是傳輸安全。人工智能通過(guò)計(jì)算機(jī)系統(tǒng)和人工智能的算法優(yōu)化信息存儲(chǔ)的方式,實(shí)現(xiàn)電子檔案的在線存儲(chǔ)、傳輸和備份,將檔案資料從一個(gè)地點(diǎn)傳輸?shù)搅硪粋€(gè)地點(diǎn),以及進(jìn)行檔案的跟蹤、審計(jì)和管理等全流程安全保管。四是載體安全。人工智能與云計(jì)算技術(shù),可以提供一個(gè)高效、安全和可靠的載體存儲(chǔ)環(huán)境,使得檔案信息可以更加安全、可靠地存儲(chǔ)和管理。同時(shí),也可以提供靈活的服務(wù)擴(kuò)展能力,滿足檔案工作中不斷增長(zhǎng)的數(shù)據(jù)存儲(chǔ)和管理需求。
結(jié)合《云平臺(tái)人工智能建模系統(tǒng)框架及功能要求》(DB14/T 2527-2022)要求,人工智能在資源建設(shè)方面的優(yōu)勢(shì)主要體現(xiàn)在檔案收集、整理和數(shù)據(jù)庫(kù)建設(shè)方面。從收集上來(lái)看,通過(guò)搭建全方位的數(shù)據(jù)采集系統(tǒng),對(duì)文字、聲音、視頻、自媒體進(jìn)行收集,實(shí)現(xiàn)了檔案資源建設(shè)的準(zhǔn)、全、多樣的要求。從整理上來(lái)看,人工智能技術(shù)通過(guò)預(yù)設(shè)的分類規(guī)則和方案,利用智能分類模型、文字處理技術(shù)、模式識(shí)別技術(shù)等手段,對(duì)檔案整理流程進(jìn)行智慧化改造,形成融合智慧化、自主性、一鍵式功能的整理體系。從數(shù)據(jù)庫(kù)建設(shè)來(lái)看,人工智能推動(dòng)數(shù)字檔案館向智慧館轉(zhuǎn)變,將全域檔案數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù),打破了不同數(shù)據(jù)類型檔案之間的信息壁壘,完成了全域檔案數(shù)據(jù)的知識(shí)融合。
人工智能的融合路徑需要建立完善的推進(jìn)措施,形成較為完備的要素支撐體系,實(shí)現(xiàn)檔案服務(wù)的智能化標(biāo)準(zhǔn)化。
作為最熱門的新技術(shù)之一,早在2017 年,國(guó)務(wù)院就發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030 年我國(guó)新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施。隨著深度學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等技術(shù)持續(xù)創(chuàng)新,人工智能將更加準(zhǔn)確地識(shí)別和理解人類語(yǔ)言、行為和情感,并能夠自主地進(jìn)行決策和學(xué)習(xí),能夠拓展檔案管理應(yīng)用的場(chǎng)景和任務(wù),為檔案管理帶來(lái)了更多創(chuàng)新。因此,要緊緊把握時(shí)代發(fā)展潮流,抓住人工智能發(fā)展的戰(zhàn)略機(jī)遇期,以“智能+技術(shù)”賦能檔案管理,逐步培育具有鮮明特色、自主可控的人工智能治理新業(yè)態(tài)。一是加強(qiáng)人工智能技術(shù)創(chuàng)新。聚焦深度學(xué)習(xí)、模擬計(jì)算、模態(tài)分析、認(rèn)知推理等實(shí)施創(chuàng)新專項(xiàng)和關(guān)鍵核心技術(shù)攻關(guān)項(xiàng)目,形成具有檔案特色的人工智能新技術(shù)。二是實(shí)施人工智能場(chǎng)景拓展計(jì)劃。打造智能技術(shù)與解決方案供給體系,圍繞開發(fā)利用、編研、整理鑒定、安全等智能化升級(jí)需求,提供自主可控的智能制造“檔案方案”。三是加強(qiáng)智慧數(shù)字化治理提升。完善檔案大腦中樞平臺(tái)功能,重點(diǎn)圍繞數(shù)據(jù)推送、交互平臺(tái)等,提升利用的便捷性和人民群眾幸福感。
人工智能需要進(jìn)行深度知識(shí)學(xué)習(xí),其中就涉及個(gè)人的隱私問(wèn)題,如果這些信息被泄露,就會(huì)對(duì)社會(huì)產(chǎn)生負(fù)面影響;人工智能依靠對(duì)數(shù)據(jù)的計(jì)算和訓(xùn)練,如果存在技術(shù)偏好將產(chǎn)生不公平現(xiàn)象,同時(shí),人工智能系統(tǒng)也面臨著網(wǎng)絡(luò)黑客的攻擊。因此,在推進(jìn)人工智能的同時(shí)認(rèn)真思考如何管理其潛在的負(fù)面風(fēng)險(xiǎn),并采取適當(dāng)?shù)拇胧﹣?lái)保護(hù)個(gè)人和社會(huì)的利益。一是高位推動(dòng)。采取措施加強(qiáng)監(jiān)管,以確保公眾利益和安全,加速建立形成通行、共識(shí)的人工智能治理規(guī)則和體系。建立多方參與機(jī)制,協(xié)力促進(jìn)人工智能良性發(fā)展。二是技術(shù)突破。要加大技術(shù)攻關(guān),圍繞實(shí)時(shí)監(jiān)測(cè)、數(shù)據(jù)篩選、數(shù)據(jù)保護(hù)、網(wǎng)絡(luò)安全等方面進(jìn)行研究,構(gòu)建更為公平和包容的技術(shù)安全環(huán)境。三是明確規(guī)范。加強(qiáng)人工智能法律機(jī)制建設(shè),規(guī)范技術(shù)標(biāo)準(zhǔn),通過(guò)有效的技術(shù)創(chuàng)新、有效的流程管理和有效的風(fēng)險(xiǎn)防范來(lái)構(gòu)筑人工智能治理的生態(tài)底座。
新技術(shù)的發(fā)展為檔案管理帶來(lái)了新的機(jī)遇與挑戰(zhàn),檔案部門要加速推動(dòng)檔案管理與人工智能深度融合。一是創(chuàng)新投入機(jī)制。充分發(fā)揮政府投入的主渠道作用,完善以財(cái)政投入為主,企業(yè)、社會(huì)廣泛參與的經(jīng)費(fèi)保障機(jī)制,加大人工智能經(jīng)費(fèi)投入力度,加強(qiáng)對(duì)政策支持力度,為推進(jìn)人工智能提供良好的政策環(huán)境和發(fā)展空間。二是加強(qiáng)宣傳引導(dǎo)。堅(jiān)持典型引路的推進(jìn)機(jī)制,總結(jié)提煉先進(jìn)經(jīng)驗(yàn)與典型案例。通過(guò)組織現(xiàn)場(chǎng)觀摩會(huì)、舉辦講座等方式,廣泛宣傳經(jīng)驗(yàn)成效,發(fā)揮輻射引導(dǎo)效應(yīng)。開展選樹先進(jìn)典型,發(fā)揮示范引領(lǐng)作用,激發(fā)人工智能引用的積極性。要按照《人工智能從業(yè)人員能力要求》(SJ/T 11805-2022 )要求,加強(qiáng)專業(yè)化隊(duì)伍建設(shè)。三是加強(qiáng)資源配置。重點(diǎn)圍繞人民群眾關(guān)心的服務(wù)媒介、資源建設(shè)、開發(fā)利用等方面,加強(qiáng)智慧檔案館、遠(yuǎn)程利用的資源和政策供給,提高人工智能應(yīng)用效能。
人工智能技術(shù)的發(fā)展已經(jīng)成為了科技領(lǐng)域的熱點(diǎn)話題,已不再是一個(gè)遙遠(yuǎn)的概念,而是滲透到生活的每一個(gè)角落,成為推動(dòng)人類文明進(jìn)步的重要力量。未來(lái)人工智能將會(huì)變得更加智慧化,應(yīng)用場(chǎng)景將會(huì)更加廣泛,發(fā)展方向也會(huì)更加多樣化,為社會(huì)發(fā)展帶來(lái)更多的機(jī)遇和挑戰(zhàn)。站在新的歷史節(jié)點(diǎn)上,檔案工作者要加強(qiáng)運(yùn)用人工智能技術(shù)的能力和水平,加強(qiáng)科技創(chuàng)新和交流合作,培養(yǎng)高技能人才,推動(dòng)人工智能健康、可持續(xù)的發(fā)展,讓智能技術(shù)更好地服務(wù)于檔案事業(yè)發(fā)展。