孟鑫 張寧 蔡金磊
摘 要:近年來,網(wǎng)絡(luò)化、信息化覆蓋的范圍十分廣泛,改變了人們的生活、工作方式。計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,為檔案信息智能檢索提供了技術(shù)支持,尤其是數(shù)據(jù)化、網(wǎng)絡(luò)化技術(shù)的發(fā)展,為檔案信息智能檢索提供了難得的發(fā)展機(jī)遇。本文在分析檔案信息檢索的發(fā)展歷程中,探討了檔案信息智能檢索的發(fā)展趨勢和研究重點(diǎn),為做好檔案信息智能檢索提供理論支撐。
關(guān)鍵詞:檔案信息 智能檢索 發(fā)展趨勢
引 言
在信息網(wǎng)絡(luò)化和社會(huì)人本化的科學(xué)發(fā)展時(shí)代, 信息檢索智能化是不可逆轉(zhuǎn)的發(fā)展趨勢。信息檢索工作,是檔案信息化建設(shè)不可或缺的重要組成部分,是關(guān)系到檔案信息資源能否最終在更大范圍內(nèi)、更便捷地為社會(huì)所利用的現(xiàn)實(shí)問題。
1檔案信息智能檢索研究綜述
1.1人工檢索階段(20世紀(jì)30年代-20世紀(jì)80年代初期)
20世紀(jì)30-40年代末是我國檔案檢索學(xué)科發(fā)展的萌芽時(shí)期,雖然這一時(shí)期,并沒有出現(xiàn)專門的檔案信息檢索方面的論文、專利或標(biāo)準(zhǔn),但已經(jīng)開始了真正意義上的學(xué)術(shù)研究。其中,較為典型的代表著作便是1936年由程長源編著的《縣政府檔案管理法》,其被視為我國研究檔案信息檢索理論的發(fā)端。20世紀(jì)30年代,史學(xué)界開始對檔案工作進(jìn)行了深入探討,這一時(shí)期主要集中于檔案信息的整理和編目,1935年騰固編纂的《檔案整理處的任務(wù)及初步整理工作》一書中就明確提出了檔案收集與整理的現(xiàn)實(shí)意義需要運(yùn)用處理檔案合理的方法進(jìn)行規(guī)律性研究。陳兆祦在《檔案管理學(xué)》專著中,第一次將檔案管理工作的內(nèi)容概括為六個(gè)環(huán)節(jié):鑒定、收集、整理、保管、統(tǒng)計(jì)、利用,并提出了一套較為完善的檔案管理工作原理及方法,但受技術(shù)限制和時(shí)代影響,這一時(shí)期的檔案信息檢索大多是借鑒歐美等發(fā)達(dá)國家的圖書、情報(bào)、檔案管理經(jīng)驗(yàn),重點(diǎn)是檔案信息檢索編目方面。
1.2計(jì)算機(jī)化檢索階段(20世紀(jì)50年代初期—20世紀(jì)90年代初期)
高德在《計(jì)算機(jī)在太鋼科技檔案檢索中的應(yīng)用》(1985年),提出利用BASIC系統(tǒng),構(gòu)建了基于數(shù)據(jù)結(jié)構(gòu)類型集合、操作集合和完整性約束條件集合組成類似于關(guān)系數(shù)據(jù)模型的檔案檢索系統(tǒng)。嚴(yán)中和在《談?wù)勎⑿陀?jì)算機(jī)檔案檢索系統(tǒng)設(shè)計(jì)中的幾個(gè)問題》(1987年),提出了采用建索引庫、倒排庫、最優(yōu)化算法來提高檢索速度,并在微機(jī)上實(shí)現(xiàn)了倒排文檔的聯(lián)機(jī)檢索系統(tǒng),將自動(dòng)倒排技術(shù)運(yùn)用于正題名(即檔案文件的標(biāo)題),實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)抽詞。彭漢林在《微計(jì)算機(jī)城建檔案檢索可行性研究與探討》(1989年)中指出,基于C-dBASEⅢ數(shù)據(jù)庫系統(tǒng),增加了檔案檢索的保密性能,并廣泛采用了COBOL、BASIC、PASCAL等高級語言建立倒排文件,結(jié)合折半查找、樹型查找和函數(shù)法查找等一系列軟件設(shè)計(jì),提高了檢索的效率。姚良清在《檔案軟件是電子檔案系統(tǒng)的關(guān)鍵》(1991年)提出,電子檔案系統(tǒng)中,檢索軟件編制的好壞,會(huì)直接影響查找效果,并指出了由北京海威電氣公司開發(fā)的集系統(tǒng)建庫與檢索兩大功能組成的Tiger檢索系統(tǒng)的先進(jìn)性。李在銘等在《圖像快傳與檔案檢索通信系統(tǒng)》(1992年)中介紹了由圖像檔案主站、話路通道及用戶站組成圖像快傳與檔案檢索通信系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)分布存檔,快速步進(jìn)檢索圖像效果。
1.3網(wǎng)絡(luò)化檢索階段(20世紀(jì)90年代初期至今)
隨著社會(huì)信息需求的急劇增長,檔案信息檢索實(shí)踐活動(dòng)也發(fā)生了日新月異的變化。如:電子檔案信息組織與管理、網(wǎng)絡(luò)檔案信息檢索、檔案信息檢索自動(dòng)化等新技術(shù)、新方法撲面而來。這些新情況、新事物為推進(jìn)檔案信息檢索理論研究,提供了大量生動(dòng)的實(shí)踐素材。國內(nèi)不少檔案學(xué)者投入大量的心血與精力,對檔案信息檢索的相關(guān)技術(shù)難題進(jìn)行了積極探究,不僅有相當(dāng)數(shù)量的論文、專著、教材發(fā)表或出版,而且一些地方的檔案管理機(jī)構(gòu)還研發(fā)了功能較先進(jìn)的檔案信息檢索系統(tǒng)。如:1999年,謝華撰文指出著錄標(biāo)引的豐富是解決智能檢索中因?qū)傩赃^少而導(dǎo)致“瓶頸”現(xiàn)象的途徑。2010年,陳麗撰文提出了檔案信息檢索自然語言化的五種實(shí)現(xiàn)方式。2011年,肖秋會(huì)撰文介紹了計(jì)算機(jī)檔案信息檢索系統(tǒng)的設(shè)計(jì)與開發(fā)等。2012年,潘士萍設(shè)計(jì)出了遞進(jìn)式檔案信息檢索教學(xué)實(shí)驗(yàn)項(xiàng)目,并提供了可資研究參考的檔案管理機(jī)構(gòu)檢索工作范例。需要指出的是,這一階段國內(nèi)雖開始關(guān)注對計(jì)算機(jī)和網(wǎng)絡(luò)共享環(huán)境下的檔案信息檢索技術(shù)研究與開發(fā),但多數(shù)論著以介紹檔案信息檢索的基礎(chǔ)理論、方法、技術(shù)為主,針對智能檢索技術(shù)的專題論述不多,實(shí)踐案例極為少見,或僅限于表層研究,缺乏實(shí)用性。
2檔案信息智能檢索趨勢
2.1人工智能推理能力
計(jì)算機(jī)技術(shù)的應(yīng)用,奠定了檔案信息智能檢索的基礎(chǔ),實(shí)現(xiàn)了檔案信息檢索用戶與檔案信息系統(tǒng)之間交互中獲取相應(yīng)知識,從而實(shí)現(xiàn)了檔案信息智能檢索適應(yīng)外界環(huán)境的變化而變化。今后,在自動(dòng)標(biāo)引、自動(dòng)分類等方面,引入“本體”等技術(shù),提升數(shù)據(jù)庫的推理能力,從而使得檔案信息檢索的智能化程度會(huì)越來越高。
2.2知識處理集成能力
檔案信息的智能檢索是根據(jù)檔案信息內(nèi)容以及內(nèi)容關(guān)聯(lián)情況達(dá)到解決問題的過程,并非傳統(tǒng)的單純字符匹配來查找的傳統(tǒng)技術(shù)。在人工智能處理方面,將各種檔案信息的檢索語言放在專業(yè)知識庫和規(guī)則庫中,由人工智能技術(shù)模擬檔案管理人員的認(rèn)知功能,實(shí)現(xiàn)檔案信息的檢索預(yù)期目的。今后,需要在超鏈接、標(biāo)記語言以及互操作等方面進(jìn)一步完善,推動(dòng)知識庫由靜態(tài)向動(dòng)態(tài)轉(zhuǎn)變,由線性應(yīng)用向網(wǎng)狀管理轉(zhuǎn)變。
結(jié) 語
隨著社會(huì)人本化和信息網(wǎng)絡(luò)化的發(fā)展,檔案信息檢索的智能化成為時(shí)代發(fā)展的必然產(chǎn)物。為滿足用戶從海量檔案信息中迅速檢索到所需的檔案信息,人工智能技術(shù)的應(yīng)用與檔案信息檢索的智能化結(jié)合將更為緊密,充分利用自動(dòng)語言處理、專家系統(tǒng)、自動(dòng)程序設(shè)計(jì)、物鏡聯(lián)想、模式識別等方式,并通過多種檢索方式結(jié)合應(yīng)用,將會(huì)使檔案信息檢索更為智能化。
參考文獻(xiàn)
[1] 陳秀麗.基于信息需求下電子商務(wù)檔案信息檢索的智能化研究[J]山東檔案,2015(6):19-21
[2] 竇繼惠.網(wǎng)絡(luò)環(huán)境下檔案檢索學(xué)科建設(shè)與發(fā)展初探[J]蘭臺世界,2013(32):30-31
[3] 陳晨.檔案信息檢索系統(tǒng)的常見問題與開發(fā)利用[J]科技文獻(xiàn)信息管理,2017(4):46-48