付鋆 易也
摘要 隨著協(xié)同辦公系統(tǒng)在貴州電網(wǎng)公司的持續(xù)完善及推廣,系統(tǒng)正逐步深入人心,達(dá)到了預(yù)期的建設(shè)效果。用戶經(jīng)常通過檢索的方式來收集自己需要的公文數(shù)據(jù)信息,并且這些數(shù)據(jù)中大部分都是非結(jié)構(gòu)化的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)的來源有很多,公文、合同、制度的附件等都是可以提供數(shù)據(jù)信息的載體。將數(shù)據(jù)非結(jié)構(gòu)化其實(shí)就是利用數(shù)據(jù)預(yù)處理技術(shù)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一篩選操作,去除數(shù)據(jù)內(nèi)部包含的噪聲從而凈化數(shù)據(jù)。本文結(jié)合多個(gè)方面,對(duì)非結(jié)構(gòu)化文檔全文檢索技術(shù)以及其在協(xié)同辦公系統(tǒng)中的應(yīng)用情況進(jìn)行了深入的探究。
【關(guān)鍵詞】非結(jié)構(gòu)化 全文檢索技術(shù) 協(xié)同辦公系統(tǒng) 應(yīng)用情況
協(xié)同辦公系統(tǒng)數(shù)據(jù)分析在系統(tǒng)使用過程中占據(jù)著重要地位,通過利用非結(jié)構(gòu)化文檔全文檢索技術(shù),用戶可以輕而易舉的找到自己需要的信息。非結(jié)構(gòu)化數(shù)據(jù)的種類比較豐富,其存在的形式也有很多種,一般這些數(shù)據(jù)都是文件的附件而自動(dòng)生成的,并且大多是以圖片、文檔等形式存在的。
1 概述非結(jié)構(gòu)化文檔全文檢索技術(shù)
用戶要想在眾多的非結(jié)構(gòu)化文檔信息中快速的檢測到自己需要并且感興趣的信息,就必須要依靠全文檢索技術(shù)。在現(xiàn)代化的檢索技術(shù)中,全文檢索是其中比較重要的~部分,它能夠有效的幫助用戶快捷的采集數(shù)據(jù)信息。為了加快用戶獲取信息的速度,我們首先要?jiǎng)澐中畔⒌姆N類,這樣用戶不僅可以輕松的查詢到自己想要了解的數(shù)據(jù)信息,還能對(duì)目前出現(xiàn)的信息進(jìn)行自動(dòng)分類,有效的提高了網(wǎng)絡(luò)平臺(tái)的檢索效率。
全文檢索是一種檢索文字資料的方法,它能夠把文件中全部的文本信息和檢索詞相匹配的內(nèi)容檢索出來。就目前情況來看,全文檢索是搜索引擎中的核心技術(shù),要想在全文檢索的理論基礎(chǔ)上來實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化文檔的全文檢索,需要我們積極的開發(fā)一些軟件程序,通過利用組合詞搜索技術(shù)來掃描每一篇文檔中出現(xiàn)的相關(guān)詞匯,以組合詞為單位,對(duì)這些文件進(jìn)行智能排序,然后再依靠檢索詞計(jì)算出每個(gè)文檔中詞匯出現(xiàn)的頻率,對(duì)出現(xiàn)過檢索詞的文檔進(jìn)行整體排序并顯示最終的排序情況,這就是用戶檢索的最終結(jié)果。針對(duì)已經(jīng)存在的文檔,我們應(yīng)該通過創(chuàng)建靜態(tài)索引的方式來保留索引內(nèi)容,當(dāng)用戶對(duì)文檔進(jìn)行增刪改除的操作時(shí),我們應(yīng)該利用索引的更新功能,使得索引能夠自動(dòng)的完成動(dòng)態(tài)更新,最后再把靜態(tài)和動(dòng)態(tài)的索引結(jié)合起來,充分發(fā)揮索引創(chuàng)建的自適應(yīng)功能。
2 非結(jié)構(gòu)化文檔全文檢索技術(shù)在協(xié)同辦公系統(tǒng)中的應(yīng)用探究
非結(jié)構(gòu)化文檔全文檢索技術(shù)在協(xié)同辦公系統(tǒng)中具有非常重要的作用。對(duì)于我國的一些企業(yè)來說,只有部門與部門之間做好協(xié)同工作,公司的項(xiàng)目才能良好的開展下去。以往傳統(tǒng)的辦公模式需要企業(yè)投入大量的人力、物力,并且,公司對(duì)員工工作的完成情況也沒有進(jìn)行有效的監(jiān)測管理,對(duì)于工作中出現(xiàn)的問題沒有及時(shí)的給予解決。協(xié)同辦公系統(tǒng)的出現(xiàn)在一定程度上解決了此類問題,此系統(tǒng)是現(xiàn)代企業(yè)實(shí)施管理工作的主要手段。搜索引擎在協(xié)同辦公系統(tǒng)中占據(jù)著非常重要的地位,搜索引擎能夠搜集到互聯(lián)網(wǎng)上出現(xiàn)的全部信息資源,然后將這些信息整理儲(chǔ)存,方便用戶進(jìn)行查詢。搜索功能主要包含三部分內(nèi)容,分別是采集信息、整理信息和用戶查詢。搜索的原理也很簡單,首先,搜索引擎需要完成抓取網(wǎng)頁的步驟,每一個(gè)獨(dú)立的搜索引擎都有著自身獨(dú)特的用來抓取網(wǎng)頁的小程序,通過超鏈接的應(yīng)用就能抓取到許多網(wǎng)頁,其次,搜索引擎需要對(duì)這些網(wǎng)頁進(jìn)行處理,最主要的處理環(huán)節(jié)就是提取網(wǎng)頁中的關(guān)鍵詞,創(chuàng)建索引文檔。最后,當(dāng)用戶為了檢索自己需要的內(nèi)容而輸入關(guān)鍵詞時(shí),搜索引擎就會(huì)依靠創(chuàng)建的索引,從數(shù)據(jù)庫中找到包含此關(guān)鍵詞的網(wǎng)頁,供用戶瀏覽。搜索引擎的應(yīng)用為系統(tǒng)的用戶帶來了極大的便利,不僅為員工節(jié)省了更多的工作時(shí)間,還增強(qiáng)了企業(yè)員工的工作效率,給企業(yè)創(chuàng)造了更大的經(jīng)濟(jì)效益。
非結(jié)構(gòu)化文檔全文檢索技術(shù)能夠幫助企業(yè)采集員工的相關(guān)信息,企業(yè)可以根據(jù)用戶的需求,實(shí)現(xiàn)對(duì)企業(yè)各模塊的設(shè)計(jì)。數(shù)據(jù)庫的出現(xiàn)為系統(tǒng)的軟件開發(fā)奠定了基礎(chǔ)。用戶通過組合詞搜索等方式對(duì)一些需要的數(shù)據(jù)信息進(jìn)行搜索,然后在得出的文檔排序中找到最適合的答案,以此完成企業(yè)協(xié)同工作系統(tǒng)的創(chuàng)建。非結(jié)構(gòu)化文檔全文檢索技術(shù)不僅節(jié)約了企業(yè)辦公的人力資源,還通過無紙化辦公的方式,減少了企業(yè)的物資消耗。除此之外,協(xié)同辦公系統(tǒng)的“無址化”特點(diǎn),幫助企業(yè)形成了一個(gè)更加自由的辦公環(huán)境,工作人員在任何地點(diǎn)和時(shí)間內(nèi)都可以進(jìn)行辦公,一個(gè)完善的協(xié)同辦公系統(tǒng)能夠提升企業(yè)的信息共享效率以及員工的協(xié)作能力。在員工查詢工作信息時(shí),全文檢索技術(shù)能夠?yàn)閱T工提供一個(gè)統(tǒng)一的文檔檢索與獲取的查詢?nèi)肟?,協(xié)作辦公系統(tǒng)的用戶只需要將檢索內(nèi)容中的關(guān)鍵詞輸入進(jìn)檢索窗口中就可以達(dá)到查詢的目的。
3 全文檢索在協(xié)同辦公系統(tǒng)的應(yīng)用優(yōu)勢
首先非結(jié)構(gòu)化文檔全文檢索速度較快,相較于其他幾種檢索方式而言,該檢索方式通??梢栽谳^短的時(shí)間內(nèi)幫助用戶定位到所需的網(wǎng)頁或信息,反映在協(xié)同辦公系統(tǒng)中則能夠有效壓縮檢索使用時(shí)間,進(jìn)而提高辦公效率。
其次非結(jié)構(gòu)化文檔全文檢索功能不會(huì)因檢索結(jié)果太多而影響到辦公效率。當(dāng)檢索結(jié)果太多時(shí),用戶一一瀏覽就會(huì)耗用大量的時(shí)間,該檢索方式展示檢索結(jié)果排序的依據(jù)是以單一信息中關(guān)鍵詞出現(xiàn)的頻率而非信息使用頻率或訪問頻率,從而將最具關(guān)聯(lián)性的信息反映在用戶面前,不容易造成用戶錯(cuò)覺,辦公效率也自然提高。
此外非結(jié)構(gòu)化文檔全文檢索技術(shù)的應(yīng)用,能夠提高企業(yè)信息的功效效率,一方面能夠提高企業(yè)員工工作效率,便于企業(yè)知識(shí)管理的展開和完善,企業(yè)管理者更容易掌握企業(yè)信息的使用情況和知識(shí)技術(shù)的應(yīng)用情況,便于做出最符合企業(yè)當(dāng)前發(fā)展需求的決策,提高企業(yè)知識(shí)利用率的同時(shí)推動(dòng)了企業(yè)的生產(chǎn)和發(fā)展。
4 結(jié)束語
隨著我國信息技術(shù)的快速發(fā)展,企業(yè)要想在激烈的社會(huì)競爭中站穩(wěn)腳跟,就必須要研究出適合企業(yè)發(fā)展的新技術(shù)。企業(yè)搜索技術(shù)的出現(xiàn),為企業(yè)協(xié)同辦公系統(tǒng)的用戶提供了更加快捷、便利的信息查詢通道。本文結(jié)合多個(gè)方面,對(duì)非結(jié)構(gòu)化文檔全文檢索技術(shù)以及此技術(shù)在協(xié)同辦公系統(tǒng)中的應(yīng)用情況進(jìn)行了深入的探究。
參考文獻(xiàn)
[1]謝子超,非結(jié)構(gòu)化文本的自動(dòng)分類檢索平臺(tái)的研究與實(shí)現(xiàn)[J].軟件,2015, 36 (11):112-114.
[2]肖興平,阮俊.基于地質(zhì)技術(shù)方法非結(jié)構(gòu)化數(shù)據(jù)的文檔檢索研究[J].中國西部科技,2015 (11):23-25.