郭旦雄 郭曉珍 郭曉梫 唐強(qiáng)
摘 要:信息檢索服務(wù)是當(dāng)前時代中一項重要的服務(wù)類型,通過對于信息檢索服務(wù)做出細(xì)化分析,隨后將其應(yīng)用到知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)中,便可以構(gòu)建起一個完整的知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng),繼而使我國的信息檢索服務(wù)的質(zhì)量得到全方位提升。
關(guān)鍵詞:知識產(chǎn)權(quán);信息檢索;服務(wù)提供系統(tǒng)
當(dāng)前,伴隨著信息化時代的到來,我國社會也開始逐漸進(jìn)入信息化時代,在信息化時代中,面對著網(wǎng)絡(luò)數(shù)據(jù)庫當(dāng)中的眾多信息,如何才能夠在第一時間找到自己想要的信息便成了一項重要內(nèi)容,而信息檢索的方式則是挖掘有效信息的重要途徑。在我國,知識產(chǎn)權(quán)是我國每個公平都享有的一項權(quán)利,若是想要及時地了解到知識產(chǎn)權(quán)信息,便需要通過信息查詢的方式,在此期間,將信息檢索的理念應(yīng)用到其中,便能夠快速查找到產(chǎn)權(quán)信息。下面本文將針對知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)的構(gòu)建做出系統(tǒng)性的分析闡述。
一、 知識產(chǎn)權(quán)信息檢索系統(tǒng)構(gòu)成
在知識產(chǎn)權(quán)信息檢索系統(tǒng)中,為了有效實現(xiàn)該系統(tǒng)的既定功能,便需要對于系統(tǒng)工作做出系統(tǒng)考量,在一般情況下,知識產(chǎn)權(quán)信息檢索系統(tǒng)主要包含以下幾個模塊:網(wǎng)頁模塊、信息收集與處理模塊、文檔模塊、索引策略模塊、索引模塊、檢索模型模塊、查詢模塊、查詢結(jié)果模塊,通過以上模塊之間的相互組合,能夠有效地實現(xiàn)知識產(chǎn)權(quán)信息檢索功能,同時也能夠為訪客提供知識產(chǎn)權(quán)信息檢索服務(wù),下圖1-1為知識產(chǎn)權(quán)信息檢索系統(tǒng)構(gòu)成示意圖。在圖1中,信息的收集與預(yù)處理主要便是有爬行器來讀取網(wǎng)上的網(wǎng)頁,隨后將其中的數(shù)據(jù)處理轉(zhuǎn)換為文檔的形式。
圖1 知識產(chǎn)權(quán)信息檢索系統(tǒng)構(gòu)成示意圖
(一) 索引策略
在儲存文檔期間,可以采用索引策略,在其中包含字、詞以及二元文法等。例如:在實際應(yīng)用中要對“知識產(chǎn)權(quán)信息檢索服務(wù)”進(jìn)行儲存,通過詞索引策略,便要用“知識”“產(chǎn)權(quán)”“信息”“檢索”“服務(wù)”與等方式進(jìn)行信息儲存,在字索引策略下,還要以“知”“識”“產(chǎn)”“權(quán)”“信”“息”“檢”“索”“服”“務(wù)”的方式進(jìn)行儲存,同時在二元文法索引策略下,要以:“知識”“識產(chǎn)”“產(chǎn)權(quán)”“權(quán)信”“信息”“息檢”“檢索”“索服”“服務(wù)”的方式來進(jìn)行文檔儲存。
(二) 檢索模型
在知識產(chǎn)權(quán)信息檢索期間,訪客將自身所要查詢的信息輸入到檢索系統(tǒng)中,隨后系統(tǒng)便可以對查詢以及索引相似度做出計算,之后還可以自動完成結(jié)果文檔集的查詢以及排序,并且將查詢信息與檢索信息相似度較高的內(nèi)容排列在最上面,之后便可以將查詢的結(jié)果反饋給訪客。通過以上過程便能夠完成整個信息檢索的過程,從而為訪客提供相應(yīng)的知識產(chǎn)權(quán)信息檢索服務(wù)。
二、 知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)總框架設(shè)計
(一) 信息的收集以及處理
在知識產(chǎn)權(quán)信息檢索系統(tǒng)中,信息的收集工作是一項重要的工作,同時也是系統(tǒng)能夠?qū)崿F(xiàn)其既定功能的核心保障。基于此,在信息收集期間,首先要做的便是要確保信息的真實性、準(zhǔn)確性,這樣才能夠令知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)受到更多人的青睞,在一般情況下,知識產(chǎn)權(quán)信息檢索系統(tǒng)中的數(shù)據(jù)來源主要便是知識產(chǎn)權(quán)局所提供,在其中還包括國家知識產(chǎn)權(quán)局以及地方知識產(chǎn)權(quán)局,需要依照系統(tǒng)服務(wù)的范圍來定制信息數(shù)據(jù)的來源。
(二) 索引策略選擇
通過研究與實踐證明,在中文檢索系統(tǒng)中,采用二元文法索引策略的檢索系統(tǒng)所取得的效果更佳,所以在知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)中同樣要選擇二元文法索引策略。
(三) 數(shù)據(jù)庫設(shè)計
在知識產(chǎn)權(quán)信息檢索系統(tǒng)中,需要構(gòu)建數(shù)據(jù)庫才能夠保證其實現(xiàn)既定功能,在一般情況下,知識產(chǎn)權(quán)信息檢索系統(tǒng)中需要存儲以下方面信息:①總詞匯數(shù)量;②單詞匯總表,在其中主要包括單詞以及其出現(xiàn)次數(shù)等;③文檔索引:在其中主要包括文檔編號、單詞等;④文檔表:在其中主要包括文檔編號以及文檔總詞數(shù)。在知識產(chǎn)權(quán)信息檢索系統(tǒng)工作期間,需要構(gòu)建起倒排索引,同時利用B+樹等方面結(jié)構(gòu)來完成數(shù)據(jù)儲存。隨后在信息檢索期間,系統(tǒng)便可以到數(shù)據(jù)庫當(dāng)中調(diào)用數(shù)據(jù)文檔,隨后經(jīng)過排序?qū)?shù)據(jù)文檔呈現(xiàn)在訪客界面。
(四) 存儲過程分析
知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng)中還要經(jīng)過存儲過程才能夠完成數(shù)據(jù)庫的存儲功能,在實際存儲過程中,主要包含以下方面在步驟:①文檔表的生成:在此期間,系統(tǒng)可以對于原始文檔做出計算,同時統(tǒng)計出在每天文檔當(dāng)中所包含的單詞以及每個文檔中單詞所出現(xiàn)的次數(shù)。②文檔索引表的生成:在該步驟當(dāng)中,主要便是對于原始文檔中的每篇文章做出分析,同時統(tǒng)計出每篇文檔的總詞數(shù),隨后做出相應(yīng)的記錄。③總詞數(shù)表的生成:在此期間的主要工作便是對于整個文檔的總詞數(shù)做出統(tǒng)計與記錄。④單詞匯總表的生成:需要對于整個文檔集中的每個單詞總計出現(xiàn)的次數(shù)做出統(tǒng)計。⑤查詢以及儲存過程的實現(xiàn):首先要將查詢表中的查詢處理,之后將結(jié)果保存到查詢結(jié)果表當(dāng)中。
三、 結(jié)束語
綜上所述,在我國信息化程度逐年提高的背景下,信息檢索服務(wù)是一項重要的服務(wù),同時該項服務(wù)也能夠有效提升人們查詢到有效信息的效率。所以便需要將該項技術(shù)應(yīng)用到知識產(chǎn)權(quán)信息檢索服務(wù)中,著力構(gòu)建其專門的知識產(chǎn)權(quán)信息檢索服務(wù)提供系統(tǒng),這樣才能夠確保知識產(chǎn)權(quán)信息檢索需求被更加優(yōu)質(zhì)的完成,完善我國社會發(fā)展期間的信息檢索服務(wù)體系。
參考文獻(xiàn):
[1]谷參.基于分布式結(jié)構(gòu)的圖書館信息檢索服務(wù)系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2017,40(1):83-85.
[2]劉銳.基于大數(shù)據(jù)和云盾技術(shù)的地方專利信息檢索系統(tǒng)研究[J].電腦知識與技術(shù),2019,15(2):7-8.
作者簡介:
郭旦雄,郭曉珍,郭曉梫,唐強(qiáng),四川省成都市,成都行曦知識產(chǎn)權(quán)服務(wù)有限公司。