• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      智能知識(shí)庫(kù)工程模型淺析

      2018-02-14 12:49:08王歡

      王歡

      摘要:信息時(shí)代來臨,智能搜索已成為大勢(shì)所趨。本文運(yùn)用組件技術(shù)構(gòu)建一種實(shí)現(xiàn)智能知識(shí)庫(kù)的工程模型。通過用戶接口、轉(zhuǎn)換查詢,數(shù)據(jù)存儲(chǔ)等組件實(shí)現(xiàn)英語(yǔ)語(yǔ)言模型的初步查詢檢索。最后對(duì)本模型相關(guān)組件功能擴(kuò)展進(jìn)行了展望。

      關(guān)鍵詞:智能知識(shí)庫(kù);散列表;信息搜索

      中圖分類號(hào):TP182? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1007-9416(2018)10-0000-00

      信息時(shí)代的到來,人們獲取知識(shí)的途徑多種多樣。但獲取結(jié)果并不完全盡如人意。搜索引擎搜到的結(jié)果往往是重復(fù)的價(jià)值較低的內(nèi)容,甚至有很多完全不相關(guān)的東西。絕大多數(shù)論壇又不夠?qū)I(yè),一個(gè)問題往往不是沒有解答就是有很多不夠滿意的答復(fù)版本。求助于電子數(shù)據(jù)庫(kù),往往又遇到付費(fèi)的尷尬。智能知識(shí)庫(kù)[2]應(yīng)運(yùn)而生。

      本文用現(xiàn)有的技術(shù)手段描述出了一種實(shí)現(xiàn)智能知識(shí)庫(kù)的工程模型。該模型總體上分為三個(gè)組件[4](即三個(gè)agent):用戶接口組件,轉(zhuǎn)換查詢組件和數(shù)據(jù)存儲(chǔ)組件。信息查詢時(shí),用戶接口組件接受不同形式的用戶查詢指令,并轉(zhuǎn)化為統(tǒng)一的內(nèi)部查詢方式傳遞給轉(zhuǎn)換查詢組件;轉(zhuǎn)換查詢組件將傳遞來的內(nèi)部查詢方式轉(zhuǎn)換為具體的存儲(chǔ)查詢方式,并傳遞給數(shù)據(jù)存儲(chǔ)組件;數(shù)據(jù)存儲(chǔ)組件按查詢條件查詢出所需的信息,并回傳給用戶接口組件。評(píng)價(jià)反饋時(shí),用戶通過用戶接口組件給所查得的信息一個(gè)評(píng)價(jià),并由用戶接口組件直接傳給數(shù)據(jù)存儲(chǔ)組件。信息錄入時(shí),與查詢時(shí)相同,只是查詢到已有此信息則可以繼續(xù)編輯,沒有就可以創(chuàng)建。本知識(shí)庫(kù)工程模型結(jié)構(gòu)如圖1所示。

      1 用戶接口組件

      用戶接口組件是最復(fù)雜的組件,其主要作用就是一個(gè)詞法分析器。將用戶用于查詢的自然語(yǔ)言轉(zhuǎn)化為內(nèi)部表示的查詢語(yǔ)言符號(hào)。由于自然語(yǔ)言過于龐大和復(fù)雜,因此本知識(shí)庫(kù)所使用的查詢語(yǔ)言只是自然語(yǔ)言[3]的一個(gè)很有限的正則子集,只有英語(yǔ)的一般疑問句形式,即“疑問詞+助動(dòng)詞+主語(yǔ)”的形式。將查詢語(yǔ)言的形式規(guī)定為什么是、何時(shí)、何地、如何、為何等幾種固定的問句形式。也就是語(yǔ)法是確定的,因此就不必再做語(yǔ)法分析[1],語(yǔ)義也隨之確定。這樣便大大簡(jiǎn)化了系統(tǒng)模型,易于實(shí)現(xiàn)、擴(kuò)展和維護(hù)。

      要保證正確理解用戶的查詢意圖是最困難的,尤其是漢語(yǔ)這種語(yǔ)義豐富的語(yǔ)言,因此分詞技術(shù)就顯得很重要。然而考慮到每個(gè)人的語(yǔ)法習(xí)慣不同,無論是經(jīng)典的正向或者反向匹配,還是改進(jìn)的加窗的最大匹配,抑或是現(xiàn)在流行的基于統(tǒng)計(jì)的方法,通用的分詞方法都是很難實(shí)現(xiàn)的。由于本知識(shí)庫(kù)查詢語(yǔ)言模型只是英語(yǔ)[7]的一般疑問句形式,分詞方面只要簡(jiǎn)單的正向匹配即可。

      本模型使用散列函數(shù)法將多樣的用戶查詢語(yǔ)言符號(hào)(如:什么時(shí)候、何時(shí)、哪一天、幾點(diǎn))轉(zhuǎn)化成單一確定的內(nèi)部表示的查詢語(yǔ)言符號(hào)。由于散列表[5]幾乎是確定的并且是線性對(duì)應(yīng)的,這樣大大避免了語(yǔ)言符號(hào)沖突問題。符號(hào)轉(zhuǎn)換散列表如圖2所示。對(duì)于散列表還可以改進(jìn)為從配置文件讀入關(guān)鍵字,這樣對(duì)關(guān)鍵字的增刪修改都將是很方便靈活的。

      2 轉(zhuǎn)換查詢組件

      轉(zhuǎn)換查詢組件的主要作用就相當(dāng)于一個(gè)代碼生成器。相對(duì)來說比較簡(jiǎn)單,只是將用戶接口組件轉(zhuǎn)化生成的內(nèi)部表示的查詢語(yǔ)言:正則確定的英語(yǔ)一般疑問句,轉(zhuǎn)化為具體的存儲(chǔ)查詢方式。可使用數(shù)據(jù)庫(kù)做存儲(chǔ)(如標(biāo)準(zhǔn)SQL語(yǔ)言),也可以使用一般的Web頁(yè)面做存儲(chǔ),或使用某種基于字符串查找的自定義查詢語(yǔ)言。

      3 數(shù)據(jù)存儲(chǔ)組件

      數(shù)據(jù)存儲(chǔ)組件則主要是對(duì)不同數(shù)據(jù)進(jìn)行分類存儲(chǔ),比如具體的分為:自然科學(xué)、工科、計(jì)算機(jī)科學(xué)、編譯技術(shù)、詞法分析,使得存儲(chǔ)和查詢都有規(guī)律,提高存儲(chǔ)和查詢的效率,查詢時(shí)還可預(yù)先選擇分類以更加精確快速的查找。同一個(gè)信息屬于不同的分類可以建立鏈接,以減小不必要的數(shù)據(jù)冗余。數(shù)據(jù)庫(kù)中的信息可以被實(shí)時(shí)修改和更新。

      為了保證檢索質(zhì)量同時(shí)又可以直接獲得全文,存儲(chǔ)中用了一個(gè)獨(dú)立的技術(shù)來確保信息的質(zhì)量。該技術(shù)就是取自生物學(xué)中的“用進(jìn)廢退”學(xué)說[5],形式是一個(gè)評(píng)價(jià)函數(shù),該評(píng)價(jià)函數(shù)由用戶操作實(shí)現(xiàn)。具體實(shí)現(xiàn)方法是,將那些用戶索取次數(shù)多、給出評(píng)價(jià)高的信息累計(jì)給出一個(gè)較高的計(jì)數(shù)值。例如:賦予某方面的專家對(duì)他所熟悉的領(lǐng)域中的信息有較高評(píng)價(jià)權(quán)值,這樣既民主又公平。

      4 結(jié)語(yǔ)

      本智能知識(shí)庫(kù)模型的三個(gè)組件都尚有很大的改進(jìn)和擴(kuò)展空間。比如用戶接口組件可以改進(jìn)的識(shí)別更多的自然語(yǔ)言語(yǔ)法;轉(zhuǎn)換查詢組件可擴(kuò)展支持更多更豐富的查詢方式;數(shù)據(jù)存儲(chǔ)組件可以支持更多更好的存儲(chǔ)形式,提供更好的匹配模式和評(píng)價(jià)機(jī)制。由于三個(gè)組件是相互獨(dú)立的,中間僅以接口來傳遞信息,還可以把數(shù)據(jù)存儲(chǔ)組件換成一個(gè)搜索組件,做成一個(gè)更加智能的搜索引擎,而不必像現(xiàn)在的搜索引擎那樣,搜“GRE滿分”搜到一大堆重復(fù)的“GRE滿分作文”“GRE滿分閱讀”之類的話題。此外還可以加入其他組件來實(shí)現(xiàn)更多的功能,只要沿用現(xiàn)有組件間通信方式既可。

      參考文獻(xiàn)

      [1]Allen J, Natural Language Understanding, 2nd ed. , The Benjamin/Cummings Publishing Company, Inc. ,1994:101-136.

      [2][美] Alexander M. Meystel, James S. Albus 著,馮祖仁,李人厚,等譯.智能系統(tǒng)——結(jié)構(gòu)、設(shè)計(jì)與控制[M].電子工業(yè)出版社,2005.

      [3]王小捷,常寶寶.自然語(yǔ)言處理技術(shù)基礎(chǔ)[M].北京郵電大學(xué)出版社,2002.

      [4]Donald E. Knuth, The Art of Computer Programming,Vol. 3 Sorting and Searching, 2nd ed., Addison Wesley Longman, 1998:65-75.

      [5]Robert Sedgewick, Algorithms in C, 3th ed., Addison Wesley, 1998:98-116.

      [6]Steven S. Muchnick, Advanced Compiler Design and Implementation,? Elsevier Science, 1997:210-244.

      [7][美]Betty Schrampfer Azar著,宋云峰 譯,西蒙高級(jí)英語(yǔ)語(yǔ)法[M].外語(yǔ)教學(xué)與研究出版社,1998.

      Analysis of Intelligent Knowledge Base Engineering Model

      WANG Huan

      (Tangshan College, Tangshan Hebei? 063016)

      Abstract: With the advent of the information age, intelligent search has become the trend of the times. In this paper, we use component technology to construct an engineering knowledge base. Through user interface, conversion query, data storage and other components, the preliminary query and retrieval of English language model is realized. Finally, the functional expansion of the related components of the model is prospected.

      Key word: Intelligent knowledge base;Hash table;Information search

      灌云县| 札达县| 娄烦县| 宜兴市| 会东县| 大同县| 黔东| 丹江口市| 绥滨县| 邹城市| 习水县| 富宁县| 巫山县| 柳江县| 梁平县| 郁南县| 平南县| 宁明县| 四会市| 永顺县| 颍上县| 徐汇区| 藁城市| 都江堰市| 邓州市| 响水县| 博乐市| 东乡县| 康保县| 长宁县| 夏津县| 龙里县| 宜昌市| 霸州市| 龙州县| 万山特区| 宜兰县| 镇江市| 东宁县| 双流县| 同心县|