• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      房產(chǎn)自動(dòng)應(yīng)答(FAQ)系統(tǒng)的發(fā)展

      2012-08-15 00:43:59
      關(guān)鍵詞:中間件分詞密鑰

      徐 軼

      (赤峰學(xué)院 國(guó)有資產(chǎn)管理處,內(nèi)蒙古 赤峰 024000)

      房產(chǎn)自動(dòng)應(yīng)答(FAQ)系統(tǒng)的發(fā)展

      徐 軼

      (赤峰學(xué)院 國(guó)有資產(chǎn)管理處,內(nèi)蒙古 赤峰 024000)

      本文根據(jù)房產(chǎn)中的應(yīng)答系統(tǒng)的特點(diǎn),采用了自然語(yǔ)言處理技術(shù),并對(duì)關(guān)鍵技術(shù)進(jìn)行了分析.

      自動(dòng)應(yīng)答系統(tǒng);分詞;數(shù)據(jù)庫(kù)加密

      1 自動(dòng)應(yīng)答系統(tǒng)的發(fā)展現(xiàn)狀與趨勢(shì)

      自動(dòng)應(yīng)答系統(tǒng)(Question Answer System,QAS)是一種基于因特網(wǎng)的高性能的軟件系統(tǒng).隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和互聯(lián)網(wǎng)資源的不斷完善,自動(dòng)應(yīng)答系統(tǒng)廣泛應(yīng)用于數(shù)字化城市建設(shè)、客戶咨詢服務(wù)、遠(yuǎn)程教育網(wǎng)的自動(dòng)答疑、移動(dòng)無(wú)線互聯(lián)網(wǎng)業(yè)務(wù)等場(chǎng)合.這一系統(tǒng)的核心技術(shù)是基于自然語(yǔ)言理解的相關(guān)技術(shù),包括知識(shí)信息的語(yǔ)義網(wǎng)絡(luò)表示、自然語(yǔ)言理解策略等.

      自動(dòng)應(yīng)答系統(tǒng)在很多方面已經(jīng)開(kāi)始取代一些煩瑣的業(yè)務(wù)受理服務(wù).首先在查詢方面,如航班查詢、電話費(fèi)查詢、高考分?jǐn)?shù)查詢等等;其次,在通訊方面,如電話自動(dòng)應(yīng)答,傳真機(jī)應(yīng)答,數(shù)字存儲(chǔ)式自動(dòng)應(yīng)答錄音系統(tǒng)等.這些自動(dòng)應(yīng)答式系統(tǒng)從時(shí)間上提高了效率,但是這些服務(wù)通常是一些比較固定的業(yè)務(wù)模式,還不能做到根據(jù)用戶提出的問(wèn)題,進(jìn)行理解后再回答相關(guān)的業(yè)務(wù)問(wèn)題,還不能算得上是真正意義上的自動(dòng)應(yīng)答,嚴(yán)格地說(shuō)應(yīng)該是一種受限制的自動(dòng)應(yīng)答系統(tǒng).

      2 自動(dòng)應(yīng)答系統(tǒng)的主要功能

      自動(dòng)應(yīng)答系統(tǒng)是利用問(wèn)題的普遍性和共性而提出的.系統(tǒng)首先由經(jīng)驗(yàn)豐富的專家將大量的常見(jiàn)答案保存在應(yīng)答系統(tǒng)的答案庫(kù)中,當(dāng)用戶將想要提出的問(wèn)題提交給系統(tǒng)時(shí),系統(tǒng)首先去理解這個(gè)問(wèn)題,之后在答案庫(kù)中找到相關(guān)的答案提交給用戶進(jìn)行參考學(xué)習(xí).由于用戶對(duì)同樣的問(wèn)題理解一般有形似之處,提出問(wèn)題也大多相同,因此當(dāng)答案庫(kù)初期建立得比較好時(shí),用戶提出的問(wèn)題的答案也大都能存在答案庫(kù)中,由系統(tǒng)給出滿意的答案,大大減少了答疑專家的工作量,用戶的問(wèn)題也能得到及時(shí)回答.隨著系統(tǒng)使用時(shí)間的增加,答案庫(kù)將因?qū)<业牟粩嗷卮鹦聠?wèn)題而自動(dòng)擴(kuò)大,系統(tǒng)也將變得越來(lái)越實(shí)用和高效,形成可以檢索的問(wèn)答知識(shí)庫(kù).

      3 自動(dòng)應(yīng)答系統(tǒng)的關(guān)鍵技術(shù)

      3.1 C/S體系結(jié)構(gòu)及相關(guān)技術(shù)

      C/S(Client/Server)結(jié)構(gòu),即是大家熟知的客戶機(jī)和服務(wù)器結(jié)構(gòu).它是軟件系統(tǒng)體系結(jié)構(gòu),表示著一個(gè)應(yīng)用與一個(gè)服務(wù)器之間的相關(guān)性.隨著局域網(wǎng)絡(luò)和分布式系統(tǒng)結(jié)構(gòu)的迅猛發(fā)展,對(duì)C/S的理解越來(lái)越復(fù)雜和深刻.在結(jié)構(gòu)上具有很多差別的許多系統(tǒng)都被稱為C/S結(jié)構(gòu).

      C/S技術(shù)本身就是一種分布處理技術(shù),通過(guò)它可以充分利用兩端硬件環(huán)境的優(yōu)勢(shì)特點(diǎn),將任務(wù)合理分配到Client端以及Server端來(lái)實(shí)現(xiàn),降低系統(tǒng)的通訊費(fèi)用、軟件開(kāi)發(fā)與維護(hù)成本,增強(qiáng)應(yīng)用的可移植性,提高用戶的使用效率,保護(hù)用戶的投資,減少對(duì)小型計(jì)算機(jī)和大型計(jì)算機(jī)的需求.C/S具有以下特征:

      C/S是分離的邏輯實(shí)體,它們通過(guò)網(wǎng)絡(luò)協(xié)同工作來(lái)完成一項(xiàng)工作.在C/S環(huán)境下,應(yīng)用成分包括界面表示邏輯、業(yè)務(wù)邏輯、數(shù)據(jù)邏輯和DBMS以及數(shù)據(jù)在網(wǎng)絡(luò)上的分布.網(wǎng)絡(luò)節(jié)點(diǎn)就可以分為Client和Server,Client是請(qǐng)求服務(wù)的節(jié)點(diǎn);Server是執(zhí)行請(qǐng)求服務(wù)的節(jié)點(diǎn).Client和Server通過(guò)連接他們的中間件來(lái)協(xié)作完成某一任務(wù).CIient、Server和中間件就構(gòu)成了C/S的基本結(jié)構(gòu).

      3.1.1 Client:C/S應(yīng)用是以Client為中心的,Client運(yùn)行應(yīng)用程序的客戶部分.它運(yùn)行于一個(gè)支持GUI而且能訪問(wèn)分布式服務(wù)的操作系統(tǒng)上.操作系統(tǒng)最常見(jiàn)的情況就是要把工作傳遞給中間件,讓Server處理非本地服務(wù).

      3.1.2 Server:運(yùn)行應(yīng)用程序的服務(wù)器部分.Server依靠操作系統(tǒng)和輸入服務(wù)器請(qǐng)求的中間件進(jìn)行聯(lián)系.Sevrer最典型的分工就是作為數(shù)據(jù)庫(kù)的服務(wù)器.一般而言,數(shù)據(jù)庫(kù)的服務(wù)器應(yīng)能提供高速度大容量的存儲(chǔ)能力,還有較強(qiáng)的處理能力,以及并發(fā)運(yùn)行多個(gè)應(yīng)用程序的能力.隨著技術(shù)的發(fā)展,Server的功能與范圍將不斷地?cái)U(kuò)大.

      3.1.3 中間件:是一種獨(dú)立的系統(tǒng)軟件或服務(wù)程序,分布式應(yīng)用軟件利用這種軟件在不同的技術(shù)之間共享資源,中間件位于客戶機(jī)服務(wù)器的操作系統(tǒng)之上,管理計(jì)算資源和網(wǎng)絡(luò)通信.中間件處于操作系統(tǒng)軟件與用戶的應(yīng)用軟件的中間,處于操作系統(tǒng)、網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)之上,應(yīng)用軟件的下層,總的作用是為處于自己上層的應(yīng)用軟件提供運(yùn)行與開(kāi)發(fā)的環(huán)境,幫助用戶靈活、高效地開(kāi)發(fā)和集成復(fù)雜的應(yīng)用軟件.中間件是C/S基本結(jié)構(gòu)的中樞機(jī)構(gòu).

      最初的信息系統(tǒng)大多采用的是集中式的結(jié)構(gòu)模型,所有的處理和計(jì)算都由中心機(jī)房的主機(jī)完成,用戶端是沒(méi)有處理能力的終端.隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,人們對(duì)信息、資源的共享和充分利用提出了更高的要求,而出現(xiàn)了二層C/S結(jié)構(gòu)模型,隨著應(yīng)用的大型化,二層C/S結(jié)構(gòu)模型越來(lái)越不能滿足分布式應(yīng)用的要求,二層C/S結(jié)構(gòu)也逐漸向三層C/S結(jié)構(gòu)過(guò)渡.

      3.2 中文分詞技術(shù)

      中文自動(dòng)分詞是各種信息檢索、機(jī)器翻譯、語(yǔ)音識(shí)別、文本校對(duì)、文本挖掘等研究的前提和基礎(chǔ).因漢語(yǔ)句子構(gòu)成的復(fù)雜性,漢語(yǔ)自動(dòng)分詞已經(jīng)成為目前中文信息自動(dòng)處理的難點(diǎn).詞語(yǔ)是自然語(yǔ)言中有意義且可獨(dú)立運(yùn)用的最基本實(shí)體,而漢語(yǔ)文本是以字為單位的,要能使計(jì)算機(jī)從語(yǔ)義上識(shí)別漢語(yǔ),通常與要對(duì)漢語(yǔ)言文本進(jìn)行切分,而中文信息與英文信息有一個(gè)明顯的差別:英文單詞之間是用空格分開(kāi)的,而在中文文本里,詞與詞之間沒(méi)有天然分隔符,中文詞匯大多都是由兩個(gè)或兩個(gè)以上的漢字組成的,語(yǔ)句是連續(xù)書寫的,所以對(duì)中文文本分析前,先將整句割成小的詞匯單元,即為中文分詞(中文切詞).從現(xiàn)有的成果看,中文分詞可以分為兩大類:一類是基于詞典與規(guī)則的字符匹配算法,另一類是基于統(tǒng)計(jì)的無(wú)詞典切分算法.前者實(shí)用高效,因而在實(shí)踐中應(yīng)用廣泛.

      在自動(dòng)應(yīng)答系統(tǒng)中,自動(dòng)分詞模塊的速度影響整個(gè)系統(tǒng)的效率.中文信息檢索主要有兩種:基于字的檢索和基于詞的檢索和基于字的檢索系統(tǒng)建立單字索引.在檢索時(shí)得到每個(gè)字的檢索,而后加以適當(dāng)?shù)剡壿嬤\(yùn)算,從而得到檢索結(jié)果.而基于詞匯的檢索系統(tǒng)對(duì)詞匯建立索引,檢索詞匯時(shí)一次命中.本系統(tǒng)是采用基于關(guān)鍵詞的檢索來(lái)實(shí)現(xiàn)中文信息檢索.

      自動(dòng)分詞的基本算法有:基于字符串匹配分詞方法和基于統(tǒng)計(jì)的分詞方法.本系統(tǒng)采用了基于字符串匹配的分詞.

      基于字符串匹配的分詞方法:

      這種方法又叫做機(jī)械分詞方法,它是按照一定的方法將待分析的漢字串與一個(gè)“充分大的”機(jī)器詞典中的詞條進(jìn)行匹配,若在詞典中找到某字符串,則匹配成功.按照掃描方向的不同,字符串匹配分詞方法又可分為正向匹配和逆向匹配;按照不同長(zhǎng)度優(yōu)先匹配的原則,可以分為最大匹配和最小匹配;按照是否與詞性標(biāo)注過(guò)程相結(jié)合,又可以分為單純分詞方法和分詞與標(biāo)注相結(jié)合的一體化方法.常用的幾種機(jī)械分詞方法如下:

      (a)正向最大匹配法(由左到右的方向);

      (b)逆向最大匹配法(由右到左的方向);

      (c)最少切分(使每一句中切出的詞數(shù)最?。?

      字符串匹配的分詞還可將上述各種方法相互組合,例如,可以將正向最大匹配方法和逆向最大匹配方法結(jié)合起來(lái)構(gòu)成雙向匹配法.由于漢語(yǔ)單字成詞的特點(diǎn),正向最小匹配和逆向最小匹配一般使用很少.逆向匹配的切分精度略高于正向匹配,遇到的歧義現(xiàn)象也比較少.統(tǒng)計(jì)結(jié)果表明,單純使用正向最大匹配的錯(cuò)誤率為1/169,單純使用逆向最大匹配的錯(cuò)誤率為1/245.但這種精度還不能滿足實(shí)際的需要.實(shí)際使用的分詞系統(tǒng),都是把機(jī)械分詞作為一種初分手段,還需通過(guò)利用其它的語(yǔ)言信息來(lái)進(jìn)一步提高切分的準(zhǔn)確率.一種方法是改進(jìn)掃描方式,稱為特征掃描或標(biāo)志切分.就是優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞,以這些詞作為斷點(diǎn),將原字符串分為較小的串再來(lái)進(jìn)機(jī)械分詞,繼而減少匹配的錯(cuò)誤率;另一種方法是將分詞和詞類標(biāo)注結(jié)合起來(lái),利用豐富的詞類信息對(duì)分詞決策提供幫助,并且在標(biāo)注過(guò)程中又反過(guò)來(lái)對(duì)分詞結(jié)果進(jìn)行調(diào)整、檢驗(yàn),從而極大地提高了切分的準(zhǔn)確率.

      3.3 數(shù)據(jù)庫(kù)加密

      數(shù)據(jù)加密就是將明文數(shù)據(jù)經(jīng)過(guò)一定的交換(一般為變序和代替)變成密文數(shù)據(jù).數(shù)據(jù)解密就是加密的逆過(guò)程,即將密文數(shù)據(jù)轉(zhuǎn)變成可見(jiàn)的明文數(shù)據(jù).

      一個(gè)密碼系統(tǒng)包含明文集合、密文集合、密鑰集合和算法,其中密鑰和算法構(gòu)成了密碼系統(tǒng)的基本單元.算法是一些公式、法則或程序,它規(guī)定明文密文之間的變換方法,密鑰可以看作算法中的參數(shù).

      數(shù)據(jù)庫(kù)密碼系統(tǒng)要求將明文數(shù)據(jù)加密成密文數(shù)據(jù),數(shù)據(jù)庫(kù)中存儲(chǔ)密文數(shù)據(jù)查詢時(shí),將密文數(shù)據(jù)取出并解密即可得到明文信息.

      較之傳統(tǒng)的數(shù)據(jù)加密技術(shù),數(shù)據(jù)庫(kù)密碼系統(tǒng)有其自身的要求和特點(diǎn).傳統(tǒng)的加密以報(bào)文為單位,加密解密都是從頭至尾順序進(jìn)行.數(shù)據(jù)庫(kù)數(shù)據(jù)的使用方法決定了它不可能以整個(gè)數(shù)據(jù)庫(kù)文件為單位進(jìn)行加密.當(dāng)符合檢索條件的記錄被檢索出來(lái)后,就必須對(duì)該記錄迅速解密,然而該記錄是數(shù)據(jù)庫(kù)文件中隨機(jī)的一段,無(wú)法從中間開(kāi)始解密.因此,必須解決隨機(jī)地從數(shù)據(jù)庫(kù)文件中某一段數(shù)據(jù)開(kāi)始解密的問(wèn)題.

      3.3.1 數(shù)據(jù)庫(kù)密碼系統(tǒng)應(yīng)采用公開(kāi)密鑰:傳統(tǒng)的密碼系統(tǒng)中,密鑰是秘密的,知道的人越少越好.而數(shù)據(jù)庫(kù)數(shù)據(jù)是共享的,有權(quán)限的用戶需要知道密鑰以便于隨時(shí)查詢數(shù)據(jù).因此,數(shù)據(jù)庫(kù)密碼系統(tǒng)宜采用公開(kāi)密鑰的加密方法.

      3.3.2 多級(jí)密鑰結(jié)構(gòu):數(shù)據(jù)庫(kù)關(guān)系運(yùn)算中參與運(yùn)算的最小單位是字段,查詢路徑依次是庫(kù)名、表名、記錄名和字段名.因此,字段是最小的加密單位.也就是說(shuō)當(dāng)查到一個(gè)數(shù)據(jù)后,該數(shù)據(jù)所在的庫(kù)名、表名、記錄名、字段名都應(yīng)是知道的.對(duì)應(yīng)的庫(kù)名、表名、記錄名、字段名都應(yīng)該具有自己的子密鑰,這些子密鑰組成了一個(gè)能夠隨時(shí)加密解密的公開(kāi)密鑰.這樣,可以設(shè)計(jì)一個(gè)數(shù)據(jù)庫(kù),其中存放有關(guān)數(shù)據(jù)庫(kù)名、表名、字段名的子密鑰,系統(tǒng)啟動(dòng)后將這些子密鑰讀入內(nèi)存供數(shù)據(jù)庫(kù)用戶使用.與記錄相對(duì)應(yīng)的子密鑰,一般的方法應(yīng)是在該記錄中增加一條子密鑰數(shù)據(jù)字段.

      3.3.3 加密機(jī)制:有些公開(kāi)密鑰體制的密碼(如RSA密碼),其加密密鑰是公開(kāi)的,算法也是公開(kāi)的,但是其算法是每個(gè)人一套.而作為數(shù)據(jù)庫(kù)密碼的加密算法不可能因人而異,因?yàn)閷ふ疫@種算法有其自身的困難和局限性,機(jī)器中也不可能存放很多種算法,因此這類典型的公開(kāi)密鑰的加密體制不適合于數(shù)據(jù)庫(kù)加密.數(shù)據(jù)庫(kù)加密解密的密鑰應(yīng)該是相同的、公開(kāi)的,而加密算法應(yīng)該是絕對(duì)保密的.

      目前房產(chǎn)自動(dòng)應(yīng)答系統(tǒng)還正處于發(fā)展階段,一些不科學(xué)、不完善的地方會(huì)在應(yīng)用中逐步得到解決,相信隨著我國(guó)房地產(chǎn)市場(chǎng)的不斷發(fā)展壯大,房產(chǎn)自動(dòng)應(yīng)答系統(tǒng)會(huì)得到大量推廣使用,為我國(guó)的房地產(chǎn)事業(yè)做出更大的貢獻(xiàn).

      TP311.5

      A

      1673-260X(2012)04-0020-02

      猜你喜歡
      中間件分詞密鑰
      探索企業(yè)創(chuàng)新密鑰
      密碼系統(tǒng)中密鑰的狀態(tài)與保護(hù)*
      結(jié)巴分詞在詞云中的應(yīng)用
      RFID中間件技術(shù)及其應(yīng)用研究
      電子制作(2018年14期)2018-08-21 01:38:10
      基于VanConnect中間件的設(shè)計(jì)與開(kāi)發(fā)
      一種對(duì)稱密鑰的密鑰管理方法及系統(tǒng)
      基于ECC的智能家居密鑰管理機(jī)制的實(shí)現(xiàn)
      值得重視的分詞的特殊用法
      中間件在高速公路領(lǐng)域的應(yīng)用
      高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
      方山县| 万山特区| 浦东新区| 汝南县| 青龙| 永年县| 仙游县| 茂名市| 柏乡县| 乐清市| 上高县| 衡阳市| 嘉义县| 阜新市| 沁水县| 塔河县| 瑞金市| 宜丰县| 临安市| 辽宁省| 时尚| 萨迦县| 句容市| 平度市| 黔南| 东兰县| 遂溪县| 伽师县| 崇信县| 阳西县| 乃东县| 洪江市| 淅川县| 东至县| 伊宁市| 武强县| 阳朔县| 新乡县| 苏尼特右旗| 永靖县| 龙海市|