劉文靜,蔡章利,盧 海
(1.重慶航天職業(yè)技術(shù)學(xué)院 人文社科系,重慶 400000;2.重慶大學(xué)a.信息物理社會可信服務(wù)計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室;b.自動(dòng)化學(xué)院,重慶 400044)
隨著社會經(jīng)濟(jì)的快速發(fā)展,人們對生活質(zhì)量的要求越來越高,外出旅游的人越來越多。為了更好地促進(jìn)中國旅游業(yè)高質(zhì)量發(fā)展,國家旅游局2015年1月發(fā)布了《關(guān)于促進(jìn)智慧旅游發(fā)展的指導(dǎo)意見》,指出“智慧旅游是運(yùn)用新一代信息網(wǎng)絡(luò)技術(shù)和裝備,充分準(zhǔn)確及時(shí)感知和使用各類旅游信息,從而實(shí)現(xiàn)旅游服務(wù)、旅游管理、旅游營銷、旅游體驗(yàn)的智能化,促進(jìn)旅游業(yè)態(tài)向綜合性和融合型轉(zhuǎn)型提升”[1]。
游客到達(dá)旅游地后,景區(qū)導(dǎo)游的重要職責(zé)是講好景點(diǎn)故事,引導(dǎo)游客進(jìn)入觀賞意境,提升旅游體驗(yàn)。好的講解服務(wù)能帶給游客好的旅游體驗(yàn),增長旅游知識!由于景區(qū)導(dǎo)游自身知識水平、責(zé)任心和服務(wù)收費(fèi)等原因,游客往往難以享受到高質(zhì)量、低成本的個(gè)性化講解服務(wù),更多是一大群人跟著導(dǎo)游走馬觀花式地觀賞,旅游沉浸感不強(qiáng)。為了提升講解服務(wù)質(zhì)量和降低服務(wù)成本,國內(nèi)不少景區(qū)建設(shè)了電子講解系統(tǒng),研究人員提出了一些系統(tǒng)實(shí)現(xiàn)方案[2-4],市場上也有美景聽聽、三毛游FM、旅游精靈等智能手機(jī)APP供游客下載使用。但這些系統(tǒng)目前都是通過紅外感應(yīng)/掃碼/觸屏啟動(dòng)的廣播式解說,缺乏人與人間的自然語音互動(dòng)交流能力,游客參與感不強(qiáng)。
自然語言處理是人工智能的一個(gè)研究熱點(diǎn),目的是讓人以自然語音或文本方式和智能設(shè)備進(jìn)行交互,讓機(jī)器理解人的意圖并做出響應(yīng)。隨著語音識別技術(shù)的逐漸成熟,自然語言處理技術(shù)已開始應(yīng)用于醫(yī)療健康、電商客服、智能家居、鐵路售票、自動(dòng)駕駛等領(lǐng)域。比如微軟的小娜、蘋果手機(jī)的Siri、百度搜索的小度、淘寶客服的小蜜等智能系統(tǒng)[5-6]。但在旅游景區(qū)講解服務(wù)方面,筆者尚未看到自然語言處理應(yīng)用于該領(lǐng)域。因此,筆者主要探討如何綜合應(yīng)用自然語言處理、本體知識檢索、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算等技術(shù)實(shí)現(xiàn)一個(gè)支持游客用自然語言與其交互,能為游客提供個(gè)性化服務(wù)的旅游景區(qū)智能講解系統(tǒng)。
“五視圖法”是信息系統(tǒng)架構(gòu)設(shè)計(jì)常用的一種方法[7]。使用該方法設(shè)計(jì)了旅游景區(qū)智能講解系統(tǒng)的物理架構(gòu)和邏輯架構(gòu)。
隨著云計(jì)算、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的快速發(fā)展,支持“云大物移智”已成為信息系統(tǒng)設(shè)計(jì)遵循的一大準(zhǔn)則。按照“云+端”模式設(shè)計(jì)的旅游景區(qū)智能講解系統(tǒng)物理架構(gòu)如圖1所示。
圖1 系統(tǒng)的物理架構(gòu)圖Fig.1 Physical architecture of the system
在圖1所示物理架構(gòu)中,將整個(gè)系統(tǒng)分為游客移動(dòng)端和講解服務(wù)端2大部分,通過移動(dòng)互聯(lián)網(wǎng)連接起來。移動(dòng)端指安裝了本系統(tǒng)APP的游客智能手機(jī);服務(wù)端由安裝了本系統(tǒng)服務(wù)程序的云主機(jī)集群組成。為了讓移動(dòng)端APP具有通用性(即不局限于某個(gè)旅游景區(qū)才能使用),當(dāng)APP啟動(dòng)時(shí),系統(tǒng)首先與服務(wù)端的接入服務(wù)器通信,將定位數(shù)據(jù)發(fā)送給接入服務(wù)器查詢出游客當(dāng)前所處景區(qū),然后返回該景區(qū)的講解服務(wù)訪問地址給移動(dòng)端。移動(dòng)端APP根據(jù)該地址直接與景區(qū)服務(wù)器通信完成后續(xù)講解服務(wù)。為了兼顧各景區(qū)已有信息化投入和分流不同景區(qū)的游客并發(fā)訪問壓力,系統(tǒng)提供了2種方式供各景區(qū)選擇。1)以獨(dú)立訪問域的方式接入平臺,即各景區(qū)就近自建/租賃云主機(jī)并按本系統(tǒng)要求部署應(yīng)用程序后將訪問地址注冊到接入服務(wù)器;2)以獨(dú)立知識庫的方式入駐平臺,即各景區(qū)共用一套云主機(jī)和服務(wù)程序,但每個(gè)景區(qū)的講解知識庫相互獨(dú)立。方法1)的好處是不同景區(qū)的游客就近訪問自己的服務(wù)器,可以減少網(wǎng)絡(luò)擁堵和分流服務(wù)器訪問壓力,比較適合一些實(shí)力雄厚,游客量大的景區(qū)采用。方法2)的好處是可以減少景區(qū)前期投入成本,在數(shù)據(jù)就是資產(chǎn)的當(dāng)下?lián)碛袑儆谧约旱闹v解知識庫,可以自行決定是否免費(fèi)提供講解服務(wù),比較適合一些規(guī)模較小的旅游景區(qū)采用。
系統(tǒng)的邏輯架構(gòu)如圖2所示。從軟件角度來看,系統(tǒng)分為2大部分。一是可安裝于游客智能手機(jī)上的APP軟件,二是部署在服務(wù)端云主機(jī)上的講解服務(wù)程序。移動(dòng)端APP是游客享受景點(diǎn)講解服務(wù)的介質(zhì),提供了游客定位數(shù)據(jù)獲取、游客問詢語音輸入、系統(tǒng)應(yīng)答(包括講解、問詢、通知語音輸出/圖片展示/視頻播放)等功能。服務(wù)端講解服務(wù)程序主要完成語音識別、文本向量化處理、命名實(shí)體識別、對話狀態(tài)跟蹤、對話策略管理等自然語言處理功能,系統(tǒng)將根據(jù)游客意圖到景區(qū)的講解知識庫中檢索知識,最后生成講解內(nèi)容返回給移動(dòng)端APP。
圖2 系統(tǒng)的邏輯架構(gòu)圖Fig.2 Logical architecture of the system
如圖2所示,運(yùn)行于服務(wù)端的講解服務(wù)程序是系統(tǒng)最重要部分,主要由語音識別、文本向量化處理、命名實(shí)體識別等功能模塊組成。由于語音識別和生成技術(shù)目前已比較成熟,且有百度語音和科大訊飛等公司/機(jī)構(gòu)提供的SDK包供使用,因此,研究主要探討文本向量化處理、命名實(shí)體識別、對話策略管理、講解知識檢索4個(gè)核心功能模塊的關(guān)鍵技術(shù)。
文本向量化處理的目的是要將語音識別得到的用戶話語文本,經(jīng)獨(dú)熱編碼和詞嵌入處理,表示為系統(tǒng)后續(xù)模塊計(jì)算所需的實(shí)數(shù)域空間連續(xù)向量。詞嵌入是指把一個(gè)獨(dú)熱編碼得到的、維數(shù)為所有詞數(shù)量的高維空間向量,映射為一個(gè)維數(shù)較低的實(shí)數(shù)域空間的連續(xù)向量,目前主要有Glo Ve、Word2Vec、Fast Text、ELMo、Open AI GPT、基于Transformer的雙向編碼表示(BERT,bidirectional encoder representations from transformers)等方法[8-9]。
BERT是Google公司2018年提出的一種可用于多種語言處理的預(yù)訓(xùn)練模型,由多層Transformer編碼器組成。由于Google發(fā)布的BERT-base(Chinese)預(yù)訓(xùn)練模型是以字為粒度對中文進(jìn)行切分的,沒有考慮中文需要分詞的特點(diǎn),哈工大訊飛聯(lián)合實(shí)驗(yàn)室于2019年6月發(fā)布了考慮中文分詞的全詞覆蓋BERT中文預(yù)訓(xùn)練模型(簡稱Chinese-BERT-wwm)[10]。文獻(xiàn)[10]給出的實(shí)驗(yàn)結(jié)果表明:將Chinese-BERT-wwm用于機(jī)器閱讀理解、自然語言推理、情感分類、句對匹配和文檔分類等任務(wù),性能均比BERT-base(Chinese)提高了1~2個(gè)百分點(diǎn)。中文語義表示的最小單位是詞,不是字。2種模型相比,筆者認(rèn)為后者更適用于研究系統(tǒng),因此選用Chinese-BERT-wwm預(yù)訓(xùn)練模型來進(jìn)行文本向量化處理。
在本文系統(tǒng)中,命名實(shí)體識別(NER,named entity recognition)模塊用于將用戶話語中具有特定意義的實(shí)體(比如人名、地名、機(jī)構(gòu)名、景點(diǎn)名、景物名、景觀名、時(shí)間、數(shù)量、貨幣、比例數(shù)值等)辨識出來,填充到預(yù)定義好的語義槽中。該模塊的輸入是文本向量化模塊輸出的用戶話語詞向量,輸出是辨識出的槽值對,其邏輯結(jié)構(gòu)如圖3所示[11]。
圖3 命名實(shí)體識別邏輯結(jié)構(gòu)Fig.3 Logical structure of named entity recognition
在圖3所示結(jié)構(gòu)中,首先將用戶話語詞向量輸入雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM,bi-directional long short-term memory)模型做編碼處理,然后將處理結(jié)果輸入條件隨機(jī)場(CRF,conditional random field)模型計(jì)算,接著用BIO標(biāo)簽做序列標(biāo)記,最后根據(jù)標(biāo)記從序列中解析出對應(yīng)不同語義槽的每個(gè)命名實(shí)體,將它們組合成槽值對輸出。整個(gè)過程可抽象表示如下
式中:X∈Rn×d是BERT預(yù)訓(xùn)練模型編碼輸出的表示用戶話語的矩陣向量;n是用戶話語長度;d=768是向量維度;是BiLSTM模型訓(xùn)練后的前向權(quán)值矩陣,是訓(xùn)練后的前向偏置向量;是BiLSTM模型訓(xùn)練得到的后向權(quán)值矩陣,是后向偏置向量;m=128是BiLSTM的隱層大小;Wdense∈R2m×k和Bdense∈Rn×k是訓(xùn)練得到的全連接層(Dense)權(quán)重矩陣和偏置矩陣,k是標(biāo)記數(shù)量;Transitions∈Rk×k是CRF訓(xùn)練后得到的標(biāo)記轉(zhuǎn)移矩陣。Y是使用維特比算法Viterbi(·)求得的、對應(yīng)輸入X的標(biāo)記序列,根據(jù)預(yù)定義槽解析Y即可完成槽值填充。
對話策略管理是系統(tǒng)實(shí)現(xiàn)自然語言處理的另一核心模塊,主要完成游客意圖識別、系統(tǒng)動(dòng)作選擇、系統(tǒng)動(dòng)作生成等功能,其輸入是用戶話語詞向量和對話特征向量,輸出是待執(zhí)行的系統(tǒng)動(dòng)作,其邏輯結(jié)構(gòu)如圖4所示。
圖4 對話策略管理邏輯結(jié)構(gòu)Fig.4 Logical structure of dialogue strategy management
首先將用戶話語向量與表示歷史對話的對話特征向量拼接起來輸入Bi LSTM模型做編碼處理,然后對BiLSTM模型的輸出做全連接(Dense)變換處理和softmax分類計(jì)算,得到用戶話語對應(yīng)每個(gè)系統(tǒng)動(dòng)作的概率,其求取過程可抽象表示為式(2),接著經(jīng)過閾值比較篩選,排序選出概率最大的系統(tǒng)動(dòng)作,最后根據(jù)系統(tǒng)動(dòng)作模板和語義槽值信息生成完整的系統(tǒng)動(dòng)作后輸出[12]。
式中:X∈Rn×d是BERT預(yù)訓(xùn)練模型編碼輸出的用戶話語句向量xn與最近n-1輪對話中表示每輪對話狀態(tài)的特征向量xi(1≤i≤n-1)拼接所得的矩陣向量;d=768是向量維度;是BiLSTM模型訓(xùn)練后的前向權(quán)值矩陣,是訓(xùn)練后的前向偏置向量;∈R(d+m)×m是Bi LSTM模型訓(xùn)練得到的后向權(quán)值矩陣,是后向偏置向量;m=128是BiLSTM的隱層大小;Wdense∈R2m×k和bdense∈Rk是訓(xùn)練得到的全連接層(Dense)權(quán)重矩陣和偏置向量,k是預(yù)先定義系統(tǒng)動(dòng)作模板數(shù);p是使用softmax分類函數(shù)求得的當(dāng)前用戶話語對應(yīng)每個(gè)預(yù)定義系統(tǒng)動(dòng)作模板的概率向量。
如圖4所示,對話策略管理模塊除了需要對話狀態(tài)跟蹤模塊提供對話特征向量和語義槽值信息外,還需開發(fā)人員預(yù)先定義系統(tǒng)動(dòng)作模板。系統(tǒng)動(dòng)作是用戶意圖的反映,一個(gè)系統(tǒng)動(dòng)作模板可視為用戶話語要表達(dá)的一種意圖。將系統(tǒng)動(dòng)作分為通知(Inform)、問詢(Quest)、API_Call 3種類型。通知指系統(tǒng)在沒有游客問詢的情況下主動(dòng)發(fā)出消息,比如致詞歡迎游客到達(dá)景區(qū)等。問詢指系統(tǒng)無法識別出游客意圖或游客意圖明確但信息缺乏或不模糊時(shí),有針對性地引導(dǎo)游客提供信息。API_Call指系統(tǒng)準(zhǔn)確識別出游客意圖和所需語義槽值后向講解知識管理模塊發(fā)出的知識檢索請求。用本體方法來構(gòu)建旅游景區(qū)講解知識庫,本體的每種屬性都可能成為游客問詢的問題,因此API_Call類型的系統(tǒng)動(dòng)作模版可根據(jù)本體模型定義的屬性來生成。
當(dāng)系統(tǒng)識別出游客意圖后,講解知識檢索模塊將從景點(diǎn)講解知識庫中找出系統(tǒng)所需的講解知識,將其輸出給講解內(nèi)容生成模塊,由該模塊根據(jù)預(yù)先定義的講解模板和講解規(guī)則生成回復(fù)游客的講解詞。要檢索知識需要先做好知識建模。在知識管理研究領(lǐng)域,知識建模目前最常用的是本體(Ontology)方法。本體是一個(gè)源于哲學(xué)的概念,哲學(xué)用其來描述世界上客觀存在的所有人、事、物。在人工智能領(lǐng)域,最流行的本體定義是Gruber于1993年給出的“本體是共享概念的規(guī)范說明”[13]。按此定義,本體模型可抽象表示為三元組(概念、關(guān)系、屬性);其中,概念是對應(yīng)用領(lǐng)域中某類人、事、物的抽象表示,等同于面向?qū)ο筌浖_發(fā)方法中的類;關(guān)系用于反映概念間的繼承、泛化等層次關(guān)系和組合、聚合、依賴、擴(kuò)展、控制等關(guān)聯(lián)關(guān)系;屬性用于描述概念的靜態(tài)特征。
在旅游信息化領(lǐng)域,研究人員設(shè)計(jì)了 Mondeca-Tourism-Ontology、Harmonis-Ontology、OTASpecification、WDTourism等本體模型來滿足個(gè)性化旅游線路規(guī)劃、旅游景點(diǎn)推薦、旅游活動(dòng)推薦等旅游服務(wù)需求[14]。為了滿足游客的個(gè)性化講解服務(wù)需求,選用本體方法來建模旅游景區(qū)講解知識。通過分析旅游講解服務(wù)特點(diǎn)本文使用Protégé工具定義了景區(qū)、景點(diǎn)、景物、景觀、人物、事件、民族、地方特產(chǎn)、文化作品、節(jié)慶活動(dòng)等45個(gè)類(Class),定義了擁有、隸屬、寫作、品嘗、到訪、居住、拍攝等14種反映類間關(guān)聯(lián)關(guān)系的對象屬性(Object Property);定義了名稱、經(jīng)度、緯度、創(chuàng)建時(shí)間、面積大小、高度、長度、價(jià)格等56種數(shù)據(jù)屬性(Data Property)來反映類的靜態(tài)特征。研究所構(gòu)建的旅游本體模型如圖5所示。
圖5 旅游本體模型Fig.5 Tourism ontology model
知識檢索指根據(jù)用戶話語從知識庫中查詢或推理出滿足條件的知識。系統(tǒng)中,用戶話語經(jīng)過命名實(shí)體識別模塊、對話策略管理模塊的語義分析,已形式化為計(jì)算機(jī)可理解的系統(tǒng)動(dòng)作和語義槽值對,知識檢索將通過執(zhí)行API_Call類型的系統(tǒng)動(dòng)作來完成。如何檢索知識與知識的表示方法和存儲方式緊密相關(guān)。知識表示主要有資源描述框架(RDF,resource description framework)、資源描述框架模式(RDFS,resource description framework schema)和Web本體語言(OWL,web ontology language)等方法[15]。RDF使用類似于主謂賓的SPO三元組來表示知識,一個(gè)三元組就是一條知識。RDFS預(yù)定義了rdfs:Class等專用詞匯,解決了RDF無法區(qū)分類和對象,無法描述類的關(guān)系和屬性等不足。OWL是對RDFS的擴(kuò)展,增加了“owl:ObjectProperty”等詞匯來支持本體建模和知識推理。因此,選用OWL方法來表示本體知識,使用RDF/XML語法來序列化保存本體知識,使用知識檢索語言SPARQL來查詢本體知識。
為了檢驗(yàn)前述系統(tǒng)架構(gòu)和方法是否可行,作者通過實(shí)際開發(fā),驗(yàn)證了所研究系統(tǒng)是可行的,將從實(shí)驗(yàn)環(huán)境搭建、知識庫構(gòu)建、軟件功能實(shí)現(xiàn)、實(shí)驗(yàn)效果分析4個(gè)方面做簡要闡述。
為了模擬系統(tǒng)的運(yùn)行環(huán)境,使用3臺PC電腦(CPU 2.4GHz/內(nèi)存32G)和2部安卓智能手機(jī)構(gòu)建了實(shí)驗(yàn)環(huán)境。3臺電腦均安裝Cent OS6.5服務(wù)器操作系統(tǒng)。其中,1臺電腦用作服務(wù)端的統(tǒng)一接入服務(wù)器,1臺電腦用于旅游本體知識管理,1臺電腦用于自然語言處理。2部安卓智能手機(jī)安裝本系統(tǒng)APP軟件,用來模擬游客使用。
基于設(shè)計(jì)的旅游本體模型,以重慶瓷器口古鎮(zhèn)為例,通過人工整理網(wǎng)上收集的有關(guān)磁器口景區(qū)的介紹資料,在本體開發(fā)工具Protégé中構(gòu)建了磁器口的本體知識庫,并選用RDF/XML語法格式,以O(shè)WL文件方式保存在知識管理服務(wù)器上。如圖6所示。
圖6 重慶磁器口本體知識庫Fig.6 The ontology knowledge base of Chongqing Ciqikou
3.3.1 統(tǒng)一接入服務(wù)程序
統(tǒng)一接入服務(wù)程序主要完成游客賬號驗(yàn)證、所在景區(qū)定位等功能。使用Java編程語言和Spring Boot框架按Web服務(wù)方式實(shí)現(xiàn),對外提供Web API接口供移動(dòng)端APP啟動(dòng)時(shí)訪問。
3.3.2 自然語言處理程序
自然語言處理程序主要完成語音識別、文本向量化處理、命名實(shí)體識別、對話策略管理、對話狀態(tài)跟蹤、應(yīng)答語音生成、講解內(nèi)容生成等功能,是整個(gè)系統(tǒng)最核心的部分。首先基于Tensor Flow1.15.2用Python語言編程實(shí)現(xiàn)文本向量化處理、命名實(shí)體識別、對話狀態(tài)跟蹤、對話策略管理功能,然后用Java編程語言和Spring Boot框架將這些功能模塊封裝成Web服務(wù),對外提供Web API接口供移動(dòng)端APP訪問。
3.3.3 講解知識檢索程序
講解知識檢索程序主要完成旅游本體知識檢索等功能。使用Java編程語言和Spring Boot框架及Jena框架按Web服務(wù)方式實(shí)現(xiàn),提供Web API接口供自然語言處理程序內(nèi)部調(diào)用(即執(zhí)行API_Call類型的系統(tǒng)動(dòng)作)。當(dāng)Web API接口收到自然語言處理程序發(fā)來的知識檢索請求后,系統(tǒng)會首先將檢索請求解析為SPARQL語句,然后調(diào)用Jena框架提供的Query Factory類create()方法以及QueryExecution類execSelect()方法查詢知識。
3.3.4 移動(dòng)端APP
移動(dòng)端APP是游客與系統(tǒng)交互的介質(zhì),主要完成游客定位數(shù)據(jù)獲取、游客問詢語音輸入、系統(tǒng)應(yīng)答等功能。研究使用Android Studio集成開發(fā)工具和Java編程語言實(shí)現(xiàn)了安卓版APP,其運(yùn)行效果如圖7所示。當(dāng)游客在智能手機(jī)上啟動(dòng)該APP時(shí),系統(tǒng)會首先獲取游客當(dāng)前定位數(shù)據(jù),然后傳回服務(wù)端接入服務(wù)器識別出所在景區(qū)后,自動(dòng)播放景區(qū)預(yù)設(shè)的歡迎語音/圖片/視頻,游客可以按下頁面底端的圓形話筒按鍵開啟語音詢問功能,詢問語音傳回服務(wù)端后將由自然語言處理程序先請求百度語音識別接口將其轉(zhuǎn)換為文本,然后再繼續(xù)后續(xù)處理。為了便于查看效果,圖7所示APP界面在播放對話語音的同時(shí)顯示了對話文本,但游客實(shí)際使用時(shí)可關(guān)閉文本顯示功能,直接收聽或查看APP播放的圖片和視頻。
圖7 游客講解服務(wù)APP運(yùn)行效果Fig.7 Operation effect of tourist explanation service app
為了檢驗(yàn)系統(tǒng)的講解服務(wù)效果,首先從講解知識庫中隨機(jī)抽取部分類實(shí)例和屬性,設(shè)計(jì)了80個(gè)游客可能提出的問題,比如“磁器口最有名的小吃是什么?磁器口有多大?建文帝是誰?華子良在哪兒脫險(xiǎn)的?”等;然后人工標(biāo)定出每個(gè)問題的正確系統(tǒng)響應(yīng)并用做測試數(shù)據(jù);然后模擬游客向系統(tǒng)提問并記錄下每次系統(tǒng)響應(yīng)結(jié)果;最后計(jì)算系統(tǒng)的每輪對話響應(yīng)精度(PRA,per-response accuracy)值。PRA表示每輪對話系統(tǒng)回答用戶提問的正確率[16]。經(jīng)測算,系統(tǒng)的PRA分別為56%,達(dá)到了預(yù)期實(shí)驗(yàn)效果,能初步滿足旅游講解服務(wù)需求。
用人工智能、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)提升旅游服務(wù)、旅游管理、旅游營銷、旅游體驗(yàn)是中國開展智慧旅游建設(shè)的目的。自然語言處理是人工智能研究領(lǐng)域的一個(gè)熱點(diǎn),相關(guān)技術(shù)可廣泛用于人機(jī)對話、知識獲取、輿情監(jiān)測等應(yīng)用。主要從技術(shù)應(yīng)用的角度詳細(xì)探討了如何綜合運(yùn)用自然語言處理、本體知識管理、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算等技術(shù)來研發(fā)旅游景區(qū)智能講解系統(tǒng),目的是讓游客能通過自然語音對話方式享受低成本、高質(zhì)量的個(gè)性化旅游景區(qū)電子講解服務(wù)。通過實(shí)際開發(fā),驗(yàn)證了系統(tǒng)方案的可行性。但受限于自然語言處理目前在深層次推理、本體知識自動(dòng)獲取等方面的不足,系統(tǒng)在一些需要推理才能準(zhǔn)確識別游客意圖的復(fù)雜對話場景,仍會出現(xiàn)錯(cuò)誤應(yīng)答和無法回答等問題。對此,筆者將繼續(xù)對自然語言處理的命名實(shí)體識別方法、意圖識別方法,以及本體知識的自動(dòng)獲取方法等做進(jìn)一步研究。