余以勝
(廣東女子職業(yè)技術(shù)學(xué)院,廣東 廣州 511450)
隨著技術(shù)的進(jìn)步,當(dāng)今移動(dòng)設(shè)備要求提供互聯(lián)網(wǎng)服務(wù)的需求有不斷增長(zhǎng)的趨勢(shì)。當(dāng)服務(wù)提供商和產(chǎn)品供應(yīng)商在互聯(lián)網(wǎng)上提供市場(chǎng)和核心業(yè)務(wù)服務(wù)的同時(shí),還提供客戶服務(wù)。參考文獻(xiàn)[1]提出了基于人工智能技術(shù)(即稱為最優(yōu)-第一搜索)的構(gòu)架,討論了能擁有建立其中的搜索技術(shù)的代理程序。本文提出有全文搜索能力的獨(dú)立應(yīng)用構(gòu)架,可以在計(jì)算機(jī)、移動(dòng)電話上通過(guò)Web瀏覽,或通過(guò)固定電話語(yǔ)音交互,該構(gòu)架稱為交互式客戶服務(wù)代理ICSA(Interactive Customer Service Agent)。
WWW運(yùn)行在HTTP協(xié)議上,它是客戶/服務(wù)器體系結(jié)構(gòu),服務(wù)器位于一端且給體系結(jié)構(gòu)另一端的客戶提供Web頁(yè)服務(wù)。圖1所示為集成的體系結(jié)構(gòu),包含Web、WAP和Voice網(wǎng)絡(luò)。PC機(jī)對(duì)HTTP請(qǐng)求/響應(yīng)直接解釋;移動(dòng)設(shè)備使用稱為WAP的輕量級(jí)協(xié)議,以編譯的或二進(jìn)制格式表現(xiàn)信息。語(yǔ)音交互使用的語(yǔ)音網(wǎng)關(guān)可以由電信服務(wù)器、ASR服務(wù)器、TTS(Text To Speech)服務(wù)器和VoiceXML解釋器組成。
在Web體系結(jié)構(gòu)中,瀏覽器位于客戶端且用來(lái)解釋由服務(wù)器傳送來(lái)的HTML代碼。移動(dòng)設(shè)備要訪問(wèn)互聯(lián)網(wǎng),需要包交換網(wǎng)絡(luò),隨著GPRS(General Packet Radio Service)、EDGE(Enhanced Data for GSM Environment)和很多其他技術(shù)的出現(xiàn),條件現(xiàn)已具備。對(duì)這樣一個(gè)包交換網(wǎng)絡(luò),則要求通過(guò)WAP網(wǎng)關(guān)接入現(xiàn)有互聯(lián)網(wǎng)。WAP網(wǎng)關(guān)也連接到BTS(Base Transceiver Station),它為客戶端的移動(dòng)設(shè)備提供無(wú)線連接。
在Voice體系結(jié)構(gòu)中,由自動(dòng)話語(yǔ)識(shí)別器ASR(Automatic Speech Recognition)服務(wù)器執(zhí)行語(yǔ)音識(shí)別,由文本-話語(yǔ) (TTS)服務(wù)器執(zhí)行文本到話語(yǔ)的轉(zhuǎn)換。一個(gè)VoiceXML解釋器根據(jù)VoiceXML規(guī)格[2]執(zhí)行應(yīng)用程序。實(shí)現(xiàn)語(yǔ)音交互的常用方法有直接對(duì)話和混合交互語(yǔ)音響應(yīng)(IVR)兩種。其中直接對(duì)話較為流行,用戶與給出語(yǔ)音格式指令集的系統(tǒng)或應(yīng)用進(jìn)行交互。IVR應(yīng)用是基于程序設(shè)計(jì)語(yǔ)言,如VXML(VoiceExtensibleMark-up Language)和 SALT(Speech Application Language Tags)。
圖1 Web、WAP和Voice集成的體系結(jié)構(gòu)
一個(gè)多通道應(yīng)用系統(tǒng)將其內(nèi)容展示給終端用戶,是基于用戶代理實(shí)現(xiàn)的。在多通道訪問(wèn)中,企業(yè)數(shù)據(jù)和應(yīng)用系統(tǒng)可通過(guò)多個(gè)通道進(jìn)行訪問(wèn)。與多通道訪問(wèn)方式不同,多模態(tài)訪問(wèn)將多個(gè)通道組合形成同一個(gè)交互活動(dòng)或會(huì)話。X+V(XML+VXML)和SALT是開(kāi)發(fā)多模態(tài)應(yīng)用[3]的常用工具?;趩我恢髂J?Single Authoring)[4]的多模態(tài)應(yīng)用能夠使用SALT開(kāi)發(fā),而基于多著作模式(Multiple Authoring)的多模態(tài)應(yīng)用要求使用X+V。
多通道應(yīng)用也可以是單一著作模式或多著作模式。單一著作模式多通道應(yīng)用使用程序語(yǔ)言或標(biāo)注語(yǔ)言開(kāi)發(fā),該語(yǔ)言能夠?yàn)楦鞣N接口或設(shè)備重新生成具有可讀性的輸出。多著作模式多通道應(yīng)用將要求不止一種的程序語(yǔ)言或標(biāo)注語(yǔ)言為各種接口或設(shè)備產(chǎn)生可讀性輸出。XML(Extensible Mark-up Language)是一種標(biāo)注語(yǔ)言,可以使用XSLT(Extensible Stylesheet Language Translation)開(kāi)發(fā)單一著作模式多通道應(yīng)用。多著作模式多通道應(yīng)用將共享一個(gè)或多個(gè)部件,通常是數(shù)據(jù)庫(kù)的Web、WAP和Voice應(yīng)用的集成。
全文搜索技術(shù)在通用企業(yè)數(shù)據(jù)庫(kù)引擎中均有很好的支持。 Oracle、MySQL、Sybase、SQL Server和 PostgreSQL等是支持FTS(Full-Text Search)的主要數(shù)據(jù)庫(kù)引擎。FTS是一種索引搜索方法,它對(duì)數(shù)據(jù)庫(kù)表中的詞建立了索引,索引創(chuàng)建在由4個(gè)或更多個(gè)字符組成的詞上[5]。全文搜索的SQL實(shí)現(xiàn)隨著選用的數(shù)據(jù)庫(kù)引擎的不同而不同。
開(kāi)發(fā)單一著作模式的多通道應(yīng)用系統(tǒng)要求語(yǔ)言轉(zhuǎn)換。轉(zhuǎn)換最好與過(guò)濾代理(即FTS)執(zhí)行的其他進(jìn)程相分離,因此在應(yīng)用設(shè)計(jì)中,使用五層體系結(jié)構(gòu)的模型。另外,應(yīng)用系統(tǒng)獨(dú)立于數(shù)據(jù)庫(kù)引擎,也是五層模型優(yōu)于三層模型之處。
XML是元標(biāo)注語(yǔ)言,是一個(gè)為數(shù)據(jù)描述創(chuàng)建語(yǔ)義標(biāo)簽的規(guī)則集合,而HTML用來(lái)指定Web頁(yè)的布局。XSL(Extensible Stylesheet Language)是基于XML的語(yǔ)言,用來(lái)操作、分類和過(guò)濾XML數(shù)據(jù)。XSLT樣式表定義一個(gè)規(guī)則或模板的集合。當(dāng)模板與源文檔中的節(jié)點(diǎn)相匹配時(shí),它在新文檔中存儲(chǔ)按模板產(chǎn)生的輸出結(jié)構(gòu)。多通道應(yīng)用給基于其連接設(shè)備的終端用戶表現(xiàn)其內(nèi)容,并且XSL是一個(gè)將內(nèi)容與表現(xiàn)分離的理想工具。通過(guò)取決于連接設(shè)備或用戶代理的XSLT處理器將XML/XSL轉(zhuǎn)換成 HTML、WML和 VXML,如圖 2所示。
N-層模型指全部數(shù)據(jù)包或應(yīng)用系統(tǒng)能夠劃分的分類層數(shù),也指層數(shù)N≥2的客戶-服務(wù)器模型。
如果使用五層模型開(kāi)發(fā),不用傳統(tǒng)的三層模型,Web應(yīng)用的執(zhí)行性能會(huì)更好。應(yīng)用5層模型的重要優(yōu)勢(shì)在于,處理未來(lái)流量的伸縮性和性能需求的適應(yīng)性、良好的結(jié)構(gòu)化設(shè)計(jì)、靈活的以銷售商為中心的應(yīng)用及其易維護(hù)性。
本文提出的ICSA多通道應(yīng)用構(gòu)架基于一個(gè)五層模型,如圖3所示。
圖2XML/XSL轉(zhuǎn)換為HTML、WML和VXML
圖3 ICSA構(gòu)架
數(shù)據(jù)層指數(shù)據(jù)庫(kù)服務(wù)器的內(nèi)容。在此情況下,數(shù)據(jù)庫(kù)服務(wù)器包含帶索引的關(guān)鍵詞,這些關(guān)鍵詞來(lái)自預(yù)設(shè)的已知問(wèn)題和回答、與用戶提出的問(wèn)題類似的問(wèn)題以及給出的可能回答。
數(shù)據(jù)訪問(wèn)層包括服務(wù)器端(SSI)文件或連接到數(shù)據(jù)庫(kù)的腳本。它建立一個(gè)連接到數(shù)據(jù)庫(kù)并為提供查詢目的的連接標(biāo)識(shí)符。將完全的數(shù)據(jù)庫(kù)轉(zhuǎn)換成XML文件的應(yīng)用程序接口(API)也在該層上操作。
應(yīng)用層負(fù)責(zé)系統(tǒng)執(zhí)行的算術(shù)和邏輯操作,包括查找關(guān)鍵詞,在沒(méi)有回答提供時(shí)存儲(chǔ)新的問(wèn)題集合。用全文搜索技術(shù)來(lái)查詢數(shù)據(jù)庫(kù)。其XML文件表示數(shù)據(jù)庫(kù),XPATH可用來(lái)定位XML文件中的回答。此外,也可用第三方API來(lái)執(zhí)行查找XML文件。然后,服務(wù)器端腳本產(chǎn)生XML文件,并存儲(chǔ)查詢結(jié)果。
表現(xiàn)層包含擴(kuò)展樣式表文件,取決于設(shè)備或訪問(wèn)系統(tǒng)的瀏覽器,它能夠?qū)⒅虚g文檔格式化轉(zhuǎn)成WML、HTML和VXML文件。具體的格式可以由檢查瀏覽器發(fā)出的HTTP請(qǐng)求來(lái)確定。此處可選的是,如HAWXY等第三程序可以充當(dāng)代理,檢查用戶的連接設(shè)備或?yàn)g覽器,并給其傳遞合適的信息。
用戶接口層以不同的瀏覽器或不同的連接設(shè)備為特征。當(dāng)使用固定電話或移動(dòng)電話時(shí),應(yīng)用系統(tǒng)在TTS服務(wù)器協(xié)助下將消息轉(zhuǎn)換成語(yǔ)音;當(dāng)使用電話上網(wǎng)時(shí),瀏覽器傳入WML文件;當(dāng)使用Web瀏覽時(shí),PC機(jī)傳入HTML文件,并可以選擇由CSS將其格式化。
本文提出的ICSA(Interactive Customer Service Agent)構(gòu)架的處理流程如圖3下方所示。當(dāng)客戶通過(guò)撥電話號(hào)碼或鍵入U(xiǎn)RL連接到應(yīng)用系統(tǒng)時(shí),Web服務(wù)器上索引文件被傳遞。在執(zhí)行期間,客戶端或連接設(shè)備的頭部請(qǐng)求決定使用哪個(gè)XSL文件將選擇出的XML文件轉(zhuǎn)換成HTML表單、WML表單或Voice對(duì)話。在提交過(guò)程中,腳本查詢數(shù)據(jù)庫(kù),并產(chǎn)生一個(gè)XML中間文檔,該XML文檔由一個(gè)XSL文件轉(zhuǎn)換,在Web瀏覽器下、將響應(yīng)表現(xiàn)給客戶之前,可選用CSS文件將其格式化。
ICSA構(gòu)架需要很少量的XML文件,需要與Web、WAP和Voice表現(xiàn)相關(guān)的獨(dú)立XSL文件,需要求執(zhí)行轉(zhuǎn)換用的服務(wù)器端腳本或應(yīng)用文件;并以其內(nèi)容管理的簡(jiǎn)易性提供健壯的Web應(yīng)用。另外,ICSA使用XSL文件極易操作XML文件。為了增加新特征或擴(kuò)展功能,該構(gòu)架在伸縮性方面留有很大的空間。
圖4所示為用例圖,明確地指出回答ICSA查詢涉及的五個(gè)步驟。在問(wèn)題提交過(guò)程中,代理程序過(guò)濾關(guān)鍵詞,查詢數(shù)據(jù)庫(kù),為客戶列舉類似問(wèn)題,從而讓客戶選擇出與其問(wèn)題最為類似的問(wèn)題,進(jìn)而提交關(guān)鍵詞(稱為水平域排序的過(guò)程)。一個(gè)確認(rèn)消息等待客戶發(fā)出,這要么通過(guò)客戶點(diǎn)擊超鏈接(即最為類似的問(wèn)題)實(shí)現(xiàn),要么通過(guò)語(yǔ)音響應(yīng)[7]實(shí)現(xiàn)。然后再執(zhí)行一個(gè)完全搜索(稱為垂直域排序),最后給出最適合的回答。如果在數(shù)據(jù)庫(kù)中不存在回答,將問(wèn)題存儲(chǔ)起來(lái)需要由人響應(yīng)。
圖4 應(yīng)用程序的用例圖
所提出的構(gòu)架的性能將基于它對(duì)使用大量的移動(dòng)電話和模擬器的可訪問(wèn)性。對(duì)人們而言,它的可用性也應(yīng)考慮到??稍L問(wèn)性指的是用戶使用URL從事Web和WAP瀏覽的能力和通過(guò)用移動(dòng)電話、固定電話和軟件撥電話號(hào)碼語(yǔ)音上網(wǎng)的能力。它的可用性決定于在代理上是否有信息可獲取,以及它在檢索信息時(shí)是否有效。可用性要考慮的因素,包括每一段時(shí)間內(nèi)日志(或向前)查詢和回答查詢的頻度。
本文提出的ICSA是一個(gè)以銷售商為中心的、與平臺(tái)無(wú)關(guān)的和基于五層模型的應(yīng)用構(gòu)架,有很大的伸縮性。它是使用XML的單一著作模式程序,并能通過(guò)支持XSLT服務(wù)器端的任何Web語(yǔ)言編寫(xiě)程序代碼實(shí)現(xiàn)。其內(nèi)容管理變得更容易,能夠像在模擬電話網(wǎng)上的DTMF應(yīng)用或在基于取決于編碼的IP的電話網(wǎng)上的IVR應(yīng)用一樣操作。實(shí)質(zhì)上,對(duì)要求24/7/365通過(guò)前述三種通道提供其重要客戶服務(wù)的任何行業(yè)或公司,它都將有助于改進(jìn)客戶關(guān)系管理(CRM)。
[1]ADEYEYE O M,ATAYERO A A.A multi-channel application framework for customer care services using bestfirst search technique[C].Proceedings of Third Generation(3G)GSM and Mobile Computing(3GSMc2007)–Intermational Conference and Workshop, Covenant University, Nigeria,2007.
[2]ATAYERO A A, OLUGBARA O O, AYO C K, et al.Design, developmentand deploymentofan automated speech-controlled customer care service system [C].Proceedings of the GSPx 2004-The International Embedded Solutions Event,Santa Clara, CA, 2004.
[3]CHANG S E.The design ofa secure and pervasive multimodal Web system[C].19th International Conference on Advanced Information Networking and Applications,2005,2:683-688.
[4]http://www.metc.pku.edu.cn/keie/courses//ucsweb2004-old/pdf/chapt04-1.pdf,2008-08.
[5] http://dev.mysql.com/doc/refman/5.0/en/fulltextsearch. html,2008-10.
[6]HONG O O.VoiceXML application development life cycle:Building usable voice user interface [EB/OL]. http://devresource.hp.com/drc/resources/vxusability/vx_devlifecycle.pdf,2008-5.
[7]庾錫昌,劉偉平,武晉,等.基于 VoiceXML的語(yǔ)音交互平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(8).