陳美芳
?
基于智能語(yǔ)音的車輛售后技術(shù)文檔需求分析與研究
陳美芳
(上海汽車集團(tuán)股份有限公司技術(shù)中心,上海 200041)
隨著語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)的進(jìn)步,車載等智能語(yǔ)音應(yīng)用越來(lái)越廣泛,傳統(tǒng)車輛售后技術(shù)文檔轉(zhuǎn)化為適用智能語(yǔ)音的結(jié)構(gòu)語(yǔ)言面臨極大挑戰(zhàn)。文章基于智能語(yǔ)言技術(shù)來(lái)分析車輛售后技術(shù)文檔的多個(gè)基本需求,如支持對(duì)話形式的檢索語(yǔ)言、分解場(chǎng)景和用戶的操作意圖等,以及研究支持智能語(yǔ)音的車輛售后技術(shù)文檔語(yǔ)音基礎(chǔ)詞庫(kù)、知識(shí)模型、數(shù)據(jù)結(jié)構(gòu)化等要求。
智能語(yǔ)音;車輛售后技術(shù)文檔;數(shù)據(jù)結(jié)構(gòu)化
提供產(chǎn)品信息、技術(shù)文檔和客戶支持內(nèi)容的聊天機(jī)器人正在被廣泛推進(jìn)。
車載智能語(yǔ)音將AI技術(shù)和汽車相結(jié)合,其通過(guò)車載語(yǔ)音設(shè)備與人類直接交流。他可以為你提供車輛使用支持,提醒你即將可能發(fā)生的危險(xiǎn)。這一切,會(huì)讓你覺(jué)得自己不再是坐在一臺(tái)冰冷的工業(yè)機(jī)器里,而是有一個(gè)好朋友的陪伴。
而應(yīng)用在維修場(chǎng)景的智能語(yǔ)言則是為維修工程師提供服務(wù)的,維修過(guò)程中經(jīng)常有這樣的場(chǎng)景,維修人員因?yàn)樾枰樵兡稠?xiàng)操作或參數(shù),而在查詢?cè)O(shè)備和車輛零件維修操作之間切換穿梭,AR眼鏡的應(yīng)用可以使維修人員隨時(shí)查看維修信息,而智能語(yǔ)音的介入又為他們提供了更為便捷的信息交互方式,售后維修工程師完全可以在維修操作的同時(shí)通過(guò)語(yǔ)音指令隨時(shí)獲取想要的信息。
傳統(tǒng)的售后支持往往是一頁(yè)一頁(yè)的文件,要實(shí)現(xiàn)上述智能語(yǔ)言場(chǎng)景,離不開(kāi)車輛售后技術(shù)文檔的突破,而將傳統(tǒng)文檔轉(zhuǎn)化為適用智能語(yǔ)音的結(jié)構(gòu)語(yǔ)言將是文檔內(nèi)容管理人員面臨的最大挑戰(zhàn)。
車輛售后智能語(yǔ)言主要用于售后技術(shù)支持、客戶服務(wù)及資訊獲取。針對(duì)售后技術(shù)支持的研究方向還是基于查找、知識(shí)庫(kù)、規(guī)則來(lái)的,即主要通過(guò)擷取關(guān)鍵字,再?gòu)臄?shù)據(jù)庫(kù)中找尋最合適的應(yīng)答;而針對(duì)客戶服務(wù)及資訊則需要構(gòu)建類似聊天機(jī)器人的虛擬助理,除龐大的數(shù)據(jù)信息庫(kù)外,還需語(yǔ)音情感應(yīng)對(duì)等等。
智能語(yǔ)音作為人類助手的價(jià)值其主要為協(xié)助知識(shí)工作者提高效率,然而當(dāng)前書(shū)面文字并非旨在以對(duì)話的方式提供,這就需要內(nèi)容管理人員創(chuàng)建智能會(huì)話內(nèi)容來(lái)實(shí)現(xiàn)目標(biāo)。謹(jǐn)慎的會(huì)話單位,或者稱為問(wèn)題-答案(線程標(biāo)題/回復(fù)),輕松的使用自然語(yǔ)言對(duì)話發(fā)現(xiàn)有用的相關(guān)內(nèi)容,這種良好的體驗(yàn)可以促進(jìn)參與并滿足客戶。
智能語(yǔ)音相當(dāng)于通過(guò)語(yǔ)音來(lái)建立搜索,經(jīng)過(guò)自然語(yǔ)言→檢索語(yǔ)言→自然語(yǔ)言的轉(zhuǎn)換,類似“上下文關(guān)聯(lián)幫助(context -sensitive)”,其主要目的是基于用戶當(dāng)前操作,提供和檢索主題相關(guān)的幫助內(nèi)容,同時(shí)又將復(fù)雜的專業(yè)化技術(shù)內(nèi)容轉(zhuǎn)化為適合會(huì)話的自然語(yǔ)言。
基于良好的智能語(yǔ)音系統(tǒng),檢索語(yǔ)言是技術(shù)文檔適用智能語(yǔ)音的創(chuàng)建重點(diǎn)。用于智能語(yǔ)音的檢索語(yǔ)言是根據(jù)語(yǔ)音檢索的需要而創(chuàng)制的,需要能夠區(qū)別標(biāo)記技術(shù)文檔信息,并支持系統(tǒng)排列,便于將標(biāo)引語(yǔ)言和檢索用語(yǔ)進(jìn)行相符性比較。一般操作是依據(jù)一定的規(guī)則對(duì)自然語(yǔ)言進(jìn)行規(guī)范,將售后技術(shù)文檔中的關(guān)鍵檢索分類、檢索主題、檢索結(jié)構(gòu)等編制成表(表1),供信息標(biāo)引以及檢索時(shí)使用。
表1 維修信息檢索分類舉例
場(chǎng)景相關(guān)性可以理解為用戶的上下文,即收集關(guān)于用戶想要實(shí)現(xiàn)的目標(biāo)以及目標(biāo)的參數(shù)信息,其包括可能有的各種變化的各種元素。結(jié)合場(chǎng)景和用戶意圖的智能語(yǔ)音文檔非常具有挑戰(zhàn)性。每個(gè)需求往往包含多個(gè)具體條件,當(dāng)無(wú)法獲取明確的需求時(shí),需要通過(guò)語(yǔ)音提問(wèn)來(lái)定位,以便獲取完整的用戶意圖。當(dāng)提取到的關(guān)鍵信息與數(shù)據(jù)庫(kù)內(nèi)容一一對(duì)應(yīng)匹配時(shí),智能語(yǔ)音才能準(zhǔn)確提供相應(yīng)的幫助。
(1)確定用戶的使用場(chǎng)景
掌握用戶的使用場(chǎng)景即意味著需要獲取當(dāng)前用戶的相關(guān)狀態(tài)和潛在需求,即明確需要解決用戶在什么場(chǎng)景下的問(wèn)題,可以通過(guò)詢問(wèn)的方式捕捉用戶的需求,或者通過(guò)車聯(lián)的相關(guān)數(shù)據(jù)自動(dòng)獲取用戶潛在需求,例如車載模塊故障報(bào)警、地理位置、車輛當(dāng)前模式、設(shè)備配置交互歷史等等。
簡(jiǎn)單的舉個(gè)例子。問(wèn):保養(yǎng)時(shí)需要加多少機(jī)油?針對(duì)這個(gè)問(wèn)題,不同的發(fā)動(dòng)機(jī)答案是不同的,可能1.5T的發(fā)動(dòng)機(jī)只需要5升,而2.0T的發(fā)動(dòng)機(jī)則需要5.2升。對(duì)于用戶體驗(yàn)來(lái)說(shuō),基于提問(wèn)補(bǔ)充來(lái)提供相應(yīng)的建議并不是很好的智能方法,因此智能語(yǔ)音要精確回答必須能夠自動(dòng)獲取該車所搭載的哪款發(fā)動(dòng)機(jī)。
(2)識(shí)別用戶的意圖
快速識(shí)別用戶的意圖,即確定用戶想干什么或者想了解什么,這就需要將話題控制到一個(gè)較小的信息范圍,即限定語(yǔ)音對(duì)話范圍,以免答案非常復(fù)雜或出現(xiàn)偏差。語(yǔ)音對(duì)話的限定有兩種。其中之一是有效控制問(wèn)題的關(guān)鍵點(diǎn)條件(圖1),或者通俗來(lái)說(shuō)就是要問(wèn)到點(diǎn)子上,通常也可以通過(guò)對(duì)話將信息范圍縮?。黄涠薅ㄖ悄苷Z(yǔ)音的可對(duì)話范圍(表2),即通過(guò)限定某些話題的方式,只要用戶的提問(wèn)不超出這個(gè)范圍,智能語(yǔ)音就比較容易滿足用戶的需求。
圖1 語(yǔ)音信息條件舉例
如果采用對(duì)話來(lái)縮小范圍,可以設(shè)計(jì)如下對(duì)話:
用戶:你好!怎么開(kāi)360全景影像?
聊天機(jī)器人:請(qǐng)問(wèn)您是需要在倒車時(shí)開(kāi)啟么?
用戶:不是,前進(jìn)時(shí)能打開(kāi)么?(識(shí)別,前進(jìn)=D擋)
聊天機(jī)器人:可以,您可以設(shè)置起步或轉(zhuǎn)向時(shí)開(kāi)啟該系統(tǒng),也可觸摸360開(kāi)關(guān)直接開(kāi)啟。
表2 維修工程師語(yǔ)音對(duì)話限定范圍舉例
精準(zhǔn)提供智能語(yǔ)音服務(wù)的需要一個(gè)信息庫(kù)支持,而如何組織這個(gè)信息庫(kù)來(lái)滿足用戶需求的內(nèi)容是我們當(dāng)前面臨的最大挑戰(zhàn)。數(shù)據(jù)信息庫(kù)的兩個(gè)重要原則,其一是數(shù)據(jù)的易發(fā)布以及共享,其二是可支持高效的查詢和搜索。而實(shí)現(xiàn)這兩者并能支持智能語(yǔ)音則離不開(kāi)支持智能語(yǔ)音的基礎(chǔ)詞庫(kù)設(shè)計(jì)和知識(shí)模型的構(gòu)建。
(1)專業(yè)術(shù)語(yǔ)基礎(chǔ)詞庫(kù)建設(shè)
我們知道智能語(yǔ)音技術(shù)離不開(kāi)兩大基礎(chǔ)建設(shè):語(yǔ)音識(shí)別和語(yǔ)義識(shí)別。因此,支持車輛售后技術(shù)的智能語(yǔ)音詞庫(kù)建設(shè)主要方向是在專業(yè)術(shù)語(yǔ)庫(kù)的基礎(chǔ)上進(jìn)行專業(yè)詞匯擴(kuò)展和語(yǔ)義擴(kuò)展。
雖然使用機(jī)器學(xué)習(xí)技術(shù)結(jié)合多級(jí)融合算法,可以借助于每個(gè)請(qǐng)求之后的用戶響應(yīng)及上下文來(lái)確定預(yù)測(cè)是否正確,并通過(guò)考慮與用戶對(duì)話所獲得的分類結(jié)果改善了系統(tǒng)的決策性能。然而在某一智能語(yǔ)音的專項(xiàng)領(lǐng)域,其運(yùn)用的初期必須對(duì)專業(yè)的基礎(chǔ)詞庫(kù)進(jìn)行研究。語(yǔ)義理解針對(duì)詞匯級(jí)的研究主要有詞性識(shí)別、專有名詞、詞重要性、同近義詞、需求詞、位置關(guān)系,這也是建設(shè)基礎(chǔ)詞庫(kù)時(shí)必須要考量的6個(gè)維度。
(2)構(gòu)建知識(shí)模型
知識(shí)模型的構(gòu)建是后續(xù)智能語(yǔ)音應(yīng)用的基礎(chǔ),與傳統(tǒng)技術(shù)文檔不同,構(gòu)建前就需要考慮把相關(guān)特征數(shù)據(jù)從不同的數(shù)據(jù)源中抽取出來(lái),并以結(jié)構(gòu)化的方式存儲(chǔ),以便支持預(yù)處理并作為后續(xù)智能系統(tǒng)的輸入。因此,知識(shí)模型的構(gòu)建最重要的核心在于對(duì)業(yè)務(wù)(或者說(shuō)用戶意圖)的深入理解以及對(duì)知識(shí)模型結(jié)構(gòu)的設(shè)計(jì)。一個(gè)完整的知識(shí)模型構(gòu)建一般包含:定義需求模型(圖2)、知識(shí)模型特征設(shè)計(jì)、數(shù)據(jù)關(guān)系定義及存儲(chǔ)。
圖2 功能類知識(shí)模型需求圖例
(3)精簡(jiǎn)知識(shí)模型數(shù)據(jù)
復(fù)雜場(chǎng)景的智能語(yǔ)音需要構(gòu)建一個(gè)強(qiáng)大的信息架構(gòu)來(lái)組織內(nèi)容和知識(shí),結(jié)合適當(dāng)?shù)闹悄苷Z(yǔ)音技術(shù)來(lái)理解和精準(zhǔn)快速反饋用戶的目標(biāo)需求。而要實(shí)現(xiàn)這一目標(biāo)需要遵循效率原則(Efficiency Principle)、分析原則(Analytics Principle)、 冗余原則(Redundancy Principle),即讓知識(shí)模型盡量輕量化、并決定哪些數(shù)據(jù)進(jìn)行智能語(yǔ)言交互,哪些數(shù)據(jù)不需要。其核心在于把技術(shù)文檔內(nèi)容單元設(shè)計(jì)成小而輕的存儲(chǔ)載體。我們僅需要把重點(diǎn)信息進(jìn)行智能語(yǔ)音開(kāi)發(fā),而那些訪問(wèn)頻率不高、對(duì)關(guān)系分析無(wú)關(guān)緊要的信息,以及部分高頻反復(fù)記憶的信息可以放到傳統(tǒng)數(shù)據(jù)庫(kù)當(dāng)中。
可能大多人會(huì)認(rèn)為只要堆砌足夠大的問(wèn)答數(shù)據(jù)庫(kù),智能語(yǔ)音在回答問(wèn)題方面就能反饋較為相近的正確率,這樣就能達(dá)到更智能的目標(biāo),而這在我們的實(shí)踐過(guò)程中印證單單憑借足夠大的數(shù)據(jù)庫(kù)是遠(yuǎn)遠(yuǎn)不夠的。
“關(guān)鍵詞匹配”方式是比較原始的,還需要有數(shù)據(jù)結(jié)構(gòu)的概念。智能所體現(xiàn)的學(xué)習(xí)能力,其本質(zhì)是通過(guò)算法將數(shù)據(jù)分配到相應(yīng)的數(shù)據(jù)組織結(jié)構(gòu)中。結(jié)構(gòu)化內(nèi)容就是將關(guān)聯(lián)內(nèi)容聚合到一起,從而為用戶提供完整而自然的信息。
(1)結(jié)構(gòu)內(nèi)容以塊的形式創(chuàng)建
從分解場(chǎng)景和用戶的操作意圖這一需求出發(fā),作為內(nèi)容幕后提供者需要模塊化的思維方式,就像使用樂(lè)高基本單元塊來(lái)構(gòu)建各個(gè)子單元再組裝成為一個(gè)龐大信息庫(kù),基于智能語(yǔ)音的售后技術(shù)文檔也需要建立基本塊信息,把較大的技術(shù)文檔拆分成基本塊,這些基本塊賦予指定的檢索特征信息后,通過(guò)特定的規(guī)則可集成不同的獨(dú)立單元,從而構(gòu)建結(jié)構(gòu)化文檔內(nèi)容。
根據(jù)場(chǎng)景和用戶意圖分解而形成的不同內(nèi)容塊,對(duì)每個(gè)內(nèi)容塊做分類/打標(biāo)簽后賦予不同特征。比如輪胎應(yīng)急場(chǎng)景提取出如下特征(表3)。
表3 輪胎應(yīng)急場(chǎng)景內(nèi)容塊及特征分類
(2)結(jié)構(gòu)內(nèi)容集成提供
結(jié)構(gòu)化內(nèi)容是豐富了語(yǔ)義標(biāo)記的內(nèi)容,它提供了有關(guān)每個(gè)顆粒整體及其各部分含義的信息。粒度的、分散的內(nèi)容塊通過(guò)彼此之間的概念聯(lián)系(即相關(guān)性),將給定的內(nèi)容塊組合連接,從而提供精確地智能語(yǔ)言服務(wù)。實(shí)現(xiàn)智能語(yǔ)音如果完全依賴于手動(dòng)構(gòu)建多個(gè)分支的決策樹(shù),將大大增加維護(hù)工作量,因此基于內(nèi)容元數(shù)據(jù)塊自動(dòng)生成語(yǔ)言服務(wù)值得進(jìn)一步深入研究。
圖3 輪胎應(yīng)急場(chǎng)景結(jié)構(gòu)關(guān)系圖
語(yǔ)義特征標(biāo)記通過(guò)關(guān)系定義將內(nèi)容塊之間聯(lián)系起來(lái)的。比如上述輪胎應(yīng)急場(chǎng)景 (結(jié)構(gòu)關(guān)系圖見(jiàn)圖3),當(dāng)提示“胎壓低”時(shí),智能語(yǔ)言獲取該問(wèn)題所涉及的相關(guān)內(nèi)容塊模型,但是需要解決具體問(wèn)題仍需要特定條件,智能語(yǔ)音可以提示用戶從內(nèi)容塊中選擇一種配備工具和相應(yīng)輪胎外觀情況,來(lái)推薦提供相應(yīng)的操作和服務(wù)。
適用于智能語(yǔ)音發(fā)布的售后技術(shù)文檔內(nèi)容應(yīng)是語(yǔ)義豐富、不受格式影響的,簡(jiǎn)潔的結(jié)構(gòu)化智能內(nèi)容。技術(shù)時(shí)代和信息時(shí)代容不下一絲猶豫,企業(yè)需要從現(xiàn)在開(kāi)始就做好準(zhǔn)備,采用結(jié)構(gòu)化的內(nèi)容創(chuàng)作方式,并逐漸打通企業(yè)技術(shù)與售后信息內(nèi)容存儲(chǔ)的孤島。
[1] 李鵬.中文分詞在聊天機(jī)器人中的應(yīng)用研究[D].中南大學(xué),2009 (05).
[2] 黃際洲.聊天機(jī)器人知識(shí)庫(kù)自動(dòng)抽取算法的研究與實(shí)現(xiàn)[D].重慶大學(xué), 2006.
[3] 王浩暢,李斌.聊天機(jī)器人系統(tǒng)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用與軟件, 2018(12).
[4] 王磊,魏勇,邸建勛,et al.本體聊天機(jī)器人的設(shè)計(jì)與應(yīng)用[J].自動(dòng)化與信息工程,2016(4).
Demand analysis and research on vehicle after-sales technical documents based on intelligent voice
Chen Meifang
( Technology center of Shanghai automotive group co., LTD., Shanghai 200041 )
With the progress of speech recognition and natural language processing technology, intelligent voice applications such as on-board vehicles are more and more widely used. It is a great challenge for traditional vehicle after-sales technical documents to be converted into structural languages that are suitable for intelligent voice. Based on intelligent language technology, this paper analyses many basic requirements of vehicle after-sales technical documents, such as search language supporting dialogue form, decomposition scene and user's operation intention, and studies the requirements of basic vocabulary, knowledge model and data structure of vehicle after-sales technical documents supporting intelligent voice.
Intelligent voice; Vehicle after-sales technical documents; Data structure
U471
A
1671-7988(2019)07-175-04
陳美芳,就職于上海汽車集團(tuán)股份有限公司技術(shù)中心。
U471
A
1671-7988(2019)07-175-04
10.16638/j.cnki.1671-7988.2019.07.058