◆孫偉博 張斌
(1.清華大學(xué)計算機(jī)科學(xué)與技術(shù)系 北京 100084;2.中國電子科技集團(tuán)公司第五十四研究所 河北 050081)
人工智能作為當(dāng)前世界最前沿的科學(xué)技術(shù),正在引領(lǐng)新一輪的科技革命,隨著越來越多的專家學(xué)者持續(xù)不斷對人工智能進(jìn)行深入的研究,人工智能的定義及產(chǎn)業(yè)框架也愈發(fā)清晰,人工智能的產(chǎn)業(yè)框架可以分為三層,分別是:基礎(chǔ)層、技術(shù)層、應(yīng)用層,其中基礎(chǔ)層主要指的數(shù)據(jù)的獲取和處理、人工智能芯片、人工智能算法等人工智能發(fā)展的基石。技術(shù)層主要是指人工智能技術(shù)發(fā)展的方向,主要有三個方向:機(jī)器學(xué)習(xí)、自然語言處理、計算機(jī)視覺。應(yīng)用層主要是指人工智能技術(shù)的應(yīng)用領(lǐng)域,主要包括:金融、安防、醫(yī)療、教育、機(jī)器、自動駕駛、國防軍事等,隨著人工智能技術(shù)的發(fā)展,各行各業(yè)都在探索怎樣使用人工智能技術(shù)推動行業(yè)的進(jìn)步和發(fā)展,中國在人工智能技術(shù)的應(yīng)用方面,呈現(xiàn)全面爆發(fā)的趨勢。
人工智能的技術(shù)層主要包括機(jī)器學(xué)習(xí)、自然語言處理及計算機(jī)視覺。其中自然語言處理是當(dāng)前人工智能技術(shù)研究的一個重要方向。對話系統(tǒng)是自然語言處理的一個重要的應(yīng)用方向,對話系統(tǒng)是將人工智能賦能計算機(jī),使其成為一個具有認(rèn)知能力的主體,然后通過文本等方式與人類進(jìn)行正常對話交互的程序系統(tǒng)。對話系統(tǒng)的應(yīng)用方向有兩個,分別是任務(wù)型對話系統(tǒng)和非任務(wù)型對話系統(tǒng)。非任務(wù)型對話系統(tǒng)主要面向的是開放域,根據(jù)用戶輸入的信息,經(jīng)過人工智能技術(shù)去處理和判斷用戶的意思,然后通過多種形式的開放內(nèi)容,給用戶合理的解答和反映,很多人工智能助手就是非任務(wù)型對話系統(tǒng)。任務(wù)型對話系統(tǒng)面向的是特定的領(lǐng)域,通過用戶輸入信息,幫助用戶完成某項具體的任務(wù),例如客服對話系統(tǒng)可以根據(jù)客戶的輸入信息,幫助其完成商品咨詢、售后服務(wù)等工作,任務(wù)型對話系統(tǒng)可以大大提高工作效率,越來越多的行業(yè)開始應(yīng)用任務(wù)型對話系統(tǒng)。
由于任務(wù)型對話系統(tǒng)的超高工作效率,所以應(yīng)用的單位與企業(yè)試圖將所有可能的對話資料全部集成入任務(wù)對話系統(tǒng),隨著對話系統(tǒng)關(guān)聯(lián)的資料越來越多,導(dǎo)致任務(wù)型對話系統(tǒng)的復(fù)雜程度越來越高,由于對話系統(tǒng)的各個工作模塊是相互獨立的,為了實現(xiàn)對話系統(tǒng)功能的完善,每個模塊需要標(biāo)注的數(shù)據(jù)也越來越多,特別是跟特定領(lǐng)域相關(guān)的數(shù)據(jù),模塊相互獨立雖然能保證系統(tǒng)的安全性,但底層模塊的錯誤可能會影響上層模塊,例如如果系統(tǒng)對客戶輸入的信息語言理解錯誤,就會影響后續(xù)與客戶對話的效果。同時,隨著對話系統(tǒng)越來越龐大,需要人工設(shè)計的流程規(guī)則也越來越復(fù)雜,系統(tǒng)規(guī)則復(fù)雜性提高,則維護(hù)難度加大,維護(hù)成本變高,同時復(fù)雜的流程規(guī)則也限制了對話系統(tǒng)的擴(kuò)展性。
圖1 深度學(xué)習(xí)與人工智能的關(guān)系
深度學(xué)習(xí)是通過人工智能技術(shù)和算法,建立一種模擬人類大腦進(jìn)行分析的神經(jīng)網(wǎng)絡(luò),并模仿人腦的運行機(jī)制來解釋數(shù)據(jù),最終達(dá)到對數(shù)據(jù)的準(zhǔn)確理解和判斷。深度學(xué)習(xí)的最終目的就是模仿人類大腦神經(jīng)元的信息傳遞過程以及處理信息的模式。深度學(xué)習(xí)建立起來的神經(jīng)網(wǎng)絡(luò)中包含很多隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這些網(wǎng)絡(luò)結(jié)構(gòu)中的每一個神經(jīng)元接收到信息之后,像人類腦神經(jīng)一樣進(jìn)行多層次的分析和計算,并最終得到一個模擬人腦思考的計算結(jié)果。隨著深度學(xué)習(xí)的發(fā)展,人們將深度學(xué)習(xí)大量應(yīng)用于自然語言處理領(lǐng)域,同時由于任務(wù)型對話系統(tǒng)是自然語言處理的一個重要的應(yīng)用方向,所以在任務(wù)型對話系統(tǒng)中也大量應(yīng)用深度學(xué)習(xí)技術(shù)。人們可以利用深度學(xué)習(xí)技術(shù)所構(gòu)建的模型,自動學(xué)習(xí)自然語言的表達(dá),同時利用神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)對話生成的策略,從而取代技術(shù)人員手工設(shè)計對話的規(guī)則,最終彌補(bǔ)任務(wù)型對話系統(tǒng)的弊端,使系統(tǒng)更準(zhǔn)確的理解用戶輸入的信息,并根據(jù)信息作出正確的應(yīng)對。
在智能戰(zhàn)場上,對于陸、海、空、天氣、電、磁力和互聯(lián)網(wǎng)等多維空間的監(jiān)測方法將產(chǎn)生大量信息。因此,在智能戰(zhàn)爭時期,戰(zhàn)場信息將呈現(xiàn)爆炸性增長趨勢。戰(zhàn)場上信息的增加將增大智能化戰(zhàn)爭對信息的依賴。
現(xiàn)代戰(zhàn)爭的戰(zhàn)場形勢錯綜復(fù)雜,戰(zhàn)機(jī)轉(zhuǎn)瞬即逝,在當(dāng)前的軍事人員與計算機(jī)對話系統(tǒng)的交互過程中,大量的戰(zhàn)場形勢、戰(zhàn)斗信息沒有得到及時而有效的傳遞和表達(dá),人機(jī)交互系統(tǒng)不能準(zhǔn)確理解指揮官的需求,自然也不能依據(jù)指揮官的需求及時分配戰(zhàn)斗所需的信息,這樣就導(dǎo)致了指揮官不能及時針對戰(zhàn)場的形式進(jìn)行分析,不能及時分析就很有可能會造成對戰(zhàn)場的錯誤判斷,進(jìn)而導(dǎo)致指揮決策的效率較低,這在未來戰(zhàn)場中是非常致命的。同時,現(xiàn)行的人機(jī)交互主要是以較為精確的按鍵單通道操控為主,這種操控對于指揮員的操作準(zhǔn)確性提出了較高的要求,在激烈戰(zhàn)場中,由于各種各樣原因,指揮員并不能每次都能進(jìn)行精確操控,所以這種交互方式對于戰(zhàn)斗的效率影響很大。
而基于深度學(xué)習(xí)的任務(wù)型人機(jī)交互系統(tǒng)可以改善這些弊端,首先,應(yīng)用深度學(xué)習(xí)的人機(jī)交互系統(tǒng)擁有多種交互方式,除了傳統(tǒng)交互的文本及按鍵等方式之外,他還能通過指揮員的表情、動作手勢、視線、語音及生理等特征,智能判斷對象的需求,從而精準(zhǔn)的為指揮員提供所需要的信息。例如,戰(zhàn)場上指揮輸入系統(tǒng)被敵方破壞,深度學(xué)習(xí)人機(jī)交互系統(tǒng)可以通過指揮官的語音來進(jìn)行戰(zhàn)場信息的傳達(dá)和處理,甚至語音系統(tǒng)被破壞之后,可以通過對指揮官的嘴部動作進(jìn)行識別,準(zhǔn)確判斷指揮官的意圖。隨著虛擬現(xiàn)實技術(shù)和增強(qiáng)現(xiàn)實技術(shù)的發(fā)展,戰(zhàn)場信息可以通過任務(wù)型對話系統(tǒng)進(jìn)行準(zhǔn)確的信息理解、信息挖掘及處理,然后通過沉浸式的顯示設(shè)備及時呈現(xiàn)給指揮官。同時基于深度學(xué)習(xí)的人機(jī)交互系統(tǒng)擁有多種交互通道,并且可以進(jìn)行非精確交互信息的判斷,可以大大提高交互效率,從而提高作戰(zhàn)效率。
圖3 人機(jī)交互系統(tǒng)組成結(jié)構(gòu)
現(xiàn)代戰(zhàn)爭中隨著攻擊武器速度的提升以及空天立體化作戰(zhàn)模式的應(yīng)用,戰(zhàn)場變得更為迅速和多變,多變的戰(zhàn)場環(huán)境對于指揮官的指揮反應(yīng)時間提出了更高的要求,提高指揮決策的速度是現(xiàn)代戰(zhàn)爭的一個必然要求。而現(xiàn)代戰(zhàn)爭中過于龐大的數(shù)據(jù)量,不能單純依靠作戰(zhàn)人員進(jìn)行人工處理、分析并作出決策,
基于深度學(xué)習(xí)的智能人機(jī)交互程序通過模擬人類腦神經(jīng)進(jìn)行多層次的分析和計算,可以在信息的搜索、戰(zhàn)場數(shù)據(jù)的存儲、敵我雙方形式的計算、決策的優(yōu)化等方面協(xié)助指揮官進(jìn)行決策,可以大大縮減數(shù)據(jù)處理和分析的時間,機(jī)器相對于人類而言具有精準(zhǔn)性和快速性,并且不受生理極限及認(rèn)知偏差等因素的影響,可以大大縮減決策所需時間同時還可以提供最優(yōu)解決方案。
近些年,國與國之間的軍事交流越來越頻繁,不論是軍事領(lǐng)域的互訪學(xué)習(xí)還是不同國家之間的聯(lián)合演習(xí)活動都愈發(fā)頻繁,在與別國進(jìn)行軍事交流活動中,存在著很嚴(yán)重的語言問題,雖然在軍事互訪、人道主義救援、聯(lián)合國框架下的維和任務(wù)以及聯(lián)合軍事訓(xùn)練過程中都有實時翻譯,但是在翻譯過程中由于軍事的保密性及敏感性,翻譯的質(zhì)量很難做到絕對的準(zhǔn)確。這種翻譯的不足在普通的軍事交流活動中的影響可以通過信息的再次確認(rèn)等方式來優(yōu)化,但是在真實的戰(zhàn)場中,對于作戰(zhàn)雙方而言,交流信息的準(zhǔn)確性是極其重要的,但是由于外語的種類繁多,每一個指揮員掌握外語的數(shù)量和水平都參差不齊,所以對戰(zhàn)場信息做到及時準(zhǔn)確的翻譯是極其重要的,基于深度學(xué)習(xí)的智能交互系統(tǒng)可以進(jìn)行跨語言的信息檢測,然后對外語信息進(jìn)行準(zhǔn)確分析,對輸入信息中的關(guān)鍵詞、句進(jìn)行提取,最終實現(xiàn)對信息的準(zhǔn)確翻譯。軍事指揮員可以通過這些準(zhǔn)確的翻譯信息,進(jìn)行準(zhǔn)確的情報收集和作戰(zhàn)指揮。
現(xiàn)代武器系統(tǒng)正向智能發(fā)展,人機(jī)交互的效率將直接影響武器系統(tǒng)的作戰(zhàn)性能。目前,人機(jī)交互技術(shù)在我國軍隊武器系統(tǒng)中相對落后,需要不斷發(fā)展和應(yīng)用新的人機(jī)交互技術(shù),以滿足新時代的需求。