張兆晨,毛曉彬,周光霞
(1.中國電科集團第28研究所 信息系統(tǒng)工程重點實驗室,江蘇 南京 210007;2.軟件新技術(shù)與產(chǎn)業(yè)化協(xié)同創(chuàng)新中心,江蘇 南京 210000)
C4ISR系統(tǒng)[1]是集指揮、控制、通信、計算、情報、監(jiān)視、偵察于一體的軍事信息系統(tǒng),是作戰(zhàn)指揮的神經(jīng)中樞和戰(zhàn)場力量的倍增器。隨著第3次人工智能浪潮的到來,智能化技術(shù)滲透到作戰(zhàn)的每個環(huán)節(jié)[2]。如何構(gòu)建“類人化”系統(tǒng),實現(xiàn)機器與作戰(zhàn)人員的相互理解、高效協(xié)作,是跨越式提升作戰(zhàn)能力的突破口。在此情況下,傳統(tǒng)C4ISR系統(tǒng)的形態(tài)和運行模式將發(fā)生顛覆性變化,人機融合系統(tǒng)應(yīng)運而生。
美軍已在戰(zhàn)略和技術(shù)層面開展人機融合系統(tǒng)研究。美軍在《人機系統(tǒng)科技發(fā)展路線圖》[3]中強調(diào),人機系統(tǒng)集成(human-machine systems integration,HSI)是系統(tǒng)設(shè)計、研發(fā)和采辦的重要組成。美國戰(zhàn)略與預算評估中心(center for strategic and budgetary assessments,CSBA)在《未來地面部隊人機編隊》報告[4]中提出未來地面部隊人機編隊的三大形式。美國國防部高級研究計劃局(defense advanced research projects agency,DARPA)部署了一系列人機融合項目。人工智能探索(artificial intelligence exploration,AIE)[5]計劃提出人機共生的設(shè)想,探索讓機器適應(yīng)不斷變化的戰(zhàn)場情況的新理論和應(yīng)用。靈活編隊(agile teams)[6]項目致力于實現(xiàn)高度靈活的人機混合編組的最優(yōu)化設(shè)計,以更好地將人的認知優(yōu)勢與機器智能結(jié)合。知識導向的人工智能推理模式(knowledge-directed artificial intelligence reasoning over schemas,KAIROS)[7-8]項目通過研發(fā)新型半自動化人機融合智能系統(tǒng),提升態(tài)勢洞察、預警探測、情報處理和戰(zhàn)爭理解的能力。成功團隊的人工社會智能(artificial social intelligence for successful teams,ASIST)項目[9-10]旨在開發(fā)具備社交技能的智能體,能夠與人編組協(xié)同作戰(zhàn)。人機探索軟件安全(computers and humans exploring software security,CHESS)[11]項目研究人與機器協(xié)作推理、識別并修復高威網(wǎng)絡(luò)漏洞。
架構(gòu)決定系統(tǒng)能力[12-13],構(gòu)建面向人機融合的C4ISR系統(tǒng),其首要環(huán)節(jié)是系統(tǒng)架構(gòu)設(shè)計。文本提出人機混合增強智能的C4ISR系統(tǒng)的架構(gòu)設(shè)計原理模型,設(shè)計了系統(tǒng)組成與運行機制,實現(xiàn)對系統(tǒng)架構(gòu)的靜態(tài)特征和動態(tài)屬性的描述,形成人機融合的C4ISR系統(tǒng)架構(gòu)設(shè)計范式,并通過在下一代C4ISR系統(tǒng)設(shè)計中的典型作戰(zhàn)案例驗證其有效性和可行性。
人機融合需要將人的認知能力與機器的強大算力實時有效融合,以應(yīng)對瞬息萬變的戰(zhàn)場環(huán)境。在作戰(zhàn)指揮中,人機融合智能貫穿感知、判斷、決策、控制環(huán)節(jié)。因此,人機融合系統(tǒng)設(shè)計必須打通從任務(wù)環(huán)境到作用對象的OODA全過程。建立人機融合系統(tǒng)架構(gòu)的原理模型,如圖1所示。
圖1 人機融合系統(tǒng)架構(gòu)的原理模型Fig.1 Principle model of human computer fusion system architecture
(1) 感知層:將各類戰(zhàn)場傳感器采集的客觀探測數(shù)據(jù)與指揮員、參謀、士兵等感官獲取的主觀信息進行融合,形成一種新的情報獲取方式。
(2) 思維層:通過機器的計算能力,讓機器學習指揮員、參謀的思維模式,實現(xiàn)人的認知能力向機器遷移,構(gòu)建一種新的機器學習模式。
(3) 應(yīng)用層:將人的判斷、決策和控制信息與機器的運算結(jié)果匹配、比較,發(fā)現(xiàn)機器在決策中問題缺陷,由人驅(qū)動機器進行算法模型優(yōu)化,以作出更加精準、可靠的決策。
人機融合系統(tǒng)架構(gòu)設(shè)計的核心是如何使得人的智能向機器智能遷移,塑造“互理解、互信任、互啟發(fā)”的人機共生指揮控制模式。本文創(chuàng)新提出博弈對抗推演的手段,將人腦中的知識、經(jīng)驗逐步轉(zhuǎn)化為機器的知識網(wǎng)絡(luò),教會機器在類似情況甚至從未出現(xiàn)的情況下如何決策。最終打造強大的“機器大腦”,實現(xiàn)真正的機器人戰(zhàn)爭。人只需要在作戰(zhàn)環(huán)路外監(jiān)控戰(zhàn)場局勢,在關(guān)鍵節(jié)點調(diào)控戰(zhàn)場走向。
將人機融合系統(tǒng)架構(gòu)設(shè)計的原理模型映射到人機融合的C4ISR系統(tǒng),構(gòu)建系統(tǒng)組成,如圖2所示。原理模型的感知層映射成為人腦感知系統(tǒng)、機腦情報感知系統(tǒng),思維層映射成為人腦知識網(wǎng)絡(luò)、機腦知識網(wǎng)絡(luò),應(yīng)用層映射成為人腦應(yīng)用功能、機腦應(yīng)用系統(tǒng),“人智能向機器智能遷移”則通過博弈對抗推演環(huán)境實現(xiàn)。
圖2 面向人機融合的C4ISR系統(tǒng)組成Fig.2 C4ISR system composition for human computer fusion
可以看到,面向人機融合的C4ISR系統(tǒng)與傳統(tǒng)智能處理系統(tǒng)相比,人腦與機腦處于對等地位。新增的博弈對抗推演環(huán)境支持人腦在作戰(zhàn)業(yè)務(wù)中與機腦無縫對接,適時將人腦的智慧融入機器的業(yè)務(wù)流程中。逐步驅(qū)動機器提煉知識,提升認知和決策能力,解決以往基于傳統(tǒng)人工智能算法無法求解的問題。
(1) 人腦感知系統(tǒng):是人通過感官獲取任務(wù)和環(huán)境信息的途徑,包含視覺、聽覺等功能。
(2) 機腦感知系統(tǒng):通過各類型、廣域分布的傳感器采集目標狀態(tài)、戰(zhàn)場環(huán)境等信息,并進行初步綜合處理,形成服務(wù)化的情報信息。
(3) 人腦知識網(wǎng)絡(luò):人腦知識網(wǎng)絡(luò)包含指揮員、參謀大腦中具備的業(yè)務(wù)領(lǐng)域知識,如基于經(jīng)驗獲得的目標特征、戰(zhàn)術(shù)戰(zhàn)法等知識,人腦的思維過程就是對這些知識關(guān)聯(lián)推理,支撐其作出判斷決策。
(4) 機腦知識網(wǎng)絡(luò):機腦知識網(wǎng)絡(luò)是將知識進行模型化表征,標記知識之間的關(guān)聯(lián)關(guān)系,構(gòu)建形成知識圖譜,對機腦應(yīng)用系統(tǒng)提供知識服務(wù)。一方面,機腦知識網(wǎng)絡(luò)能夠自主進行隱含規(guī)律的挖掘,擴充知識圖譜;另一方面,通過人機博弈對抗,不斷從人腦中獲取經(jīng)驗知識,實現(xiàn)知識演化更新。
(5) 博弈對抗推演環(huán)境:包括仿真推演引擎、虛擬戰(zhàn)場博弈對抗平臺和虛實結(jié)合的戰(zhàn)場博弈對抗平臺,其中,虛擬戰(zhàn)場博弈對抗平臺支持人-人、人-機、機-機博弈對抗學習訓練。博弈對抗推演環(huán)境是實現(xiàn)人腦知識向機腦知識遷移的關(guān)鍵,它在數(shù)字空間構(gòu)建了一個虛擬戰(zhàn)場,既支持特定任務(wù)場景下的人與人、人與機器、機器與機器的全數(shù)字仿真推演,也能夠接入真實戰(zhàn)場情報數(shù)據(jù),進行虛實結(jié)合的仿真推演。
(6) 人腦應(yīng)用功能:是指揮員、參謀憑借經(jīng)驗、認知實施指揮控制的業(yè)務(wù)功能,能夠在關(guān)鍵節(jié)點為機器提供重要決策方向的指導。
(7) 機腦應(yīng)用系統(tǒng):是機器在機腦知識網(wǎng)絡(luò)和博弈對抗推演環(huán)境的支持下,實現(xiàn)快速、可信、精準的指揮控制的業(yè)務(wù)功能。
基于面向人機融合的C4ISR系統(tǒng)組成,建立其運行機制,描述其動態(tài)屬性。“人智能向機器智能遷移”是通過博弈對抗實現(xiàn)的,其過程是分階段的,包括人與人、人與機器、機器之間自主博弈對抗3個階段。只有在平時基于博弈對抗推演環(huán)境,由人驅(qū)動機器開展學習訓練,獲得人的認知能力,才能在戰(zhàn)時保證機器作出準確決策。
戰(zhàn)前博弈對抗推演環(huán)境構(gòu)建了一個虛擬戰(zhàn)場,通過人人和人機對抗,促進人腦知識向機腦遷移。在此基礎(chǔ)上,通過機機自主對抗,不間斷產(chǎn)生供機器學習的樣本數(shù)據(jù),驗證、優(yōu)化模型,自主提升系統(tǒng)能力。
(1) 人-人博弈對抗訓練
依據(jù)歷史作戰(zhàn)案例,由博弈對抗推演環(huán)境構(gòu)建一個虛擬任務(wù)和作戰(zhàn)環(huán)境。由指揮員、參謀分別扮演紅藍雙方,在虛擬戰(zhàn)場中開展博弈對抗。在人腦知識網(wǎng)絡(luò)的支撐下,所有判斷、決策、控制信息均由指揮員、參謀下達至虛擬戰(zhàn)場,虛擬戰(zhàn)場產(chǎn)生紅藍雙方的推演數(shù)據(jù)發(fā)送給機腦知識網(wǎng)絡(luò),機腦知識網(wǎng)絡(luò)進行分析、關(guān)聯(lián),獲取指揮員、參謀的目標識別經(jīng)驗、戰(zhàn)術(shù)戰(zhàn)法、決策規(guī)律等知識,初步構(gòu)建形成知識圖譜。人-人博弈對抗訓練的運行機制如圖3所示。
圖3 人-人博弈對抗訓練的運行機制Fig.3 Operational mechanism of game confrontation training (human to human)
(2) 人-機博弈對抗訓練
機器學習獲取了一定的決策知識后,就可以開展人與機器的博弈對抗訓練。同樣,由博弈對抗推演環(huán)境構(gòu)建一個虛擬任務(wù)和作戰(zhàn)環(huán)境,由指揮員、參謀指揮紅方兵力,機器指揮藍方兵力進行博弈對抗。紅方的決策信息由指揮員/參謀下達至虛擬戰(zhàn)場。藍方的指揮決策則基于機腦知識網(wǎng)絡(luò)中的知識圖譜和知識服務(wù)下達至虛擬戰(zhàn)場。虛擬戰(zhàn)場產(chǎn)生紅藍雙方的推演數(shù)據(jù)發(fā)送給機腦知識網(wǎng)絡(luò),機腦知識網(wǎng)絡(luò)的知識圖譜進一步擴展,挖掘深層次、隱含的規(guī)律,發(fā)現(xiàn)決策中的缺陷和薄弱環(huán)節(jié),驗證算法的有效性,優(yōu)化決策模型,實現(xiàn)機腦知識網(wǎng)絡(luò)的演化生長。人-機博弈對抗訓練的運行機制如圖4所示。
圖4 人-機博弈對抗訓練的運行機制Fig.4 Operational mechanism of game confrontation training (human to computer)
(3) 機-機博弈對抗訓練
當機器的知識網(wǎng)絡(luò)趨于完善,具備與人進行博弈對抗的能力后,就可以開展機器自主的博弈對抗訓練。由機器扮演對抗的紅藍雙方,在機腦知識網(wǎng)絡(luò)的支撐下,所有判斷、決策、控制均由機器作出,并將信息下達至虛擬戰(zhàn)場,實現(xiàn)機器全天候不間斷的博弈對抗訓練,不斷積累樣本數(shù)據(jù),優(yōu)化知識網(wǎng)絡(luò),并探索人腦無法設(shè)想到的復雜場景下的決策模式,實現(xiàn)機器能力的自主提升。機-機博弈對抗訓練的運行機制如圖5所示。
圖5 機-機博弈對抗訓練的運行機制Fig.5 Operational mechanism of game confrontation training (computer to computer)
戰(zhàn)前的博弈對抗訓練已實現(xiàn)機器獲取人的認知能力,形成了能夠自主決策的“機器大腦”。在真實作戰(zhàn)過程中,博弈對抗推演環(huán)境接入傳感器的真實情報數(shù)據(jù),機器作為“虛擬指揮員”或“參謀”,運用“機器大腦”實現(xiàn)與對手的全自主作戰(zhàn),指揮員、參謀只需監(jiān)控機器的作戰(zhàn)執(zhí)行過程,在關(guān)鍵節(jié)點作出重要決策,掌控戰(zhàn)場態(tài)勢走向。平行仿真推演的運行機制如圖6所示。
圖6 平行仿真推演的運行機制Fig.6 Operational mechanism of parallel simulation deduction
在本文提出的架構(gòu)范式的指導下,結(jié)合智能目標識別與攔截的作戰(zhàn)場景,采用美國國防部體系結(jié)構(gòu)框架 2.0 版(department of defense architecture framework,DoDAF2.0)[14]的系統(tǒng)接口描述模型(SV-1)和系統(tǒng)狀態(tài)轉(zhuǎn)移描述模型(SV-10b),運用自主研發(fā)的體系架構(gòu)開發(fā)工具ModelDesigner,分別開展典型系統(tǒng)組成和運行流程設(shè)計,對面向人機融合的C4ISR系統(tǒng)架構(gòu)范式進行實例化。
以紅方指揮所發(fā)現(xiàn)藍方不明目標并采取行動應(yīng)對的場景為例,設(shè)計紅方的人機融合目標識別與武器控制系統(tǒng)。紅方機腦已通過戰(zhàn)前人-人、人-機、機-機的博弈對抗學習訓練,積累了目標識別、武器控制等相關(guān)知識,形成一定的自主判斷、決策與控制能力。
首先,紅方雷達發(fā)現(xiàn)藍方空中一批不明目標,由紅方參謀初步判斷,假設(shè)目標屬性,紅方機腦進行關(guān)聯(lián)印證,驗證參謀的判斷。紅方指揮員決策是否對藍方目標采取反制措施,以及采用的武器平臺,由紅方機腦接入真實目標情報,進行平行推演,預測紅藍雙方對抗態(tài)勢,并控制紅方武器行動。
設(shè)計SV-1并細化到第2層系統(tǒng)組成,系統(tǒng)組成模型如圖7所示,系統(tǒng)組成描述如表1所示。
圖7 系統(tǒng)組成模型Fig.7 Systems composition model
表1 系統(tǒng)組成描述Table 1 Systems composition description
針對7個系統(tǒng)組成,設(shè)計SV-1的系統(tǒng)組成之間的關(guān)系模型,如圖8所示。
圖8 系統(tǒng)組成關(guān)系模型Fig.8 Systems composition relationship model
通過以上設(shè)計,建立了人機融合的目標識別與武器控制系統(tǒng)的SV-1模型,基于機腦知識網(wǎng)絡(luò)和博弈對抗推演環(huán)境,實現(xiàn)對參謀假設(shè)的印證,并自主預測敵方行動路線,提前發(fā)現(xiàn)指揮員意想不到的敵情,實現(xiàn)機器“智力”與指揮員和參謀“謀略”共生共長。該模型為下一代智能化C4ISR系統(tǒng)詳細設(shè)計、驗證、研制提供了重要支持。
采用泳道圖的方式設(shè)計SV-10b系統(tǒng)狀態(tài)轉(zhuǎn)移描述模型,任務(wù)場景分為2個階段,分別是目標識別階段和平行推演階段,如圖9所示。
圖9 系統(tǒng)狀態(tài)轉(zhuǎn)移描述模型Fig.9 Systems state transition description model
在目標識別階段,紅方機腦情報感知系統(tǒng)的雷達發(fā)現(xiàn)藍方空中一批不明目標,將融合后的航線上報給參謀,參謀觀察航線信息,根據(jù)與大腦中的目標畫像知識匹配,初步假設(shè)目標為2架A型偵察機;為了驗證參謀假設(shè)的正確性,并獲得更準確的目標屬性,機腦知識網(wǎng)絡(luò)在知識圖譜中調(diào)取A型偵察機的典型航線,并進行匹配;同時,為進一步確認目標的國別、意圖,機腦知識網(wǎng)絡(luò)調(diào)取機腦情報感知系統(tǒng)收集的熱點事件,發(fā)現(xiàn)近期B國在該區(qū)域開展軍事演習的事件,由此,機腦應(yīng)用系統(tǒng)確認目標的型號、國別、意圖的基本屬性。
在平行推演階段,紅方指揮員依據(jù)人腦知識網(wǎng)絡(luò)中的戰(zhàn)法經(jīng)驗,決策采用3架C型殲擊機對藍方偵察機進行攔截和驅(qū)逐。博弈對抗推演環(huán)境構(gòu)建一個虛實結(jié)合的戰(zhàn)場,機腦情報感知系統(tǒng)實時收集紅藍雙方武器平臺的真實情報信息。一方面,機腦應(yīng)用系統(tǒng)能夠基于機腦知識網(wǎng)絡(luò)的武器控制模型計算,實現(xiàn)對紅方殲擊機的自主行動控制,并超前規(guī)劃多條行動路線;另一方面,機腦知識網(wǎng)絡(luò)對藍方偵察機典型航線匹配,支撐機腦應(yīng)用系統(tǒng)對藍方偵察機航線的預測,從而實現(xiàn)紅藍雙方行動的超實時、多分支博弈對抗推演。在推演過程中,指揮員監(jiān)視虛實戰(zhàn)場中紅藍雙方的行動,當推演到關(guān)鍵分支節(jié)點時,指揮員可對紅方行動方向進行選擇決策,掌控戰(zhàn)場局勢。
通過以上設(shè)計,形成了人機融合的目標識別與武器控制系統(tǒng)的SV-10b模型,描述了系統(tǒng)基本業(yè)務(wù)流程?;跈C器自主博弈推演的方式,實現(xiàn)對抗性開放復雜決策問題搜索求解,突破指揮員腦力極限,為指揮員提供多條分支行動路線選擇,并探索人腦意向不到的結(jié)果,指揮員只需在關(guān)鍵節(jié)點進行決策,從而顛覆傳統(tǒng)機器作為計算工具的輔助決策方式,解決指揮藝術(shù)與機器智能有效融合的難題。該模型為智能化系統(tǒng)業(yè)務(wù)流程運轉(zhuǎn)提供了理論指導。
未來智能化戰(zhàn)爭中,只有將人腦的創(chuàng)造力、思維力與機器的計算力相結(jié)合,優(yōu)勢互補,形成人機互理解、互啟發(fā)的指揮控制模式,才能應(yīng)對超出人腦生理極限的高速、復雜、多變、持久的戰(zhàn)場環(huán)境。本文為人與機器智能深度融合的C4ISR系統(tǒng)架構(gòu)提供了指導性的設(shè)計范式,并以應(yīng)用實踐驗證其有效性,從而改變傳統(tǒng)機器作為輔助工具的人機協(xié)同作戰(zhàn)模式,塑造人與機器的混合增強智能[15],發(fā)揮1+1>2的體系作戰(zhàn)效能。