雷霆,朱承,張維明
(國(guó)防科技大學(xué)信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙410073)
軍事計(jì)劃是指指揮員根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)和所賦予的軍事任務(wù),使用有限的作戰(zhàn)資源(兵力、武器裝備),生成一系列行動(dòng)步驟和相關(guān)細(xì)節(jié)的過(guò)程,包含了多層次(與指揮組織層次對(duì)應(yīng))、多階段(計(jì)劃的生成、分析、執(zhí)行、調(diào)整)、多類型(如資源調(diào)度、路徑規(guī)劃)和多參與方.
軍事計(jì)劃一直是軍事決策的核心內(nèi)容,指揮部門(mén)決策主要圍繞著計(jì)劃的擬制與執(zhí)行展開(kāi).軍事計(jì)劃環(huán)境往往是高度壓力、不確定、多目標(biāo)、目標(biāo)變化的復(fù)雜非線性活動(dòng)[1].隨著現(xiàn)代戰(zhàn)爭(zhēng)正從機(jī)械化向信息化變革,軍事計(jì)劃問(wèn)題的復(fù)雜程度急劇增加,能否快速準(zhǔn)確地生成計(jì)劃成為影響戰(zhàn)爭(zhēng)成敗的關(guān)鍵所在.
軍事計(jì)劃問(wèn)題一直受到多學(xué)科領(lǐng)域的關(guān)注.心理與認(rèn)知科學(xué)領(lǐng)域從認(rèn)知層面研究人做計(jì)劃的問(wèn)題求解方式、描述結(jié)構(gòu)[2],并基于指揮員認(rèn)知特征提出了軍事計(jì)劃過(guò)程模型[1],但是在時(shí)間緊迫的戰(zhàn)爭(zhēng)環(huán)境中,人難以快速處理大量決策細(xì)節(jié).其他學(xué)科則研究如何使用自動(dòng)化方法來(lái)解決計(jì)劃問(wèn)題.人工智能領(lǐng)域中的自動(dòng)規(guī)劃能模擬人的計(jì)劃方式,將計(jì)劃問(wèn)題視為搜索生成行動(dòng)序列,將問(wèn)題的初始狀態(tài)轉(zhuǎn)化為目標(biāo)狀態(tài),并做了有限狀態(tài)、確定性、靜態(tài)、串行行動(dòng)等嚴(yán)格問(wèn)題的假設(shè)[3],而不確定、動(dòng)態(tài)的軍事計(jì)劃問(wèn)題不能滿足這些假設(shè),并且難以建立完備的領(lǐng)域知識(shí),因此無(wú)法直接求解.管理科學(xué)領(lǐng)域主要使用運(yùn)籌學(xué)的方法對(duì)計(jì)劃問(wèn)題的相關(guān)要素特征進(jìn)行分析和建模,求解優(yōu)化結(jié)果.
由于軍事計(jì)劃問(wèn)題是非結(jié)構(gòu)化的問(wèn)題,問(wèn)題要素難以被建模和求解.這些自動(dòng)化方法不能體現(xiàn)指揮員的策略、經(jīng)驗(yàn)和偏好,并且整個(gè)過(guò)程對(duì)于用戶是一個(gè)“黑盒”,用戶無(wú)法控制和理解問(wèn)題的求解過(guò)程.單靠人或自動(dòng)化的方法均無(wú)法解決軍事計(jì)劃問(wèn)題,若能綜合利用人機(jī)各自的知識(shí)和問(wèn)題的解決能力,則能夠處理軍事計(jì)劃中的復(fù)雜性和動(dòng)態(tài)性,提高計(jì)劃質(zhì)量.因此從多學(xué)科交叉的角度出發(fā),分析人和自動(dòng)化之間如何協(xié)同解決軍事計(jì)劃問(wèn)題,具有重要的理論意義.這不僅能夠有助于軍事計(jì)劃問(wèn)題的求解,還能夠解決此類具備不確定性、動(dòng)態(tài)性和對(duì)抗性的復(fù)雜計(jì)劃問(wèn)題,如搶險(xiǎn)救災(zāi)、商業(yè)競(jìng)爭(zhēng)等.
人機(jī)協(xié)同計(jì)劃技術(shù)在軍事決策中已經(jīng)得到廣泛應(yīng)用,使軍事計(jì)劃朝著科學(xué)、高效、精確的方向發(fā)展,其應(yīng)用的發(fā)展可分為3個(gè)階段.第1個(gè)階段從20世紀(jì)90年代初至90年代中期.海灣戰(zhàn)爭(zhēng)之后,dARPA贊助的 ARPI(dARPA-Rome planning initiative)項(xiàng)目[4]研究了一系列人機(jī)協(xié)同計(jì)劃系統(tǒng),輔助制定物資調(diào)度、應(yīng)急救援、空軍戰(zhàn)役等計(jì)劃,解決了人對(duì)計(jì)劃系統(tǒng)的控制問(wèn)題.第2個(gè)階段從20世紀(jì)90年代中期至90年代末,研究重點(diǎn)是增強(qiáng)計(jì)劃系統(tǒng)的透明性和可指導(dǎo)性,并將應(yīng)用的范圍擴(kuò)展到計(jì)劃的全周期,處理層次擴(kuò)充到非戰(zhàn)爭(zhēng)軍事行動(dòng)等[5].第3個(gè)階段從21世紀(jì)初至今,研究人員將人機(jī)協(xié)同計(jì)劃應(yīng)用到特種作戰(zhàn)行動(dòng)[6]、多國(guó)聯(lián)合行動(dòng)[7]等領(lǐng)域,能夠解決決策時(shí)間緊迫、態(tài)勢(shì)動(dòng)態(tài)變化的計(jì)劃
問(wèn)題,輔助聯(lián)合行動(dòng)計(jì)劃的協(xié)同.
國(guó)外學(xué)者對(duì)人機(jī)協(xié)同軍事計(jì)劃技術(shù)進(jìn)行了廣泛研究,但國(guó)內(nèi)學(xué)者在這一領(lǐng)域的研究還局限于對(duì)軍事計(jì)劃本體的描述,因此本文主要是在國(guó)外學(xué)者的相關(guān)文獻(xiàn)基礎(chǔ)上進(jìn)行綜述.
人機(jī)協(xié)同計(jì)劃過(guò)程既要處理不同層次、不同類型的決策計(jì)算間的影響,又要通過(guò)建立人與自動(dòng)化間的協(xié)同來(lái)改進(jìn)解決方案,因此是一個(gè)分層、分階段、迭代遞增的解決過(guò)程.本文針對(duì)軍事計(jì)劃的問(wèn)題特性,根據(jù)人機(jī)協(xié)同軍事計(jì)劃的流程,提出了人機(jī)協(xié)同軍事計(jì)劃技術(shù)的一般體系結(jié)構(gòu),如圖1所示.
圖1 人機(jī)協(xié)同軍事計(jì)劃體系結(jié)構(gòu)Fig.1 The structure of human-machine collaborative planning system
計(jì)劃模型描述模塊提供人機(jī)能共同理解的計(jì)劃描述,是人機(jī)協(xié)同的基礎(chǔ);方案生成模塊提供了計(jì)劃生成方法;方案調(diào)整模塊提供方案在戰(zhàn)場(chǎng)環(huán)境中執(zhí)行時(shí)的動(dòng)態(tài)調(diào)整方法;方案解釋模塊向用戶提供方案的決策原因解釋和展示.
本文從計(jì)劃模型描述、行動(dòng)方案生成、行動(dòng)方案解釋、行動(dòng)方案調(diào)整4個(gè)方面分析人機(jī)協(xié)同計(jì)劃策略在軍事計(jì)劃過(guò)程中的應(yīng)用.
人機(jī)協(xié)同計(jì)劃過(guò)程中需要讓人與系統(tǒng)之間能夠交流計(jì)劃信息,包括計(jì)劃過(guò)程、計(jì)劃結(jié)果等,而傳統(tǒng)計(jì)劃文書(shū)和圖表無(wú)法直接被系統(tǒng)使用,且智能規(guī)劃中基于狀態(tài)描述的模型也難以表達(dá)復(fù)雜軍事計(jì)劃,這就需要研究人機(jī)通用的計(jì)劃模型描述.
人機(jī)協(xié)同軍事計(jì)劃模型描述通過(guò)本體來(lái)實(shí)現(xiàn).本體被Studer[8]定義為共享概念模型的明確的形式化規(guī)范說(shuō)明,能夠被計(jì)算機(jī)所理解和使用.本體模型分為2類:1)面向過(guò)程描述的本體技術(shù),其對(duì)計(jì)劃流程各方面領(lǐng)域知識(shí)進(jìn)行形式化描述,目的是促進(jìn)不同計(jì)劃系統(tǒng)、人與系統(tǒng)之間對(duì)計(jì)劃的共同理解,但難以用于組織間的計(jì)劃協(xié)同;2)面向約束描述的本體技術(shù),其描述聯(lián)合軍事計(jì)劃,并且增加了對(duì)計(jì)劃理性的表示,用于促進(jìn)不同軍事組織之間的計(jì)劃協(xié)同.其中基本理性描述作出計(jì)劃決策的原因和依賴的假設(shè),包括3類理性[9]:“因果關(guān)系”理性描述領(lǐng)域約束如何被應(yīng)用的推理步驟;“依賴性”理性描述計(jì)劃實(shí)體真值如何被維護(hù);“決策”理性關(guān)注于如何產(chǎn)生其他計(jì)劃實(shí)體的決策和假設(shè).
描述軍事計(jì)劃內(nèi)容的本體已有大量的研究,代表性的有20世紀(jì)90年代dARPA開(kāi)發(fā)的核心計(jì)劃描述CPR[10],它從過(guò)程的角度對(duì)計(jì)劃進(jìn)行建模,是描述計(jì)劃、過(guò)程、活動(dòng)通用信息的模型.接著Gil等[11]提出了計(jì)劃本體PLANET,能夠描述計(jì)劃上下文和構(gòu)成計(jì)劃問(wèn)題背景的約束、計(jì)劃問(wèn)題中關(guān)于環(huán)境初始狀態(tài)和目標(biāo)的信息,并在外部約束和計(jì)劃承諾之間做了明顯區(qū)分.
描述軍事計(jì)劃領(lǐng)域中實(shí)體(如資源、時(shí)間、可視模式)的本體與具體應(yīng)用相關(guān).Smith[12]建立了調(diào)度領(lǐng)域?qū)ο蟊倔wOZONE,能描述活動(dòng)、資源和相關(guān)約束,并建立了在計(jì)劃器層時(shí)間約束網(wǎng)絡(luò)中“環(huán)”的距離約束描述(將它們描述為活動(dòng)時(shí)間相互依賴集、活動(dòng)次序依賴),用于面向用戶的計(jì)劃解釋創(chuàng)建.Lino[13]提出了用于計(jì)劃可視化模式的語(yǔ)義模型,包括對(duì)可視化模式、計(jì)劃過(guò)程信息、移動(dòng)顯示設(shè)備特征、用者Agent特征、環(huán)境的描述.
在基于本體的計(jì)劃描述的基礎(chǔ)上,研究人員提出了基于約束的聯(lián)合計(jì)劃描述方法.Tate[14]使用基于約束的描述方法,將計(jì)劃認(rèn)為是在約束內(nèi)滿足任務(wù)目標(biāo)的設(shè)計(jì),提出了<I-N-C-A> 計(jì)劃描述框架(前身是<I-N-OVA>),將計(jì)劃內(nèi)容描述為議題(issue)、節(jié)點(diǎn)(node)、約束(constraint)和標(biāo)注(annotation),能被規(guī)劃器和計(jì)劃人員所共同理解,并且標(biāo)注部分能夠描述記錄計(jì)劃過(guò)程中處理議題的理性.<I-N-CA>已被應(yīng)用到多國(guó)聯(lián)合行動(dòng)計(jì)劃實(shí)驗(yàn)中.
Allen 等[15]在 PLANET 和<I-N-OVA> 計(jì)劃描述語(yǔ)言的基礎(chǔ)上,提出了協(xié)同計(jì)劃模型(collaborative planning model,CPM),使用邏輯描述語(yǔ)言O(shè)WL形式化描述軍事計(jì)劃內(nèi)容,并能夠描述計(jì)劃基本理性,適合表達(dá)限定計(jì)劃相關(guān)決策的不同形式的上下文信息.
國(guó)內(nèi)的楊建池等[16]討論了軍事領(lǐng)域本體的構(gòu)建;錢(qián)猛等[17]描述了本體技術(shù)在作戰(zhàn)計(jì)劃系統(tǒng)中的應(yīng)用.
軍事計(jì)劃模型描述依據(jù)本體技術(shù),從面向過(guò)程和面向約束2種角度出發(fā)描述計(jì)劃內(nèi)容,為人機(jī)協(xié)同計(jì)劃中人機(jī)交互提供了計(jì)劃共享上下文和內(nèi)容,是進(jìn)行行動(dòng)方案生成、解釋、校驗(yàn)和調(diào)整的基礎(chǔ).
在行動(dòng)方案生成中,根據(jù)計(jì)劃問(wèn)題空間的搜索策略的不同可將計(jì)劃生成方法分為:1)交互約束計(jì)劃方法,由人機(jī)添加各種約束,填補(bǔ)計(jì)劃細(xì)節(jié)等[18];2)基于指導(dǎo)的計(jì)劃方法,由人提供高層指導(dǎo),機(jī)器快速填充具體實(shí)現(xiàn)細(xì)節(jié).
交互約束方法又可分為層次式和機(jī)會(huì)式2種.前者使用最小承諾策略,人機(jī)協(xié)同遞增、自頂向下地精化;后者是盡可能快地“跳躍”到一個(gè)解決方案,機(jī)會(huì)式地解決計(jì)劃問(wèn)題[2].層次式計(jì)劃方法應(yīng)用于具備良好層次結(jié)構(gòu)的計(jì)劃領(lǐng)域,常采用HTN這種層次式計(jì)劃方法[8],因?yàn)镠TN符合軍事計(jì)劃活動(dòng)中人的逐層精化思想.機(jī)會(huì)式計(jì)劃模型面向的是病態(tài)結(jié)構(gòu)計(jì)劃領(lǐng)域,需要處理動(dòng)態(tài)變化的計(jì)劃約束.Ferguson等[19]借鑒人與人之間協(xié)同計(jì)劃的對(duì)話方式,采用混合主動(dòng)(即系統(tǒng)中“主動(dòng)性”是共享的,每方都能貢獻(xiàn)于計(jì)劃的開(kāi)發(fā)和管理,而無(wú)需被明確要求[20])的方式機(jī)會(huì)式地生成計(jì)劃.Smith[21]研究了在約束不確定的情況下計(jì)劃生成的方法,將活動(dòng)和時(shí)序約束描述為簡(jiǎn)單時(shí)序問(wèn)題(simple temporal problem,STP),約束網(wǎng)絡(luò)中的時(shí)間邊,當(dāng)用戶決策增加或調(diào)整了約束,約束傳播更新受影響的節(jié)點(diǎn)邊界,從而實(shí)現(xiàn)計(jì)劃的遞增式生成.
這種計(jì)劃模型問(wèn)題解決的方式是迭代遞增的,關(guān)注人機(jī)交替約束計(jì)劃的細(xì)節(jié).但在實(shí)際軍事計(jì)劃中,用戶更擅長(zhǎng)高層計(jì)劃策略的探索,而由計(jì)劃器來(lái)填充細(xì)節(jié).這種通過(guò)目標(biāo)調(diào)整來(lái)獲得計(jì)劃的方式更符合指揮員的習(xí)慣[22].因此研究人員又將注意力投向了基于指導(dǎo)的計(jì)劃生成方法.
基于指導(dǎo)的計(jì)劃方法可分為:1)基于目標(biāo)操縱:人根據(jù)資源性能和約束,在目標(biāo)空間中不斷調(diào)整,由計(jì)劃器反饋目標(biāo)的可行性,以搜索到可行的目標(biāo)[22];2)基于草圖(sketch)的計(jì)劃方法:人給出高層的問(wèn)題解決策略(草圖),由計(jì)劃器來(lái)快速填充其他的計(jì)劃內(nèi)容,或提出策略的修復(fù)建議.
基于目標(biāo)操縱的計(jì)劃模型主要研究用戶級(jí)目標(biāo)描述到計(jì)劃器目標(biāo)的轉(zhuǎn)換.Cox等[23]描述目標(biāo)為行動(dòng)謂詞,并基于目標(biāo)層次定義了目標(biāo)空間轉(zhuǎn)換操作,包括目標(biāo)類型轉(zhuǎn)換(如實(shí)例化)、目標(biāo)參數(shù)轉(zhuǎn)換和價(jià)(valence)轉(zhuǎn)換,并且為使得目標(biāo)謂詞能夠?yàn)榛跔顟B(tài)空間推理的計(jì)劃器所使用,將目標(biāo)中的行動(dòng)映射為計(jì)劃器中操作符的效果狀態(tài)文字(literal).
基于草圖的計(jì)劃模型主要研究如何識(shí)別草圖,將其轉(zhuǎn)化為計(jì)劃生成過(guò)程和結(jié)果上的各類約束和控制.草圖可分為:
1)所需計(jì)劃過(guò)程特性.Myer[24]提出了描述計(jì)劃高層屬性的元級(jí)理論,構(gòu)建了3類結(jié)構(gòu):角色(操作符中對(duì)象功能)、特征(操作符屬性)和度量,并定義2類策略建議[25]:a)角色建議:指出哪種角色填充是需要的或者限制在具體活動(dòng)中;b)方法建議:規(guī)定或禁止計(jì)劃內(nèi)具體活動(dòng)的使用.為使策略建議能指導(dǎo)計(jì)劃器,Myer[25]根據(jù)HTN計(jì)劃精化結(jié)構(gòu),在角色填充滿足和活動(dòng)匹配的概念上定義計(jì)劃約束滿足,并通過(guò)考慮HTN節(jié)點(diǎn)的操作符選擇和環(huán)境狀態(tài)、當(dāng)前部分計(jì)劃精化結(jié)構(gòu)上下文,將建議約束轉(zhuǎn)化為操作符使用約束和計(jì)劃過(guò)程約束.
2)所需計(jì)劃結(jié)果特性.Myer等[26]以 HTN 作為計(jì)劃算法基礎(chǔ),使用一階謂詞描述要完成的任務(wù),并提出草圖擴(kuò)充算法:先使用演繹式的計(jì)劃識(shí)別方法,將草圖中各成分關(guān)聯(lián)到候選高層目標(biāo),再基于此關(guān)聯(lián)將所選高層目標(biāo)集擴(kuò)展為全部計(jì)劃.Kott[27]研究了將軍事行動(dòng)時(shí)空策略擴(kuò)展為可執(zhí)行計(jì)劃的方法,基于HTN將行動(dòng)、調(diào)度等計(jì)算緊密交叉遞增,分解當(dāng)前任務(wù),產(chǎn)生受限遞增的任務(wù)集,再由調(diào)度步驟執(zhí)行時(shí)序約束傳播,并調(diào)度新增加活動(dòng)到可用資源和時(shí)間階段.
基于目標(biāo)操縱的計(jì)劃方法能夠處理計(jì)劃目標(biāo)在態(tài)勢(shì)動(dòng)態(tài)變化下需動(dòng)態(tài)調(diào)整的情況,這種方法可根據(jù)資源性能約束靈活調(diào)整目標(biāo),但其缺點(diǎn)是將用戶和計(jì)劃細(xì)節(jié)完全隔開(kāi).基于草圖的計(jì)劃方法能夠指出計(jì)劃過(guò)程和結(jié)果需要實(shí)現(xiàn)的策略,但是草圖中可能存在的不一致性(如多個(gè)建議之間的沖突)會(huì)增加對(duì)草圖的反復(fù)調(diào)整過(guò)程.
表1列舉了本節(jié)所討論的行動(dòng)方案生成技術(shù).
表1 行動(dòng)方案生成技術(shù)Table 1 Plan generation technology
行動(dòng)方案生成的研究從智能規(guī)劃技術(shù)出發(fā),通過(guò)將人對(duì)規(guī)劃算法細(xì)節(jié)的操縱和高層策略的指導(dǎo)實(shí)現(xiàn),在計(jì)劃中體現(xiàn)人的經(jīng)驗(yàn)、偏好,其中基于指導(dǎo)的計(jì)劃方法避免了人在計(jì)劃細(xì)節(jié)調(diào)整中可能存在的前后不一致性,能夠快速生成行動(dòng)計(jì)劃.但是這種方式限制了用戶對(duì)細(xì)節(jié)調(diào)整的靈活性,在實(shí)際應(yīng)用中需要其與交互約束計(jì)劃方法結(jié)合使用.
在生成行動(dòng)方案的過(guò)程中,系統(tǒng)需向用戶提供對(duì)計(jì)劃系統(tǒng)決策的解釋,并對(duì)計(jì)劃內(nèi)容進(jìn)行抽象、概括和展示.解釋一方面能增強(qiáng)用戶對(duì)系統(tǒng)方案的理解和信任,另一方面當(dāng)系統(tǒng)決策失敗時(shí),對(duì)問(wèn)題原因的解釋能夠讓用戶選擇可行的修復(fù)策略.
當(dāng)系統(tǒng)需要向用戶解釋問(wèn)題解決過(guò)程中的搜索失敗或方案不一致時(shí),通常使用抽象領(lǐng)域模型將內(nèi)部的系統(tǒng)描述映射到用戶級(jí)的行動(dòng)中,映射方式與底層計(jì)劃系統(tǒng)描述和上層本體相關(guān).
目前的系統(tǒng)解釋研究多集中于基于約束推理的計(jì)劃器上的產(chǎn)生約束沖突的解釋.Smith等[28]利用時(shí)間約束網(wǎng)絡(luò)中“環(huán)”在距離約束上的結(jié)構(gòu),通過(guò)計(jì)算形成解釋的約束集和識(shí)別用戶能用來(lái)解決調(diào)度中沖突的約束松弛選項(xiàng),提供內(nèi)容創(chuàng)建關(guān)于沖突的解釋.Siebra[29]以<I-N-C-A >計(jì)劃本體為基礎(chǔ),通過(guò)捕獲與計(jì)劃的約束處理失敗相關(guān)聯(lián)的事件,為事件獲取解釋模板并將其實(shí)例化,為計(jì)劃的失敗作出解釋.但這種面向用戶的解釋技術(shù)目前較少被研究,較多的是集中于面向底層描述的解釋技術(shù),如在約束滿足問(wèn)題解決領(lǐng)域解釋的創(chuàng)建通常是面向單個(gè)決策變量和約束[30].
除了向用戶提供計(jì)劃決策解釋之外,計(jì)劃系統(tǒng)還需以多視角將計(jì)劃視圖展現(xiàn)給用戶.包括:1)計(jì)劃內(nèi)容的多種視角.常用的計(jì)劃視角類型包括:任務(wù)(行動(dòng)網(wǎng)絡(luò))視角、資源視角、時(shí)空視角等.2)面向用戶角色的多視角.不同職責(zé)權(quán)限人員的計(jì)劃視圖不同.3)面向顯示設(shè)備的多視角.Lino[13]使用計(jì)劃可視化的語(yǔ)義模型和推理機(jī)制來(lái)支持協(xié)同計(jì)劃中的多??梢暬?該方法從可視化角度來(lái)組織和建模計(jì)劃領(lǐng)域,并且為信息描述提供了可裁剪的支持.
當(dāng)計(jì)劃方案的要素?cái)?shù)量眾多并且難以展現(xiàn)時(shí),需要經(jīng)過(guò)近似、抽象等操作,使得用戶能夠理解計(jì)劃方案的特征.常使用的方法有:1)近似計(jì)劃結(jié)果,以簡(jiǎn)化視圖.如Bresina[31]中對(duì)于計(jì)劃調(diào)度結(jié)果數(shù)量巨大、具有靈活開(kāi)的始時(shí)間范圍,設(shè)計(jì)的視圖中只顯示調(diào)度的固定開(kāi)始時(shí)間;2)提取計(jì)劃統(tǒng)計(jì)特征.如M-yer[32]提出了興趣時(shí)序?qū)傩愿爬?summarization of interesting temporal properties,SITP)的框架,對(duì)計(jì)劃中的時(shí)序特征(如任務(wù)頻率、時(shí)序模式)進(jìn)行分析,以提升用戶對(duì)計(jì)劃的理解.3)提取計(jì)劃高層特征.如Myer[24]研討了利用計(jì)劃元理論從計(jì)劃結(jié)果中抽取高層屬性的可能.
表2羅列了所討論的行動(dòng)方案解釋技術(shù).
表2 行動(dòng)方案解釋技術(shù)Table 2 Plan explanation technology
行動(dòng)方案解釋技術(shù)是研究如何將智能規(guī)劃系統(tǒng)的問(wèn)題解決過(guò)程和問(wèn)題的解決結(jié)果以用戶可理解的方式展現(xiàn)的方法,其中關(guān)于對(duì)系統(tǒng)生成計(jì)劃的抽象、概括方面的研究目前還較少.
在開(kāi)始執(zhí)行方案后,由于戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)變化,計(jì)劃執(zhí)行可能會(huì)受到阻礙或需處理新目標(biāo),這就需要及時(shí)對(duì)行動(dòng)方案進(jìn)行調(diào)整,以使方案能夠適應(yīng)戰(zhàn)場(chǎng)環(huán)境.
戰(zhàn)場(chǎng)的態(tài)勢(shì)信息是海量和動(dòng)態(tài)變化的,需將與計(jì)劃執(zhí)行相關(guān)的信息過(guò)濾、傳遞給用戶,使用戶決定如何調(diào)整計(jì)劃.監(jiān)控的內(nèi)容不僅包括方案中行動(dòng)的執(zhí)行狀況,還包括計(jì)劃所依賴的基本理性(即所依賴的事實(shí)和假設(shè))相關(guān)信息.
監(jiān)控信息是由計(jì)劃結(jié)構(gòu)中行動(dòng)間的因果關(guān)系、行動(dòng)與事實(shí)間的依賴關(guān)系、決策理性等理性推導(dǎo)得出,與計(jì)劃器的形式化描述和推理方式相關(guān).Drabble等[33]采用因果鏈接描述計(jì)劃的結(jié)構(gòu),記錄計(jì)劃中行動(dòng)的效果和行動(dòng)間的依賴關(guān)系(一個(gè)行動(dòng)效果建立后面某些行動(dòng)的前提),通過(guò)行動(dòng)前提將計(jì)劃相關(guān)信息過(guò)濾給用戶,并根據(jù)計(jì)劃修復(fù)上下文(行動(dòng)當(dāng)前進(jìn)度),從目標(biāo)結(jié)構(gòu)推導(dǎo)行動(dòng)執(zhí)行失敗與外界事件對(duì)行動(dòng)的影響范圍;Myer[34]基于HTN計(jì)劃結(jié)構(gòu),從每一個(gè)節(jié)點(diǎn)搜集動(dòng)態(tài)的(如部隊(duì)運(yùn)動(dòng)位置)且沒(méi)被包含在先前節(jié)點(diǎn)效果中的前提條件作為監(jiān)視內(nèi)容;Veloso等[35]在基于狀態(tài)空間的計(jì)劃器(基于后向鏈方式)算法中的決策點(diǎn)(行動(dòng)選擇、行動(dòng)實(shí)例化、子目標(biāo)選擇)處創(chuàng)建3類影響決策的信息監(jiān)視:子目標(biāo)、行動(dòng)可行性前提和行動(dòng)量化前提監(jiān)視;Asuncion等[36]在部分序因果鏈接(partial order causal link,POCL)計(jì)劃算法中,記錄了行動(dòng)間因果關(guān)聯(lián)和每個(gè)因果關(guān)聯(lián)被加入的時(shí)間順序點(diǎn)(chronological point)作為計(jì)劃理性,并在環(huán)境狀態(tài)中文字(literal)或行動(dòng)效果中文字被刪時(shí),為受影響的因果關(guān)聯(lián)創(chuàng)建重計(jì)劃子目標(biāo),推導(dǎo)無(wú)法執(zhí)行行動(dòng)和與其相關(guān)的不穩(wěn)定行動(dòng);Susanne[37]的混合計(jì)劃技術(shù)結(jié)合了層次規(guī)劃和對(duì)行動(dòng)間因果依賴的明確推理,反應(yīng)了當(dāng)人在擬制計(jì)劃時(shí)所執(zhí)行的推理,使得失敗方案能夠被以一種保證穩(wěn)定性的方式修復(fù).
由于單行動(dòng)的失敗不足以反映對(duì)復(fù)雜的戰(zhàn)場(chǎng)環(huán)境中的計(jì)劃障礙,因此還需要用戶補(bǔ)充給出需要監(jiān)控的內(nèi)容.Myer[34]歸納了2種高層失敗模式:1)聚合級(jí)失敗:在許多情況下單個(gè)行動(dòng)失敗并不影響聚合級(jí)的失敗;2)不可歸屬失敗:雖然單個(gè)行動(dòng)沒(méi)有失敗,但是評(píng)估認(rèn)為計(jì)劃不適合,但還有更多的高層失敗模式需要?dú)w納.
當(dāng)用戶通過(guò)計(jì)劃監(jiān)控發(fā)現(xiàn)計(jì)劃執(zhí)行受阻或出現(xiàn)新的目標(biāo)時(shí),必須及時(shí)修改計(jì)劃以適應(yīng)新的態(tài)勢(shì).當(dāng)前研究中計(jì)劃修復(fù)的主要原則是:修復(fù)過(guò)程應(yīng)當(dāng)盡量重用原計(jì)劃內(nèi)容,計(jì)劃修復(fù)對(duì)原計(jì)劃擾動(dòng)最小,以保持原有計(jì)劃的穩(wěn)定性[38].由于計(jì)劃受到阻礙的原因可能是復(fù)雜的,因此用戶的參與對(duì)于保證計(jì)劃的動(dòng)態(tài)調(diào)整過(guò)程滿足用戶的需求和偏好也是必要的[34].
人機(jī)協(xié)同計(jì)劃修復(fù)過(guò)程根據(jù)人機(jī)分工不同,可分為2種類型:1)相互約束的修復(fù).Drabble等[33]對(duì)于被外界破壞的計(jì)劃因果鏈接,通過(guò)尋找已有的可能促成因素或添加新的行動(dòng)來(lái)插入合適效果,提供修復(fù)選擇,由用戶選擇合適行動(dòng);Myer[34]基于對(duì)計(jì)劃依賴結(jié)構(gòu)的分析,確定失敗來(lái)源的根節(jié)點(diǎn)集,并為根節(jié)點(diǎn)重計(jì)劃其子任務(wù)節(jié)點(diǎn);Veloso[35]等對(duì)于計(jì)劃監(jiān)視被觸發(fā)的情況,動(dòng)態(tài)創(chuàng)建控制規(guī)則,啟發(fā)重引導(dǎo)計(jì)劃空間的搜索,以執(zhí)行計(jì)劃的轉(zhuǎn)換操作(增加、刪除、跳轉(zhuǎn));Asuncion[36]允許失敗后先由用戶給出修復(fù)建議(增刪行動(dòng)、增刪目標(biāo)),這些修復(fù)對(duì)計(jì)劃造成影響(相關(guān)行動(dòng)被增加、刪除或變?yōu)椴环€(wěn)定,或重計(jì)劃子目標(biāo)被增加),系統(tǒng)利用具有時(shí)間戳的因果關(guān)聯(lián)來(lái)局部性地修復(fù)計(jì)劃.2)基于高層指導(dǎo)的修復(fù).Myer等[34]為了支持對(duì)不可歸屬等高層失敗的修復(fù),允許用戶能直接指定需要重新規(guī)劃的根節(jié)點(diǎn),并支持用戶直接給出基于策略建議[25]的計(jì)劃修復(fù)指導(dǎo);對(duì)于環(huán)境變化或資源問(wèn)題造成目標(biāo)無(wú)法完成的情況,Cox等[23]直接對(duì)目標(biāo)進(jìn)行轉(zhuǎn)換,實(shí)現(xiàn)全局的重計(jì)劃.
表3列出了所討論的行動(dòng)方案調(diào)整技術(shù).
表3 行動(dòng)方案調(diào)整技術(shù)Table 3 Plan repair technology
目前行動(dòng)方案調(diào)整研究的思路是依據(jù)計(jì)劃中包含的理性知識(shí)對(duì)計(jì)劃的執(zhí)行進(jìn)行監(jiān)控和局部修復(fù)調(diào)整,以保持計(jì)劃的穩(wěn)定性,在此過(guò)程中人能夠給出不同層次的建議.然而在聯(lián)合行動(dòng)中,由于外部的agent可能將其自身的計(jì)劃基于該agent所陳述的意圖(承諾),所以計(jì)劃修復(fù)質(zhì)量的度量還與agent維持計(jì)劃承諾相關(guān)聯(lián)[39].但目前缺乏對(duì)維持計(jì)劃承諾度量下的人機(jī)協(xié)同方案調(diào)整的研究.
從文中介紹可以看出人機(jī)協(xié)同軍事計(jì)劃系統(tǒng)研究方興未艾,這項(xiàng)技術(shù)是充分發(fā)揮人機(jī)性能、提高軍事指揮效能的有效手段,成為了軍事輔助決策技術(shù)中的一項(xiàng)重要研究?jī)?nèi)容,在今后若干年中仍會(huì)是一個(gè)研究熱點(diǎn),未來(lái)存在的技術(shù)趨勢(shì)有以下幾點(diǎn):
1)基于認(rèn)知科學(xué)的計(jì)劃過(guò)程中的人機(jī)任務(wù)分工.目前的計(jì)劃系統(tǒng)缺乏對(duì)軍事計(jì)劃環(huán)境下人的認(rèn)知特性和負(fù)荷、操作方式的量化分析,應(yīng)借鑒人機(jī)協(xié)同 決 策[40](human-machine collaborative decision making,HMCDM)和以人為中心的自動(dòng)化(humancentered automation)中的研究;對(duì)軍事行動(dòng)計(jì)劃生成中的人機(jī)任務(wù)分工進(jìn)行量化分析[40];對(duì)軍事計(jì)劃過(guò)程中人的操作進(jìn)行建模[41];確定計(jì)劃中人和系統(tǒng)的交互設(shè)計(jì),降低用戶的認(rèn)知偏差和負(fù)擔(dān);研究以人為中心的計(jì)劃擬制技術(shù),以滿足透明度、適度調(diào)整和基于事件反饋等原則[42].
2)不完備計(jì)劃模型下的計(jì)劃技術(shù).當(dāng)前的人機(jī)協(xié)同計(jì)劃中的系統(tǒng)仍需要完整的計(jì)劃領(lǐng)域知識(shí)描述,在面臨計(jì)劃模型不完備時(shí),無(wú)法生成有效的行動(dòng)方案.未來(lái)應(yīng)研究在不完備計(jì)劃知識(shí)下人機(jī)如何協(xié)同生成計(jì)劃,降低計(jì)劃方案對(duì)知識(shí)不完備情況的敏感性.借鑒輕量級(jí)的計(jì)劃技術(shù)[43],以降低領(lǐng)域建模負(fù)擔(dān).研究在計(jì)劃、目標(biāo)和偏好被完全定義之前,如何將計(jì)劃集成到一個(gè)迭代過(guò)程中[44];研究如何基于領(lǐng)域相關(guān)特征,生成多樣性的計(jì)劃方案[45];研究如何使用機(jī)器學(xué)習(xí)技術(shù),使計(jì)劃系統(tǒng)在計(jì)劃過(guò)程中學(xué)習(xí)用戶實(shí)施計(jì)劃的經(jīng)驗(yàn)和偏好,系統(tǒng)還應(yīng)能夠?qū)W習(xí)計(jì)劃案例,提取其中的計(jì)劃理性.
3)動(dòng)態(tài)不確定環(huán)境下的分布式人機(jī)協(xié)同計(jì)劃技術(shù).當(dāng)前大部分研究關(guān)注單人單機(jī)計(jì)劃的生成,難以在未來(lái)戰(zhàn)爭(zhēng)復(fù)雜的組織計(jì)劃環(huán)境中使用.應(yīng)當(dāng)研究動(dòng)態(tài)不確定混合主動(dòng)環(huán)境的分布式計(jì)劃,在分布環(huán)境下靈活地計(jì)劃、重計(jì)劃和任務(wù)分配[7].
總之,人機(jī)協(xié)同計(jì)劃是解決軍事行動(dòng)計(jì)劃問(wèn)題的有效途徑,是在未來(lái)戰(zhàn)爭(zhēng)中保持決策優(yōu)勢(shì)的重要方法.將人工智能、認(rèn)知科學(xué)、決策科學(xué)和運(yùn)籌學(xué)從不同學(xué)科角度對(duì)計(jì)劃的研究結(jié)合起來(lái),將是未來(lái)人機(jī)協(xié)同軍事計(jì)劃技術(shù)研究的主要方式.
[1]KLEIN G A,ORASANU J,CALDERWOOD R,et al.Decision making in action:models and methods[M].Norwood:Ablex Publishing,1993:138-147.
[2]ROTH H,PERRAULT B.A cognitive model of planning[J].Cognitive Science:A Multidisciplinary Journal,1979,3(4):275-310.
[3]GHALLAB M,NAU D,TRAVERSO P.Automated planning:theory and practice[M].San Fransisco:Morgan Kaufmann,2004:9-11.
[4]TATE A.Advanced planning technology:technological achievements of the ARPA/Rome laboratory planning initiative[M]//Menlo Park:AAAI Press,1996:3-10.
[5]MU?OZ-AVILA H,AHA D W,BRESLOW L,et al.HICAP:an interactive case-based planning architecture and its application to noncombatant evacuation operations[C]//Proceedings of the Eleventh Conference on Innovative Applications of Artificial Intelligence.Menlo Park:AAAI Press,1999:879-885.
[6]MYERS K L,TYSON W M.PASSAT:a user-centric planning framework[C]//Proceedings of the 3rd International NASA Workshop on Planning and Scheduling for Space.Houston,USA,2002:1-10.
[7]KOMENDA A,VOKRINEK J,PECHOUCEK M,et al.IGlobe:distributed planning and coordination of mixed-initiative activities[C]//Proceedings of Knowledge Systems for Coalition Operations(KSCO).[S.l.],UK,2009.
[8]STUDER R,BENJAMINS V R,F(xiàn)ENSEL D.Knowledge engineering,principles and methods[J].Data and Knowledge Engineeing,1998,25(1/2):161-197.
[9]POLYAK S,TATE A.Rationale in planning:causality,dependencies and decisions[J].Knowledge Engineering Review,1998,13(3):247-262.
[10]PEASE A,CARRICO T.JTF ATD core plan representation,SS-97-06[R].Menlo Park,1997.
[11]GIL Y,BLYTHE J.PLANET:a shareable and reusable ontology for representing plan[C]//Proceedings of the AAAI Workshop on Representational Issues for Real World Planning Systems.Menlo Park:AAAI Press,2000:28-33.
[12]SMITH S F,BECKER M A.An ontology for constructing scheduling systems[C]//Working Notes of 1997 AAAI Symposium on Ontological Engineering.Menlo Park:AAAI Press,1997:120-129.
[13]LINO N,TATE A,CHEN-BURGER Y H.A visualization approach for collaborative planning systems based on ontologies[C]//Proceedings of the Eighth International Conference on Information Visualization.Washington DC,USA,2004:807-811.
[14]TATE A.<I-N-C-A>:an ontology for mixed-initiative synthesis tasks[C]//Proceedings of the Workshop on Mixed-Initiative Intelligent Systems(MIIS)at the International Joint Conference on Artificial Intelligence(IJCAI-03).Acapulco,Mexico,2003:125-130.
[15]DORNEICH M C,MOTT D,BAHRAMI A,et al.Lessons learned from an evaluation of a shared representation to support collaborative planning[C]//Proceedings of Knowledge Systems for Coalition Operations(KSCO 2012).[S.l.],USA,2012.
[16]楊建池,韓守鵬,黃柯棣.軍事領(lǐng)域本體構(gòu)建研究[J].計(jì)算機(jī)仿真,2007,24(12):6-9.YANG Jianchi,HAN Shoupeng,HUANG Kedi.Research on military domain ontology development[J].Computer Simulation,2007,24(12):6-9.
[17]錢(qián)猛,劉忠,姚莉,等.本體技術(shù)在作戰(zhàn)計(jì)劃系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(16):18-23.QIAN Meng,LIU Zhong,YAO Li,et al.Survey for COA ontological technologies in military planning system[J].Computer Engineering and Applications,2009,45(16):18-23.
[18]KLAU G W,LESH N,MARKS J,et al.Human-guided search[J].Journal of Heuristics,2010,16(3):289-310.
[19]FERGUSON G,ALLEN J F,MILLER B.TRAINS-95:towards a mixed-initiative planning assistant[C]//Proceedings of the Third Conference on Artificial Intelligence Planning Systems.Menlo Park:AAAI Press,1996:70-77.
[20]BURSTEIN M H,MCDERMOTT D V.Issues in the development of human-computer mixed-Initiative planning systems[M]//Berlin:Elsevier,1996:285-303.
[21]SMITH S F,HILDUM D W,CRIMM D R.Comirem:an intelligent form for resource management[J].IEEE Intelligent Systems,2005,20(2):16-24.
[22]ZHANG C.Cognitive models for mixed-initiative planning[D].Dayton,USA:Wright State University,2002:11-14.
[23]COX M,VELOSO M.Controlling for unexpected goals when planning in a mixed-initiative setting[C]//Proceedings of 8th Portuguese AI Conference.Coimbra,Portuguese,1997:309-318.
[24]MYERS K L.Metatheoretic plan summarization and comparison[C]//Proceedings of the 16th International Conference on Automated Planning and Scheduling.Menlo Park,USA,2006:182-192.
[25]MYERS K L.Strategic advice for hierarchical planners[C]//Principles of Knowledge Representation and Reasoning:Proceedings of the Fifth International Conference.San Fransisco:Morgan Kaufmann Publishers,2006:112-123.
[26]MYERS K L.Abductive completion of plan sketches[C]//Proceedings of the Fourteenth National Conference on Artificial Intelligence.Menlo Park,USA,1997:687-693.
[27]KOTT A.Building a tool for battle planning:challenges,tradeoffs,and experimental findings[J].Applied Intelligence,2005,23(3):165-189.
[28]SMITH S F,CORTELLESSA G,HILDUM D W,et al.U-sing a scheduling domain ontology to compute user-oriented explanations[C]//16th European Conference on Artificial Intelligence Workshop on Planning and Scheduling:Bridging Theory to Practice.Valencia,Spain,2004:179-188.
[29]SIEBRA C A.A united approach to planning support in hierarchical coalitions[D].Edinburgh:University of Edinburgh,2006:87-91.
[30]JUSSIEN N,BARICHARD V.The PaLM system:explanation-based constraint programming[C]//Proceedings of Techniques for Implementing Constraint Programming Systems.Singapore,2000:118-133.
[31]BRESINA J L,JóNSSON A K,MORRIS P H,et al.Mixed-Initiative planning in MAPGEN:capabilities and shortcomings[C]//Proceedings of the ICAPS-05 Workshop on Mixed-initiative Planning and Scheduling.Menlo Park,USA,2005:54-61.
[32]MYERS K L.Temporal summarization of plans[C]//Proceedings of the ICAPS-2007 Workshop on Moving Planning and Scheduling Systems into the Real World.Menlo Park,USA,2007.
[33]DRABBLE B,TATE A.Repairing plans on the fly[C]//Proceedings of the NASA Workshop on Planning and Scheduling for Space.Oxnard,USA,1997.
[34]MYERS K L.CPEF:a continuous planning and execution framework[J].AI Magazine,1999,20(4):63-69.
[35]VELOSO M M,POLLACK M E,COX M T.Rationalebased monitoring for planning in dynamic environments[C]//Proceedings for the Fourth International Conference on AI Planning Systems.Pittsburgh,USA,1998:171-179.
[36]ASUNCION M,CASTILLO L,F(xiàn)ERNANDEZ-OLIVARES J,et al.Local(human-centered)replanning in the SIADEX framework[C]//Conference of the Spanish Association for Artificial Intelligence.San Sebastian, Spain,2003:79-88.
[37]BIUNDO S,BIDOT J,SCHATTENBERG B.Planning in the real world[J].Informatik Spektrum,2011,34(5):443-454.
[38]NEBEL B,KOEHLER J.Plan reuse versus plan generation:a theoretical and empirical analysis[J].Artificial Intelligence,1995,76(1/2):427-454.
[39]CUSHING W,KAMBHAMPATI S.Replanning:a new perspective[C]//Proceedings of the International Conference on Automated Planning and Scheduling.Monterey,USA,2005:13-16.
[40]MALASKY J S.Human machine collaborative decision making in a complex optimization system[D].Cambridge,USA:Massachusetts Institute of Technology,2005:44-51.
[41]GANAPATHY S.Human-centered time-pressured decision making in dynamic complex systems[D].Dayton,USA:Wright State University,2006:21-36.
[42]LEIFLER O.Combining technical and human-centered strategies for decision support in command and control:the comPlan approach[C]//Proceedings of the 5th International ISCRAM Conference.Washington,DC,USA,2008:504-515.
[43]KAMBHAMPATI S.Model-lite planning for the web age masses:the challenges of planning with incomplete and evolving domain models[C]//Proceedings of the 22th AAAI Conference on Artificial Intelligence.Vancouver,Canada,2007:1601-1604.
[44]SMITH D E.Planning as an iterative process[C]//Proceedings of the 26th AAAI Conference on Artificial Intelligence.Toronto,Canada,2012:2180-2185.
[45]COMAN A,MU?OZ A H.Qualitative vs.quantitative plan diversity in case based planning[C]//Proceedings of ICCBR 2011.London,UK,2011:32-46.