孫 昱, 姚佩陽, 李明輝, 李 凡
(1. 空軍工程大學信息與導航學院, 陜西 西安 710077; 2. 空軍后勤部, 北京 100720)
?
兵力組織指揮控制結(jié)構(gòu)適應(yīng)性調(diào)整方法
孫昱1, 姚佩陽1, 李明輝2, 李凡1
(1. 空軍工程大學信息與導航學院, 陜西 西安 710077; 2. 空軍后勤部, 北京 100720)
兵力組織指揮控制(command and control, C2)結(jié)構(gòu)適應(yīng)性調(diào)整問題是指揮自動化領(lǐng)域研究的熱點。首先介紹了兵力組織的組成要素,給出了兵力組織C2結(jié)構(gòu)的形式化描述方法,定義了兵力組織C2結(jié)構(gòu)的性能測度指標。然后分析了不同情形下兵力組織指控控制結(jié)構(gòu)適應(yīng)性調(diào)整問題,建立了相應(yīng)的數(shù)學優(yōu)化模型。最后基于m-best策略提出了一種貪心求解算法,并通過實驗證明了該算法的有效性和優(yōu)越性。
兵力組織; 指揮控制結(jié)構(gòu); 適應(yīng)性調(diào)整; 貪心算法
兵力組織是圍繞一定的作戰(zhàn)目的,由各作戰(zhàn)單元有機組合而形成的一個作戰(zhàn)整體。在信息化軍事對抗中,兵力組織面臨著戰(zhàn)場環(huán)境復雜多變的挑戰(zhàn)[1]。為了有效應(yīng)對這種挑戰(zhàn),兵力組織需要敏捷的組織模式來適應(yīng)環(huán)境的動態(tài)變化,從而獲取并維持對抗優(yōu)勢,最終達成作戰(zhàn)目的[2-3]。
兵力組織指揮控制結(jié)構(gòu)是兵力組織的關(guān)鍵要素[4-5],當戰(zhàn)場環(huán)境變化時,兵力組織指控結(jié)構(gòu)如何進行適應(yīng)性的調(diào)整是作戰(zhàn)指揮關(guān)注的重點。為了解決這一問題,文獻[6]預(yù)測戰(zhàn)場環(huán)境可能發(fā)生的變化并基于三階段方法構(gòu)造出若干可行的組織結(jié)構(gòu),然后根據(jù)組織結(jié)構(gòu)與戰(zhàn)場環(huán)境的一致性測度及組織結(jié)構(gòu)的調(diào)整代價來決定組織結(jié)構(gòu)的變遷路徑。文獻[7]進一步探討了動態(tài)環(huán)境參數(shù)的設(shè)計,同時以最小化組織的重構(gòu)代價與性能代價為目標建立了組織調(diào)整的優(yōu)化模型。文獻[8-9]基于分層思想研究了兵力組織決策層結(jié)構(gòu)的調(diào)整,并基于模擬退火提出了一種求解算法。文獻[10-11]則嘗試采用Petri網(wǎng)分析兵力組織的適應(yīng)性調(diào)整過程,建立組織的適應(yīng)性調(diào)整模型。
雖然目前對兵力組織指控結(jié)構(gòu)適應(yīng)性調(diào)整問題的研究已取得不少成果,但這些研究仍具有一定的局限性。首先,在衡量組織當前結(jié)構(gòu)的性能時常常忽略組織過去狀態(tài)可能造成影響;第二,較少考慮組織內(nèi)的決策單元發(fā)生損毀時的接替指揮問題;第三,求解問題模型的算法大多是智能搜索算法,難以保證求解的時效性要求。
為了解決這些問題,本文首先給出兵力組織指揮控制結(jié)構(gòu)的形式化描述方法并定義其性能測度指標;然后考慮不同情形下指控結(jié)構(gòu)的適應(yīng)性調(diào)整問題,建立相應(yīng)的數(shù)學模型;最后基于m-best策略提出一種貪心求解算法,并通過實驗證明該算法的有效性和優(yōu)越性。
1.1形式化描述
兵力組織中的實體通常包括任務(wù)實體(task, T)、平臺實體(platform, P)和決策實體(decision-maker, DM)。任務(wù)實體是兵力組織為達成其作戰(zhàn)目的而必須采取的行動。平臺實體是組織中作戰(zhàn)資源的承載單元,是作戰(zhàn)任務(wù)的直接參與者。決策實體是兵力組織中實施指揮控制的單元,分為戰(zhàn)役決策實體(operational decision-maker, ODM)和戰(zhàn)術(shù)決策實體(tactical decision-maker, TDM)。戰(zhàn)役決策實體負責對整個兵力組織進行宏觀集中控制,戰(zhàn)術(shù)決策實體控制平臺實體執(zhí)行具體的作戰(zhàn)任務(wù)。
兵力組織中通常含有一個戰(zhàn)役決策實體,若干戰(zhàn)術(shù)決策實體,若干任務(wù)實體和若干平臺實體[12]。兵力組織中各種實體間的關(guān)系形成了兵力組織的結(jié)構(gòu),如圖1所示。
圖1 兵力組織的結(jié)構(gòu)Fig.1 Structure of army organization
在圖1中,戰(zhàn)役決策實體指揮控制各個戰(zhàn)術(shù)決策實體,形成戰(zhàn)役決策實體對戰(zhàn)術(shù)決策實體的指控關(guān)系RODM-TDM;戰(zhàn)術(shù)決策實體間保持相互協(xié)作,形成協(xié)作關(guān)系RTDM-TDM;戰(zhàn)術(shù)決策實體指揮控制平臺實體,并執(zhí)行作戰(zhàn)任務(wù),形成戰(zhàn)術(shù)決策實體對平臺實體的指控關(guān)系RTDM-P和戰(zhàn)術(shù)決策實體對任務(wù)實體的執(zhí)行關(guān)系RTDM-T;平臺實體被分配參與作戰(zhàn)任務(wù),形成平臺實體在任務(wù)實體上的分配關(guān)系RT-P;各作戰(zhàn)任務(wù)之間具有一定的時序約束,形成任務(wù)間的時序關(guān)系RT-T。
定義 1兵力組織的行動計劃OOP是兵力組織為完成其作戰(zhàn)目的,制定的行動方案以及資源調(diào)度方案,由二元組OOP=(RT-T,RT-P)表示。
定義 2兵力組織的指揮控制(command and control, C2)結(jié)構(gòu)OC2是兵力組織根據(jù)其行動計劃,對組織內(nèi)各決策實體所屬的平臺、任務(wù),以及決策實體相互間關(guān)系作出的安排,由四元組OC2=(RODM-TDM,RTDM-TDM,RTDM-P,RTDM-T)表示。
1.2性能測度
當兵力組織的行動計劃確定時,組織的指控結(jié)構(gòu)決定了作戰(zhàn)過程中各戰(zhàn)術(shù)決策實體的工作負載。合理的指控結(jié)構(gòu)不僅可以均衡各戰(zhàn)術(shù)決策實體的負載,還能避免組織中不必要的協(xié)作從而降低戰(zhàn)術(shù)決策實體的負載均值[6],因此通過衡量兵力組織中各戰(zhàn)術(shù)決策實體的負載水平可以評估組織指控結(jié)構(gòu)的性能優(yōu)劣。
(1) 符號說明
在某一時刻t,兵力組織中所有戰(zhàn)術(shù)決策實體構(gòu)成的集合記為STDM={TDM1,TDM2,…, TDMND},ND為戰(zhàn)術(shù)決策實體的數(shù)量;所有平臺實體構(gòu)成的集合記為SP={P1,P2,…,PNP},NP為平臺實體的數(shù)量;所有任務(wù)實體構(gòu)成的集合記為ST={T1,T2,…,TNT},NT為任務(wù)實體的數(shù)量。
(1)
(2) 測度定義
(2)
(3)
(4)
2.1問題描述
兵力組織指控結(jié)構(gòu)進行適應(yīng)性調(diào)整主要包括以下兩種情形。
情形 1兵力組織在完成其作戰(zhàn)目的的過程中,由于戰(zhàn)場環(huán)境的復雜性和不確定性,其行動計劃可能因為任務(wù)的臨時增加或取消,平臺的新增或損毀而發(fā)生改變。行動計劃的變化可能導致兵力組織指控結(jié)構(gòu)性能的下降,進而影響組織的整體作戰(zhàn)效能。此時兵力組織需要適應(yīng)性地調(diào)整指控結(jié)構(gòu)來提高其性能。
情形 2當兵力組織中的戰(zhàn)術(shù)決策實體被破壞時,其所屬的平臺和任務(wù)應(yīng)由組織中的其他戰(zhàn)術(shù)決策實體接替指揮和完成,從而保證組織的穩(wěn)定性和作戰(zhàn)過程的連續(xù)性。此時兵力組織的指揮控制結(jié)構(gòu)也將進行適應(yīng)性的調(diào)整。
2.2指控結(jié)構(gòu)調(diào)整模型
(1) 情形1中的指控結(jié)構(gòu)調(diào)整
在情形1中,兵力組織雖然可以通過調(diào)整指控結(jié)構(gòu)來提高其性能,但是結(jié)構(gòu)的變化也會對組織產(chǎn)生不利影響,即組織需要承受一定的調(diào)整代價[6]。兵力組織指控結(jié)構(gòu)變化越大,兵力組織承受的調(diào)整代價越大,因此兵力組織需要在其可承受的范圍內(nèi)調(diào)整指控結(jié)構(gòu)。
(5)
情形1中兵力組織指揮控制結(jié)構(gòu)適應(yīng)性調(diào)整的模型為
(6)
(2) 情形2中的指控結(jié)構(gòu)調(diào)整
若兵力組織有ND個戰(zhàn)術(shù)決策實體,在情形2中不妨假定TDMND被破壞(因為若其他戰(zhàn)術(shù)決策實體被破壞,余下的ND-1個戰(zhàn)術(shù)決策實體可以重新編號為TDM1,TDM2,…,TDMND-1)。
(7)
式(6)和式(7)中的數(shù)學模型實質(zhì)是組合優(yōu)化問題,可以采用智能搜索算法如遺傳算法、模擬退火算法等進行求解,但是這類算法在有限的求解時間內(nèi)并能不一定能得到較好的結(jié)果。考慮到兵力組織指控結(jié)構(gòu)的適應(yīng)性調(diào)整是一個實時性要求較強的問題,本文基于m-best策略[15]提出一種貪心搜索算法(greedysearchalgorithm,GSA)來求解模型。
3.1子問題求解
(1) 基于貪心策略的求解
基于貪心策略求解子問題的過程如下:
(2) 基于m-best策略的求解
m-best策略是對貪心策略的一種改進。貪心策略每一步都能選擇一個局部最優(yōu)的結(jié)果,但是該選擇并不一定是全局最優(yōu)的。m-best策略每一步會對m個局部較好的結(jié)果進行全局性質(zhì)的評估,然后從中挑選一個作為當前結(jié)果,從而使最終結(jié)果逼近全局最優(yōu)。
基于m-best策略求解子問題的過程如下:
步驟 2判斷countA 3.2GSA算法流程 圖2 情形1中的GSA算法流程Fig.2 GSA algorithm flow in case 1 圖3 情形2中的GSA算法流程Fig.3 GSA algorithm flow in case 2 由圖2和圖3中的算法流程可知,GSA算法調(diào)用fm -best的次數(shù)不超過max(σ,ε)次,故其時間復雜度不高于O(max(σ,ε)·ND·NP3/6)≤ O(ND·NP4/6),其中,ND和NP分別為組織指控結(jié)構(gòu)調(diào)整后,組織中戰(zhàn)術(shù)決策實體和平臺實體的數(shù)量。 以文獻[12]中提出的聯(lián)合作戰(zhàn)想定為算例在Pentium(R)Dual-CoreCPU2.3GHz計算機上進行仿真實驗,算例中戰(zhàn)術(shù)決策實體的初始數(shù)量ND=4,任務(wù)實體的初始數(shù)量NT=18,平臺實體的初始數(shù)量NP=20。初始的平臺-任務(wù)關(guān)系RT-P以及戰(zhàn)術(shù)決策實體-平臺關(guān)系RTDM-P分別如表1和表2所示。 表1 任務(wù)-平臺關(guān)系 表2 戰(zhàn)術(shù)決策實體-平臺關(guān)系 仿真實驗 1若在時刻t情形1或情形2出現(xiàn),此時兵力組織需要進行指控結(jié)構(gòu)調(diào)整。采用GSA算法求解兵力組織指控結(jié)構(gòu)的適應(yīng)性調(diào)整問題,算法采用的m-best策略中變量m的值分別取1,3,5。對情形1和情形2各進行10組實驗,所得結(jié)果如表3和表4所示。 表3 情形1中指控結(jié)構(gòu)性能測度值 表4 情形2中指控結(jié)構(gòu)性能測度值 當m=1時,m-best策略每次只提供一個局部最優(yōu)選項,此時GSA即為純粹的貪心算法,m的值越大,m-best策略提供的選項越多,GSA的結(jié)果越易接近全局最優(yōu)解。表3和表4中的實驗結(jié)果表明,m越大,求解得到的指控結(jié)構(gòu)的性能測度越低,即調(diào)整后兵力組織指控結(jié)構(gòu)的性能越好,因此GSA算法是有效的。 仿真實驗 2若在時刻t情形1或情形2出現(xiàn),分別采用GSA(其中m的值設(shè)為5)和其他智能搜索算法求解兵力組織指控結(jié)構(gòu)的適應(yīng)性調(diào)整問題,所得結(jié)果如圖4和圖5所示。 圖4 情形1中各算法對比Fig.4 Comparison of algorithms in case 1 圖5 情形2中各算法對比Fig.5 Comparison of algorithms in case 2 在圖4和圖5中,GSA求解得到的兵力組織指控結(jié)構(gòu)的性能優(yōu)于其他算法,且算法耗時也明顯更低,這說明GSA可以在較短的時間內(nèi)獲得較好的解。雖然在足夠的求解時間下,智能搜索算法最終能收斂于全局最優(yōu)解,但其時間效率不高,并不適用于求解指控結(jié)構(gòu)適應(yīng)性調(diào)整這類實時性要求較高的問題,因此相比而言,本文提出的GSA算法更優(yōu)越。 本文研究了兵力組織指揮控制結(jié)構(gòu)的適應(yīng)性調(diào)整問題,主要有以下3方面的工作:①形式化描述了兵力組織的指控結(jié)構(gòu)并定義了其性能測度;②建立了兩種不同情形下兵力組織指控結(jié)構(gòu)適應(yīng)性調(diào)整的數(shù)學優(yōu)化模型;③基于m-best策略提出了一種貪心求解算法,并通過實驗證明了該算法的有效性和優(yōu)越性。 本文的不足是在研究中忽略了各決策實體工作能力的差異性。本文下一步的工作是繼續(xù)完善模型并研究兵力組織通信網(wǎng)絡(luò)的設(shè)計和適應(yīng)性調(diào)整方法。 [1] Hayes R E,Alberts D S.Powertotheedge:commandandcontrolintheinformationage[M]. Washington: DoD Command and Control Research Program,2003. [2] Xiu B X, Mu L, Zhang W M, et al. Model and method of adaptive optimization of C2 organizational structure[J].MilitaryOperationsResearchandSystemsEngineering, 2012, 26(1): 35-41. (修保新, 牟亮, 張維明, 等. C2組織結(jié)構(gòu)適應(yīng)性優(yōu)化的模型與方法[J].軍事運籌與系統(tǒng)工程, 2012, 26(1): 35-41.) [3] Han X, Mandal S, Pattipati K R, et al. An optimization-based distributed planning algorithm: a blackboard-based collaborative framework[J].IEEETrans.onSystem,Man,andCybernetics-PartA:SystemandHumans, 2014, 44(6): 637-685. [4] Levchuk G M, Levchuk Y N, Luo J, et al. Normative design of organizations-part II: organizational structure[J].IEEETrans.onSystems,Man,andCybernetics-PartA:SystemsandHumans, 2002, 32(3): 360-375. [5] Yao P Y, Zhou X X, Zhang J Y, et al. Research on decision-making entity organization structure of military C2 organization[C]∥Proc.oftheIEEESymposiumonRoboticsandApplications, 2012: 968-971. [6] Levchuk G M, Levchuk Y N, Meirina C, et al. Normative design of organizations-part III: modeling congruent, robust, and adaptive organizations[J].IEEETrans.onSystems,Man,andCybernetics-PartA:SystemsandHumans,2004,34(3):337-350. [7] Xiu B X, Zhang W M, Liu Z, et al. Adaptive design of C2 organizational structure[J].SystemsEngineeringandElectronics, 2007, 29(7): 1102-1108. (修保新, 張維明, 劉忠, 等. C2組織結(jié)構(gòu)的適應(yīng)性設(shè)計方法[J].系統(tǒng)工程與電子技術(shù), 2007, 29(7): 1102-1108.) [8] Mu L, Feng Y H, Zhang W M, et al. The adaptive optimization of C2 organization decision layer structure based on nested improved simulated annealing algorithm[C]∥Proc.oftheIEEEInternationalConferenceonIntelligentComputingandIntelligentSystems, 2010: 682-687. [9] Mu L, Zhang W M, Xiu B X, et al. C2 organization decision-layer structure dynamic adaptive optimization based on rolling horizon procedure[J].JournalofNationalUniversityofDefenseTechnology,2011,33(1):125-131.(牟亮,張維明,修保新,等.基于滾動時域的C2組織決策層結(jié)構(gòu)動態(tài)適應(yīng)性優(yōu)化[J].國防科技大學學報,2011,33(1):125-131.) [10] Levchuk G M, Meirina C, Levchuk Y N, et al. Design and analysis of robust and adaptive organization[C]∥Proc.ofthe6thInternationalCommandandControlResearchandTechnologySymposium, 2001: 1-28. [11] Yang C H, Liu J X, Chen H H, et al. Adaptive optimization of agile organization of command and control resource[J].JournalofSystemsEngineeringandElectronics,2009,20(3):558-564. [12] Yu F, Tu F, Pattipati K R. Integration of a holonic organizational control architecture and multi-objective evolutionary algorithm for flexible distributed scheduling[J].IEEETrans.onSystem,Man,andCybernetics-PartA:SystemandHumans, 2008, 38(5): 1001-1017. [13] Zhang J Y, Yao P Y. Model and solving method for collocating problem of decision-makers in C2 organization[J].SystemsEngineeringandElectronics, 2012, 34(4): 737-742. (張杰勇, 姚佩陽. C2組織決策實體配置問題建模與求解方法[J].系統(tǒng)工程與電子技術(shù), 2012, 34(4): 737-742.) [14] Zhou X X, Yao P Y, Wang X. Command and control resource deployment based on improved hierarchical clustering method[J].SystemsEngineeringandElectronics,2012,34(3):523-528.(周翔翔,姚佩陽,王欣.基于改進層次聚類法的指揮控制資源部署[J].系統(tǒng)工程與電子技術(shù),2012,34(3):523-528.) [15] Han X, Bui H, Mandal S, et al. Optimization-based decision support software for a team-in-the-loop experiment: asset package selection and planning[J].IEEETrans.onSystem,Man,andCybernetics-PartA:SystemandHumans, 2013, 43(2): 237-251. Adaptive adjusting method of command and control structure of army organization SUN Yu1, YAO Pei-yang1, LI Ming-hui2, LI Fan1 (1.InformationandNavigationCollege,AirForceEngineeringUniversity,Xi’an710077,China;2.AirForceLogisticsDepartment,Beijing100720,China) The adaptive adjusting problem of command and control (C2) structure of army organization is a research hotspot in the command automation field. Firstly, the components of an army organization are introduced, the C2 structure of the army organization is described formally, and the performance measurement of the C2 structure is defined. On that basis, mathematical optimization models are built for the problem appearing in different situations. Finally, a greedy algorithm based on them-best strategy is proposed to solve these models. And the availability and superiority of the algorithm is proved through the experiment. army organization; command and control (C2) structure; adaptive adjustment; greedy algorithm 2015-09-02; 2015-11-23;網(wǎng)絡(luò)優(yōu)先出版日期:2016-03-04。 國家自然科學基金(61573017)資助課題 E 917 A 10.3969/j.issn.1001-506X.2016.09.17 孫昱(1989-),男,博士研究生,主要研究方向為指揮控制系統(tǒng)建模與仿真。 E-mail:suny.z@qq.com 姚佩陽(1960-),男,教授,博士,主要研究方向為指揮控制理論與技術(shù)。 E-mail:ypy_664@163.com 李明輝(1983-),男,工程師,博士,主要研究方向為指揮信息系統(tǒng),軍事信息網(wǎng)絡(luò)。 E-mail:airminghuili@163.com 李凡(1983-),男,講師,碩士,主要研究方向為指揮信息系統(tǒng)。 E-mail:sniper_lifan@163.com 網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160304.1649.008.html4 實驗結(jié)果及分析
5 結(jié)束語