劉忠民 葉佩軍 戴迪 王飛躍
人才作為新型作戰(zhàn)力量戰(zhàn)斗力基本要素,直接影響戰(zhàn)斗力水平.軍隊(duì)院校教育作為培養(yǎng)人才的主渠道,是軍隊(duì)建設(shè)發(fā)展的基石.確定人才培養(yǎng)方案,教學(xué)教育大綱,軍隊(duì)學(xué)科建設(shè),打造師資隊(duì)伍,構(gòu)建教學(xué)訓(xùn)練保障體系,應(yīng)以人才培養(yǎng)需求為牽引.如何構(gòu)建更加科學(xué)的軍隊(duì)院校教育人才培養(yǎng)體系,已經(jīng)成為現(xiàn)實(shí)而緊迫的重大研究課題.
隨著陸軍數(shù)字化裝甲兵部隊(duì)建設(shè)的加速推進(jìn),數(shù)字化裝甲兵指揮人才的客觀需求與數(shù)字化作戰(zhàn)指揮人才緊缺之間的矛盾,已經(jīng)成為制約數(shù)字化部隊(duì)?wèi)?zhàn)斗力生成的重要因素.當(dāng)前數(shù)字化指揮人才描述不清楚,需求不明確,人才培養(yǎng)還存在著課程體系不完善、教學(xué)條件不成熟、培訓(xùn)模式不清晰等問題.如何針對數(shù)字化裝甲兵指揮人才核心能力需求,深化院校培養(yǎng)數(shù)字化裝甲兵指揮人才問題研究,成為亟待解決的重大問題.諸多專家學(xué)者對此展開深入研究.丁志宏對陸軍數(shù)字化部隊(duì)的教育訓(xùn)練展開探討,就加快我軍數(shù)字化部隊(duì)人才培養(yǎng)步伐提出自己的建議[1].胡中豫等提出高素質(zhì)人才培養(yǎng)是數(shù)字化部隊(duì)建設(shè)的關(guān)鍵問題,強(qiáng)調(diào)突出培養(yǎng)人才素質(zhì)的綜合性、基礎(chǔ)性和創(chuàng)造性,構(gòu)建課程體系,更新教學(xué)內(nèi)容,提高人才培養(yǎng)質(zhì)量和效益[2].王家生等著重探討了按照“專業(yè)組合、內(nèi)容融合、資源整合、統(tǒng)分結(jié)合”思路,構(gòu)建基于體系保障能力的專業(yè)化人才培訓(xùn)體系,培養(yǎng)信息化復(fù)合型裝備保障人才[3].王西欣指出,數(shù)字化部隊(duì)建設(shè)應(yīng)把提高官兵素質(zhì)特別是信息化素質(zhì)擺到突出位置,全面提高官兵的思想政治素質(zhì)、科學(xué)文化素質(zhì)、軍事專業(yè)素質(zhì)和身體心理索質(zhì),促進(jìn)人與武器裝備、人與信息系統(tǒng)有機(jī)結(jié)合,為加速推進(jìn)數(shù)字化部隊(duì)建設(shè)提供人才和智力支撐[4].在外軍數(shù)字化部隊(duì)建設(shè)方面,沈壽林等指出,外軍注重頂層設(shè)計(jì)和整體籌劃,以信息理論為指導(dǎo),專門成立領(lǐng)導(dǎo)機(jī)制,制定發(fā)展規(guī)劃,通過多手段試驗(yàn)驗(yàn)證,從試點(diǎn)建設(shè)抓起,以模塊化改制為重心,全面推進(jìn)數(shù)字化部隊(duì)建設(shè)[5].
然而,現(xiàn)有研究成果大多是從某一角度出發(fā),對我軍數(shù)字化部隊(duì)指揮人才培養(yǎng)的能力素質(zhì)需求、培訓(xùn)體制機(jī)制、培訓(xùn)體系、培訓(xùn)方法手段、培訓(xùn)條件建設(shè)等方面內(nèi)容進(jìn)行研究探索,所提出的對策建議往往受制于當(dāng)前工作的局限,指導(dǎo)性、操作性和針對性還不強(qiáng).在理論方面,研究還不夠深入具體,對研究涉及到的問題還處于現(xiàn)象描述層面,缺乏嚴(yán)密的理論論證.為解決上述問題,本文結(jié)合數(shù)字化裝甲兵指揮人才核心能力需求,以數(shù)字化裝甲兵建設(shè)理論和人才培養(yǎng)新理論為重要抓手,通過分析數(shù)字化裝甲兵指揮人才需求,運(yùn)用平行系統(tǒng)理論和方法,進(jìn)行數(shù)字化裝甲兵指揮人才平行培養(yǎng)的描述,采用BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,構(gòu)建人才培養(yǎng)質(zhì)量評估模型,實(shí)現(xiàn)人才培養(yǎng)體系要素與人才培養(yǎng)質(zhì)量之間的定量計(jì)算,幫助優(yōu)化數(shù)字化裝甲兵指揮人才培養(yǎng)資源配置.
平行系統(tǒng)理論與方法最早由王飛躍研究員正式提出.平行系統(tǒng)是指由一個(gè)自然現(xiàn)實(shí)系統(tǒng)和一個(gè)或多個(gè)對應(yīng)的虛擬人工系統(tǒng)所組成的共同系統(tǒng),是在復(fù)雜程度增加的情況下,對系統(tǒng)進(jìn)行分析、管理和控制的一種可行方式[6].平行系統(tǒng)主要針對社會(huì)網(wǎng)絡(luò)、信息資源和物理空間深度融合的信息物理社會(huì)系統(tǒng)(Cyber-Physical-Social Systems,CPSS),包含物理系統(tǒng)數(shù)據(jù)、虛擬的人工系統(tǒng)數(shù)據(jù)、泛在社會(huì)大數(shù)據(jù)等.構(gòu)建人工系統(tǒng),通過虛擬和實(shí)際系統(tǒng)的平行交互、動(dòng)態(tài)運(yùn)行,實(shí)現(xiàn)計(jì)算、物理和社會(huì)的時(shí)空一致性表述,成為解決不確定性CPSS 問題的有效途徑.通過實(shí)際系統(tǒng)與人工系統(tǒng)之間的虛實(shí)互動(dòng)、協(xié)同互校,實(shí)時(shí)調(diào)整人工系統(tǒng)和實(shí)際系統(tǒng)的管控方式,實(shí)現(xiàn)從知識表示、決策推理到場景自適應(yīng)優(yōu)化的閉環(huán)反饋,進(jìn)而完成對實(shí)際系統(tǒng)的實(shí)驗(yàn)評估和優(yōu)化管控.另一方面,實(shí)際系統(tǒng)中多源泛在感知數(shù)據(jù)可以實(shí)時(shí)導(dǎo)入人工系統(tǒng),完成人工系統(tǒng)中各種模型參數(shù)的在線標(biāo)定,從而使得后續(xù)的實(shí)驗(yàn)評估與優(yōu)化管控以新的現(xiàn)實(shí)為基礎(chǔ),更為合理可靠.平行系統(tǒng)通過實(shí)際系統(tǒng)與人工系統(tǒng)的虛實(shí)互動(dòng)、交互反饋,形成自適應(yīng)優(yōu)化控制,是一個(gè)以引導(dǎo)型的模型控制和優(yōu)化系統(tǒng).
實(shí)現(xiàn)該模型主要采用人工智能與數(shù)據(jù)挖掘技術(shù),在平行系統(tǒng)中,人工系統(tǒng)是軟件定義的系統(tǒng),將實(shí)際系統(tǒng)中的各要素建模為智能體,并基于實(shí)際系統(tǒng)的數(shù)據(jù)利用知識發(fā)現(xiàn)和知識工程獲得智能體的屬性和規(guī)則;接著,基于一定的目標(biāo)生成大量的人工場景,運(yùn)行產(chǎn)生大量數(shù)據(jù),再利用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方法進(jìn)行分析、預(yù)測、評估,獲得針對特定目標(biāo)、特定場景的最優(yōu)控制方案;最后,通過平行執(zhí)行循環(huán)、在線地引導(dǎo)實(shí)際系統(tǒng)逼近人工系統(tǒng).其基本思想是構(gòu)建與實(shí)際系統(tǒng)相對應(yīng)的虛擬系統(tǒng),將復(fù)雜系統(tǒng)問題的求解空間從物理空間擴(kuò)展為信息物理空間,再引入社會(huì)信號擴(kuò)展為社會(huì)信息物理空間,從而得到其優(yōu)化可行解.系統(tǒng)復(fù)雜性科學(xué)的一個(gè)基本假設(shè),是在資源相對有限的前提下,系統(tǒng)不可知、不可假設(shè).這可進(jìn)一步概括為不確定性、多樣性和復(fù)雜性,簡稱UDC(Uncertainty,Diversity,Complexity,UDC)問題[7].
處理UDC 問題的有效方法之一是基于ACP 的平行系統(tǒng)方法.其基本思想是拓展求解空間,在新的虛擬空間中尋求系統(tǒng)解.ACP 方法即人工系統(tǒng)、計(jì)算實(shí)驗(yàn)、平行執(zhí)行.引入人工系統(tǒng)、計(jì)算實(shí)驗(yàn)和平行執(zhí)行的目的,就是要跨越由于人和社會(huì)因素的復(fù)雜性所產(chǎn)生的建模鴻溝,導(dǎo)致系統(tǒng)從牛頓的“大數(shù)據(jù)、小定律”之特性轉(zhuǎn)向默頓的“小數(shù)據(jù)、大定律”之特性[8].基于ACP 的平行系統(tǒng)的基本框架主要思想是:首先構(gòu)造與實(shí)際系統(tǒng)等價(jià)的人工系統(tǒng),在人工系統(tǒng)上利用計(jì)算實(shí)驗(yàn)對系統(tǒng)行為進(jìn)行分析和評估,通過二者虛實(shí)互動(dòng)的協(xié)同互校,研究對各自未來狀況的借鑒和預(yù)估,相應(yīng)調(diào)節(jié)各自的管理與控制方式[9].人工系統(tǒng)可以理解為傳統(tǒng)的數(shù)學(xué)或解析建模的擴(kuò)展,可用數(shù)學(xué)模型或仿真工具構(gòu)建;計(jì)算實(shí)驗(yàn)由數(shù)據(jù)驅(qū)動(dòng),融合知識自動(dòng)化、機(jī)器學(xué)習(xí)等方法,是仿真模擬的升華;而平行執(zhí)行就是自適應(yīng)控制的進(jìn)一步推進(jìn)升華,在虛實(shí)平行系統(tǒng)中構(gòu)成大閉環(huán)反饋機(jī)制[10].基于平行理論和ACP 方法,邢陽等介紹了平行坦克系統(tǒng)的理論基礎(chǔ)和其數(shù)字四胞胎結(jié)構(gòu),指出了平行坦克系統(tǒng)中的多項(xiàng)關(guān)鍵技術(shù),同時(shí)還給出了平行坦克平臺的系統(tǒng)構(gòu)成和未來戰(zhàn)爭應(yīng)用[11].
人工神經(jīng)網(wǎng)絡(luò)簡稱為神經(jīng)網(wǎng)絡(luò),是一種由輸入層、隱含層和輸出層構(gòu)成的算法模型[12-14].通過足夠的樣本訓(xùn)練這個(gè)神經(jīng)網(wǎng)絡(luò),通過動(dòng)態(tài)的自適應(yīng)調(diào)整,訓(xùn)練出最符合真實(shí)情況要求的模型.一旦神經(jīng)網(wǎng)絡(luò)訓(xùn)練完畢,便可成為一種有效的工具,來幫助實(shí)現(xiàn)人才培養(yǎng)資源的優(yōu)化配置[15].
人工神經(jīng)網(wǎng)絡(luò)中的每個(gè)神經(jīng)元模型包含一個(gè)傳遞函數(shù)或者激活函數(shù),通常稱為非線性函數(shù),例如logistics 函數(shù):
其中,x是神經(jīng)元經(jīng)過所有突觸輸入的加權(quán)和減去偏置的局部誘導(dǎo)域,y是通過激活函數(shù)得到的神經(jīng)元的輸出.
網(wǎng)絡(luò)包含一層或多層隱藏神經(jīng)元節(jié)點(diǎn),它們不是神經(jīng)網(wǎng)絡(luò)輸入層和輸出層,這些隱藏層的神經(jīng)元逐層地通過輸入數(shù)據(jù)提取數(shù)據(jù)中的多種有用特征.網(wǎng)絡(luò)中的突觸(連接權(quán)值)決定了神經(jīng)網(wǎng)絡(luò)的高度連接性,網(wǎng)絡(luò)的改變通過突觸連接數(shù)量的改變以及突觸權(quán)值的改變.
定義網(wǎng)絡(luò)各層的輸入為input,輸出為out,則神經(jīng)網(wǎng)絡(luò)主要通過三層來計(jì)算.第一層為輸入層,該層節(jié)點(diǎn)直接與輸入量相連,并將其直接傳遞到下一層.第二層為隱含層,在每一個(gè)節(jié)點(diǎn)計(jì)算相應(yīng)輸入對激勵(lì)函數(shù)的激勵(lì)值.第三層為輸出層,主要實(shí)現(xiàn)非線性運(yùn)算,確定神經(jīng)網(wǎng)絡(luò)的輸出.
神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于人才培養(yǎng)質(zhì)量指標(biāo)預(yù)測,其主要思想就是利用神經(jīng)網(wǎng)絡(luò)算法從海量歷史數(shù)據(jù)中找出所隱含的信息,即數(shù)據(jù)所具有的趨勢性與規(guī)律性,并依據(jù)這些規(guī)律進(jìn)行評估,從而可作為指揮與控制中的輔助決策工具,實(shí)現(xiàn)該部分功能,對于快速?zèng)Q策具有重要意義.人才培養(yǎng)體系一般是非線性系統(tǒng),神經(jīng)網(wǎng)絡(luò)通過層層神經(jīng)迭代,通過激活函數(shù)可有效實(shí)現(xiàn)非線性的解決方案.權(quán)重和閾值賦初值.5)輸入學(xué)習(xí)樣本特征值矩陣和學(xué)習(xí)樣本的綜合評估評判值,構(gòu)成期望輸出向量,作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練參照.6)計(jì)算隱含層、輸出層各神經(jīng)單元的實(shí)際輸出值.7)通過學(xué)習(xí)樣本誤差函數(shù),計(jì)算整個(gè)神經(jīng)網(wǎng)絡(luò)對于所有學(xué)習(xí)樣本的平均誤差.8)通過反向傳播調(diào)整各神經(jīng)元權(quán)重和閾值.9)給定精度,迭代N次,訓(xùn)練網(wǎng)絡(luò)模型,得到輸出結(jié)果結(jié)束訓(xùn)練.10)對于訓(xùn)練好的BP 神經(jīng)網(wǎng)絡(luò)模型,用測試樣本進(jìn)行驗(yàn)證,若測試正確率達(dá)到精度要求,則該模型可用于評估人才培養(yǎng)質(zhì)量.11)不斷迭代訓(xùn)練樣本,直至算法終止.
數(shù)字化裝甲兵指揮人才培養(yǎng)體系是在平行教育理論指導(dǎo)下,解決兩類問題,包括以培養(yǎng)要素體系為條件、人才質(zhì)量評價(jià)指標(biāo)為目標(biāo)時(shí)的人才質(zhì)量影響分析,以人才質(zhì)量評價(jià)指標(biāo)為條件、培養(yǎng)要素體系為目標(biāo)時(shí)的培養(yǎng)要素優(yōu)化分析.本文通過BP 神經(jīng)網(wǎng)絡(luò)預(yù)測人才培養(yǎng)質(zhì)量指標(biāo)值,從而對人才培養(yǎng)質(zhì)量進(jìn)行評估,這與平行教育理論一脈相承.
神經(jīng)網(wǎng)絡(luò)的初始閾值和權(quán)值是隨機(jī)給定的,在獲取數(shù)據(jù)樣本時(shí),首先構(gòu)建樣本輸入輸出及其編碼方式.從問卷調(diào)查中提取的信息越多,輸入信息的維度越大,表達(dá)的信息將越多,將越有利于模型準(zhǔn)確性的提高.但輸入維度太高、將會(huì)給樣本集構(gòu)建、網(wǎng)絡(luò)訓(xùn)練,以及存儲空間、處理時(shí)間等帶來很多問題.因而,為了便于網(wǎng)絡(luò)訓(xùn)練和保證模型的實(shí)用性,在構(gòu)建樣本集時(shí),既應(yīng)全面、客觀地表示數(shù)據(jù)信息,又應(yīng)考慮到存儲空間、處理時(shí)間和易于實(shí)現(xiàn)等現(xiàn)實(shí)需求.因此,數(shù)據(jù)預(yù)處理時(shí),應(yīng)形成便于標(biāo)準(zhǔn)化的編碼形式,本文采用(權(quán)值,閾值)的形式來進(jìn)行編碼.
本文采用BP 神經(jīng)網(wǎng)絡(luò)模型,建立人才培養(yǎng)質(zhì)量評估模型,算法流程如圖1所示.主要求解步驟為:1)建立完善人才質(zhì)量評價(jià)指標(biāo)體系和人才培養(yǎng)要素體系.2)獲取樣本數(shù)據(jù),將數(shù)據(jù)分為訓(xùn)練樣本和測試樣本.3)確定神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率、隱含層節(jié)點(diǎn)數(shù)、迭代次數(shù)、誤差精度等.4)神經(jīng)網(wǎng)絡(luò)初始化,為網(wǎng)絡(luò)的
圖1 基于神經(jīng)網(wǎng)絡(luò)的人才培養(yǎng)質(zhì)量評估算法流程圖Fig.1 Flow chart of the algorithm for evaluating the quality of talent training based on neural network
針對數(shù)字化指揮人才質(zhì)量評價(jià)指標(biāo)和人才培養(yǎng)要素的對應(yīng)關(guān)系,通過調(diào)查問卷等形式,采集相關(guān)數(shù)據(jù),作為實(shí)驗(yàn)數(shù)據(jù)集.本文將人才質(zhì)量評價(jià)指標(biāo)分為優(yōu)秀(90 分以上)、良好(75 ~90 分)、及格(60 ~75分)、不及格(60 分以下)4 個(gè)等級.問卷調(diào)查主題對象是院校教員和部分學(xué)員,共發(fā)放問卷1 200 份,取其中1 000 份作為實(shí)驗(yàn)數(shù)據(jù),構(gòu)建初始數(shù)據(jù)集.同時(shí),用最大最小值法進(jìn)行歸一化處理,將評價(jià)指標(biāo)評分標(biāo)準(zhǔn)化到[0,1]區(qū)間.以政治素質(zhì)為例(其他人才質(zhì)量評價(jià)指標(biāo)同理),生成標(biāo)準(zhǔn)化樣本數(shù)據(jù),如表1所示.
本文的實(shí)驗(yàn)環(huán)境為Windows 10 系統(tǒng),Intel Core i7-9700 處理器,4 GB 內(nèi)存,實(shí)驗(yàn)軟件為Python 3.7.
表1 數(shù)據(jù)集建立(部分)Table 1 Data set establishment(partial)
將1 000 組數(shù)據(jù)中的900 組用于訓(xùn)練,剩余的100 組用于測試,檢驗(yàn)?zāi)P偷男阅?訓(xùn)練該模型時(shí),誤差指標(biāo)取0.5.其中,人才培養(yǎng)要素為神經(jīng)網(wǎng)絡(luò)的輸入,人才質(zhì)量評價(jià)指標(biāo)為輸出.例如,以政治素質(zhì)評價(jià)指標(biāo)為第一個(gè)輸出變量,第一組輸入數(shù)據(jù)為(0.92,0.86,0.95,0.89,0.90,0.88),輸出為0.91,以此類推,不斷進(jìn)行訓(xùn)練,得到較合理模型后,輸入后100 組數(shù)據(jù)作為測試數(shù)據(jù),用該模型預(yù)測人才質(zhì)量評價(jià)結(jié)果,達(dá)到收斂時(shí)部分測試數(shù)據(jù)的預(yù)測結(jié)果如表2所示.
預(yù)測結(jié)果的精度隨迭代次數(shù)增加而變化的仿真結(jié)果如圖2所示.由圖2 可知,BP 神經(jīng)網(wǎng)絡(luò)在迭代次數(shù)達(dá)到10 000 次時(shí),各項(xiàng)人才質(zhì)量評價(jià)指標(biāo)預(yù)測精度均已達(dá)到要求,例如,政治素質(zhì)指標(biāo)的平均預(yù)測精度達(dá)到0.992 2,均方誤差為0.000 036 8;同時(shí),在訓(xùn)練8 000 次時(shí)基本收斂到穩(wěn)定值,驗(yàn)證了基于BP 神經(jīng)網(wǎng)絡(luò)的人才質(zhì)量評估模型的準(zhǔn)確性和穩(wěn)定性,較好地滿足評估要求,得出的評估數(shù)據(jù)更可靠.
表2 政治素質(zhì)評估結(jié)果(部分)Table 2 Political quality assessment results(partial)
圖2 基于BP 神經(jīng)網(wǎng)絡(luò)的教學(xué)質(zhì)量評價(jià)指標(biāo)預(yù)測精度Fig.2 The prediction accuracy of teaching quality evaluation index based on BP neural network
進(jìn)一步可知,六項(xiàng)人才質(zhì)量評價(jià)指標(biāo)達(dá)到收斂時(shí)的平均預(yù)測精度和均方誤差如表3所示.通過基于BP 神經(jīng)網(wǎng)絡(luò)的人才培養(yǎng)質(zhì)量評估模型,有效實(shí)現(xiàn)了對人才培養(yǎng)質(zhì)量的優(yōu)化控制,為后期復(fù)雜大數(shù)據(jù)情況下的人才培養(yǎng)質(zhì)量評估提供了堅(jiān)實(shí)的理論基礎(chǔ).
表3 人才質(zhì)量評價(jià)指標(biāo)預(yù)測結(jié)果Table 3 Forecast results of talent quality evaluation indicators
本文將平行系統(tǒng)方法和BP 神經(jīng)網(wǎng)絡(luò)引入數(shù)字化裝甲兵指揮人才培養(yǎng)質(zhì)量的評估中,一定程度上克服了裝甲兵人才培養(yǎng)的非線性關(guān)系識別困難,具有評估準(zhǔn)確、穩(wěn)定、自適應(yīng)性強(qiáng)等優(yōu)點(diǎn).以人才質(zhì)量評價(jià)指標(biāo)和人才培養(yǎng)要素為切入口,本文進(jìn)一步通過院校教員和學(xué)員的實(shí)際調(diào)查數(shù)據(jù),驗(yàn)證了所構(gòu)建BP 模型的評估有效性.實(shí)驗(yàn)結(jié)果表明,本文所提模型的評價(jià)結(jié)果較為準(zhǔn)確、穩(wěn)定、可靠,為實(shí)現(xiàn)培養(yǎng)方案的快速優(yōu)化提供了輔助支撐技術(shù).
本文構(gòu)建的BP 網(wǎng)絡(luò)評價(jià)模型只是數(shù)字化部隊(duì)指揮人才培養(yǎng)的特定環(huán)節(jié)和初步嘗試.在未來的研究中,我們將進(jìn)一步在虛擬空間中構(gòu)建指揮人才的數(shù)字四胞胎,通過數(shù)字指揮人才和真實(shí)指揮人才的平行交互,實(shí)現(xiàn)對真實(shí)指揮官生理和心理狀態(tài)的實(shí)時(shí)“感知認(rèn)知預(yù)測”全過程,進(jìn)而對其所作的決策和行為完成動(dòng)態(tài)描述、預(yù)測和引導(dǎo).