• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    自主航天器天地協(xié)同控制模式與技術(shù)綜述

    2023-06-21 10:16:30崔曉峰
    宇航學報 2023年5期
    關(guān)鍵詞:航天器自主性指令

    崔曉峰

    (北京航天飛行控制中心,北京 100094)

    0 引 言

    隨著計算軟硬件等技術(shù)的發(fā)展,航天器的自主能力得到不斷增強。關(guān)于航天器上各類自主功能的需求和設(shè)計實現(xiàn),已經(jīng)得到大量研究和應用[1-3]。

    自主性的發(fā)展并不意味著地面對航天器的控制會從一個航天器的整個運行生命周期中完全消失。如Jónsson等[4]所說,“制造人的控制不可及的航天器顯然不是人的本意。”現(xiàn)實中,即使對于特別需要器上自主能力的深空探測等任務,在條件允許的情況下,地面的干預和支持仍然是確保航天器安全和任務成功的必要手段[5]。實際上,航天器的“高度自主”與地面控制并非矛盾而是互補,二者在微觀上可以是分時的,在宏觀上則是共存的。即使對于“全自主”的特定功能,地面仍然可能在其之前、之后甚至之中介入,實施預置、決策、應急等。

    另一方面,從技術(shù)優(yōu)化的角度,關(guān)于自主性的大量研究和實踐均指出,除了特殊場景和運行時段需要完全依靠機器的自主能力,更多情況下,將人完全排除在外的“全自主”并非最有效和高效的系統(tǒng)運行模式,相反,人機結(jié)合是比全自主控制更優(yōu)的選擇[6-8]。單純的“替代人類”,是自動化、機器人等領(lǐng)域研究的早期目標[8-9],“與人組隊”則由于更高的應用實效以及經(jīng)濟性、可行性,成為越來越得到強調(diào)重視的自主性內(nèi)涵和發(fā)展方向[10-11]。

    因而無論從現(xiàn)實還是理論角度,都可以說自主控制與地面控制的共同作用,是自主航天器運行生命周期中必然存在的運行場景和重要特征。這里所說的共同作用,既包括在相同(或相近)時間的兩個來源的控制,也包括存在時間先后但有關(guān)聯(lián)關(guān)系的兩個來源的控制。這種共同控制具有自身的特殊性,也是實踐證明容易出現(xiàn)不協(xié)調(diào)性等問題的根源。另外,要實現(xiàn)上面所說的“與人組隊”的自主,還需要新的方法、技術(shù)作為支撐,解決好“人與自主”相互依賴以及高效協(xié)作等問題[8,12]。當前關(guān)于航天器上的各類自主功能已得到大量研究、實現(xiàn)和應用[1-3],針對自主航天器的地面操作流程、工具等也有所探討[13],但是對于自主航天器天地協(xié)同控制的相關(guān)問題還關(guān)注較少,缺乏系統(tǒng)化的認識和闡述。

    1 自主性概念和自主航天器概述

    自主性的問題在控制和人工智能(AI)等領(lǐng)域得到了大量研究和實踐,但是在現(xiàn)實語境中對其內(nèi)涵與外延的認識仍存在很大的差異。“獨立于人或者其它主體的干預”[14-15]通常被認為是自主的基本特征。除此以外,在有些定義中強調(diào)目標導向[16-18]或目標驅(qū)動[19],即自主系統(tǒng)按照設(shè)定或生成的目標進行行為的規(guī)劃并加以實施。還有觀點認為自主性需要體現(xiàn)在與外部的交互和協(xié)作上[6,20],或者突出對環(huán)境的適應性[21-22],以及強調(diào)具備自學習性[6,21]等等。對于以上各類特性,需要同時具備還是具備其中的某一項或幾項即可稱為“自主”,并未得到統(tǒng)一。

    從詞源上,除了主要來源于哲學、社會學等的自主性(autonomous)概念,關(guān)于自主性的研究中還存在一種來源于生理學的自主(autonomic)概念。IBM由此提出的自主計算(autonomic computing)[23],基本思想是通過類似自主神經(jīng)的自管理,解決信息系統(tǒng)的復雜性問題。自管理能力由稱之為“self-CHOP”的4個特性組成,分別是自配置、自治愈、自優(yōu)化和自保護。自主計算也擴展到了包括航天在內(nèi)的不同領(lǐng)域,例如NASA概念性的自主納技術(shù)蜂群(ANTS)系統(tǒng)架構(gòu)[16]支持在大規(guī)模的探測器群體上實現(xiàn)“self-CHOP”特性。

    基于自主性實現(xiàn)程度的多樣性,對自主性進行層級的劃分成為一個經(jīng)常的話題。這種劃分起源于自動化領(lǐng)域的自動化分級(LOA)[11,24],其中得到廣泛引用的是Sheridan等[25]和Endsley等[26]的10級劃分法,由此發(fā)展的有Beer等[27]的機器人自主性分級(LORA)等?;谶@種劃分,自主性被認為是從“完全人控”到“完全自主”的一個連續(xù)譜段,位于譜段中間的點即為“半自主”。通常按照人與機器的分工對“半自主”的方式進行細分[27],這種基于“人與機器誰更優(yōu)”(HABA-MABA)思維的分工觀念,對于具有動態(tài)復雜性的人與自主的協(xié)同關(guān)系是一種局限[20]。此外,“全自主”的概念容易誤導認為“人的排除”即是自主的最高境界,實際上,有觀點[28-29]指出人與機器以隊友方式工作時的雙方都是全自主的。

    在航天領(lǐng)域,歐洲航天局(ESA)給出了一個對航天器自主性進行劃分的模型[30],提出了4種航天器自主等級,其中“主要由地面控制,器上存在有限安全管理”為E1級;“器上執(zhí)行預先規(guī)劃的、地面定義的任務操作,一般是按預置時間執(zhí)行”為E2級;“器上執(zhí)行適應性任務操作,一般是設(shè)計好的控制規(guī)程”為E3級;“器上執(zhí)行面向目標的任務操作,即面向目標的規(guī)劃”為E4級。該模型比較符合航天領(lǐng)域的實際,但是包含的自主性概念比較有限,如前所述的關(guān)于自主性的多種能力沒有得到體現(xiàn)。

    從航天工程實踐看,通常所說的航天器自主,實際是指能夠在其運行生命周期的某個或某些時段中,脫離對地面的實時依賴,在器上實現(xiàn)的各種功能操作。航天器的各種自主功能在應用目標、范圍、時段、方式等方面可以有很大不同。這里基于自主性技術(shù)的研究和實踐現(xiàn)狀,從實現(xiàn)特點和能力的角度對航天器上的自主性進行辨識,將其劃分為4種類型:程序式自主,是指通過執(zhí)行事先固化的程序?qū)崿F(xiàn)自主操作;反應式自主,是指基于對環(huán)境或自身狀態(tài)的響應執(zhí)行自主操作;目標式自主,是指針對設(shè)置的目標通過規(guī)劃實現(xiàn)器上功能;協(xié)同式自主,是指器上具備與地面協(xié)同方式工作的能力。此外,目標式自主和協(xié)同式自主都可以融入適應、學習和演化等特性。以上四種類型的劃分,基本覆蓋了研究領(lǐng)域提出的各類自主性概念,并對應當前和(近期)未來航天器自主性具有的特征和能力。

    2 自主航天器的天地控制模式劃分

    這里針對自主航天器的天地控制問題,基于相關(guān)研究和實踐現(xiàn)狀,總結(jié)提出自主航天器天地控制的3種模式。圖1說明了3種控制模式及其與4種自主類型(以及完全人工控制的“無自主”和完全器上控制的“全自主”兩種特殊情況)的關(guān)系。

    圖1 航天器自主類型和天地控制模式Fig.1 Types of spacecraft autonomy and space-ground control modes

    指令直接控制模式是指由地面發(fā)送指令對航天器進行直接控制。該模式可作用于4種自主類型以及“無自主”和“全自主”航天器,如圖1中控制線①~⑥所示。對于程序式和反應式自主航天器,這是一種當前通常使用的控制方式。對于目標式和協(xié)同式以及“全自主”航天器,這是一種輔助性的控制方式(圖中虛線表示),作用是實現(xiàn)直接干預。

    目標策略控制模式是指通過設(shè)置目標和策略實現(xiàn)對航天器的控制。該模式主要作用于具有目標式自主能力的航天器,如圖1中控制線⑦所示。對于協(xié)同式自主航天器,這里認為其應具備向下兼容目標式自主的能力,因此也能夠輔助使用目標策略控制模式,如控制線⑧所示。

    協(xié)同交互控制模式是指通過地面與航天器之間的協(xié)同與交互,實現(xiàn)對航天器的控制和共同完成任務目標。這種控制模式只能作用于具備協(xié)同式自主能力的航天器,如圖1中控制線⑨所示。

    圖1所示的4種自主類型以及無自主和全自主兩種特殊情況,在實際中通常是一個航天器的不同自主狀態(tài),而非某個固化類型的航天器。一個實際航天器通常是多種不同作用和實現(xiàn)方式自主功能的組合體,并在整個運行生命周期中動態(tài)轉(zhuǎn)化,這種轉(zhuǎn)化又稱為自主性調(diào)節(jié)或動態(tài)自主性[28]。

    從自動化與機器人控制的角度,對于帶有部分自主性的機器進行的控制,即介于完全手工控制與完全自主運行之間的方式,通常稱為監(jiān)督控制[25,31]。按照這個概念,圖1中對除了無自主和全自主兩種情況以外的自主類型進行的控制,即控制線②~⑤和⑦~⑨,均可認為屬于監(jiān)督控制的范疇。

    3 自主航天器的指令直接控制模式

    3.1 指令直接控制模式的概念

    指令直接控制,是指地面發(fā)送指令(序列),航天器嚴格依照每條指令執(zhí)行相應的動作,不對指令進行任何改變性操作。這種控制是一種最傳統(tǒng)和基本的控制方式,也是當前仍大量使用的控制方式。

    指令直接控制屬于手工控制[26]、直接操縱[32]的控制方式。指令直接控制的航天器如果沒有自主功能,則地面指令就完全決定了航天器的后續(xù)狀態(tài),這等同于機器人控制中的遙操作[27]。如果航天器具有一定的自主功能,例如自主健康管理等,則航天器的后續(xù)狀態(tài)實際是由地面指令和器上自主控制共同作用的結(jié)果,這是一種特殊的控制形式,類似于機器人控制中的共享控制[25]。鑒于當前的航天器幾乎沒有例外地都帶有一定的自主能力,因此這種共同控制的形式是一種實際最常見的應用場景。

    3.2 指令直接控制模式的問題

    對于指令直接控制模式,已有對其存在不足的討論主要是相比器上自主控制方式而言,包括器上控制不閉環(huán)、不能適應變化、地面工作復雜等[33-34]。如前所述,當前實際存在的普遍情況是對具有一定自主性的航天器使用直接控制方式,由此帶來的問題還較少得到關(guān)注。在這種場景下,航天器接受地面和自主兩種來源控制的共同作用,可能發(fā)生地面指令執(zhí)行后的實際狀態(tài)與預期不同,甚至更嚴重的危害。實踐證明該類問題現(xiàn)實存在甚至時常發(fā)生,以下通過一個假設(shè)的簡化例子加以具體說明。

    例1.地面欲使器上在指定時刻(t2)斷開控溫回路并在之后保持斷開狀態(tài)。為此地面發(fā)送指令在t1和t2分別執(zhí)行禁止自主控溫和斷開控溫回路的指令,預期在t2之后,控溫回路能夠持續(xù)為斷開狀態(tài)。圖2(a)示意了預期的指令執(zhí)行時序,即在t1之前允許器上進行自主控溫(例如在ta),在t1之后則自主功能被禁止,于是在t2執(zhí)行了斷開控溫回路指令之后,器上不會再有自主指令又將控溫回路接通,因而斷開狀態(tài)可以得到保持。

    圖2 例1的預期控制結(jié)果與實際控制結(jié)果Fig.2 Expected and actual control results in the Example 1

    以上雖然地面已經(jīng)考慮到了器上的自主功能可能會影響預期的控制目的,采取了先在t1禁止自主控溫的措施,但實際卻仍然會發(fā)生非預期的結(jié)果,即在t2之后某個時刻控溫回路又變?yōu)榻油顟B(tài)。這是由于器上自主控溫功能的實現(xiàn)方式是首先檢測溫度是否超限,如果超限則發(fā)出接通控溫回路的指令,而從檢測到接通(ta1到ta2)實際存在一個微小的時間間隔,于是就可能出現(xiàn)如圖2(b)所示的時序,即在t2執(zhí)行了地面發(fā)送的斷開控溫回路指令之后,在ta2又執(zhí)行了自主發(fā)出的接通控溫回路指令,因而控溫回路最終處于接通狀態(tài)。

    上述結(jié)果雖然作為個例有其具體原因,但實質(zhì)上代表性地說明了對自主航天器采用指令直接控制方式時的天地指令沖突問題。進一步分析發(fā)現(xiàn),問題的根源在于這種方式實際建立在地面能夠準確預測器上每時每刻狀態(tài)和指令執(zhí)行細節(jié)的假設(shè)前提上。然而在這種假設(shè)實際通常難以成立,因為地面不掌握器上自主觸發(fā)動作的確切時機,無法精準預測和匹配天地指令的時序關(guān)系,由此使得二者之間產(chǎn)生不匹配不協(xié)調(diào),器上最終出現(xiàn)非地面預期的結(jié)果。

    3.3 指令直接控制模式問題的檢測與解決

    在采用指令直接控制方式時,為了避免出現(xiàn)上述問題,要求地面對器上的控制執(zhí)行機制做到深入細致的掌握,并通過嚴密分析以及概率仿真,發(fā)現(xiàn)可能的時序錯誤和指令沖突,有些問題需要在單個時鐘周期的粒度才能發(fā)現(xiàn),難度要求很高。

    為此這里另外給出一種程序模擬的方法,就是將地面指令和器上自主指令的執(zhí)行邏輯模擬為并行程序進行分析。其基本思想是,地面指令與器上指令發(fā)生沖突的根本原因是二者的并行執(zhí)行以及對同一狀態(tài)進行不相容的操作,而操作的時序?qū)ψ罱K的結(jié)果有決定性作用。因此通過并行程序模擬的方法,可以比較簡單有效地達到發(fā)現(xiàn)該類問題的目的。

    對于上節(jié)例子,可以將地面指令和器上指令分別用圖3所示的偽碼程序進行模擬,其中自主控溫的狀態(tài)和控溫回路的狀態(tài)作為系統(tǒng)共享變量進行描述。從該程序就可以比較容易分析出,器上程序和地面程序作為并行程序?qū)嶋H存在一個競爭條件,即兩段代碼在不同的執(zhí)行順序下將出現(xiàn)非唯一的執(zhí)行結(jié)果。具體而言,假設(shè)初始狀態(tài)是自主使能(au=ON)且溫度超限,則程序在一些情況下(例如代碼塊執(zhí)行順序為B1-B2-B3或B3-B1-B2時)的執(zhí)行結(jié)果符合預期(sw=OFF);而在另一些情況下(例如代碼塊的執(zhí)行順序為B1-B3-B2時),則會出現(xiàn)不符合預期的另一種結(jié)果(sw=ON)。

    圖3 地面指令與器上自主指令的并行程序模擬Fig.3 Parallel program analogy of ground commands and onboard autonomous commands

    此外,除了上述靜態(tài)分析的方法,還可以采用形式化建模的方法對并行程序的特性進行驗證。例如對上述程序可以轉(zhuǎn)換為PROMELA語言的形式化表示,使用模型檢測工具SPIN對期望的屬性“sw最終值為OFF”(線性時態(tài)邏輯表示為◇sw==OFF)進行檢測,能夠自動檢測出該屬性的不滿足,即說明會出現(xiàn)與預期不同的并行程序執(zhí)行結(jié)果。

    可以看到,通過上述分析和檢測的方法,能夠有效發(fā)現(xiàn)地面控制指令與器上自主行為可能存在的耦合關(guān)系和不唯一結(jié)果。上述方法的有利之處是不需要對器上的處理細節(jié)有很具體的了解,僅從天地控制邏輯的并行關(guān)系分析潛在沖突,雖然并不嚴格代表器上狀態(tài),但能夠快速發(fā)現(xiàn)存在問題的可能,從而避免了地面指令編排時對器上狀態(tài)預測的困難,并且能夠?qū)崿F(xiàn)一定程度的自動化驗證。

    從問題解決的角度,一旦能夠發(fā)現(xiàn)該類問題,則可以針對具體情況采取相應的解決措施。例如對于本例,可以采取拉長地面兩條指令間隔(原則上大于ta1到ta2的最大時長即可),或者在器上程序中使用臨界區(qū)(將自主檢測到執(zhí)行的代碼設(shè)置為不可打斷的臨界區(qū))從而避免產(chǎn)生競爭條件等方法,在此不再詳述。這里需要指出的是,由于指令直接控制模式的本質(zhì)特點,各種應對方法實際都還難以成為從根本上實現(xiàn)天地協(xié)調(diào)的系統(tǒng)化途徑。

    4 自主航天器的目標策略控制模式

    4.1 目標策略控制模式的概念

    “目標”是意圖的抽象,代表一組期望的世界狀態(tài)[40]。目標能夠通過行為(序列)獲得,從目標推導出該行為序列的過程即為規(guī)劃[35]。目標式自主即是通過行動獲取目標的自主能力[18]。對航天器實施目標控制就是由地面設(shè)定預期的目標,由器上通過規(guī)劃確定實現(xiàn)該目標的動作并加以實施。

    NASA的遠程Agent(RA)作為一個自主性架構(gòu),首次實現(xiàn)在軌航天器的基于目標的操作(GBO)[34],并在深空1號(DS-1)探測器上得到成功驗證[5]。地面對RA的控制是通過發(fā)送稱為任務剖面的目標文件,建立和調(diào)整器上管理的任務目標。此外,NASA運行于地球觀測1號(EO-1)衛(wèi)星的自主科學航天器試驗(ASE)[36]架構(gòu)、運行于火星科學實驗室(MSL)探測器的任務數(shù)據(jù)系統(tǒng)(MDS)[37]架構(gòu)等,都實現(xiàn)了類似的面向目標控制方式。除了這些在系統(tǒng)級實現(xiàn)目標控制[38]的范例,還有許多器上特定功能的實現(xiàn)也可歸為目標控制類型,例如指定控制效果的軌道控制、指定目標點的移動控制等,這類控制方式在現(xiàn)有航天器上已得到大量運用。

    “策略”在有些語境下的含義等同于計劃,即“獲取目標的行動”[39]。策略的另一層含義是“指導行為的原則”,在許多方法中通常表示為條件-行動規(guī)則[39],或者更基本的規(guī)則例如閾值、優(yōu)先級等[40]。策略管理是針對復雜系統(tǒng)管理而產(chǎn)生的概念和方法,基本思想是通過對策略的操作改變系統(tǒng)的行為,而不是對系統(tǒng)進行直接的控制,達到簡化設(shè)計與管理的目的[40]。自主計算[23]以基于策略的管理(PBM)作為主要實現(xiàn)機制,其中策略是對自主行為和特征的期望要求的一種標準化的外部表示[41]。

    策略方法應用于航天器控制,就是由地面指定器上規(guī)劃等各種處理所使用的規(guī)則、方法、知識、條件等,從而引導和限定器上行為使之符合地面的期望。作為一種基于策略的方法,Pea等[42]提出了MacMAS方法,用于對系統(tǒng)的自主屬性進行規(guī)約,基于該規(guī)約進行策略的構(gòu)造,并將該方法運用在NASA的ANTS自主系統(tǒng)架構(gòu)上。此外,其它通過設(shè)置閾值或各種參數(shù)數(shù)據(jù)對航天器上的自主管理,或者自主導航、自主探測等特定功能進行調(diào)諧導向的方式,也都可以從廣義上認為屬于策略控制。

    綜上所述,目標與策略的概念具有內(nèi)在的共同點,即都是在比具體操作更高層次上的、可用于支配系統(tǒng)行為的抽象。因此這里綜合二者歸納為“目標策略控制”模式,即地面通過對航天器設(shè)置目標以及對相關(guān)模型和規(guī)則進行調(diào)整,由器上通過自主規(guī)劃和執(zhí)行,實現(xiàn)目標和策略導向的自主運行。

    4.2 目標策略控制模式的特點優(yōu)勢

    基于目標和策略對系統(tǒng)進行控制的方式都是通過提高抽象層次,避免了在實施細節(jié)上進行操作的復雜性[40]。具體而言,目標策略控制模式的優(yōu)勢主要包括以下幾個方面。

    首先是能夠?qū)崿F(xiàn)控制的匹配性,從根源上杜絕指令沖突。由于在該模式下所有的指令都是由器上生成,目標導向的航天器能夠結(jié)合器上的具體狀態(tài),完整處理所有的約束和沖突,統(tǒng)籌目標的全集,在確保目標實現(xiàn)的同時,也確保了指令的協(xié)調(diào)性,提高了器上控制的效率和實現(xiàn)地面控制意圖的可能。

    同樣以第3節(jié)中的例子,給出一種目標策略控制模式的實現(xiàn),說明其比指令直接控制模式杜絕指令沖突問題的有效性。為簡化起見,這里假設(shè)使用一種簡單的目標處理方法,即首先從每個目標推導(規(guī)劃)出其對應的動作,繼而對動作集合進行沖突檢測,根據(jù)優(yōu)先級確定動作的執(zhí)行和取消。本例的具體控制可以表示為兩個目標G0和G1,分別為器上的默認目標和地面的設(shè)置目標,圖4說明了每個目標的含義及其在不同情況下導出的動作。

    基于建立的上述目標,即可以在任意時刻通過目標處理,得到最終執(zhí)行的動作,并確保無沖突的發(fā)生。圖5給出了各種可能結(jié)果中的3個示例,其中(a)和(c)兩種情況下的動作與目標無沖突而得到執(zhí)行,(b)中的動作與目標沖突而得到取消。

    圖5 例1的3個控制實例和結(jié)果Fig.5 Three control cases and results of the Example 1

    從該例可以看出,基于目標的控制方式能夠有效杜絕指令直接控制方式的指令沖突和結(jié)果非預期問題,并且天地的控制邏輯都得到簡化和清晰。從地面角度,只需指定期望的目標,無需關(guān)心器上執(zhí)行時的狀態(tài),更不必人為禁止自主功能;從器上角度,通過目標處理算法的通用化,以及目標規(guī)約的相互解耦,在確保不會出現(xiàn)指令沖突的同時,實現(xiàn)了“關(guān)注點隔離”的良好設(shè)計理念。

    第二方面的優(yōu)勢是實現(xiàn)的靈活性,能夠更大程度保證目標的獲得。在該模式下,地面?zhèn)鬟f給航天器的實質(zhì)上是高層的意圖和規(guī)則而不是固化的指令,航天器只需保證的是意圖的實現(xiàn)和規(guī)則的遵守,而使用的指令和發(fā)令的時間都可以進行靈活調(diào)整,使得計劃避免由于固化而失敗。例如在RA架構(gòu)中,地面發(fā)送給器上的目標文件以及器上規(guī)劃的結(jié)果都最大限度保留允許靈活變化的指令時間,從而在執(zhí)行環(huán)節(jié)能夠盡可能保證計劃的成功實施[5]。

    第三方面的優(yōu)勢是地面的關(guān)注點從實現(xiàn)層向目標層轉(zhuǎn)移,效率得到提高。指令直接控制方式下的地面指令編排工作量和無差錯要求是巨大的壓力負擔[34]。在目標策略控制模式下,地面不再關(guān)注具體指令及其時序而只需聚焦目標和規(guī)則,有利于在更高層面上籌劃和分析任務。在基于ASE的EO-1衛(wèi)星運行過程中,據(jù)統(tǒng)計從觀測發(fā)現(xiàn)到重新觀測的時間從12~26 d縮短至6 h,獲得有效科學數(shù)據(jù)增加了100倍,運行成本節(jié)約100萬美元/年[43]。

    4.3 目標策略控制模式的實現(xiàn)框架

    這里給出目標策略控制模式的一個天地綜合實現(xiàn)框架,如圖6所示,其中傳統(tǒng)的指令和數(shù)據(jù)處理等底層功能作為實現(xiàn)目標策略控制的基礎(chǔ)。

    圖6 目標策略控制模式的實現(xiàn)框架Fig.6 Framework of the goal-policy control mode

    地面系統(tǒng)主要包含目標策略的規(guī)約、推演、設(shè)置、跟蹤等邏輯單元。目標策略規(guī)約實現(xiàn)對控制意圖的捕捉和規(guī)格化定義。目標策略經(jīng)過推演驗證確保一致性和可行性。驗證后的目標策略通過上行對航天器進行設(shè)置。通過下行數(shù)據(jù)信息還原出器上的自主規(guī)劃、決策、執(zhí)行過程和結(jié)果,對行為和狀態(tài)進行評估及預測,做出目標策略調(diào)整的控制。

    4.4 目標策略控制模式的關(guān)鍵技術(shù)

    為實現(xiàn)目標策略控制模式和上述基本框架,需要一系列不同于傳統(tǒng)指令控制模式的關(guān)鍵技術(shù)作為支撐,以下簡述其中的主要方面和研究現(xiàn)狀。

    (1)目標建模與驗證:目標建模即建立目標模型(GM),是對目標進行規(guī)劃、驗證、推理等操作的基礎(chǔ),目的是實現(xiàn)目標的準確、顯式描述。在需求工程、Agent等領(lǐng)域的研究中,已經(jīng)提出KAOS[44]、Tropos[45],以及形式化的約束目標模型(CGM)[46]等多種不同的目標模型。Braubach等[47]給出的目標顯式化模型,包含一個通用化的目標生命周期,描述了目標在運行時的狀態(tài)和轉(zhuǎn)換關(guān)系,以及四個帶有特定執(zhí)行行為的目標類型。

    目標驗證是對目標(集合)的一致性、可滿足性進行判定。KAOS和Tropos都支持基于線性時態(tài)邏輯(LTL)對約束進行形式化規(guī)約和分析[46]。Nguyen等[46]基于CMG模型對偏好和數(shù)字屬性的表達,使用解析器實現(xiàn)輸入模型精化和偏好最大化的自動推理。Thanagarajah等[48]給出了目標的顯式化表示,支持目標一致性檢測和沖突解決。

    (2)目標規(guī)劃與執(zhí)行:目標規(guī)劃即通過規(guī)劃算法從目標導出行為序列。目標規(guī)劃是實現(xiàn)目標式自主的核心功能,相關(guān)技術(shù)已有豐富的研究和應用[49]。針對航天任務的特點,基于時間線的時態(tài)約束規(guī)劃模型得到廣泛應用,例如PS[34]、CASPER[36]、PLASMA[38]、EUROPA[50]等規(guī)劃器和框架。

    目標的執(zhí)行就是將目標規(guī)劃的結(jié)果轉(zhuǎn)化為末端的行為序列并加以實施,但是單向的執(zhí)行過程在遇到某個步驟失敗時只能以目標的放棄而退出。在RA架構(gòu)[51]中,通過對目標的執(zhí)行過程進行監(jiān)視,并進行基于模型的問題識別和重構(gòu)方案的建立,最大程度保證計劃的繼續(xù)進行和目標的實現(xiàn)。

    (3)目標謀劃和目標推理:在目標導向的自主運行過程中,一味追求目標集合的全部滿足可能并不可行或者效果并非最優(yōu)。目標謀劃(goal delibe-ration)的作用即是解決目標之間的交織問題,確定選擇哪些目標付諸實施,以及對哪些目標進行延緩或放棄[47,52],這是自主系統(tǒng)具備“理性行為”的基本要求[53]。基于意圖理論[54]的信念愿望意圖(BDI)方法為目標謀劃提供了一種基礎(chǔ)框架[55],作為該類方法,Pokahr等[52]在Jadex BDI推理引擎上實現(xiàn)了一個用于目標謀劃的解釋器架構(gòu)。

    目標推理(goal reasoning)是指自主系統(tǒng)通過對正在執(zhí)行的目標進行推理而改變目標,包括當前目標的暫停、退出以及新目標的生成等[56]。作為自主系統(tǒng)的一種重要能力,目標生成實現(xiàn)了應對變化的環(huán)境條件,包括通過生成新目標從而捕捉到新出現(xiàn)的機會,以及解決新出現(xiàn)的問題[57]。Molineaux等[19]和Aha等[56]提出的目標驅(qū)動的自主(GDA)給出了在動態(tài)未知環(huán)境下生成新目標的概念框架。

    其余地區(qū)都存在綜合效率不足的問題,其中荊門、咸寧和隨州的農(nóng)業(yè)發(fā)展規(guī)模報酬都是呈現(xiàn)遞增狀態(tài),那么在今后的發(fā)展過程中應擴大農(nóng)業(yè)生產(chǎn)的規(guī)模,同時注重農(nóng)業(yè)生產(chǎn)技術(shù)的提高,從而達到純技術(shù)效率有效的狀態(tài)。

    (4)目標設(shè)置與跟蹤:目標控制模式下,目標的設(shè)置和調(diào)整是地面對航天器的主要作用方式。為了實現(xiàn)正確合理的目標設(shè)置,地面應當具備與自主航天器等同的目標規(guī)劃執(zhí)行、謀劃推理等處理能力,從而能夠?qū)⒁O(shè)置的目標進行事先的檢查、仿真、驗證。此外,地面還要對器上的模型庫、知識庫等進行更新維護,確保器上自主功能的正常運行。在DS-1的RA試驗中,即成功演示了地面與器上以異步方式進行目標、模型等更新的操作[5]。

    目標具有比指令更高的抽象層級,更長和復雜的生命周期[47]。目標導向的自主行為比傳統(tǒng)模式下具有更多的選擇性和多樣性。地面必須實現(xiàn)目標的跟蹤,不僅需要獲取目標執(zhí)行的結(jié)果,還需要目標規(guī)劃和執(zhí)行的軌跡。為此,器上需要進行信息收集、提煉、下行,地面則需要對器上的目標規(guī)劃、決策、執(zhí)行過程等進行還原、判斷。針對目標式自主航天器地面操作的新型數(shù)據(jù)分析、預測、顯示工具,Rajan等[58]和Castao等[13]給出了探討和示例。

    (5)策略規(guī)約與執(zhí)行:策略的規(guī)約就是實現(xiàn)策略的建立和表示,是策略管理的基礎(chǔ)。對規(guī)約的策略進行管理并加載、解釋、執(zhí)行,是實現(xiàn)策略控制的關(guān)鍵[40]。Dulay等[59]提出了一種策略規(guī)約語言Ponder和基于Ponder的策略部署模型。針對自主航天器,Tipaldi等[60]基于所提出的器上實現(xiàn)自主性的三層結(jié)構(gòu)(功能層、操作層、決策層),初步探討了地面生成與維護器上運行所需策略的挑戰(zhàn)。策略方法在航天領(lǐng)域的系統(tǒng)化研究和實踐還有待深化。

    5 自主航天器的協(xié)同交互控制模式

    5.1 協(xié)同交互控制模式的概念

    目標策略控制模式與指令直接控制模式雖然有根本差別,但二者也存在一個共同點,就是地面與航天器之間均為一種“控制-被控制”的關(guān)系。協(xié)同交互控制模式則在這一點上又有了質(zhì)的改變,在這種新的控制模式下,地面與航天器以團隊的方式運行,通過協(xié)作更有效和高效地完成更復雜的任務。

    如前所述,能夠支持協(xié)同交互控制的航天器需要具備協(xié)同式自主能力。協(xié)同式自主的相關(guān)概念在機器人、AI等領(lǐng)域中已得到廣泛重視,包括協(xié)同自主[20]、共享自主[61]、以人為中心的自主(HCA)[62]等。協(xié)同自主是從協(xié)同的視角定義自主,如McNeese等[63]提出“自主是一種能夠與人作為隊友工作,包含其核心任務工作和團隊工作功能的技術(shù)”。Dorais等[62]提出以人為中心的自主替代與人沒有交互的黑盒式自主,實現(xiàn)人與自主系統(tǒng)的靈活交互。

    與協(xié)同自主概念相應的,人對具有協(xié)同自主能力的系統(tǒng)進行的控制,即為協(xié)同控制[64]。Fong等[65]提出協(xié)同控制的概念,即人與機器人作為隊友共同完成任務目標。人與自主組隊(HAT)[6,11]也是以人與自主系統(tǒng)組合的方式實現(xiàn)高效團隊工作。Bradshaw等[66]針對航天應用中的人與機器人的協(xié)作,提出采用以團隊工作為中心的自主,而不是以自主為中心,其中人與自主系統(tǒng)并行工作,任務執(zhí)行的過程具有增量式、協(xié)商式、應變式的特點。

    綜上所述,這里提出的自主航天器的協(xié)同交互控制模式,是機器人、AI等領(lǐng)域中的協(xié)同控制等理念和技術(shù)在航天器控制問題上的映射。在航天領(lǐng)域中,相關(guān)的研究和應用主要關(guān)注空間機器人一類的控制對象,此外對于在軌航天器的天地協(xié)同式管控方面有一些積極的探索[67-68],總的來講,針對廣泛意義航天器的研究應用還在起步階段。

    5.2 協(xié)同交互控制模式的特點優(yōu)勢

    對協(xié)同自主和協(xié)同控制重要性的認識來自實踐與研究。在傳統(tǒng)的自動化領(lǐng)域中,忽視人與機器的關(guān)系而造成的“自動化驚訝”[9],以及由此總結(jié)的“自動化反諷”[69],均揭示出對于自動化系統(tǒng),關(guān)注人的交互問題的重要性。同樣針對自主系統(tǒng)可以說,自主并沒有消除人機交互的需要,而是對其有了更特殊的依賴性和更高的要求。以下從3個方面進一步說明協(xié)同交互控制模式的重要意義。

    首先,對于后果影響特別重要的應用,如軍事、航空、航天等,人應當具有對機器的掌控權(quán)力,即人需要在回路中[4,10],這是得到普遍認可并付諸實踐的系統(tǒng)原則。航天器和航天任務的特殊價值無疑使之不會在有條件的情況下排除人的監(jiān)督與控制。協(xié)同交互提供了人在回路的控制方式,并且這種交互不是簡單的“控制-被控制”,而是能夠充分發(fā)揮自主能力同時以高效方式實現(xiàn)人的參與和支配。

    其次,大量的研究和實踐已經(jīng)共同證實,人與自主相協(xié)同的方式是比完全人工或完全自主都更高效的運行模式,特別是在不確定性的環(huán)境中[6-8]。人的經(jīng)驗、直覺、判斷、決策能力與機器的存儲、計算、嚴格能力具有很大的互補性,并且對航天任務而言,地面的計算能力和數(shù)據(jù)資源與航天器上未能下傳的感知信息也是互補,人與器、天與地相結(jié)合的方式可以成為實現(xiàn)整體增強的高效途徑。

    最后,人與自主的協(xié)同有望做到更有效的差錯避免。人與機器的差異不僅體現(xiàn)在能力上,還體現(xiàn)在人可能由于情緒、注意力等原因出現(xiàn)疏忽性錯誤,機器則不會;機器會由于設(shè)計缺陷造成荒謬性錯誤并渾然不知,而人卻很容易發(fā)現(xiàn)。此外,機器掌握最即時和全面的狀態(tài),更利于發(fā)現(xiàn)人由于掌握信息不夠?qū)е碌牟缓侠聿僮?。因?通過人機協(xié)作互助糾錯,能夠為系統(tǒng)整體安全性提供更大保證。

    5.3 協(xié)同交互控制模式的實現(xiàn)框架

    這里給出協(xié)同交互控制模式下的一個天地綜合實現(xiàn)框架,如圖7所示,其中目標策略控制和傳統(tǒng)的指令與數(shù)據(jù)處理功能作為協(xié)同交互控制的基礎(chǔ)。

    圖7 協(xié)同交互控制模式的實現(xiàn)框架Fig.7 Framework of the collaborative interaction control mode

    航天器上主要包含協(xié)同交互會話、地面意圖理解、自感知與信息提煉等邏輯單元。通過協(xié)同交互會話,從地面上行信息中提取地面意圖,經(jīng)過理解,成為引導器上行為的依據(jù);另一方面,器上通過基于狀態(tài)的自感知與信息提煉加工,形成主動傳送的信息,通過協(xié)同交互會話下行給地面。

    地面系統(tǒng)主要包含協(xié)同交互會話、器上態(tài)勢感知、地面決策與響應等邏輯單元。通過對下行信息的處理,獲得器上的態(tài)勢感知,基于態(tài)勢感知進行地面的決策與響應,并通過協(xié)同交互會話,實現(xiàn)與航天器的協(xié)同交互控制過程。

    5.4 協(xié)同交互控制模式的關(guān)鍵技術(shù)

    為實現(xiàn)協(xié)同交互控制模式和上述基本框架,需要一系列不同于前述兩種控制模式的關(guān)鍵技術(shù)作為支撐,這些關(guān)鍵技術(shù)當前主要在人與機器人交互(HRI)等領(lǐng)域中得到研究與實踐,如何適應航天器天地協(xié)同的問題特點進行發(fā)展運用,相關(guān)的研究和驗證都還較少,這里給出初步的分析探討。

    (1)協(xié)同實現(xiàn)機理:基于人類團隊活動研究的聯(lián)合活動等理論[70],為人與自主系統(tǒng)的交互問題提供了協(xié)同機理的基本指導。聯(lián)合活動是指團隊基于共同目標開展的協(xié)同活動,Klein等[71]提出其4個基本需求,即基本契約、共同基礎(chǔ)、可預測和可導向?;酒跫s是指對共同目標和參與協(xié)同的認可;共同基礎(chǔ)是指共享的相關(guān)知識、信念、假設(shè)等;可預測是指行為對于隊友具有可預測性;可導向是指能夠接受隊友的指示影響。

    作為聯(lián)合活動的一種主要形式,混合驅(qū)動的交互[41]是協(xié)同交互控制模式有別于傳統(tǒng)控制的基本特征之一。在混合驅(qū)動的交互中,地面與航天器都可以成為交互的主導者,進行主動給予、主動支持、主動請求等,具體的方式可以包括問詢/回答、請求/響應,以及迭代會話等,并實現(xiàn)合作式的規(guī)劃、決策、診斷、學習等特定功能。作為航天器與地面交互新模式的范例,一些器上主動按需向地面請求管控和服務的方法得到提出[67-68]。還有更多的協(xié)同交互場景與技術(shù)有待發(fā)掘與實踐,例如在環(huán)境不確定的小天體探測中的應用等。

    另外需要指出的是,人與機器的協(xié)同與人類之間的協(xié)同不盡相同[70],地面與在軌航天器的協(xié)同和人與機器人的協(xié)同又有很大不同,因此協(xié)同交互控制模式的實現(xiàn)需要緊密結(jié)合本領(lǐng)域的需求和特點,使得協(xié)同得以有效和高效實現(xiàn),這個問題的進一步認識和良好解決也應是后續(xù)研究的一個重點。

    (2)交互機制與策略:交互是通過信號傳遞[70]實現(xiàn)聯(lián)合活動的基本手段,交互的機制與策略包括交互語言、交互協(xié)議、交互內(nèi)容等,是實現(xiàn)交互的物理支撐。航天任務中地面與航天器之間均為遠程交互,并存在特征的多樣性,主要體現(xiàn)在時延和間斷性的差異。這里用四象限法將其定性地劃分為四種類型,分別是持續(xù)(近)實時交互(例如通信全覆蓋的地球空間站)、間斷(近)實時交互(例如測控站斷續(xù)跟蹤的近地衛(wèi)星)、持續(xù)延遲交互(例如長時間測控可見的深空飛行器)、間斷延遲交互(例如通過軌道器中繼的行星表面巡視器)。

    可以看到,地面與航天器的協(xié)同所基于的交互特點與通常環(huán)境中的人機交互[28]有很大不同,通信條件的限制使得交互可能難以及時或持續(xù)進行,一些通常使用的基于實時會話的交互機制和技術(shù)將不適用。如何在此條件下設(shè)計合理高效的交互機制,為地面與航天器之間的協(xié)同交互提供底層支持,是針對領(lǐng)域特點要解決的基礎(chǔ)問題。

    (3)團隊態(tài)勢感知:態(tài)勢感知(SA)是“對環(huán)境中的要素的知覺、理解和預測”[72]。自主性的提高使得對人而言的不確定性和不可預測性大大增加[61],因而增加了態(tài)勢感知的困難。為此,航天器需要增強自我感知能力,即對自身狀態(tài)的獲取、分析、判斷以及主動傳遞。地面與航天器還需要實現(xiàn)團隊態(tài)勢感知(TSA)[73],就是對自身、隊友,以及共同的目標、對方的意圖、協(xié)作的進展等各方面狀態(tài)的掌握。許多研究特別強調(diào)了系統(tǒng)透明性的概念[61],即系統(tǒng)行為的可觀察性、可預測性、可解釋性等,以及人的透明性,即理解人的意圖和行為[74]。

    人機界面是態(tài)勢信息傳遞給人的通道和幫助理解的工具,因而是實現(xiàn)透明性的關(guān)鍵要素[61]。作為一個設(shè)計范例,Gersh等[75]通過建立“手段-目的”抽象層級,對航天器的目標、功能、部件等的關(guān)系進行描述,基于該層級結(jié)構(gòu)驅(qū)動特定事件相關(guān)信息的動態(tài)呈現(xiàn)。Chen等[76]提出了一種基于態(tài)勢感知的Agent透明性(SAT)模型,通過人機界面提供對意圖、表現(xiàn)、計劃、推理的理解。

    (4)自主性調(diào)節(jié):一個航天器的自主能力和控制模式在其運行生命周期中不應是固化不變,而是可以動態(tài)轉(zhuǎn)換的。航天器需要具備針對不同場景的需要呈現(xiàn)不同自主性特征的能力,這種變化的自主性即為可調(diào)節(jié)自主性[62]。自主性調(diào)節(jié)的關(guān)鍵問題是確保調(diào)節(jié)前后的狀態(tài)正確,避免由于調(diào)節(jié)而喪失原有的態(tài)勢感知,破壞運行的連續(xù)性和正確性,如同Kortenkamp等[29]指出的交換控制中的問題。

    自主性的調(diào)節(jié)可能由地面驅(qū)動,也可能由器上發(fā)起。器上的認知失效[34]設(shè)計,使之能夠識別到任務或功能執(zhí)行的不成功而實施失效處置,包括觸發(fā)監(jiān)督模塊進行自主性調(diào)節(jié)[62]。地面對航天器自主性進行調(diào)節(jié)時,可以通過操作器上的目標庫、模型庫等實現(xiàn)改變。Bradshaw等[41]提出了利用策略機制實現(xiàn)自主性調(diào)節(jié)的方法,可以認為是前述目標策略控制模式的一種結(jié)合應用。

    (5)協(xié)同效能評估與提升:協(xié)同交互控制模式下,地面與航天器各自的工作效能以及整體工作效能,是衡量該模式成功與否的關(guān)鍵標準之一。航天器自主性的提高對于人的工作強度具有減輕作用,但是也存在負面影響的風險,包括注意力降低、態(tài)勢跟蹤不及時、快速響應能力退化等,在自主性動態(tài)變化的情境下,還對地面的正確響應與處置能力提出更高的要求。

    6 結(jié)束語

    隨著航天器自主能力的不斷提升和自主性航天任務的不斷增多,如何實現(xiàn)對自主航天器的天地相協(xié)調(diào)的控制,并不斷提高任務執(zhí)行的效能,是需要加以關(guān)注的重要問題。指令直接控制代表了傳統(tǒng)的“人工控制”理念,自主行為與地面指令存在天然的難協(xié)調(diào)性;目標策略控制代表了“機器控制”的理念,為從根本上實現(xiàn)全局一致性提供了可能;協(xié)同交互控制則代表了“人機協(xié)同”的理念,有望實現(xiàn)協(xié)調(diào)高效的“人與器”的團隊協(xié)作。

    在當前的工程實踐中,針對在軌航天器的指令直接控制仍為使用最多的控制模式,目標策略控制的系統(tǒng)級實現(xiàn)還較少,協(xié)同交互控制的相關(guān)研究和應用則整體還處在起步階段。隨著技術(shù)的發(fā)展,航天器自主能力的持續(xù)增強,不僅體現(xiàn)在其獨立于地面工作的能力,還體現(xiàn)在其與地面高效交互、協(xié)同合作從而完成更具挑戰(zhàn)性任務的能力,這種人機協(xié)同的方式,將是航天器運行與控制的一個重要發(fā)展方向和有待進一步研究探索的領(lǐng)域。

    猜你喜歡
    航天器自主性指令
    聽我指令:大催眠術(shù)
    2022 年第二季度航天器發(fā)射統(tǒng)計
    國際太空(2022年7期)2022-08-16 09:52:50
    2019 年第二季度航天器發(fā)射統(tǒng)計
    國際太空(2019年9期)2019-10-23 01:55:34
    2018 年第三季度航天器發(fā)射統(tǒng)計
    國際太空(2018年12期)2019-01-28 12:53:20
    ARINC661顯控指令快速驗證方法
    LED照明產(chǎn)品歐盟ErP指令要求解讀
    電子測試(2018年18期)2018-11-14 02:30:34
    2018年第二季度航天器發(fā)射統(tǒng)計
    國際太空(2018年9期)2018-10-18 08:51:32
    英語學習的自主性及其教學應用
    實用英語教材與藝術(shù)生自主性培養(yǎng)
    發(fā)揮主體作用,加強高中數(shù)學復習的自主性
    贵定县| 浪卡子县| 富锦市| 大理市| 松桃| 上饶市| 安乡县| 青冈县| 乌兰察布市| 郯城县| 华池县| 成武县| 炎陵县| 洛阳市| 石城县| 太原市| 灵璧县| 罗定市| 东兰县| 靖边县| 福安市| 阿瓦提县| 即墨市| 民和| 浦北县| 沿河| 马山县| 武陟县| 普格县| 同心县| 虞城县| 桃园县| 监利县| 福清市| 宜良县| 阜宁县| 金华市| 嘉定区| 平谷区| 循化| 金寨县|