楊尚飛,林龍信,葉 飛
(海軍研究院,北京100161)
以海豚、海獅、鯨等為代表的海洋動物具備天生的潛水和超聲波定位本領。經(jīng)過訓練后,這些海洋動物可以按照指令在公?;顒?;它們靈敏的聽覺和潛水本領,可以完成人類或水下航行器無法完成或難以完成的任務。同時,海洋動物的行動不受水下能源供應限制,且具有良好的機動性和隱蔽性[1]。
上述特點使得海洋動物在軍事和民用領域具有重要的發(fā)展前景。在一些國家中,海洋動物已成為海軍武裝力量的一個特殊“兵種”。利用海洋動物的本能及通過訓練養(yǎng)成的反射動作,教會它們某些軍事技能,使其為戰(zhàn)爭服務,是海軍軍事力量發(fā)展的重要內容。
海洋動物行為控制技術則是實現(xiàn)上述目標的主要關鍵技術。控制海洋動物的行為是一項復雜的系統(tǒng)工程,涉及生物學、生理學、MEMS技術、控制技術、通訊技術、傳感技術等諸多領域。本文主要對海洋動物的行為控制機理及海洋動物行為控制的主要方法和關鍵技術進行研討,分析海洋動物行為控制的國外研究現(xiàn)狀,并提出海洋動物行為控制技術的未來可能應用方向。
20世紀60年代初,美國海軍成立了海洋哺乳動物研究試驗基地。圣迭戈海軍基地的海洋系統(tǒng)中心,有百余只海洋動物在“受馴”。經(jīng)過多年的研究和訓練,美國已初步建立一支主要由海豚、海獅和鯨組成的海洋動物特種兵,輔助完成了越南戰(zhàn)爭期間在金蘭灣阻擊越南潛水員、海灣戰(zhàn)爭前夕赴波斯灣反水雷等作戰(zhàn)任務[2-4]。
2006年,美國海軍水下戰(zhàn)中心啟動“鯊魚特工”研究,通過在鯊魚大腦中植入微型電極來遙控鯊魚的行為,將其變成動物機器人,秘密跟蹤敵方艦船運動,完成各種危險的間諜任務。
2010年,美國海軍在弗吉尼亞州海岸訓練了一支由數(shù)十只海獅、海豚和巨鯨組成的海洋動物搜爆部隊,其主要任務是反水雷,同時也能夠在水下制服恐怖分子。
20世紀80年代中期,蘇聯(lián)海軍開始模仿美國海軍,制定“海洋哺乳動物系統(tǒng)”計劃,秘密訓練海洋哺乳動物,設立了卡查亭灣和海參崴2個訓練中心。1990年初,卡查亭灣中心馴養(yǎng)著大約100只海豚、34頭海獅和2只白鯨。海豚大部分被訓練成“看門狗”,而白鯨則用于執(zhí)行自殺性任務。目前,北方艦隊已擁有一支由15只受過良好訓練的海豹組成的小規(guī)?!八绿胤N分隊”。它們在水下值班放哨,不受嚴酷天氣的影響,確保了戰(zhàn)略核潛艇的安全[5]。
圖1 美海軍戰(zhàn)士對海豚進行訓練Fig.1 US naval soldiers train dolphins
印度也是全球能夠指揮海豚從事深海任務的極少數(shù)國家之一?,F(xiàn)已擁有若干技術純熟的海豚,并成立“海豚特種部隊”,專門在敵人艦船下放置具有強烈附著力的炸彈,進行攻擊與破壞任務。
海洋動物的行為主要分為反射運動、模式運動和意識運動等類型。其中,反射運動由外界刺激引起,運動形式固定、反應快捷;模式運動是指運動形式固定的周期性運動,具有時空對稱的表征,如游動;意識運動則具有明確的目的性,運動形式比較復雜,主要受主觀意識的支配。這三種運動行為并不是絕對獨立的,海洋動物的許多行為往往涉及到上述多種運動的綜合作用。
研究表明,反射運動是海洋動物中樞神經(jīng)的基本活動形式,主要包括條件反射和非條件反射兩種類型。按照巴普洛夫的條件反射理論,條件反射是在一定條件下,外界刺激與有機體反應之間建立起來的暫時神經(jīng)聯(lián)系,而非條件反射是條件反射形成的基礎。由于非條件反射的內部機理復雜,短期內難以在動物行為控制中得到應用,故本文僅針對條件反射進行討論。條件反射的建立,極大地擴大了動物機體反射活動的范圍,增加了動物活動的預見性和靈活性,從而使動物更能精確的適應環(huán)境變化[6]。
通常情況下,海洋動物的行為控制主要是通過人工電刺激等各種訓練方法,訓練海洋動物形成條件反射運動,刺激帶動其模式運動,并發(fā)揮其本身具備的優(yōu)良特性,完成人類或水下航行器無法完成或難以完成的任務。因此,著重從條件反射運動研究海洋動物的行為控制機理。
1)條件發(fā)射的形成。
條件反射建立在非條件反射的基礎上。形成條件反射的基本條件為:①無關刺激與非條件刺激在時間上的反復多次結合;②無關刺激必須出現(xiàn)在非條件刺激之前或同時;③條件刺激的生理程度比非條件刺激要弱。
以海豚進食小魚為例。小魚是非條件刺激,哨聲為無關刺激。但若在每次喂食小魚之前先出現(xiàn)一次哨聲,然后再喂食小魚,則多次結合之后,當哨聲一出現(xiàn),海豚即會出現(xiàn)進食反應,哨聲便成為了條件刺激。這種建立條件反射的過程稱為強化,這種條件反射又稱為經(jīng)典條件反射。
與此相對應,還存在操作性條件反射,要求動物完成一定的操作。例如,海豚偶爾頂?shù)綉覓煸谏戏降钠で驎r,即喂以小魚,強化這一操作,如此反復多次,海豚即可學會頂皮球而得食。然后在此基礎上進一步訓練海豚,只有當出現(xiàn)某一特定信號(如手勢)后頂皮球,才能得到小魚。此類條件反射的特點是動物必須通過自己完成某種運動或操作后才能得到強化,故稱為操作性條件反射[7]。
2)條件反射的消退。
條件反射建立后,如果反復應用條件刺激而不給予非條件刺激,條件反射就會減弱,最后完全不出現(xiàn),稱為條件反射的消退。一個正在進行的條件反射,有可能被突然出現(xiàn)的一個新的強刺激而被抑制,使該條件反射暫時消退。條件刺激太強或作用時間太久,也會抑制正在進行的條件反射??傊?,為了建立條件反射,使用的條件刺激要固定,強度要適宜,而且要經(jīng)常用非條件刺激來強化和鞏固。否則,已經(jīng)建立的條件反射也會因受到抑制而逐漸消退。
在海豚、白鯨或其他動物的實際訓練中,經(jīng)常會碰到這樣的情況:一個訓練動作動物已經(jīng)訓練一段時間并已基本掌握,但突然在某天或某個時段動物似乎忘卻了這個動作,需要重新加以訓練或引導,這稱為暫時性失憶。
在實踐中經(jīng)??捎^察到,相同種類的不同動物個體在形成條件反射的速度、強度、精確性和穩(wěn)定性方面,以及對疾病的抵抗力、對藥物的敏感性和耐受性等方面,都存在著明顯的個體差異。這種因大腦皮層的調節(jié)和整合活動存在的個體差異,稱為神經(jīng)活動類型,一般簡稱為神經(jīng)型[8-9]。
海洋動物的基本神經(jīng)型主要包括興奮型、活潑型、安靜型和抑制型。其中,興奮型的特點是興奮和抑制都很強,但比較起來,興奮更占優(yōu)勢;其行為表現(xiàn)是急躁、暴烈、不受拘束和帶有攻擊性,能迅速建立比較鞏固的條件反射,但精確性較差?;顫娦偷奶攸c是興奮和抑制都強,且均衡發(fā)展,互相轉化比較容易且迅速;行為表現(xiàn)為活潑好動,對周圍發(fā)生的微小變化能迅速反應,精確性高,能適應環(huán)境的復雜變化,最適宜開展行為訓練。安靜型的特點是興奮和抑制都強,發(fā)展也比較平衡,但互相轉化比較困難而緩慢;行為表現(xiàn)為安靜、細致、溫順、有節(jié)制,對周圍變化反應冷淡,能很好地建立精細的條件反射,但速度較慢。抑制型的特點是興奮和抑制都很弱,一般更容易表現(xiàn)為抑制;行為表現(xiàn)為膽怯、不好動、易疲勞,常常畏縮不前并帶有防御性,一般不易形成條件反射,形成后也不鞏固,不能適應復雜變化的環(huán)境,也難于勝任較強和持久的活動。
因此,為了使海洋動物具備經(jīng)過人類訓練后完成指定任務的可靠能力,在海洋動物篩選時主要關注基本神經(jīng)型為活潑型的海洋動物,如海豚、海豹、海獅、海象、白鯨等。
如上所述,海洋動物行為控制主要是訓練養(yǎng)成其完成特定任務的條件反射,因此,行為控制的主要方法即條件反射的訓練養(yǎng)成方法。從各國實踐來看,海洋動物行為控制主要包括操作性條件反射和人工電刺激等2種方法,如圖2所示。
圖2 海洋動物行為控制的主要方法Fig.2 Main methods of marine animal behavior control
操作性條件反射是一種學習過程,其特點是用獎勵性手段來強化某種反應方式,其理論基礎是桑代克和斯金納的操作性條件反射理論。
訓練方式主要包括正面獎勵方法和目標訓練法。正面獎勵方法是訓練海洋動物的最基本方法,如果海洋動物能做出指定動作,便會得到食物作為獎勵。目標訓練法是在訓練前讓海洋動物識別聲音、哨子、目標棒等操作性指令,繼而訓練它們將操作性指令與具體的行為或目標相對應,從而完成不同的行為動作。
在世界各國海洋動物行為控制實踐中,以正強化為主導的操作性條件反射方法占據(jù)主要地位。在具體使用上,主要綜合運用正強化、橋接及條件化等方法,通過原強化物和次強化物等建立適宜的強化方式。操作性條件反射方法的運用需要熟練掌握海洋動物的需求和學習心理,要求進行大量的調研和訓練。
動物的運動行為歸根結底是由神經(jīng)系統(tǒng)調控完成的。動物運動的神經(jīng)調控系統(tǒng)是一個分層次的多級控制系統(tǒng),其調控網(wǎng)絡存在不同水平的控制中心,如脊髓、腦干下行系統(tǒng)和大腦皮層。根據(jù)該層次結構,我們可以從不同層次對動物的運動行為進行誘導。
人工電刺激方法是以電子信息技術和神經(jīng)生物學的交叉融合為背景,通過人工設計的腦接口控制器對海洋動物的神經(jīng)系統(tǒng)進行調控誘導,通過訓練和強化,使海洋動物聽從訓練員指令的方法。通過設計腦接口控制器,自動輸出實現(xiàn)目標行為所需要的電刺激信號,從而驅動海洋動物生成特定行為。
該方法涉及的關鍵技術主要包括腦接口技術、腦信息接收處理技術、腦防護技術等。由于生物神經(jīng)系統(tǒng)的復雜性,加之人工電刺激方法不可避免地會對海洋動物造成一定的傷害,因此,人工電刺激方法的研究稍顯滯后,成功應用的實例也并不多見。實際應用表明,人工電刺激的訓練結果與動物個體差異較為相關,一方面動物的受控程度與所選擇的電刺激脈沖參數(shù)具有很大的相關性;另一方面,不同動物個體所需要的電刺激脈沖強度也存在較大差異。此外,微電極的植入位置、環(huán)境噪聲以及其它觸覺、視覺等因素的干擾等均對訓練結果的正確性與及時性造成影響。根據(jù)實際應用需求,未來可重點從海洋動物運動行為的神經(jīng)調控機理、腦信息接收與處理技術、生物腦接口控制技術、生物腦防護技術以及操作性條件反射與人工電刺激相結合的海洋動物行為控制技術等方面展開研究。
海洋動物行為控制技術可為海洋動物執(zhí)行軍用或民用任務提供技術支撐。在相關技術研究成熟后,海洋動物主要可在水下破障、水下環(huán)境獲取(監(jiān)視與偵察)、水下進攻、深水打撈等方向得到應用。
圖3給出了利用海豚執(zhí)行深海軍事攻擊任務的構想圖。首先,海豚從母船接受命令,攜帶智能武器向偵查目的地出發(fā);利用智能武器裝備的聲吶傳感器探測目標,向母船發(fā)回探測數(shù)據(jù),指令控制海豚的運動軌跡;智能武器探測到目標后,向母船發(fā)出信號報告當前位置,由母船指揮中心判斷是否執(zhí)行任務;智能武器接到母船的命令后,啟動自動分離裝置和海豚分離,進行自主航行,并跟蹤目標;海豚返回母船;智能武器靠近目標后,根據(jù)螺旋槳發(fā)出的噪音、螺旋槳附近的水流和水溫,貼近螺旋槳,執(zhí)行任務。
圖3 海豚執(zhí)行遠程深海任務構想圖Fig.3 Conception diagram of dolphins performing long-range deep-sea missions
需要指出的是,不同應用的執(zhí)行過程可能有所不同,但利用海洋動物行為控制技術控制海洋動物執(zhí)行軍事任務的核心均是海洋動物接受母船操控指令,攜帶不同的任務載荷向目的地出發(fā),利用攜帶的傳感器探測目標,向母船發(fā)出信號報告當前位置及態(tài)勢,由母船指揮中心判斷是否執(zhí)行任務。接收到母船命令后,啟動自動分離裝置將任務載荷與海豚分離,由任務載荷執(zhí)行相應的任務。
海洋動物行為控制技術的發(fā)展,使我們可以充分利用海洋動物具有的機動靈活、隱身性強、不受水下能源供應限制等獨特優(yōu)勢,在未來的海洋開發(fā)、利用及海洋權益爭奪中發(fā)揮越來越重要的作用。為此,需針對海洋動物的行為控制機理及操作性條件反射方法和人工電刺激方法進行持續(xù)深入研究,通過理論分析和訓練實踐,逐步提高海洋動物行為的可控性和海洋動物行為控制的可靠性。