潘金磊 葉爾德尼
淺談犬訓(xùn)練獎(jiǎng)勵(lì)的原則
潘金磊 葉爾德尼
獎(jiǎng)勵(lì)是為加速培養(yǎng)和鞏固犬的能力,增強(qiáng)犬行為出現(xiàn)的幾率,以及犬服從指揮,做出正確動(dòng)作的正強(qiáng)化方法,是犬訓(xùn)練的重要有效方法。獎(jiǎng)勵(lì)時(shí),需要注意哪些問(wèn)題?掌握什么原則?大量的訓(xùn)犬書(shū)籍里只闡述了獎(jiǎng)勵(lì)的方法,很少有關(guān)于獎(jiǎng)勵(lì)原則的論述。原則是對(duì)原理進(jìn)行總結(jié)歸納而得出的規(guī)則,是對(duì)原理的高度概括。懂得原理,才能想出方法,不懂原理,只會(huì)方法,永遠(yuǎn)只能停留在照貓畫(huà)虎,依葫蘆畫(huà)瓢的水平上。懂得原理,總結(jié)出原則,可以創(chuàng)造出各種各樣的獎(jiǎng)勵(lì)方法,原則重于方法,方法來(lái)源于原則。不懂原理,輕者,只能發(fā)現(xiàn)問(wèn)題,不能解決問(wèn)題,甚至,根本發(fā)現(xiàn)不了問(wèn)題。理解了原理,掌握了原則,才能發(fā)揮獎(jiǎng)勵(lì)的最佳增強(qiáng)效果。通過(guò)訓(xùn)練實(shí)踐,歸納總結(jié)出了以下五條獎(jiǎng)勵(lì)的原則。
不怕警犬不工作,就怕警犬沒(méi)愛(ài)好。不同的犬,不同的犬種,其喜好的東西是不同的,所以對(duì)于犬的獎(jiǎng)勵(lì)方式,也是千差萬(wàn)別的。獎(jiǎng)勵(lì)時(shí),只有因犬制宜,投其所好,才能完全調(diào)動(dòng)犬的積極性,使犬充滿訓(xùn)練的激情和動(dòng)力。在平時(shí)和犬的接觸中,喜歡吃的食物,喜歡玩的游戲,用犬喜好的東西去獎(jiǎng)勵(lì)它,才能充分發(fā)揮犬的主觀能動(dòng)性,使犬積極主動(dòng)地學(xué)習(xí)、工作。
獎(jiǎng)勵(lì)只有及時(shí),才能有效。過(guò)早的獎(jiǎng)勵(lì)和過(guò)晚的獎(jiǎng)勵(lì),都會(huì)降低獎(jiǎng)勵(lì)的效果。
犬在完成動(dòng)作之后的兩秒鐘內(nèi),進(jìn)行獎(jiǎng)勵(lì),才能明白是獎(jiǎng)勵(lì)的哪個(gè)行為。當(dāng)然,這是在保持動(dòng)作沒(méi)有發(fā)生改變的情況下。如果在兩秒鐘內(nèi),動(dòng)作已經(jīng)發(fā)生了變化,那么,獎(jiǎng)勵(lì)增強(qiáng)的行為是和獎(jiǎng)勵(lì)出現(xiàn)的時(shí)間間隔最接近的行為,獎(jiǎng)勵(lì)已經(jīng)錯(cuò)過(guò)了最佳時(shí)機(jī)。獎(jiǎng)勵(lì)時(shí),一定要在動(dòng)作完成后的兩秒鐘內(nèi)且動(dòng)作沒(méi)有發(fā)生改變時(shí)進(jìn)行。在動(dòng)作過(guò)程中進(jìn)行獎(jiǎng)勵(lì),同樣也能起到增強(qiáng)效果。例如,當(dāng)犬在坐下的過(guò)程中進(jìn)行獎(jiǎng)勵(lì),犬會(huì)更加努力地去重復(fù)這個(gè)行為。獎(jiǎng)勵(lì)時(shí)機(jī)過(guò)晚不但對(duì)正確的行為沒(méi)有增強(qiáng)效果,而且會(huì)造成大量訓(xùn)練問(wèn)題。例如,當(dāng)犬坐下,主人用 “好”的口令獎(jiǎng)勵(lì)犬時(shí),犬正好又回到站立的姿勢(shì),主人到底獎(jiǎng)勵(lì)的是犬的哪個(gè)行為?犬理解的是站立的行為。 每當(dāng)發(fā)現(xiàn)訓(xùn)練出現(xiàn)問(wèn)題時(shí),首先要考慮的是獎(jiǎng)勵(lì)的時(shí)機(jī)是否太晚。如果訓(xùn)導(dǎo)員在訓(xùn)練中忙得無(wú)法分心留意,這時(shí)可以請(qǐng)助訓(xùn)員幫忙觀察,看看自己獎(jiǎng)勵(lì)的時(shí)機(jī)是否太晚,這對(duì)于掌握獎(jiǎng)勵(lì)的時(shí)機(jī)將會(huì)大有幫助。
過(guò)早給予獎(jiǎng)勵(lì)也可能沒(méi)有效果。在行為出現(xiàn)前給予獎(jiǎng)勵(lì),完全無(wú)法強(qiáng)化這個(gè)行為,因?yàn)槭艿姜?jiǎng)勵(lì)的是犬沒(méi)有發(fā)生的行為,此時(shí)的獎(jiǎng)勵(lì),完全起不到增強(qiáng)行為的效果。
獎(jiǎng)勵(lì)只有與行為的難易程度相當(dāng),恰到好處,才能起到獎(jiǎng)勵(lì)的效果。什么時(shí)候給予什么樣的獎(jiǎng)勵(lì),在犬訓(xùn)練中極為重要,獎(jiǎng)勵(lì)恰到好處,事半功倍。知道獎(jiǎng)勵(lì),而不知道該給什么獎(jiǎng)勵(lì),往往會(huì)造成勞而無(wú)功、事倍功半的不良后果。
利用食物進(jìn)行訓(xùn)練獎(jiǎng)勵(lì)時(shí),訓(xùn)導(dǎo)員常搞不清楚食物獎(jiǎng)勵(lì)的份量應(yīng)該是多大,答案是盡可能越小越好。食物獎(jiǎng)勵(lì)越小,犬能越快吃掉食物,不但可以減少訓(xùn)導(dǎo)員等待的時(shí)間,而且每次練習(xí)時(shí)還可以增加食物獎(jiǎng)勵(lì)的使用次數(shù),不會(huì)讓犬一下子就吃飽吃膩了。一般來(lái)說(shuō),一小口食物足以讓犬保持興奮,如果是特別喜愛(ài)的食物,份量甚至可以更少。行為的難易程度應(yīng)當(dāng)與食物獎(jiǎng)勵(lì)的大小相當(dāng),食物的大小雖然沒(méi)有一定的定律,但是有時(shí)候工作越艱難,報(bào)酬將會(huì)越大,如果我們完成了艱難工作卻未獲得相應(yīng)的報(bào)酬,我們肯定埋怨不已。
激動(dòng)的獎(jiǎng)勵(lì)方式能燃起犬激動(dòng)的情緒,慢條斯理的獎(jiǎng)勵(lì)方式,能穩(wěn)定犬激動(dòng)情緒,可促使性格急躁的犬心理放松。訓(xùn)練時(shí),根據(jù)犬的工作狀態(tài)和訓(xùn)導(dǎo)員的訓(xùn)練需求,選擇適合的獎(jiǎng)勵(lì)方式;需要犬處于興奮狀態(tài)時(shí),選擇激動(dòng)、興奮的獎(jiǎng)勵(lì)方式,需要犬處于平穩(wěn)狀態(tài)時(shí),選擇慢條斯理的獎(jiǎng)勵(lì)方式。例如,快速撫拍犬胸部的獎(jiǎng)勵(lì)方式和慢速撫摸犬被毛的獎(jiǎng)勵(lì)方式,其效果是完全不一樣的,前者用于燃起犬激動(dòng)的情緒,后者使犬心理放松,穩(wěn)定犬的情緒。
獎(jiǎng)勵(lì)的持續(xù)時(shí)間,對(duì)訓(xùn)練的效果,也極具重要作用。在訓(xùn)練進(jìn)行的過(guò)程中,選擇持續(xù)時(shí)間短的獎(jiǎng)勵(lì),往往不會(huì)中斷犬的思維,便于犬學(xué)習(xí)和訓(xùn)練。而在訓(xùn)練結(jié)束時(shí),選擇持續(xù)時(shí)間長(zhǎng)的獎(jiǎng)勵(lì),可以使犬徹底地放松神經(jīng)中樞,對(duì)下次訓(xùn)練充滿期待。
犬接受訓(xùn)練初期,要簡(jiǎn)化犬得到獎(jiǎng)勵(lì)的過(guò)程,讓犬很容易得到獎(jiǎng)勵(lì);訓(xùn)練后期,形成犬牢固條件反射之后,要慢慢增加獲得獎(jiǎng)勵(lì)的復(fù)雜程度,這樣才有利于增強(qiáng)犬連續(xù)作業(yè)的能力。例如,當(dāng)犬依照口令完成了某一動(dòng)作,獎(jiǎng)勵(lì)時(shí),把玩具拋進(jìn)草叢里讓犬去尋找,而不是直接得到玩具,這就是一個(gè)具有復(fù)雜程度的獎(jiǎng)勵(lì)。
一位研究老鷹的生物學(xué)家注意到,如果老鷹在某處樹(shù)叢下抓到老鼠,隨后約有一星期的時(shí)間它每天都會(huì)到該處偵察,它飛過(guò)那個(gè)特定地點(diǎn)的幾率已經(jīng)被強(qiáng)烈增強(qiáng)。如果你在垃圾桶里撿到一張百元鈔票,我相信你以后再次經(jīng)過(guò)這個(gè)垃圾桶時(shí),肯定會(huì)走過(guò)去向垃圾桶里瞧瞧。這些行為之所以被增強(qiáng),是因?yàn)闊o(wú)形之中獲得了意外獎(jiǎng)勵(lì)。
對(duì)于已經(jīng)具有一定訓(xùn)練基礎(chǔ)的犬,為了避免犬形成定性思考,獎(jiǎng)勵(lì)的類別和大小,一定要變幻莫測(cè)。下一個(gè)出現(xiàn)的獎(jiǎng)勵(lì)是什么?是物品?是食物?是犬最喜歡的食物還是一般喜歡的食物?讓犬永遠(yuǎn)摸不清楚規(guī)律,變幻無(wú)常,犬才會(huì)對(duì)獎(jiǎng)勵(lì)充滿期待。
獎(jiǎng)勵(lì)時(shí),獎(jiǎng)勵(lì)出現(xiàn)的位置,不能恒定不變,如果經(jīng)常右手掏球獎(jiǎng)勵(lì)犬,犬就會(huì)盯著右手出現(xiàn)的地方,長(zhǎng)此以往,會(huì)形成不良聯(lián)系。例如,在誘導(dǎo)獎(jiǎng)勵(lì)訓(xùn)練時(shí),可以左手誘導(dǎo)、左手獎(jiǎng)勵(lì),左手誘導(dǎo)、右手獎(jiǎng)勵(lì),右手誘導(dǎo)、右手獎(jiǎng)勵(lì),右手誘導(dǎo)、左手獎(jiǎng)勵(lì)等等,不停地變換獎(jiǎng)勵(lì)出現(xiàn)的地方。另外,獎(jiǎng)勵(lì)物可以從身體的任何一處出現(xiàn),要讓犬永遠(yuǎn)都猜不到,下一個(gè)獎(jiǎng)勵(lì)即將在哪里出現(xiàn)。
出其不意的獎(jiǎng)勵(lì),往往會(huì)有出其不易的效果。在訓(xùn)練中,訓(xùn)導(dǎo)員都遇到過(guò)無(wú)論怎么重復(fù)、大聲地喊口令,犬還是一動(dòng)不動(dòng)的情況。此時(shí),性格暴躁的訓(xùn)導(dǎo)員,往往壓制不住內(nèi)心的怒火去打犬,造成訓(xùn)練半途而廢,犬恐懼主人。
出其不意的大獎(jiǎng)是一個(gè)對(duì)動(dòng)物或人類都極為有效的技巧。大獎(jiǎng)是指非常大的獎(jiǎng)勵(lì),甚至可能比平常大十倍,而且訓(xùn)練對(duì)象沒(méi)料到它會(huì)出現(xiàn)。遇到犬不聽(tīng)話、害怕或抗拒而完全不服從口令的行為時(shí),偶爾給一次大獎(jiǎng)極有可能有效改善犬的反應(yīng)。不知道這種不勞而獲的大獎(jiǎng)為什么具有如此效果顯著的作用,只知道當(dāng)我們什么都沒(méi)做時(shí),卻得到了意外的獎(jiǎng)勵(lì)后,我們會(huì)加倍努力的工作,其中原由一直沒(méi)弄明白,也許是為了得到更大的獎(jiǎng)勵(lì),也許是對(duì)自己不勞而獲的愧疚。
以上獎(jiǎng)勵(lì)原則,只有在平時(shí)訓(xùn)練中多加注意,嚴(yán)格遵守,融會(huì)貫通,才能取得意外的訓(xùn)練效果。
(作者單位:潘金磊,新疆伊犁州新源縣公安局刑警大隊(duì),835800;葉爾德尼,新疆塔城地區(qū)烏蘇市公安局刑警大隊(duì),833000)
(編輯:顏 勤)