首页 > 分享 > 【正增强的技巧

【正增强的技巧

欢迎各位一起学习科学训犬和正向训练,以下内容均由个人整理,希望各位点赞收藏支持---花生爸

【腾讯文档】正向训练入门手册V1.1

https://docs.qq.com/doc/DWlZ4blBBZnBjWVJw

↑↑ 更多内容及后续更新都会在这里 ↑↑ 行为问题在这里都有答案 ↑↑

本篇关键词:经典条件作用、普雷马克原则、 变化性增强法 、增强率、泛化、成对讯号、限定反应时间、诱导式训练

八个常犯的训犬错误

(8 Common Dog Training Errors: Cautionary Tales)

原文出处:http://eileenanddogs.com/2013/09/17/8-dog-training-errors/

作者:美国训练爱好者Eileen Anderson写于2013/9/17

译者:黄薇菁(Vicki)

译文出处:动物的事‧响片训练随意窝部落格

译注:部分照片影片连结和相关说明已省略

 训练大师鲍伯‧贝利(Bob Bailey)说过:「训练很简单,但不容易。」原则非常简单明了,可是实际应用时可能非常困难。

 我提过很多次,我并非专业训练师,不过我和一些杰出训练师一块儿混,此外我信奉终生学习,经常观察我自己和别人,如果对别人有帮助,我也不在乎分享我犯过的错。

 以下是训犬时最不该犯下的错,我全犯过,而且还有录像存证!(而且你知道吗?我还另有15-20个错,如果大家有兴趣我再多写几篇)

 顺带一提,犯下这些错的训练者都是会尽可能学习并使用最人道训练法的人,如果是使用重度厌恶刺激的训练者,他们犯下的错可能与这八个非常不同,我现在还不想列下那些。

可能犯什么错呢?

(1) 让狗狗不断演练你正设法去除的行为

 我有位训练师朋友说,这是客户的头号问题,某位客户会说:「我买了一个狗床放在笼里,狗狗拿来啃。我再买一个狗床,它又拿来啃。我又买一个,它还是啃。我已经买了五个狗床,它全啃过了。」

 这只狗啃床的技巧越来越高超,而且找到了一个在笼内消磨时间的法子。

 如果狗狗有问题行为,这是因为那个行为获得了增强(啃咬东西对狗来说很好玩!)我们通常并非故意让它发生(可是增强依然发生),所以我们通常不觉得它算数,可是这如同每次狗狗啃了狗床、跳上沙发或做了某事,我们就给它饼干吃是一样的道理。

 如果我们想要教导狗狗去做件不同的事,我们同时需要避免它们演练好玩的「错误」行为,要阻止这个增强机会。

 例如,你想训练狗狗不要挤在后门边,一开门它就往前冲,如果它每次这么做,你就马上放它出门,这类行为就会获得增强。当你开始教导等门礼貌,你无疑要从「简单一点」的门开始练习,先用室内的门做练习,训练出你喜见的行为,用食物增强它。

 可是在此同时,你每次带狗去后院上厕所时,它依然挤到门前,你一开门它就冲门,[得以出门]显然是极强的增强物,而且没有发生任何事情阻止它发生。为了让狗狗在后门出现新行为,你必须避免让狗狗练习旧行为。

 若不使用厌恶刺激可能不容易,但是这可以做得到。我们家有三只狗,等后门的行为依然尚未训练完成,但是旧习偶尔还是会获得增强,而「偶尔」增强即足以维持旧习。

 重演行为及对立的增强物的典型例子是松绳散步。如果你让狗拖着你跑(而且你试图教导松绳散步时使用同一项圈或胸背带),它每次暴冲都能去到它想去的地方,因而获得增强,如同它每次暴冲你就喂予饼干吃一样。这是为何在你想同时教导松绳散步时,训练师总是告诉你不要去遛狗,如果非得遛狗的话,至少换个项圈或胸背带,否则你如同搬石头砸自己的脚。

(2) 要求过多或过高

 意思是你没有把想教导狗狗的行为拆解成足以让狗狗达成的分解动作,例如,你想教狗狗到垫子上趴下,你的狗已开始了解你的讯号。你站在垫子旁给它讯号,狗狗趴下,你站在离垫子六十公分远处给讯号,狗狗走上垫子趴下。你把垫子放在房里角落,和狗狗一起走回房里中央再给讯号,你的狗则说:「呃?」

 如果我们教导行为时采取小小的分解步骤,人犬之间很多误解都可以避免。

(3) 没有概化狗狗的讯号行为

  狗狗有很棒的区辨能力,它们留意到环境中的所有小细节,对它们都有关系。狗狗的概化能力不如我们,而我们很难用我们人类的脑袋理解这一点。

 如果狗狗在坐西朝东的厨房时能了解坐下口令,当它在坐南朝北的前厅里,站在钢琴椅子上时未必了解这口令,而且如果你和它一起躺在地上或倒立时给它口令,它几乎绝对不会知道这是坐下口令;你一直以为它对你的口令有反应,但是其实它的反应是因为它站在坐西朝东的厨房里,而且你有响片和零食,而且你说了一个词(看来说任何词都没差),这些实际上全是狗狗学习到的讯号。

 在这里帮美国训练师苏、艾丝比(Sue Ailsby)的Training Levels训练计划打个广告,它是我所见过把每个步骤都建立概化的最佳计划。

(4) 不知道狗狗依哪个讯号出现反应

 它可能并非我们以为的那个讯号,狗狗通常很留意我们的肢体语言和道具,超乎我们想象;几乎所有饲主都以为狗狗很理解口令,但实际不然。我自己有很多经验,有幸养了两只对口令理解能力或许比一般差的狗狗,即使练习多次,我还在努力教它们区分一些简单的口令,而某些犬种或狗狗似乎很快就能理解。

 要知道你的狗是否真正了解口令,你不只需要练习概化,也要把自己的影响去除掉。我有相当多令我难堪的文章和录像,内容是我试图测试我家狗狗是否了解进笼和上垫子的口令差异,直到我看了影片,我才察觉到自己的身体一直给了它暗示。

(5) 在狗狗过于紧迫时进行训练

 参加过训犬俱乐部的人几乎都曾这么做或看过这种情形,狗狗设法适应着满是人犬的吵杂混乱环境,即使它不害怕陌生人犬,噪音和混乱场面让困难度提升,此时对于你对狗狗的了解、观察它的表现和学习狗狗肢体语言就很重要了。

 虽然有些狗狗紧迫恐惧时仍会对指令出现反应,好的老师会协助你找到方法帮自己的狗在环境里感到更自在,然后才开始教导行为。多数人会同意,比起学习听令坐下,让狗狗学习如何在困难环境中感到自在更是重要的一课,而且这么做真的有长远的好处。

(6) 没有意识到狗狗的反应

 这比第(5)更普遍,一旦你开始学习犬类肢体语言,观看自己的训练录像可能会令你大感吃惊,你可能发现自己拨弄狗狗毛发时让它紧张起来,或者在你伸出手去摸它头时,它会出现很大的闪躲动作;你可能发现自己的身体朝着狗狗脸部倾得太过了;你可能发现,自己在教导狗狗学习放松保持某行为不变时,没有意识到自己做了令它嗨起来的动作;或者像我一样,你可能学习到狗狗对于声响的敏感度大大超乎预期。

(7) 太早使用口令

 我的意思是,我们都会想要一开始就喊口令,但这正是不该做的事!

 对我们人类而言,假设狗狗了解我们人类的语言或「应该」了解,似乎几乎是我们的本能。如果你来自下了坐下口令就压狗狗屁股的世代,你很难想象有别的法子。

 不过请记得,「坐下」口令是个讯号,它如同绿灯,意谓「如果你现在坐下就会有增强物」,不过把讯号和行为链接起来是日后的步骤,不是第一步骤。

 一直喊着坐下坐下坐下没法告诉你的狗要做什么事,而且压下狗狗屁股的作法告诉它:坐下口令代表的第一件事就是,「马麻即将压下我的屁股。」  

 依美国训练师苏‧艾丝比(Sue Ailsby)的说法,我们要告诉狗狗的是:「你在做的这件事,我们要把它叫做『坐下』,好吗?」 

 第一步骤是让狗狗经常出现坐下动作,你可诱导、捕捉或塑形,不过你最好把嘴闭上,不要喊口令。有些人说,在你愿意以一百美元下赌狗狗将会出现坐下行为之前,你就不应该使用口令。

(8) 增强率过低

 增强率代表单位时间(例如每分钟)提供的增强物数量。

 当你教导狗狗新行为,尤其它若才刚学习训练的话,最好把增强率设得很高,如果狗狗知道你有零食,也知道你正与它玩训练,可是它却找不到游戏规则,这会让它挫折、丧失兴趣或甚至晃走离开。身为训练者,我们的工作是安排教导方式,让学生有很高的成功率,因而有很高的增强率。

 在这段影片中有我训练家中三只狗的片段,最高增强率出现于Zani的第一回训练: 43秒内12个零食,约每3.5秒就有一个零食,或每分钟17个零食,其他回合的训练约每5秒1个零食,或约每分钟12个零食。许多行为刻意要求狗狗稍微持久动作一点点,所以这个增强率还不错。

古典制约:顺序弄错的灾难

(T What Not to Pair: The Consequence of Mixing Consequences)

作者:美国训练师暨应用行为专家卡西.史黛欧(Kathy Sdao)

原文出处: http://www.kathysdao.com/articles/what-not-to-pair/

译者:黄薇菁(Vicki)

译文出处:动物的事‧响片训练随意窝部落格

 我很荣幸从2003年起便担任凯伦布莱尔ClickerExpo响片研习会上的讲师,我们至今已举行过26次研习会,每场会上有几百位饲主和狗狗齐聚一堂,参与三天的演讲和工作坊,主题遍及响片训练的各种层面。会上也包含一小时的座谈会,席间有六位讲师回答与会人士的问题。有一年座谈会上有个有趣的提问,:「有没有什么训练错误是无可补救的?」换言之,做响片训练时,有没有什么时候你会不小心对动物未来的学习能力造成永久伤害?

 我们首先的响应是,使用严苛处罚当然有可能造成长期恐惧和学习障碍,在此声明后,我的同侪主要回答:响片训练相当能够补救,几乎可以用响片解决任何问题。

 但是我不同意这一点。我越来越意识到某个训练错误,我相信它可能会严重破坏动物的学习能力及对训练者的信任,在你改变处罚物或增强物的情绪意义时会犯下这个错误,训练者通常不自觉发生什么事。导致处罚物或增强物改变情绪价值的学习过程即古典制约。

 古典制约是动物学习到环境刺激具有预测关连性的过程。我们都记得一百年前苏联的巴法洛夫教会狗狗听到铃声就流口水,做法是重复把铃声和狗狗进食关连起来。古典制约要能够作用,铃声(制约刺激CS)必须发生在喂狗吃东西(未制约刺激US)之前,换言之,这两个刺激必须依顺序发生: CS之后是US,否则CS没有对动物产生任何预测性(期望性)的意义,因此若要发生古典制约,US不能在CS之前,也不能让两者同时发生。

 另一个古典制约的必要原则是,US的情绪价值会倒回去「影响」CS,意即在多次「CS再出现US」的配对之后,动物对US的视觉、嗅觉或触觉所产生的情绪,在它见到CS时将反射地感受到相同情绪。制约刺激将承接到未制约刺激的情绪价值,[注:有时动物对CS的生理反应不同于对US的反应,例如老鼠对电击的反应是突然间增加活动,但是它对于预告电击即将到来的声响,反应却是大幅减少活动。更多例子请见文献报告:Rescorla, R. (1988) Pavlovian Conditioning: It’s Not What You Think It Is. American Psychologist, 43, 151-160]

 动物训练者可透过各式不同的有用方式利用古典制约的威力,此即创造出各种制约增强物(次级增强物)的过程,包括响片声[注:古典制约的原则是响片声出现后,稍候一下便给赏,如果两者同时出现,即使动物看到的给赏只是训练者伸手去拿食物的动作,动物也不会把响片视为增强物。因此,响片声应该要在训练者对于食物或玩具奬赏有任何手部、眼部或身体动作之前出现才行]。古典制约可对动物感受到的环境景象或声响产生「制约情绪反应」(conditioned emotional responses),可能是愉悦或恐惧。它也让训练者能够依据简单原则即可成功把旧的行为讯号转移给新的讯号。

 但是古典制约在训练时还有一个偷偷作用的方式,我们很容易忽视这一点。古典制约可以改变动物对于增强物或处罚物的观感,原本应具有增强性或处罚性的后果经过学习而改变了情绪价值,这种改变可能普遍持久。

 莫瑞‧西德门博士(Murray Sidman)的革命性著作《Coercion and Its Fallout》(暂译:胁迫与附带作用)里,他清楚说明这个概念。为了证实这个原则,西德门博士以关在操作制约箱里的老鼠为例,他描述可以有效使电击转变成正增强物的简单步骤,甚至可以用来训练老鼠出现全新行为。实验人员可利用古典制约使电击和食物产生关连性(例如老鼠接受电击后马上获得食物),虽然我们的常识是电击对于动物一直具处罚作用,但是这么做的训练结果是,产生疼痛的电击刺激真的变成老鼠的增强物,会让它想要积极获取。(pp. 74-75)。

 以下段落摘录自另一本书,法兰克‧洛根(Frank A Logan)撰写的旧教科书《Fundamentals of Learning and Motivation》(暂译:学习与动机的基本原则,1970, Dubuque Iowa: Wm. C. Brown)。

 「要说明建立期待反应的原则有何重要性可以利用制约刺激和未制约刺激,两者中一个具有正向情绪反应(例如食物),另一则具有负向情绪反应(例如电击),我们来看看变化两者出现顺序会发生什么事。

 首先设想有个环境里,一个生物偶尔会被电击,这预告它接下来可以去食槽获取食物,依此顺序,电击是制约刺激,食物是未制约刺激,后者产生的正向情绪反应变得制约于前者,除非是强烈电击,否则电击会丧失它令人不快的特质。这个生物会冷静接受电击并且迫不及待地奔向食物。或许它会觉得以声响或亮光预告食物到来会更好,但它在这样的环境里活得相当满意。

 现在我们把顺序倒过来,以一秒作间隔。如果之前电击后隔半秒出现食物,现在我们把环境安排成食物可自由获取,但是这个生物吃下一口食物后,隔半秒就遭受电击,以此顺序,电击产生的负向情绪反应会被制约在食物上头,生物便不太会进食了。它生活在冲突的状态里,表现出不当行为,事实上它过着悲惨的生活。

 远观起来,这两种环境一模一样:都可以获得相同份量的食物和一样的电击次数,但是生物对不同环境显然有不同反应:第二个发生的事件成为这个情况的主导,因为第二个事件的情绪反应被制约到第一个刺激上,改变了它的情绪价值,电击可能变得令人愉悦,食物也可能变得令人厌恶。(pp 55-56)」 

 我们作为动物训练者必须理解,这两种学习过程(处罚物变成增强物,或增强物变成处罚物)蛮常发生而我们不自觉,这才是真正危险的地方:我们的狗狗学习到猛扯牵绳、训斥或其他厌恶刺激其实是增强物,而食物、玩具、拍抚和称赞其实是处罚物,这常破坏我们训练新行为的能力,导致训练者挫折,让狗狗感到混淆。

 以下是训犬时发展出这类问题的常见例子:假设你因为幼犬啃咬餐桌桌脚而对它大骂,当它一不咬你就称赞它,也许还赏它一块零食,有些训练师称此为「双面人做法」或「恩威并重的做法」,意思是狗狗不乖时你会相当严厉,但是只要它一出现较喜见的行为,你就应该从大骂或猛扯牵绳转为柔声甜笑还喂它吃东西。无论这个方法对于减少啃咬桌脚的行为是否有效,它所改变的是更重要的事。

 它把训斥(或打狗或猛抽牵绳)转变成制约增强物,这代表随着时间累积,这个行为后果对于压抑行为的效果越来越差,由于你不理解为何如此,你很可能认为你必须提高责骂(或打狗或猛扯牵绳)的强度,但是如果你持续在每次提高厌恶刺激强度之后就提供正增强物,即使强烈的厌恶刺激也将失去处罚(减少前一行为强度)的能力。西德门博士陈述,即使电击(透过操作制约箱的地板传导)的强度足以让老鼠电得跳起来,它也可能变成正增强物,可用作使老鼠学习新行为的动机。

 对于响片训练者和所有正增强训练者,了解这一点为何重要?

 我们不是会尽可能避免使用处罚吗?是的,当然,但是我相信也有必要保留符合人道的轻度处罚物,用它的效力来抑制行为。如此一来,如果偶而决定在训练时使用轻度处罚物(例如在狗狗前脚离地,企图搭上厨房流理台吃咬块烤鸡时出声:「嗯-嗯!」),它就会有预期效果。最糟的情况是,我们决定在悉心策画的训练里偶而使用某个处罚物,但是发现它不但没有压制不喜见行为,事实上还增加了它的频率!只有明智的训练者才明白,这时对狗骂得更大声无法解决问题。

 要避免这种破坏性的结果,原则很简单:在处罚之后,不要和狗狗(马儿或甚至你的孩子)互动一段时间,可能的话,有三十秒时间不与狗狗进行任何沟通,或者至少十秒,如果只能做到这么久,在这段短暂时间里与狗狗「断线」(就心理层面,非指身体,所以别把牵绳放了!)你要确保,施予处罚后没有任何可能反制约处罚成效的事。给予处罚物后,避免对狗狗出现任何「关爱再现」。我们当然希望正增强狗狗的任何喜见行为,但是不会在处罚后的空白断线期间这么做。

 那么你是否可以利用这个过程刻意化解可能的处罚物呢?是的,我可以想到几个例子。也许某位家人会对狗大骂,你想利用古典制约教导狗狗当它被人骂(或有人拉它的毛或抓它的项圈)其实是件好事,也就是说这件事预测美味食物的到来/好玩的拔河游戏/在院子嬉闹。或者另一个我有许多客户遇到的状况是,他们在带狗散步时若感到焦虑就会拉紧牵绳,狗狗通常会把拉紧的牵绳解读为不自在又有压力,但是在家里,我给的练习作业是,让客户利用古典制约说服狗狗,拉紧的牵绳预测好事即将发生,在多次「牵绳拉紧(制约刺激)然后就有肝零食(未制约刺激)」的连结之后,狗狗对于牵绳拉紧就会出现如同看到肝零食的情绪反应(依比耶!!!)。

 那要是发生像罗根博士说的,食物变得令人厌恶的第二种可能性呢?这对正增强训练师是个大问题,我挺常看到这情况。最常见的是训练者拿出食物诱饵给狗看,然后立即出现某件发生疼痛、惹人厌或吓人的事,重复发生「食物出现然后马上出现厌恶刺激」多次后,狗狗学习到不信任食物,甚至回避食物,这是许多个案饲主说:「可是我的狗对食物缺乏动机。」的真正理由。

 以下是一些情况,显示意外的古典制约可能造成某种程度的食物回避现象:

。上敏捷课时使用切块牛排诱导犹豫害怕的狗狗走上翘翘板(切块牛排出现,接着是动来动去的可怕翘翘板)

。在冰箱门涂花生酱让狗狗舔,同时你把它打结的毛梳开(花生酱出现,接着是梳毛太过用力或过久,即便轻轻梳毛一下下可能没事)

。给家中焦虑的狗狗一个塞了干酪和饼干的kong玩具,然后马上出门上班(干酪和饼干出现后,接着是极度痛苦的分离。对于还没有先在无压力情况学习过把玩kong玩具的狗狗来说,这个做法的问题尤其大)

。你注意到对街有狗接近就马上喂你家会攻击其他狗的狗狗吃鸡肉,它吃了一些鸡肉之后才注意有狗接近(鸡肉出现后,接着出现「威胁性」犬只。较佳的技巧会是在狗狗注意到其他狗之后再喂它鸡肉)

。发狗饼干给陌生人,让他们喂自己的害羞幼犬(狗饼干出现后,接着与可怕的人有太多近距离互动)

。让食物产生不当连结的情形里,较不普遍的两个是,训练者一直试图喂食已吃饱的狗(也许在训练课结束前),或在紧迫情境(例如在兽医院里)里企图强迫喂食。

 以同样的做法甚至可能一不小心使响片声产生不良连结,这是为何我在处理恐惧犬时使用响片会特别谨慎,虽然响片训练是协助狗狗克服恐惧的理想做法,重要的是响片之后不会发生令狗狗害怕或无法面对的事件。传奇训练大师罗伯‧贝利(Bob Bailey)说过:「你的响片是一辈子的。」所以我们必须小心让它保持清楚明确的正向意义。 

 我训练任何动物时非常重要的是,对于我可能决定使用的任何人道处罚物,我会保留它的负向情绪效用;至于我所有的未制约增强物(例如食物、玩具、游戏、散步或抚摸)和制约增强物(例如响片声、「对!」或称赞),我会保留它们的正向情绪效用。即使训练技巧再纯熟和行为调整计划再有创意,都无法补偿没有清楚区分增强物和处罚物的错误。

训练概念篇:爱碰运气的狗儿

引用或转贴请注明译文出处,请尊重著作权。

爱碰运气的狗儿

(Your Gambling Dog)

原文出处:http://dogcentral.msn.com/article.aspx?cp-documentid=2588025

作者:训练师卡西.史黛欧(Kathy Sdao)写于2007年1月22日

作者简介请见响片训练,或只是拿着响片作训练?

译者:黄薇菁

译文出处:动物的事奇摩部落格

  花点儿时间想想,你这辈子看过训练最棒的动物是什么?它可能是海洋世界跳水表演的海豚、园游会上弹钢琴的鸡或带领主人穿越忙碌街口的导盲犬,它们高度复杂精确的行为表现让我们叹为观止,也让我们把家中宠物犬拿来比较,为什么小黄不能如此专注、乐于表现并认真工作呢?

  与其怪罪你家狗儿有遗传缺陷或个性懒惰,考虑一下利用专业训练师获得这些惊人成效的技巧,其中一项最必要的工具是「变化性增强法」(variable reinforcement),意思是动物听令出现正确行为时,它获得的增强物将时时变化,它的种类、数量或给予方式每次都可能不同。以刮刮乐为例,结果可能什么都没有,免费再刮一张,或者中了终生月领现金的大奬,刮奬者的「正确」行为维持不变──买张刮刮乐来刮,但是每次结果不尽相同。

  以这种无可预测的奖励方式交换投资代价相当低的行为可能建立起持之以恒的习惯,这是赌博使人沈迷的原因,下一张彩卷、下一次拉把或转下一次轮盘可能就是得大奬的机会,超大回馈虽很罕见,但有可能,而小小回馈也会不时出现,以维持人们保持兴趣,锲而不舍。

  你可利用变化性增强法使你家狗儿变得乐于训练,首先,列出你家狗儿能听令(依口令或手势)进行的熟知行为,可能包括坐下、趴下、过来、等待、吠叫、转圈、甩动身体、乞求或随侧走。

  如果你的狗只是偶而对某个指令有反应(例如不到一半成功率),或没法做出完整动作,这些行为还不能施行变化性增强,它们需要加强基本训练,利用的是持续性增强法,意思是每次正确反应出现一定会有相同奖励,这种增强物可以是一点食物、一场游戏、拍抚、称赞或任何狗儿喜欢的事物。

  当狗儿有了一些相当熟知的行为,你便应该想想如何变化增强方式,以下是一些例子:

奖励的种类:

食物:干饲料、巿售狗零食、肉块、热狗、花生酱、管状干酪、猫食。

游戏:丢球、拔河、追逐训练者、新的怪声玩具、和别只狗玩、游泳。

其他:称赞、拍抚、训练者帮狗儿搔痒、闻闻动物便便的机会、出现喜爱行为的机会。

奖励的量:

.少至几近微量(只是一丁点食物或玩耍几秒钟),多至极多(一餐的量、整块汉堡或玩五分钟拔河)。

如何给予奖励:

.作法:手喂、丢到地上、掷入空中或置入中空玩具里。

.频率:依狗儿出现行为的次数,变化性地给予奖励(例如平均起来,只在第三次正确坐下后才给赏),或依上次给赏后所经过的时间给奖励(例如,平均每隔三秒钟,狗儿趴着的行为将获奖励)。

  结合这些和其他作法,随你创意发明,为你的狗儿设计出至少十种增强物的选择。

  现在你可开始在训练中增加一些变化,逐渐使奖励狗儿熟知行为的方式变得意外又随机,目标是要变得无可预测,当狗儿做到要求的行为时,它应该无法预测奖励,当然,你也不应该在它出现行为之前就亮出奖励给它看,例如,不要先在空中挥挥热狗,然后再叫它来,这是贿赂,效用恰恰适得其反,造就一只看到眼前奖励才会听话的狗,它也违背了无可预测的目标。

  维持无法预测的奖励时制需要花点功夫,但是优秀训练师知道这点儿投资回收可大了,它使你去除必须时常给予的食物奖励,它也培养出一只「爱碰运气」的狗儿──即使狗儿看不到立即好处,它也将持续热切地出现行为,因为它相信,只要再听话「坐下」一次,这次或许就可以享受中头彩的快感。

如何激励自己训练狗儿或带它运动──或做任何事!

(How to Motivate Yourself to Train or Exercise Your Dog—Or Do Practically Anything Else!)

原文出处:http://clickertraining.com/node/1340

作者:Aidan Bindoff,写于09/01/2007

Positive Petzine在线宠物杂志编辑

译者:黄薇菁(Vicki)

译文出处:动物的事‧响片训练 奇摩部落格

  如果你没有每天带狗散步、太少训练它,甚至当它迫切需要训练但你却没做,你因此感到歉疚吗?

  冬天是否让你提不起劲,很难踏出家门吹寒风?或者炎夏令你懒洋洋不想动?(你一年到头都找得出借口吧?)

  自我激励其实非常容易,我们只需要运用我们的训犬知识来训练自己就好了!

从小地方开始,不要一下子要求过高!

  训犬术语里,「lumper」(要求过多的人)要求狗儿一次就达到很高标准或学习过多东西,无法把一项行为拆解成狗儿有能力做到的阶段动作。

  相反地,「splitter」(从细项做起的人)把每项行为拆解成多个适当的分解动作──这非依个人意见,而是依狗儿是否能够成功达成每项分解动作而定,然后再一项一项地训练进阶分解动作,直到狗儿学会完整行为。如中国谚语所言:千里之行,始于足下。

  即使外头真的冷得要命,带狗出去散步之类的简单行为应该仍做得到吧?那么,阻碍我们去做的理由是什么呢?

  或许,认为它很简单的想法蒙蔽了我们双眼,其实这件事有其困难?是不是因为我们明知自己应该去做这件事,可是当下有另一件更具增强的事呢?

  我们有时无法理解,即使极其简单的事也可拆解成更简单的分解动作,心理博士及说服专家凯文.荷根(Kevin Hogan)有篇文章建议:与其设法激励自己跑步,不如只把穿上跑步鞋设定为目标,如果我们只专注于从沙发起身、穿上跑步鞋的行为,这会如何呢?

  假如我们一心只想着下一步训练爱犬做什么又会如何?接下来,只想着去拿个响片的简单动作,再来就想着拿些零食或球‧‧‧

  看到发生什么事了吗?想一想,生活里还有哪些地方可以运用拆解动作的概念。

增强自己的行为

  「增强」这件事其实得视后果而定,如果某件事没有增加或维持行为,它就不能被称为增强物。

  找出训练自己的增强物需要你去观察测量自己的行为,你可能会想在墙上挂个月历,记下哪天带狗散步,走了多久,这个习惯不但有助测量自己的行为,你也可能觉得这些记录具有增强作用。

  有些人可能觉得经常和狗儿一块儿运动或进行有趣活动具有增强作用;对许多人而言,得知爱犬可以更快乐、更健康或更乖就足以增强他们。

  假如知道这一点还不够,你必须让自己的行为和实际成果产生联结──注意到爱犬有多开心?注意它散步后有多放松?注意到它可以耐心等在门口,或者召回的反应变快?用眼睛观察,并且告诉自己这个好的改变与你自己的行为有关,恭喜你自己吧!

遵守「普雷马克原则」(Premack Principle)

  在这个「想怎样就怎样」的时代,不常有人用到「阿嬷家规」(例如:打扫房间后才能出去玩)。

  你注意到自己晚上一旦坐下放松之后就不太想动吗?放松是很重要的,特别在睡前尤然,不过如果你想在晚上带狗散步或作训练,在你放松之前就要先这么做,否则你大概不太可能会去做。

  把坐下来放松作为带狗运动或训练后的奬励,这不但意谓你将更常与狗一起运动及训练,狗儿也将更容易与你一起安静放松。

译注:

简而言之,「普雷马克原则」的意思是,利用动物较喜爱的行为增强较不喜爱的行为。

进阶技巧:限定反应时间

引用或转贴请注明译文出处,请尊重著作权。

限定反应时间

(The Limited Hold)

原文出处:http://clickertraining.com/node/724

作者:凯伦.布莱尔,《别毙了那只狗》作者

译者:黄薇菁(Vicki)

译文出处:动物的事奇摩部落格

  『限定反应时间』是科学专有名词(其实它是实验室惯用语),是利用标定讯号和增强物加速动物对讯号出现反应的好方法。

  我们对慢条斯理的反应都习以为常。你叫大家吃晚饭,大家等会儿迟早会来吃,只不过届时舒芙蕾甜点已经塌了不好看或汤也凉了;你请同学安静,有些人坐下来不出声,但是等到全部人都静下来总是得花些时间;你叫爱犬进屋去,它心不甘情不愿地走过来,沿途探索了五、六样新事物才终于来到了门口。

  假设你遇上其中一项行为,你给了讯号,对方也出现反应,只是他拖拖拉拉地才出现反应,如今你想改掉这一点──首先练习个几次,看看延迟的时间平均起来有多久,你可以自己默数秒数或利用秒表。

  现在,你给予讯号,留意时间,然后只增强发生于平均延迟时间之内的反应,如果对方超过时间才予以反应,你便结束这次练习(以狗儿而言很简单,只要移到另一地点即可),然后重给讯号,开始倒数计时。

  我在《别毙了那只狗!》书中述及一个和限定反应时间有关的故事,六○年代我们在海洋生物世界最有效利用这个技巧的表演之一乃由六只小型飞旋海豚担纲,依水底声响讯号出现各式跳跃旋转的花式动作,最壮观的表演就是它们因而得名的空中跳旋。

  起初,讯号出现后海豚的跳旋动作此起彼落,六只共花了15秒才完成。我们利用秒表,开始只让讯号出现12秒,而且只标定及增强在这段时间内出现的跳旋动作;在多数海豚能够在12秒内完成之后,我们再缩短限定反应时间到10秒,然后5秒,最后缩短成2.5秒,再短已不可能,因为海豚必须先潜下水底才能获得足以冲出水面跳旋的游速。即使如此,每只海豚都学到,要想吃鱼就得在讯号出现后2.5秒内做出空中旋跳的动作。

  成果是,海豚在水底扩音器旁专心一意地蓄势待发,当讯号一出,水池中即爆冲出在空中飞旋的海豚,场面相当壮观,我有天坐在观众席里不小心听到很好笑的一段话,一位看来像是教授的人士斩钉截铁地告知同行友人,要获得这种训练反应唯有利用电击。

  在实验室里,训练对象对讯号的反应时间称为『延迟时间』(latency),拖了很久是『延迟时间很长』,反应迅速表示『延迟时间很短』。有时你不必费心测量时间即能塑形出延迟时间很短的反应,作法是很快地连续多次要求反应,但只增强较快出现的反应。

  例如,我为了示范延迟时间的变化,有时会找只坐下动作缓慢的狗儿──它会依讯号出现反应,只是延迟时间很长。我叫它名字,并且后退 一两 步(目的要引它往前移动),当它过来时就按响片给赏,重复 一两 次;当狗儿很有意愿跟着我时,我后退并说「坐下!」,停步,当它后脚开始稍微弯曲一点儿就按下响片给赏;再次叫它,很快后退并说「坐下!」,当它一出现坐下的动作就按下响片,但并不等到它完成坐下的动作;然后,我进阶到后退时说「坐下!」,在它屁股贴地时才按下响片;接下来,我只在它听见口令便立刻坐下时才按下响片,如果它有点迟疑,我再度后退,叫它,再说一次口令。约二十次按响片给赏(约30秒)之后,限定反应时间已近乎零,狗儿的坐下动作快得如同犬赛冠军;然后,你便可以改变下口令时脸部的朝向,或到另一房间练习,或改天练,最后到户外去练,于是乎你可以训练出在各种状况之下都快速反应的行为。当然,为了这个调整反应速度的目的,你也必须去除自己增强迟缓反应的习惯。

  「过来」这个行为通常带点儿懒散,只用眼睛可能很难判断孰快孰慢,此时限定反应时间这个按规则走的训练技巧便可能很有用。把限定反应时间视为要求一项训练的标准,如同跳栏高度、坐着的时间或推的力道,你可以在某种情境训练它,然后将同一标准引申到其他时间或其他地点运用,以召狗回屋里但它却沿途闻遍每一块砖每一寸草的情况为例,你可能得先在屋内训练出反应时间很短的召回行为,然后逐渐要求它在其他状况之下也迅速反应。

  家中的长走道最适合作此练习,在走道两端用粉笔划上一条线,自己站在一端的线后,请人帮忙把狗儿叫到另一端或牵过去,或者请人拉住它,给你时间走到另一端线后。头几次练习时距离短短就好(约 两公尺 左右),狗一跑到粉笔线处就按下响片,赏给它超爱的零食。

  现在,把距离拉长到整个走道,怎么判断哪次跑得较快呢?我们多数人可以用相当稳定的速度背英文字母,你可以用它作评估。你说「过来!」,当狗儿冲向你时就开始背英文字母a-b-c-d-e-f-g-h-i-j-k-l,直到它越过粉笔线,这时就按响片给赏;下次如果你背到h或j它就到了,不用等到k,你便知道它快了一点点,当然,如果它变慢了你也会知道。

  要点并不是处罚它较慢的召回反应,而是奖励较快的召回反应;你必须把每次的要求放得够宽,使多数的召回反应都符合要求,这个过程本身可能即具有加速狗儿反应的作用。

  当它开始加快速度时,你可以加入限定反应时间的要求:选择一个英文字母作为你的容许标准,如果它在标准内赶不到你身旁,就让它调头,自另一端召回。我曾见过世界级动作慢的纽芬兰犬,第一次召回时慢吞吞地,要念到l-m-n-o-p才到达,后来它对过来的讯号出现了小跑步的不错反应,到我身旁时只念到b-c-d,约按了15次响片给赏即达到此程度。

  噢,这对人类当然也有效。举例来说,当我对一群新的听众演讲时,起初我把手举起来作为安静的手势,通常大家会继续聊他们的天,然后我会走下讲台,四处走动约30秒,看到任何没讲话的人就按下响片,递出巧克力;下次我再请大家安静时(通常是结束中场休息即将开始时),我站着不动看表,等多数人停止说话时,我在麦克风前按下响片,说:「很好!」,然后开始讲话。

  到了第三次时,我一站上讲台举起手来,除了零星出现 一两 声偷笑(「她在训练我们啦!」)以外,大家马上安静了下来,我建立了一个举手的讯号,而且也塑形出反应时间很短的不错反应。

  如训练大师鲍伯和玛莉安‧贝利夫妇所言,延迟时间的行为具有传染性。如果你谨慎小心地选择增强几个主要行为的迅速反应──只奖励反应时间很短的反应,您的训练对象对讯号的整体反应通常较为迅速,这造就出看来聪敏的训练对象!相反地,如果你普遍来说会接受任何达成反应的行为,即使对方(狗儿、小孩、青少年或配偶)花了很久很久的时间才达成,那么你通常会得到很长的反应时间,要等待许久。我个人体验到的一个例子是骑乘观光牧场马匹和工作马匹(驱赶牛羊用)的不同:观光马匹在你踢了几下之后开始慢慢走,必须再多踢几次并且赶它才跑得起来,而且控制它的走向不太容易,要它停下来反应也不快,它会从快步跑渐变成慢步跑,最后才又变成慢慢走。相反地,工作马匹随令随动,随即移动或改变速度方向,而且稍微给点讯号就做得到,骑来真是乐趣!它们的反应时间短到让你觉得彷佛它们能够心电感应到你脑中的想法。

  如果你想要训练对象出现这种反应的话,你只要看重迅速的讯号反应并予以增强,但不增强缓慢的反应,而当反应速度不易测量时,就把「限定反应时间」这项有用的训练技巧拿来用吧!

概念篇-教导不受控制的狗狗学习

──来自凯伦‧布莱尔的佳节献礼

原文出处: http://clickertraining.com/node/1604

作者:凯伦.布莱尔写于12/12/2007

《别毙了那只狗》作者

译者:黄薇菁(Vicki)

译文出处:『动物的事‧响片训练』奇摩部落格

 我的新书《Reaching the Animal Mind》(暂译:进入动物心灵)将在2008年秋出版,以下内容从新书摘录,作为送给各位的耶誔献礼。

====================

抓准时间点真的很重要──尤其当你上电视的时候!

 狗儿从习惯性反应转为专注出现操作制约行为的迅速改变持续使我惊叹,彷佛你给了它们一个新工具箱之后,它们随即把旧的抛出窗外。出现这种转变有两个关键:很多小小美味的初级增强物,以及把按响片给赏的频率保持很高,每分钟数次。

 我第一次真正使用这种高频率增强时制是在上电视的时候,那次在一场芝加哥的科学会议上,知名广播电视名人史提夫‧戴尔邀请我在他的午间新闻每周宠物专题示范一点儿响片训练,在五至十分钟的电视报导里做什么才能让人一目了然呢?我请他安排从收容所里找来一只友善、不受控制且不足两岁的大型犬(收容所有很多这种狗,它们还是小小幼犬时很惹人怜爱,跳到人们大腿上乱舔人脸一通,这种行为不但被人允许而且完全受到增强,但是当它们体重有36公斤且撞倒老年人时就不那么可爱了,的确,史提夫毫无困难地找到示范犬。)。

 我带着响片和半磅切丁的烤鸡到了摄影棚,那只狗是一只尾巴直摇、胡乱跳扑舔脸的大型混种拉不拉多犬,绝佳的示范犬!摄影机启动了,那只狗拖着收容所志工来到录像台上,直直朝着我和我的鸡肉冲过来,我按下响片,给赏!当它吃下鸡肉时,它站着不动了一会儿,这可能是它一生中第一次吃到如此美味的东西,也可能是它当天第一次站着没动的时刻,我再次按下响片给赏。

 我请收容所志工离开,把牵绳交给史提夫,告诉他:「跟着它,保持牵绳松松的,你只是为了预防它跑离现场的安全措施。」我开始在舞台上缓慢绕圈走,当它扑到我身上,什么都没发生,当它走离我,什么也没发生,不过每当它走近我的左侧,我就会按响片并给它一块鸡肉吃。我继续地走着,它开始越来越跟着我走,我每走两步就按响片给赏,然后每三步一次,很快地,那只狗安静跟在我脚侧走了好几步,它开始盯着我的脸看,我也捕捉这个专注的行为,然后我提高要求,每走八步才按响片,再来是每十步,它依然跟着我的脚步走,后头跟着面带微笑的史提夫,他一直依我的要求保持牵绳的松度。

 如果我现在停下来会如何?它会离开我吗?我赌了一下,停下脚步,那只狗不但停了下来,事实上它还坐了下来,咔啦!大大的奖励。过去有人曾教过它这个行为,现在它不但重新出现,而且还为它带来好处,狗狗你看,你可以让人类做出你要他们做的事,不过要用新的方法,不能用你以往一直尝试的作法。我走到史提夫身旁,为他坐下如何呢?史提夫对着那只狗说话,它没扑上去,反而坐在他面前,耶!我按下响片,由史提夫给奖励。

它是我的同台来宾,也是我的朋友

 在五分钟内,我和这只现在是模范好公民的狗儿一同亦步亦趋地走下台,彷佛我们是多年好友。它仍然需要在不同地点与不同人们练习的经验才能够在牵着走路时持续控制自己,不过它已经进步很多了,它刚才学习了如何学习,变得较为安定,对人们产生了新的兴趣,现在它注视的是人们的脸而不只是手和食物,它被人认养的可能性已经提高,而且也比较不会被退回。

发挥佳节精神

世界各地的响片训练师正不断重复着这个小小的示范,让坐立难安的兴奋狗儿为了获得增强而主动出现一些操作制约行为,比起利用纠正和肢体压制的方法压抑过度兴奋的行为,这种替代方法美好太多了,你何不到附近收容所里自己试试看,散播一些佳节欢乐呢?

视耶诞及佳节愉快!

凯伦‧布莱尔

诱导式训练的潜在问题

(Lure No More! Potential Problems With Lure-reward Training)

作者:美国响片训练师Angelica Steinker

,原文出处:The APDT Chronicle of the Dog, Jul/Aug 2004, Vol. XI. No.4

译者:黄薇菁(Vicki)

译文原出处:动物的事‧响片训练奇摩部落格

译文现出处:动物的事‧响片训练随意窝部落格

诱导奖励式训练近年来变得极为普遍,然而很少人注意到它可能带来的潜在问题,以下是一些如何避免问题并且增进训练的方法:

 诱导由训练者利用食物或玩具引导出喜见的行为,例如教导狗儿坐下时把零食放在它鼻头再往它头上方移动就是诱导,训练者利用奖励促成想见到的坐下行为。

潜在问题

问题:依赖食物

 使用诱导式训练时,有些狗在没有看到食物出现之下不会依讯号出现行为。此时,诱导制造出对于奖励的预期,而非获得奖励的希望,预期食物的心理破坏了狗儿对于获赏的希望,然而训练游戏的一大乐趣就是这个希望。

 解决办法:避免以手中食物诱导,利用手目标或其他方法获得行为,尽快去除手中的食物,狗儿才不会预测到你的下个动作。作一些变化,有时手中拿着食物但不喂给它,有时让它看不见食物的存在,等到按了响片之后再意外出现食物。

问题:遮蔽效应(overshadowing,译注:目前没有统一中译名词,暂译为遮蔽效应)

 对有些狗而言,食物的威力强大,以致阻碍了它的学习,它没有处于操作制约之下,于是无法学习。对食物动机极强的狗无法在食物诱导之下进行学习,因为食物喧宾夺主。

 解决办法:如果有诱导的必要,利用手目标代替,如果没有办法利用手目标,利用较不吸引狗儿的食物作为奖励。

问题:诱导物成了讯号

 利用诱导时,用来诱导的食物或玩具可能变成实际的讯号,于是狗儿只有在食物讯号出现后才会出现行为,训练者手上若没有食物,狗儿将不会行动。

 解决办法:发挥创意取得新行为,利用捕捉法、塑形或其他方法获得行为。塑形是许多有趣的方法之一,它不会很难,一般人都能学会。全美国的响片训练师都作塑形!

问题:诱导可能破坏训练者对狗儿和训练过程的自信心,训练者变得和狗儿一样依赖食物。

 解决办法:使用各式各样的奖励:拍抚、赞美和玩具都是可减少对食物依赖的方式。已建立的行为可以考虑减少给予增强物的次数,使活动本身变得更具增强效果。

问题:淡出食物诱导可能不容易,训练通常不强调淡出诱导的过程,于是淡出后狗儿对于讯号的反应可能不尽理想。

 解决办法:多数训练者有很多如何运用食物诱导的计划,但很少人强调除去诱导物的需要──谨遵『诱不过三』的原则,只诱导三次,然后马上开始淡出诱导物。

问题:只有训练者拿着食物时,狗儿才会专注。

 训练者手拿食物的行为被狗儿专注在训练者身上的行为增强,因此要让训练者不再手拿食物可能是很大的挑战,训练者一旦把食物放下,狗儿的专注可能就会减少,于是训练者对于手不拿食物的作法感到气馁。

 解决办法:手中显然拿着食物时避免教导新行为。使用可轻易藏入手中的小块湿软食物,很快便把在身上的食物转移成放在各处的食物,不要让手中或身上的食物成为是否可获得奖励的唯一预测指标。

问题:食物诱导无法教导狗儿解决问题(它无法变得处于操作制约之下的狗儿)

 诱导无法给予狗儿可能冲突的情境,例如「如果我丢下一块食物,你仍可听话坐下吗?」如果你获得行为时利用诱导而非塑形,你可能发现自己的狗儿对于自由塑形或其他的问题解决技巧较无响应。

 解决办法:只要不用食物或玩具诱导就好了!找到发挥创意的训练方式,避免诱导,鼓励狗儿思考。

额外的提议

。和你家狗儿一起玩──找出对你家狗儿而言最有乐趣的活动,游戏是最强力的增强方式,但最少被人运用,游戏可以随你高兴持续玩到再久都行,但食物只有在狗儿咀嚼的时间里有效果。

。食物对狗儿情绪状态的影响不如游戏──

 游戏是影响情绪最有力的方式,它只能与开心快乐的情绪共存,吃得下东西的狗儿仍然可能感受到紧迫,但是玩游戏的狗儿无法同时感到紧迫。

。利用食物训练时,零食常被直接喂至狗儿口中,最多只有几秒的时间,许多狗儿只是直接吞下,甚至不作任何品尝,游戏的奖励效果则可以随你高兴地想要多久就多久。

。丢掉你的零食袋──它是个巨大讯号,意味好料时间即将开始,而且代表当你没有背着它时即没有食物。

。藏起零食,让它的出现无法预测──在家里和训练场所的不同地点布置好装有零食的容器。

。发展并使用其他形式的奖励,例如赞美、拍抚、游戏和生活奖励

  不是每只狗都喜欢赞美,但如果你家狗很爱就用它吧,把赞美和食物或其他它喜爱的事物配对,教导它喜欢被人赞美。拍拍、搔痒和来回磨抚都可能是强力的奖励物──如果它有用的话就用吧!例如在让狗儿出门前要求行为的生活奖励也是让狗儿不会只专注在食物上的好方法。利用玩具的游戏(例如拾回或拔河)也是可用于奖励的游戏。

 诱导和利用食物的训练虽然很有用,但它们普遍被滥用,使用其他方式(例如塑形法或捕捉法)获得行为可能比较接近理想。

被毒害的讯号:它真的是固执吗?

(Poisoned Cues: The Case of the Stubborn Dog)

原文出处: http://www.clickertraining.com/click/2849/201004

作者:美国KPA训练师Rebecca Lynch写于 04/01/2010

译者:黄薇菁(Vicki)

译文原出处:动物的事‧响片训练奇摩部落格

译文现出处:动物的事‧响片训练随意窝部落格

 我上周抵达客户家时,她兴奋地想让我看看她的狗蜜西对于碰手的表现,梅根一边拿起响片和零食一边说:「你看!」她面前的蜜西全神贯注,梅根给了口头讯号:「去碰!」,把手伸出,蜜西看了她的手一眼,把头压低,坐下来搔痒;梅根又试了一次,蜜西开始嗅闻地面,梅根的表情失去了光彩:「为了给你看,我们整个星期一直练习,蜜西知道去碰手,它为什么这么固执?」

蜜西是固执吗?

 它一直对于参与训练表现出兴奋,直到它听见了讯号。它原本完全专注在梅根身上,热切等候表现的机会,不过当它听见了讯号,它改变了心意。虽然对梅根而言,搔痒和嗅闻看来像是违抗的表现,我知道蜜西其实表现出紧迫的讯号。蜜西对于碰触梅根的手感到担心,它为何担心呢?一星期前,蜜西还会跑去碰房间另一头梅根的手,发生什么事了?

 我决定观看梅根和蜜西的训练,梅根把蜜西召来,叫它坐下,蜜西开心地把屁股放地面上,梅根按下响片,称赞它同时拍一下它的头,然后给了它一块零食,我有了答案,这是个讯号被毒害的例子。

什么是毒害的讯号?

 讯号好比是「绿灯」,告诉狗儿这时出现某个行为,它可以是任何动物感受得到的东西:口头声音、视觉、环境、气味、声响或碰触,讯号可以经训练习得──例如很常见的「坐下」口令──或者可从关连性习得(每当我刮起碗底的冰淇淋时,我的狗把它当成它应该起身,装出可怜饿死鬼表情的讯号,这样我就会让它舔碗。)

 如凯伦‧布莱尔在新书《Reaching the Animal Mind》(探索动物心灵)描述,当狗儿把讯号与感觉不快的事物联想在一起,它即成为毒害的讯号,由于这些不佳联想,狗儿若非在行为前表现犹豫,就是完全不出现行为。我们人类认为「不快」是施以责骂或疼痛(例如猛扯一下环刺项圈),不过我们的认定常与狗儿的认定不同,轻拉牵绳、抓着项圈拖狗、朝着狗儿弯下腰,或者以蜜西为例,拍头一下,全可能令狗儿感觉不佳。

 人们每天都拍爱犬的头,怎么可能感觉不佳?

 看一下四周,你是否独自一人?如果是,或者没人在看你,请你像拍狗狗头一样,在自己眼睛上方的额头拍一下。现在,想象别人来拍你头,这些大大的手指直接朝着你的眼睛过来,而且动来动去!拍头动作本身也令人感觉不佳!如果你每次有好的工作表现,老板就拍一下你的额头如何?你会不会开始避开老板?会不会避免有好的工作表现?会不会避免工作?

 当蜜西发觉主人在它碰手后就会拍它头之后,它决定不去碰手,以免被拍头,它不是固执,它只是不想有人用这种方式碰它,可怜的梅根很爱她的狗,以为自己是在奖励它,这完全是个沟通不良的例子。

 毒害的讯号常见的程度出人意料,它常是狗儿被视为固执的主要原因。一个最常受到毒害的讯号是「来!」,我们经常叫狗来,然后对它们做不好的事:我们叫狗来就帮它洗澡,我们叫狗来就把它关笼,当狗儿正在研究户外各式气味时我们叫狗来,然后要它们回到无聊的屋内。狗儿极为聪明,而且它们的狗生座右铭是:「这对我有何好处?」它们很快学习到「来!」等于不好的事,如果回到主人身旁的奖励比不上外头那些又酷又棒的事,许多狗儿将朝着反方向跑走。

 毒害的讯号可能很微妙,你下坐下口令时是否会轻扯牵绳?你是否曾在对狗生气时叫它名字?我有名客户经常在责骂她家幼犬「 三米 」时叫它名字,她那时还没有学会如何教导替代行为或监督幼犬,是位挫折的幼犬新饲主。我们开始训练时,我希望 三米 学习到当主人叫它名字时就看主人眼睛,起初我们在 三米 自动看主人眼睛时就按下响片给赏, 三米 很喜欢这项训练,很会去看眼睛,接着我们加了讯号:它的名字。 三米 一听到自己的名字就跑去躲在沙发底下,可怜的 三米 每次都以为当它听见自己名字时它就惨了,因为它曾听过很多次:「 三米 ,不可以!」

 当你在找寻训练师,务必在报名前询问他们使用什么训练方法,很多训练师会以正向方法训犬,但是他们觉得狗儿一旦「晓得」该做什么之后,当它不出现行为时是可以处罚它的,不幸的是,以这种方法教出来的讯号将受到毒害,你的狗不只不想对这些讯号出现反应,你们的训练也成为恶性循环──讯号->不出现行为->处罚->讯号->不出现行为->更多处罚。

拿毒害的讯号怎么办?

 现在你一定正检查看看哪里有被毒害的讯号,以下是好消息:要修正毒害的讯号相当容易,你只须重新教导行为,加个新讯号即可。重新教导行为非常重要,因为你没法把毒害的讯号转移到新讯号上。不必担心!你的狗将记得该项行为,所以重新教它可能相当快上手,加上新讯号后,你应该知道把毒害讯号丢掉不用可让你的狗不再担心,要当心不要毒害了新讯号。

 花点时间在不同情境之下观察你的狗,它的肢体语言在放松、和你玩、与他狗玩、对邮差吠叫、在公园散步或被人拍头时是什么样子?在这些互动中,哪些肢体语言告知你它的情绪状态?尾巴翘多高?尾巴摇得快或慢?耳朵呈什么样子?狗儿是否舔舌?打呵欠?

 至于蜜西,梅根重新塑形了碰手的行为,并且教它新讯号「鼻子」,现在梅根不再拍爱犬的头,她们的关系比以前更佳,她已学会观察蜜西的肢体语言,蜜西又能够开心地去碰房间另一头梅根伸出的手了,它也喜欢每一部分的训练。

我不养狗也不养鸡,我为何参加训鸡营?

原文出处: http://verbalbehaviorapproach.blogspot.tw/

作者:Mary Lynch Barbera博士,美国医学学会认证行为分析师,写于2012/6/11

译者:黄薇菁(Vicki)

译文原出处:动物的事‧响片训练奇摩部落格

译文现出处:动物的事‧响片训练随意窝部落格

 我最近到了西雅图,来到美丽华盛顿州期间,我参加了训鸡营。自从我在脸书上放了几张我抱着鸡的照片,一直有人问我一大堆问题。

 本文将回答三个主要问题:什么是训鸡营?我为何参加?我学到了什么?

1. 什么是训鸡营?

 你们许多人知道,我是美国医学学会认证的行为分析师,利用行为科学(即「应用行为分析」[Applied Behavior Analysis,ABA])治疗自闭症儿童,该门科学依据的是 史金纳 博士在三○年代发展出的操作制约理论。

  史金纳 博士和同侪研究动物(主要为大鼠和鸽子),发现行为的基本原则,最重要的是,正增强可提高所有动物(包括人类)的行为发生频率。

 凯伦布莱尔博士自六○年代起开始对动物使用操作制约,并且发展出响片训练,这门技术利用响片声、哨声或铃声标示正确行为,随即提供增强物。

 过去十年间,凯伦布莱尔响片训练公司发展出TAGteach (应用在人类身上的响片训练),它是用来教导儿童或成人学习各式技能的绝佳技术。

 举办训鸡营的讲师泰瑞莱恩(Terry Ryan)是动物训练界里国际知名的师,为期两至四天,可在华盛顿Sequim镇的Legacy Canine训练中心上课,或者她可受邀到世界各地上课,采小班制约20人。

 泰瑞出差时不会带着鸡,所以华盛顿州以外的训鸡营主办单位必须提供上课用鸡只。

 泰瑞一直与凯伦布莱尔密切合作,也经TAGteach认证,第一期训鸡营的内容很基本,有讲课、观看录像及训鸡的实操活动,鸡只养在上课场地里。许多人参加训鸡营是为了改善训练自家狗儿的能力,不过越来越多管理级人士和训人专业人士前来参加,为的是钻研他们的训人技巧。

 我们的两天训鸡营较为进阶,因为所有二十名参加者都是医学学会认证行为分析师(或熟知应用行为分析),所以这个课程依我们的特殊需求调整了内容。

2. 我为何参加?

 如同鸡只,我治疗的许多儿童(包括我15岁自闭症儿子)无法了解复杂的人类语言,自从我在2010年认证成为初级TAGteach讲师,也读过凯伦布莱尔该年出版的新书《探索动物心灵》(暂译,Reaching the Animal Mind),我确信对我而言,要成为一名更好的行为分析师,关键在于学习更多动物训练的知识。

 我没养宠物,所以为了获得一些动物训练的经验,有人引介我去看看泰瑞莱恩的训鸡营。我发现泰瑞的训练中心距离西雅图只有两小时车程,因为极多行为分析师将在2012年5月前往西雅图参加会议,我询问泰瑞是否可以在会前安排两天的进阶训鸡营。

 虽然泰瑞曾经为中情局或船员经理等团体教授过训鸡营,她从未教过一屋子的行为分析师。我不知道这点子是否对其他认证行为分析师很具吸引力,但很高兴报名在三月就额满了。

3. 我学到了什么?

 我的训鸡营经验太赞了!虽然我一开始对于抱着鸡有点紧张,我很快学会所需技巧,在各方面都感到顺利。以下是我在两天训鸡营里学到的重点或更被强化的观念:

 (1) 教导人时,不可在短时间里提供过多信息。

  训鸡时我们每50分钟就休息10分钟,在我们休息前两次时(开始50分钟后休息一次,一小时后又休息一次),我心想这么常休息太过度了,不过到了第一天下午,我变得很感谢这么频繁的休息次数,因为大家可以好好交流,有个轻松的训练环境,也有开心的参加者。

 (2) 增强宁早勿晚

  教导新行为或困难行为时这么做尤其重要,例如,当我们刚开始教导我们的鸡只啄红片,泰瑞指导我们,只要鸡喙朝着红片移动或几乎碰到红片时就按下响片。

 我上周在治疗一名三岁儿童时应用了这作法,我们无法让他坐到教学桌前,所以只要他开始朝着教学桌接近,我就指示治疗师打开iPad上的录像,要是在过去,我可能会等到他在桌前坐好才会增强他,而我们就不可能成功了。

 (3) 不可自以为已经知道什么是使鸡只或儿童出现反应的可能其他变因

   自从我从训鸡营返回,我觉得自己更加意识到要引发目标行为并且实时增强它有多么困难,因为我们永远处于出现变因诸多、无法控制的环境。

 (4) 如果动物突然不出现目标行为,它可能需要休息、可能吃饱了或可能需要下颗蛋。

   身为护士兼行为分析师,我非常明白我们治疗的多数儿童有时除自闭症之外可能有其他生理问题,它可能是个影响因素。

 (5) 短短训练时间是让大家保持警醒的最佳方法

   训鸡营里除了每50分钟让人类休息一次之外,我们也很小心不让鸡只过度训练,每次训练一个目标行为约30-60秒,就把鸡从桌上抓起来,然后才进行下次训练,这么重复进行约只十分钟,然后就让鸡回笼喝水休息。

   需要每30-60秒就休息一次的不只是鸡,训练者也需要时间分析什么做对了,什么做错了,并且需要为下次训练作计划。

 (6) 不可过度引导,以肢体让鸡移动或诱导它完成行为

   例如,要让鸡绕着锥状物一圈,不可拿出食物让鸡追着跑,而是应该增强鸡把头或脚朝着正确方向移的行为,按下响片(代表该行为是对的)再给赏。一般来说,自闭症儿童太常被人引导和诱导了。自从参加过训鸡营,我更加意识到较好的作法是增强塑形的行为。

 (7) 如果鸡只重复出现错误行为,这是因为要求太高或增强率过低。

   如果鸡只/儿童的学习停滞不前,这是因为他们缺乏必须事先具备的技能,或者你还没有找到教导他们所需技能的方法。如果你尚无法获得目标行为,你可以提高增强频率、缩小环境、以更好的方式引导或设法降低要求标准。在鸡只/儿童成功达成后再提高要求。两天训鸡营里极度强调鸡只/学生/儿童/受训者永远没有错的概念,如果他们不懂,是你没有正确地「教导/训练」他们。

选择回到你身边──有关抉择行为的科学信息

(Choosing to Come When Called—and Other Choice Morsels on the Science of Choice Behaviour!)

原文出处:http://clickertraining.com/node/2970

作者:Aidan Bindoff,免费宠物杂志Positive Petzine的编辑,居住于澳洲

译者:黄薇菁

译文原出处:动物的事‧响片训练奇摩部落格

译文现出处:动物的事‧响片训练随意窝部落格

某选项的机率

 狗会作选择,训练其实就是提高狗儿选择出现你偏好行为而不出现其他选择的机率,因此了解动物如何作选择很重要。好消息是行为出现的机率其实相当可预测──虽然发现自己想要的行为出现机率低时不怎么好过。不过,另一则好消息则是,有方法可以提高机率,以下「抉择行为」的研究将解释。 

你会获得你奖励的行为

 狗通常会寻求最高增强,它们会依什么会带来最高利益决定出现什么行为,不必以为狗会在此过程里花很多脑筋思考,因为有些反应可能是自动反应。人类能进行极复杂的抉择过程,但我们多半对自己的选择不会想太多,我们只是会去做以前学过的事,同理地,狗可能也不会想太多,除非有其必要。

 许多实验已研究过动物(包括人类)如何抉择,它们通常给动物两个选择──例如:鸽子可能有两个键可以啄,各自代表不同的增强时制,或者每个键代表不同数量的食料或延迟不等的食料出现时间,也可能以啄键力道决定是否有食料出现,行为科学家利用这些实验回答了以下问题:

。反应频率和增强频率必须要多相近?

。如果同时有一次大量增强的选项,必须结合多少次少量增强才足以影响抉择?

。动物倾于选择实时的少量增强或是延迟的大量增强?

。如何让动物选择去做较难的任务?

 实验数据也有助回答许多有关狗儿抉择行为的常见问题。

 如果狗儿的选项是去追兔子或回到我们身边,我们如何影响它,让它选择回到我们身边?

 狗儿对于奖励会产生期望,如果奖励大大低于它的期望,在这种情境下这种奖励可能无法成为增强物。决定用什么当成奖励时要实际,一个方法是利用方便的增强物(可迅速给予也很容易取得,例如小块食物)教导行为,这符合经济,而且可多次增强。不过,日后把要求提高时要使用较不方便但更高价值的奖励。当然,价值高不高由狗儿决定!高价值奖励使你想训练的行为──你偏好的抉择行为──每次出现时都获得更多增强效果。

 阅读这篇文章的多数读者应该已经使用响片,我不必要解释用它有什么好。响片最棒的好处之一是它成为反应和增强物之间的桥梁,虽然有了这个桥梁,切记按了响片最好还是尽快增强,动物较喜欢实时的奖励,而非延迟者。

让它偏向你要的选择

 学习了抉择行为的知识后,如何拿来实际运用呢?正增强绝对有助教导狗儿回到主人身边,而不要去追兔子和找狗玩,训练出实时且稳定的召回反应是很棒的训练目标,以下是达成这个目标和其他训练目标的一些袐诀:

 。为了促进它做出正确选择,你必须管理它获得其他增强物的机会,尤其初期训练的时候。初时在低干扰环境里训练,在没有太多选项的环境里训练,这样你的狗比较会专注在你身上,出现你想要增强的行为。

  稍后,利用围起来的区域或牵绳限制它接近其他选项的机会。长绳是教导召来的超棒工具,使用适当长绳也较不会让你或你的狗受伤。胸背带也是不错的工具,不会让绳子绊到狗的脚,如果突然往上拉扯,狗也不会受到太大伤害。

 。训练做得越多,越多次召来获得增强,你的狗将越可能选择被你召回身边,这是相当简单的公式,在你的狗对简单召回很熟练之后,开始增加距离和干扰,提高难度,这应该以你的狗能够成功召回的进展来做,这样才能够增强它,不可急着把要求太快提高──虽然某天你的狗可能表现很好,但没人知道明天会如何,好的地基才能成为坚固的房子。

 干扰应该在控制之下的环境中提高,为的是要管理获得其他增强物的机会。例如,在你召回狗儿时,请某人在狗儿经过时呈出手上食物,如果它停下来查看,这人应该用手把食物包起来,所以它的反应不会获得奖励,这种好奇终将消逝,它很快会在召回时不理会这个干扰,它偶而可能仍会去看看,但是这是个显示如何让机率转向对你有利方向的明显例子,你看得到它的发生,虽然你没法强迫你的狗作选择,但是你可以影响机率,让它倾向你的偏好。

最佳召回?

 一阵子后,开始挑选最佳的召回反应才予以增强,让其他差的反应慢慢消失,不过什么是『最佳』召回?虽然我们期待狗儿可从不同距离招回,无论远近,不可去除短距离召回,这还是很需要的!我们也不该期待狗儿一定要全速跑回,这不一定很实际,尤其在家里。

 最佳的召回是马上有所反应,不是东晃西晃,也不会停下来闻闻花儿或去旁边绕绕再回来。初期训练时就该着重于狗儿的反应时间,日后训练则只要维持这种反应就好。狗儿越少花时间思考要不要被召回身边,它越不会注意到头顶树上有只松鼠!

最佳奖励?

 食物可能是完美的增强物,对有些狗而言,你可能永远只需要用食物,有些狗则较爱球、拔河、咬袖子/捕咬套或赶羊,如果你不曾训练过天生的拾回狗,你无法想象站在水边拿着拾回道具时拿片干酪放在狗面前有多么无用!所有让它出现最爱活动的讯号都在现场,而你却拿出…干酪?

 然而,若用拾回教导每项行为可能会有点慢且麻烦!同理地,设法利用拔河或捕咬套教导德国狼犬的工作犬每一项行为可能会让你很快就累且全身酸痛。你的选项是可以利用食物塑形行为的基本雏形,然后在训练大串行为时再利用狗在该情境最爱的东西作为动机。

提供成功的好机会!

 在难度逐渐提高的情境提供大奬将使机率大举倾向你希望的方向,但要小心不要要求过高,当你败在这一点上,你的狗会因为出现其他行为而获得奖励,因而降低召回的机率。

 狗永远都有选择,没有一定的事,制约的行为不会有百分之百的机率,因为事实是它们有可能出现其他行为,不过利用我们对抉择行为研究的了解,我们可以提供自己和狗儿生命中最棒的机会。

在控制之下玩拔河

(Playing Tug Games by Your Rules)

出处:http://clickertraining.com/node/1129

作者:Aidan Bindoff,写于08/01/2007

自由网宠物杂志Positive Petzine的编辑,居住于澳洲

译者:黄薇菁(Vicki)

译文出处:动物的事奇摩部落格

提问:我家幼犬会把裤脚咬起来甩,我试过对它发出低吼,也试图把它甩开,但是它反而变本加厉,所以我试着不加理会,这也没用,怎么办?

回答:

 幼犬咬着裤脚甩的行为通常具有自我增强的作用,幼犬觉得这种拔河游戏很好玩,于是常常会这么做。低吼或把它甩开的动作将使一些幼犬更加兴奋,不理会这个行为并不代表这个行为不会受到增强。

 一个可能的解决之道是教导幼犬玩拔河游戏,不过它得按照游戏规则玩,而且必须使用比裤脚适当的拔河对象,如此一来它有很多机会玩这个它显然非常爱的游戏,而当它了解拔河游戏规则时,你可利用拔河增强其他行为,以下拔河游戏一文将详述。

 设法找出你家幼犬何时较会去咬裤脚,狗儿常在牵着散步时这么做,如果是这样,利用响片训练它乖乖牵着散步,按了响片之后,就可以玩一下拔河游戏作为奖励。

 教导它依游戏规则及拿适当的对象玩拔河,利用它想要的行为增强你想要的行为。

 在幼犬学会玩拔河游戏之后,当它咬上你的裤脚,叫它放开,然后以拔河游戏作为放开裤脚的奖励。

 当然,有些裤子就是让它们忍不住想咬,如果你的裤管容易乱抖乱飘,不要在幼犬面前穿着这类裤子,留到其他场合再穿;如果可以事先预防,何必等到问题出现再浪费时间去处理咧?

================================

拔河游戏:新颖的增强物

(Tug Games: A Novel Reinforcer)

出处:http://clickertraining.com/node/727

作者:Aidan Bindoff,写于08/01/2006

自由网宠物杂志Positive Petzine的编辑,居住于澳洲

译者:黄薇菁

译文出处:动物的事奇摩部落格

 很多狗儿天生就是爱拔河,至于不爱拔河的狗狗,它们多数都可学会拔河而爱上这个游戏,如果狗儿爱做某件事,作响片训练的人会拿它怎么办呢?没错,就是拿它作为有效增强其他行为的增强物。

 和狗儿玩拔河这件事围绕着许多的迷思和无稽之谈,有些人坚持拔河游戏助长攻击性、咬人及「爱当老大」的行为,虽然未依规则进行的拔河游戏可能导致行为问题,不过如果你按游戏规则走、在控制之下玩拔河,这样反而较不会出现问题,

 控制之下的拔河游戏除了作为有效增强物之外,它也运动狗儿的身心,教导它一些重要的基本行为(自制力、以嘴咬着和放掉对象),也提供狗儿纾发本能冲动的绝佳管道。当你学会教导狗儿如何玩拔河时,你即学会如何以实用有趣的方式结合犬类天生行为和学习行为。

起步

 选择适当的拔河玩具:我们开始时可用一条干净的破布,事实上我们会用到两条破布,以下你很快会明白原因。

 对于没啥兴趣拔河的狗,我们必须先激发出一点儿猎捕本能,怎么做呢?把破布移动得像猎物一样。猎物会跑向要掠食它们的动物吗?才怪!它们会逃走,而你家幼犬就是掠食者,所以把破布往幼犬的反方向移动,不可朝它接近,如果猎物朝着掠食者接近,掠食者可能会出现一些被吓到的防御反应,我们可得避免这一点,因为如此一来这个游戏还没开始就会结束了。

 猎物也喜欢让掠食者摸不着头绪,使掠食者无法确定何时该进行猎杀,所以你要使猎物不时改变行进方向,但永远跑离你家这只掠食者。

 有些狗儿只见破布稍微抖动就会开始玩这个游戏,有些则需要你花些心力才有兴致,所以要有心理准备你可能得玩得满身大汗,响片训练并不是只躺在椅子上等广告时间再做就好唷!

 当然,你家这只掠食者必须要能真的赢了这场游戏,要捕捉得到猎物才能够拔河,所以让猎物装成有点儿受伤的样子,慢一点,让幼犬有机会跳扑上去咬住它。

 这时你可以按下响片,标定这个咬的行为,然后轻轻拉扯一下破布,鼓励它咬着不放,不可把破布用力扯走,力道只要足以使幼犬咬着和你拉扯一番即好。

 接着,丢下这条破布,从口袋拿出另一条破布,此时第一条破布已经「死了」──所有好玩的成份都消失不再,现在第二条破布开始「活起来」,由它接收第一条破布的好玩乐趣,呼唤着幼犬来玩!

 当幼犬一放开第一条破布,即刻按下响片,让它咬到第二条破布,和它拔河玩一会儿。

 然后,放掉第二条破布,捡起第一条,同样地,让它在手上复活,等待幼犬放掉口中破布,等它一放掉就按下响片,让它咬上你手中的破布。

 重复做,直到你挥动手中破布时,它就会「稳定出现」放掉嘴里破布的行为,这可能玩一回合它就做得到,或者需要好几回合。「稳定出现」是什么意思呢?意思是你挥动手中破布时,五次之中至少会有四次幼犬将立刻放掉嘴里破布。

 这便是加入「放开!」讯号的好时机(附注:如果你是要训练参赛,先不要使用参赛用讯号),在你挥动手中破布以前,说出:「放开!」,幼犬很快将学会当你说出放开时要放掉嘴里破布。

 教导幼犬或狗儿「放开!」的行为很有用,当幼犬偷咬了衣服或小孩作业时,这个行为就非常有用,很容易可拿回东西。

 幼犬需要学习:1‧把嘴里的东西迅速吐掉永远都对它有好处,2‧你下口令时并不一定会拿着破布挥。

 你家狗儿学习到的概念很可能是,当两件事同时发生时它才须放掉破布:1‧你说了:「放开!」,2‧你拿着另一条破布,现在你需要开始训练它只听口令就放掉破布。

 手中不拿破布,说出:「放开!」,如果你运气很不错,幼犬将立即放掉嘴里破布,这时你便按下响片,捡起破布和它玩拔河。

 如果你运气不佳,等候一下,默数到五,幼犬很可能觉得无聊或不知所措而丢下破布,这时按下响片,捡起破布和它玩拔河。

 如果它没有放掉的动作,再说一次口令,这次手上拿着另一条破布,稍后再试试不拿着碎布说出口令。

引申概化:无论任何东西,任何地方,任何时间

 至此,你家狗儿学会了咬破布拔河和听口令放掉,现在可开始使用其他对象:一截水管、网球、软材质玩具、出怪声的玩具等;你也可以开始在不同地点玩拔河:家中不同房间、前院和后院、公园、兽医院外头等。

 偶而,按下响片后不以拔河作为奖励,以食物取代,捡起玩具,等个几秒,然后再引它玩拔河。

浅谈「延迟反应时间」:快速反应行为

 有些狗儿听到口令不会实时反应,对于这类狗儿,最好早早花些时间处理这个问题。

 找出你家狗儿花多久时间才反应,假设是四秒的话,我们就给它五秒钟出现反应,如果它在时限内出现反应,按下响片继续玩,如果它超过时限,结束游戏,稍后再试。

 当狗儿稳定出现反应,五次里有四次都会在五秒内放掉,便减少时限至四秒,如此一秒一秒地减少时限,直到反应时间不到一秒,此后维持这个时限(更多概念解释请见限定反应时间一文)

 现在,你的工具箱有了这个好玩的游戏,想想可以利用它的方式,狗儿大多都学会超爱这个游戏,于是它成为增强其他行为(如召来或作为跑完全程敏捷赛的结尾)的好方法,如果你参加护卫犬、狗展、拾回或飞球比赛,你可以想想如何塑形这个「放开!」的行为,使它成为稳定出现的「吐出!」或拾回手上的行为。

 有些饲主甚至发现,在倍受压力的状况(例如接受困难的训练)之后,拔河可有效纾解狗儿压力。

 请依规则玩拔河,但最重要的是,拔河必须很好玩才行唷!

『吠叫』与『安静』:利用成对讯号加速学习

(A Swinging Pair: Using Paired Cues to Accelerate Learning)

原文出处:http://www.clickertraining.com/node/169

作者:凯伦.布莱尔女士,写于2003年四月

译者:黄薇菁 (Vicki)

译文出处:动物的事奇摩部落格

  同时训练两个行为?同时教两个讯号?怎么做?为何要这么做?教导特定的成对讯号能够加速学习过程,同时也教导狗儿一个概念──这种情形可应用到新的学习。

  选择相对行为,例如:「前进」和「后退」,「跳过」和「钻过」,「脚」和「鼻子」,交替地按下响片给赏,成对行为之间或成对讯号之间的显著差异成为一项狗儿新学习到的信息。利用相对行为训练狗儿区别的概念可使学习加速甚快,你可能发现只要一次训练即可建立起行为和讯号。

  然而,你必须捕捉或引发这两个很不同的行为,以吠叫/安静的相对行为为例,如果想同时很快使两个行为连接到讯号上,试试以下作法:

  .狗正在叫时即可开始训练。这时遇到爱吠叫的狗就很容易,不过如果你必须引发吠叫的行为,在附近的门上或桌子上敲一敲,这通常可以引发吠叫。

  .按下响片,给块零食,当它吞下零食时,突然出奇不意地在它面前作出一个「停」的手势(或是任何你知道会让它注意看的手势),狗儿将表现出稍稍吃惊的反应,或许有点担心,也可能稍微表现出安定讯号(calming signal),例如把头别开。(译注:暂译为安定讯号,由挪威训犬师Turid Rugaas命名,指狗儿的一些微妙行为,出现于狗儿紧张的情境,作用为多重:安定自己、预防打架、回避威胁、表达善意)。

  .在它出现吃惊的反应时,按下响片给赏(事先把零食藏在拿响片的手中,另一手空出来作上述手势),给它吃下零食。

  .现在等待狗儿再度吠叫(有必要的话你可引发吠叫),按下响片给赏,给手势,按下响片给赏,重复练习。

  这是怎么回事呢?你不但引发吠叫(如果狗儿自发吠叫的话较佳),而且还增强这个行为,然后你引发一个相对的行为并且增强它。这时还没有建立起讯号的链接,只是轮流按响片奖励两个相对的行为。

  注意:你并不是轮流按响片奖励「吠叫」和「不吠叫」的行为,成对讯号并不代表「出现行为」和「不出现行为」,而是「做这件事」和「做那件事」。以「吠叫」和「安静」的情形来看,你所增强的行为是「吠叫」和它的相反行为,它可以是任何你作出「停」的手势时狗儿出现的轻微吃惊反应──稍微瞇眼并往后缩一下、把头别开、耳朵竖起来,狗儿可能以为它应该「闭上嘴巴」、「把头别开」(同时闭着嘴巴)、「低头躲」、「表现担心的样子」,或者做出任何你按下响片给赏的行为,可是它的确做了某件事,而且它出现时你也按下了响片。

  接下来呢?

  .当两个成对行为看起来有点儿受到操作制约时,也就是你看到狗儿开始有点儿故意出现这些行为时,即可以加上口头讯号「叫!」。

  .使用手势作为「安静」或「闭嘴」的讯号

  .训练那个与吠叫相对的行为(任何被你增强的狗儿行为),让它出现的时间越来越长

  .当行为和讯号出现良好链接时,把手势转移到「安静!」或「请别出声!」的口头讯号上。

  2003年第一届响片研讨会在芝加哥举行时,当地的雪德水族馆(Shedd Aquarium)训练部主任Ken Ramirez解释了海洋哺乳动物训练师惯常运用成对讯号训练鲸豚的方法,他指出第一次训练成对讯号时可能有点慢,但是等到动物学会三对成对讯号时,它已经有了相对的概念:A讯号出现时做这件事,B讯号出现时做那件事,从此之后教导任何成对讯号将相当迅速。如果你想作训练参加比赛,第一次训练成对行为时,你可能得选一对容易在家里训练的行为(或许是「前进」和「后退」),让狗儿把A讯号之后出现B讯号的概念学得很好,日后需要狗儿在重要情境下对成对讯号出现反应时,你可依此概念加以扩充。

  另外一些可以同时学得很好的相对行为是「前进」和「后退」以及「鼻子」和「脚」(去碰目标),你可以教狗儿「大」「小」(教它去碰大的东西或小的东西)或「黑」「白」,「跳过」和「钻过」也不错,「左」和「右」对敏捷赛和人狗跳舞极为有用。英国训犬师Kay Laurence的学生在设计人狗跳舞的动作、进行气味训练、服务犬训练及远距离训练时都训练许多成对讯号,以并入其他动作中使用(顺带一提,Kay的意见是,狗儿很难分辨英文的左和右,她用「踢」和「搭」或「粉红」和「蓝色」等其他讯号代替,无论这对狗而言重不重要,它迫使训练师牢记这些意义并不明显的讯号,有助让讯号的使用维持一致性及准确性)。

  如果你有一些训练得很好的成对讯号,可以试试同时使用它们,「脚」加「左边」加「推」的讯号等同让狗儿走过去,用力去点一下左边的目标物。

  译注:本篇概念属高级训练

训练结束讯号

(The End-of-Session Signal)

作者:美国知名动物训练师Ken Ramirez,发表于2016年5月25日

现任凯伦布莱伦响片训练公司的执行副总裁及训练长

有近四十年训练及咨询经验

曾在世界知名的美国Shedd水族馆担任动物照护及训练部的执行副总裁

著作《动物训练:透过正增强的成功动物管理(暂译)》

(ANIMAL TRAINING: Successful Animal Management Through Positive Reinforcement)

是动物园领域许多训练员的必修宝典。

原文出处: http://www.clickertraining.com/the-end-of-session-signal

译者:黄薇菁(Vicki)

译文出处:动物的事‧响片训练随意窝部落格

 「训练结束讯号」是好或是坏?训练者应该使用这个讯号吗?上个月的宾州兽医工作犬会议(Penn Vet Working Dog Conference)上,我与一群搜救犬训练师对这个讯号辩论起来,讨论得很热烈。

 要留意的重点是,科学文献里没有出现「训练结束讯号」,它是训练圈子里出现的做法。简单来说,「训练结束讯号」代表任何刻意使用的预测性讯号,它告知动物,训练已结束。这个工具的应用没有一定的做法,优缺点则取决于此讯号的使用方式。

支持使用的人

 在一段压力大或困难的训练之后,训练者有时会给动物一个「结束」讯号,他们解释这个讯号的作用是增强物,不但代表耗神费力的活动结束了,也代表有休息的机会。

 许多工作犬(尤其是导盲犬和某些服务犬)需要长时间专注执行特定任务。训练师会教导「休息」讯号,向动物表明它不再需要积极工作,直到有人下令回到工作状态为止。举例来说,当人带狗狗到了餐厅,人坐在桌旁,下令让狗狗休息,有时这可以视为「训练结束讯号」。

 有时训练者使用「训练结束讯号」的原因是,训练结束后狗狗依然非常热切专注,追随着训练者,一直盯着人,所以他们觉得「训练结束讯号」向狗狗清楚传递信息,代表狗狗不再需要留意人,可以做自己的事。

反对使用的人

 有些训练者主张,「训练结束讯号」没必要使用,甚至有坏处。如果这个讯号代表训练结束,这通常代表不再有正增强。依定义来说,取消获得正增强的机会是暂停的做法,技术上来说是负处罚物。在训练最后以暂停结尾会处罚最后一个行为或最后一串行为,所以它是个好工具或坏工具呢?

 在我让使用「训练结束讯号」的各位恐慌,担心自己一直以来处罚了狗狗之前,请放轻松,事实可能不然。让我们来看看「训练结束讯号」的一些用法,看看每一个用法对动物的意义有何不同。

传统训练

 在我专业生涯初期,即我学习到正增强之前,我参与使用纠错处罚的传统训练,在这种情况之下,「训练结束讯号」标示压力的结束,于是狗狗大概会松了一口气,这个讯号的作用是负增强物。

导盲犬

 我做导盲犬训练时,我们教导狗狗当它不需要积极导盲时会叫它「休息」,如前述的餐厅例子。许多训练师称这个「休息」讯号为「训练结束讯号」。但以我之见,它只是个放松的「等待」行为,不过是要导盲犬执行的一长串任务之一。以此用法来说,这个讯号相当有好处。

搜救犬

 我四月发表的文章《When Training Is Too Much Fun!》里提过搜救犬卡森,因为无意间使用的「训练结束讯号」而使它丧失了提报行为。可预测地,这个讯号的出现意谓回家时间到了,卡森因而在无意间受到处罚。它极爱搜寻,对于乐趣结束了而感到失望。

 使用「结束」讯号的训练者总是在给予讯号后就去上班或消失了,留下狗狗自己独处,我认为他们的狗狗便是和卡森一样。如果狗狗喜欢训练,但「训练结束讯号」出现后接下来训练者就消失,狗狗可能会视它为非常不快、具惩罚性的经验。

正向的替代做法

 有些训练者结束训练时使用「结束」讯号,接着马上发生一些事:可能是得以到户外的机会,玩新玩具的机会,获得可以啃咬很久的零嘴,或是开始沙发上的抱抱时间。这时的「结束」讯号不会结束增强,其实它是一个开始新增强活动的讯号。

 我以前训练过一群海象,正式训练结束时我们总是提供它们蛤蛎、九孔和其他有趣的零食,藏在堆积如山的冰块里。在能提供海象去冰块堆里觅食的机会时,我们就会给予讯号,参观的训练师常以为它是「训练结束讯号」,但我们把它训练成一个非常正向的增强性讯号。

结语

 由于使用「训练结束讯号」并没有规定用什么方法,而且它的用法不一,所以不可能以一概全地说它是好或是坏,虽然前述例子可能都称为「训练结束讯号」,但有可能用词不当,因为每个讯号的作用都非常不同。

 许多训练者使用「训练结束讯号」却不自知:解下零食袋,给狗狗看空空的双手,离开狗狗或结束时搓揉狗狗一下,如果我们不小心谨慎的话,这些动作可能都具有惩罚作用。

 是否使用所谓的「训练结束讯号」无法用来显示训练做得好不好,要点是这个讯号的用法,而且最重要的是学习者的反应。「训练结束讯号」的最佳用法是让人慢慢地退出当时情境,人的消失不会对之前的行为形成处罚,而增强物则自然而然地消失,例如给讯号后让狗狗去玩,或给予玩具,或提供找零食的益智玩具。

 了解自己增强或处罚了什么行为,也要准备好可能要调整自己的做法,以让狗狗成功。

 结束训练时观察学习者的行为,如果它放松自在,行为合宜,你可能不需要改变结束训练的方式。相反地,如果你看到训练结束时,狗狗表现紧张、挫折或问题行为,你可能要检视结束训练的方式。

 观察狗狗学习到什么,表现出什么,「聆听」它的肢体语言和行为告诉你什么。我们的目标应该是给予明确的指导,并且营造让学习者成功的情境。

 训练快乐!

相关知识

对以正增强为基础训练的6大误解
最完整攻击犬行为训练教程(仅使用正增强技巧)
正增强和犬训练( I 、II)Positive Reinforcement and Dog Training
正增强与犬训练 VII:总结与结论 Summary and Conclusions
白杨文化:电影拍摄技巧:如何运用特效增强视觉冲击力
户外训练狗狗回到你身边的技巧(提高狗狗服从性,增强亲密关系)
正增强和犬训练IV:小狗和大狗 Little Dog vs BigDogs
【增强免疫力的食物】增强免疫力的水果,增强免疫力的蔬菜
如何增强狗狗的训练效果
怎么知道宠物店正不正规?教你几招判断技巧

网址: 【正增强的技巧 https://m.mcbbbk.com/newsview503910.html

所属分类:萌宠日常
上一篇: 谷歌大脑提出对智能体进行「正向
下一篇: 谷歌大脑提出对智能体进行「正向-