дрессировщики делали это, чтобы закрепить в сознании собаки сигнал, который больше никто, кроме неё, не поймёт. Я знаю одного очень способного дрессировщика на послушание, использовавшего едва слышное фырканье как условное подкрепление. Я видела похвалу одной из участниц соревнований: «Хорошая работа!» (она тут же отразилась великим наслаждением на морде её собаки), которая была передана прикосновением пальца хозяйки к голове собаки. Я знаю, что одна участница соревнований научила свою собаку Рекса, что лакомства называются «Билли». Затем, когда собака все выполняла на ринге, она подкрепляла особенно хорошее поведение, например точное возвращение, что выглядело в виде команды: «Билли, рядом!» И всем казалось, что она использует обычное имя своей собаки.
Когда собака обучена каким-то действиям, условное подкрепление позволяет не только отсрочить награду пищей, не теряя при этом совершенства исполнения, но и давать вообще меньше лакомства. Вам не следует волноваться, что ваше животное успеет насытиться ещё до конца работы. Один пример: на собачьих выставках я часто замечала хендлеров, которые раз за разом подкармливали собак, давали им пищу, чтобы получить наиболее совершенную выставочную стойку или напряжённое выражение. И когда бы я не наблюдала, как в собачью пасть падает все новая и новая пища, всякий раз я знала, что хозяин этой собаки не имеет ни малейшего представления об условном подкреплении! Намного эффективнее приучить животное к нужной позе, развить понимание словесного указания, а затем подкрепить собаку щелчком за то, что она сохраняла нужную стойку соответствующее время. Награда пищей последует потом, вне ринга или когда эксперт уйдёт.
Сила условного подкрепления заключается в его действии — оно передаёт информацию и влияет на поведение животного, причём во всех ситуациях, когда обычное подкрепление нежелательно или невозможно. Подумайте, к примеру, насколько было бы полезно условное подкрепление для обучения розыскных собак, ездовых, сторожевых, поводырей, разыскивающих птиц и приносящих убитую дичь и для формирования любого поведения собак, когда требуется, чтобы животное работало далеко от вас.
Контроль плохого поведения при помощи положительного подкрепления вместо «коррекции» может показаться бесперспективным занятием, но дрессировщики дельфинов знают множество способов, как это делать. Мы предлагаем три примера.
Это не будет сигналом, означающим «Я собираюсь тебя ударить», но это будет сигнал «Нет, я не буду тебя подкреплять». Оно говорит животному, что ряд его действий не будет оплачен. Например, вы можете просто повернуться спиной к своей собаке. Животное быстро поймёт, что, увидев этот «красный свет» или «плохой» сигнал, оно должно изменить своё поведение. Вы сможете использовать этот сигнал, чтобы, к примеру, отучить собаку прыгать на вас приветствуя, а вместо этого спокойно стоять — тогда её подкрепят лаской.
В нашем шоу в Морском парке один дельфин просто изводил одну из девушек, выступавших в том же шоу. Прежде чем дать пловчихе водяной пистолет (или разрешить другое наказание), мы обучили дельфина давить на рычаг, торчащий над водой по свистку или за рыбу, и каждый раз, когда девушка оказывалась в воде, мы просили его давить на этот рычаг. Дельфин не мог одновременно давить на рычаг и преследовать пловчиху, эти действия были несовместимы (тем более что давление на рычаг всегда подкреплялось, поэтому прекратилось преследование пловчихи). Вы можете использовать эту технику для приучения собаки лежать в гостиной во время вашего обеда, тогда она не будет попрошайничать у вашего стола.
Иногда дельфин делает что-то действительно плохое, например проявляет агрессию (бьёт головой или зубами по руке дрессировщика). Когда такое происходит, нужно сразу же повернуться к нему спиной, забрать свои принадлежности и ведро с рыбой и уйти на целую минуту. Дельфин сразу же высовывает голову из воды и смотрит с недоумением: «Эй, что я такого сделал?» После нескольких повторений он учится думать о своих действиях. Собачий эквивалент может быть таким же: уберите лакомство и кликер — и конец всем развлечениям.
Дрессировщики в океанариуме успешно используют тайм-ауты для борьбы с агрессией, направленной на людей-пловцов, даже у таких высокодоминантных животных, как взрослые самцы-касатки. Но эта техника может приносить страдания животным, поэтому использовать её нужно осторожно.
Использование подкрепления составляет большую часть работы дрессировщика, поэтому оно заставляет вас думать. Но что за головная боль! Намного легче следовать таким простым правилам: если сделала кучу, ткните её носом, если собака не идёт рядом, дёрните поводок. Однако обдумав то, что вы собираетесь подкрепить, вы станете намного более искусным дрессировщиком. Но для совершенного выбора момента для подкрепления вам нужно сосредоточиться, тогда дрессировка станет очень волнующим, а не скучным занятием.
С точки зрения животного этот вид дрессировки не означает приучение держаться подальше от неприятностей, выполняя то, что от него требуют, ведь это просто обычная работа, и больше ничего. Взамен эта дрессировка даёт животному шанс победить, снова и снова, а также шанс контролировать хотя бы часть своей работы. Например, с точки зрения дельфина, когда он научился понимать значение свистка, дрессировка не становится для него сменой команд и послушания, она становится игрой в загадки, которые дельфин стремится «разгадать» различными способами, как заставить дрессировщика дунуть в свой свисток. Это игра по строгим правилам, но при равенстве обеих сторон. Ничего удивительного, что дельфины очень любят своих дрессировщиков, которые учат их послушанию!
Действие положительного условного подкрепления намного сильнее, чем у простой дрессировки. Если вы прекратите полагаться на контроль плохого поведения, а начнёте формировать хорошее поведение с чётко выраженными условными сигналами подкрепления, ваша собака будет относиться к вам совсем по- другому. Вы научитесь использовать интуицию при общении со своей собакой.
ГЛАВА ВТОРАЯ
ДАВАЙТЕ НАЧНЁМ
О хорошо обученных собаках мы обычно думаем, что они просто не способны что-то сделать неправильно: прыгнуть на гостя, много лаять, залезать на диван и т. д. Поэтому и о «дрессировке» мы думаем, как о способе избежания плохого поведения. Под дрессировкой мы понимаем прекращение прыжков на людей, лая или хождение рядом на поводке. Поэтому обычная дрессировка на первый взгляд состоит из контроля и профилактики. Вы дёргаете свою собаку за поводок, чтобы заставить её сделать что-то, а затем исправляете её, обычно другим рывком поводка, когда собака делает что-то «неправильно», пока она не научится, как делать «правильно».
Дрессировка с кликером, или оперантное обучение, имеет совершенно другие принципы. В результате дрессировки с кликером вы получаете собаку с хорошим поведением, но сформированным совершенно новым путём. Вместо того, чтобы прекратить неправильное поведение собак, мы учим собак сразу вести себя правильно. Собака учится вежливо встречать гостей, лаять в нужное время, ходить рядом на провисшем поводке, ходить только там, где ей позволено (по полу, а не по дивану, по траве, а не по