Перед тем, как вы погрузитесь в начальную дрессировку, уделите внимание нескольким «дошкольным» проблемам, о которых вам надо знать. Некоторые покажутся банальными, даже глупыми, но все они очень значимы.
Приучение к физическому контакту.
Одна из очень важных вещей, к которым надо приучать каждую собаку – это спокойное отношение к физическому контакту. Это означает не только удовольствие от дружеской возни в парке или энергичного похлопывания.
Ваша собака должна хорошо относиться к касанию и ощупыванию всего тела. Она должна давать открыть себе пасть и осмотреть зубы и десны, поднимать и массировать лапы, стричь когти и чистить уши. Не должно быть части тела, которую собака не дает вам осмотреть, потрогать или помассировать.
Для этого есть несколько важных причин. Совершенно очевидно, что вашему ветеринару и грумеру потребуется трогать собаку. Иногда их прикосновения будут носить неприятный характер. Собака не должна сопротивляться. Эти специалисты справедливо обеспокоены собаками, которые кусаются или проявляют агрессия. Поскольку это считается «профессиональным риском», у них нет никакой законной защиты даже в случае серьезного нападения. Если они не уверены в манерах вашей собаки, то могут потребовать надеть на нее намордник или даже дать наркоз. Вы не только улучшите отношения с ветеринаром и грумером, но и сделаете общение вашей собаки с ними более приятным, если специально займетесь обучением.
Есть и еще одна причина., о которой мы предпочитаем не думать. Ваша собака неизбежно хоть раз получит травму на тренировке. Она ударится о барьер, или приземлится после прыжка и поскользнется, или наступит на камень и порежет лапу или повредит коготь. Это случается. И тогда вы должны будете позаботиться о собаке до оказания ей помощи профессионалом. В большинстве случаев самое главное – успокоить собаку и не допустить еще большей травмы. Если ваша собака хорошо относится к массажу, вы сможете взять ее под контроль, осмотреть повреждение и сделать самые простейшие вещи — например, помассировать уши, – чтобы уменьшить ее панику и самому оценить ситуацию более спокойно. И осознание того, что вы это можете сделать, позволит вам более профессионально отреагировать на травму или несчастный случай, когда (а не если!) он произойдет.
Другой стороной травм является то, что мы узнаем о травме, только если она серьезна. Собаки очень хорошо скрывают боль. Этологи предполагают, что это атавистический механизм, позволяющий выжить: в стае больная собака подвергается риску быть изгнанной или даже убитой. Неважно, какая инстинктивная основа у этого поведения, главное, что если вы заметили у своей собаки травму, степень повреждения вас может удивить. Если вы постоянно делаете собаке массаж и привыкли к ощущению ее здоровых мышц, суставов и связок, вы сможете заметить даже незначительные признаки травмы (напряженность, «деревянность», легкая припухлость и т.д.) и вмешаться до того, как разовьется болезнь.
Щенки учатся мириться с осмотром и массажем довольно охотно, хотя некоторые поначалу и сопротивляются. Старшие собаки будут чувствовать себя неуверенно, и часто «отмахиваются» от хэндлера – не кусают в полном смысле этого слова, но открывают пасть и касаются зубами вашей руки. Крайне необходимо приучить собаку реагировать на осмотр без этого.
Когда собака учится переносить полный осмотр, она также признает ваше главенство. В этом смысле доминирование – не то, что получается с применением силы. Вы получаете полное доверие собаки, она верит, что вы будете все делать правильно, и поэтому разрешает вам себя трогать. Когда вы установите такой вид «лидерства», остальная дрессировка будет гораздо легче.
Общий массаж.
Проводите с собакой время в тишине каждый день. Используйте очень легкое поглаживание по морде и понемногу просовывайте пальцы в пасть, массируя зубы и десны. Если она сопротивляется, не отступайте, но и не продвигайтесь дальше. Останьтесь на том же месте, пока она не расслабится, даже если это займет пару дней. Никогда не боритесь с собакой.
Когда ваша собака поймет связь щелчка кликера и лакомства, вы сможете использовать кликер, чтобы успокоить собаку. Вы можете щелкать и кормить ее, или (если, например, одна ваша рука у собаки в пасти) только щелкать. После щелчка покормите как только представится возможность. Смысл этого – переключить внимание собаки на поощрение и объяснить ей, что физический контакт – нечто приятное. Необязательно долго заниматься с кликером, поскольку когда собака научится принимать прикосновения, они станут для нее поощрением сами по себе.
Уделяйте особенное внимание лапам. Используйте долгие, мягкие поглаживания по всей длине ног сверху вниз. Массируйте пальцы и между ними, раздвигая и приподнимая каждый палец. Если собака откусывается или пытается отдернуть лапу, спокойно разговаривайте с ней и уменьшите воздействие – но не прекращайте массаж совсем. Не поощряйте у собаки мысль, что она может остановить вас укусом или угрозой.
Массируйте тело длинными поглаживаниями по грудной клетке открытой ладонью со слегка раздвинутыми пальцами. Также оглаживайте собаку по всей длине, против шерсти.
Массируйте хвост и основание хвоста, обхватив его пальцами и слегка потянув.
TTouch.
TTouch – зарегистрированная терапевтическая методика для животных, разработанная Линдой Теллингтон-Джонс. Я не практикую ТТ, и не претендую на то, что могу учить этому методу. Я использую некоторые виды прикосновений к своим собакам, и считаю, что они приносят пользу и мне, и им. Очень рекомендую купить книгу Линды и освоить хотя бы часть способов. Они дадут вам возможность контактировать с собакой для ее блага в различных обстоятельствах. Я часто использую ТТ перед выходом в ринг, чтобы успокоить собаку и успокоиться самому.
Те места из книги, которые могут помочь в освоении отдельных навыков, будут мной освещены в соответствующих разделах. Это ни в коем случае не заменит первоисточник.
Что общего все это имеет с обидиенс?
Как владелец собаки, вы скоро обнаружите, что чем больше собака приучена к физическому контакту, тем лучше. Вы сможете легче решить проблемы с поведением, и может быть, даже совсем избежать их. И вы увидите, что общий контакт с собакой улучшится.
Для тренера или спортсмена по обидиенс, все, что помогает развить уверенность собаки в вас и вас в собаке, поможет в ринге.
Например, очень часто поведение, которое выглядит как боязнь (например, стойка для осмотра судьей) – на самом деле, дискомфорт от физических прикосновений. Многие собаки очень неспокойно стоят, даже стоя на всех четырех лапах. Это симптом «биться или убежать». Некоторые касания по методике ТТ помогут собаке стоять более уверенно. Это полезно как на выставке, так и в ринге обидиенс. Общее чувство спокойствия также будет огромной помощью при обучении выдержке сидя и лежа.
Физический контакт, описанный здесь, даст вашей собаке более спокойное и осмысленное отношение к этим упражнениям. Собаки, которые привыкли к грубому обращению, покажут боязнь рук хэндлера во время работы. Например, я видел собак, которые отставали от хэндлера во время движения рядом из-за того, что в начале обучения старались держаться подальше от его руки.
Регулярный массаж также даст вашей собаке лучшее представление о том, где какая часть тела у нее находится. Собаки в основном не слишком это сознают. Это особенно очевидно на примере их задних лап. Собаки просто не думают о своей задней части (это особенно видно, когда собака в испуге прячет голову, считая, что раз ее не видно, то и всего остального не видно тоже). При отработке фронтальной посадки, например, часто бывает, что собака идеально держит голову и перед, но ее задняя часть отклоняется от идеальной линии. Развивая у собаки умение управлять всеми частями тела, вы получите собаку, более уверенную в движениях, особенно при движении рядом или прыжках.
Принимая во внимание то, что целью соревнований по обидиенс является «продемонстрировать полезность собаки как компаньона» (слегка перефразируя АКС), массаж имеет и очевидный эффект в плане того, что собака начинает спокойно принимать мягкое лечение от человека, и следовательно, хорошо себя ведет у ветеринара или грумера, а также общаясь с прохожими.
Если вам когда-нибудь придется давать собаке таблетки, вы будете рады, если она спокойно даст открыть себе рот. Наши собаки болеют и получают травмы. После всех процедур, которые я проводил с Вуди, я научил остальных собак, Сэма и Дилана, команде «Прими таблетку» — каждый открывает пасть и позволяет мне засунуть туда палец.
Наконец, меня часто удивляет, насколько неуютно бывает хэндлерам с их собственными собаками. Их собаки слушаются в ринге, но я видел множество спортсменов, которые не верят в то, что их собаки могут быть социальны не только с другими людьми, но даже с собственными хозяевами. Я рассматриваю это как побочный эффект методов дрессировки. Но это и продукт физической отчужденности между владельцем и собакой, и это можно частично преодолеть с помощью методов, описанных выше.
ОК, давайте теперь поговорим о дрессировке.
Безусловное и условное подкрепление.
Подкрепление повышает вероятность повторения поведения в будущем. Говоря проще, подкрепление усиливает поведение. Некоторые виды подкрепления «объективны», т.е. собака их получает сама собой. Например, вода, которая бьет из фонтана, когда вы нажимаете на кнопку, подкрепляет нажимание кнопки. В дрессировке подкрепление «субъективно», т.е. вы как дрессировщик даете его собаке с целью вызвать данное поведение в будущем. Знаете вы это или нет, ваши действия всегда подкрепляют что-то, что делает собака. Неважно, какого поведения вы хотите добиться от собаки, это всегда продукт того, что вы делали, чтобы это подкрепить. Так что вы всегда должны думать, что именно вы собираетесь подкрепить, и как вы это делаете.
Давайте посмотрим на «меню подкреплений».
Дрессировочный «обмен».
Я буду больше говорить об этом в разделе о положительном подкреплении, но коротко упомяну и здесь. Дрессировка, основанная на отборе поведения с помощью положительного подкрепления, покоится на «дрессировочном обмене» между вами и вашей собакой. Проще говоря, вы говорите собаке: «Ты делаешь то, что я хочу, и за это я тебе дам то, что ты хочешь». Тогда дрессировочный процесс становится диалогом между вами. Собака смотрит на вас в ожидании указаний (информации о том, что вы хотите от нее) и подтверждения правильности (что собака сделала именно это). Ваша задача – быть понятным, последовательным и честным.
Звук щелчка, издаваемый кликером – основной путь «разговаривать» с собакой во время дрессировки. Это работает потому, что вы последовательно доставляете собаке то, что «обещает» щелчок, так что собака чувствует себя уверенно с этим однозначным ответом.
Безусловное подкрепление.
Хотя существует несколько научных определений термина «безусловное подкрепление», для целей дрессировки мы используем следующее: «то, что собака «естественно» хочет». Другими словами, вам не надо приучать собаку хотеть это. Это «что-то» может быть едой, игрой, физическим контактом с хэндлером и т.д. Секс – тоже безусловное подкрепление, но мы воздержимся от обсуждения этой темы в нашей книге. Это не то, что собаку надо «учить» любить. Пища – самое простое безусловное подкрепление для использования в дрессировке, потому что пищевой инстинкт — один из основных, и едой проще манипулировать. Игра как безусловное подкрепление не столь удобна (кроме «перемен» или празднования окончания тренировки), поскольку прерывает занятие. То же касается и физического поощрения (игры или массаж).
Условное подкрепление.
Условное подкрепление (иногда также называемое вторичным) – это то, что собаку «научили» любить, связывая его появление с безусловным подкреплением. В теории, все, что угодно, может быть условным подкреплением – голос, свисток, кликер. Главный аргумент при выборе сигнала – удобство для дрессировщика. Я слышал различные аббревиатуры, чтобы суммировать все необходимые качества условного подкрепления, но мне нравится одно: PRIDE: условное подкрепление должно быть в наличии (Present), постоянным (Reliable), немедленным (Immediate), определенным (Distinct) и очевидным (Evident). Расшифруем:
в наличии – оно должно быть у вас с собой и должно быть легко доступно для использования;
постоянным – Вы вырабатываете у собаки ассоциацию особого звука с безусловным подкреплением, так что вы должны иметь возможность воспроизводить этот звук одинаково все время;
немедленным – звук должен быть очень быстрым, чтобы вы могли его очень точно применять в нужный момент. Фраза «Сейчас ты был очень хорошей собакой и хорошо, если ты сделаешь так еще раз» не годится. Подумайте об односложном слове или коротком звуке;
определенным – условное подкрепление должно четко ассоциироваться с безусловным, и не должно «размываться» ассоциацией с чем-то, не относящимся к дрессировочному процессу. Слово «хорошо» не очень эффективно как условное подкрепление, поскольку вы его используете и в других ситуациях помимо дрессировки;
очевидным – собака должна быть способна узнавать и отличать его от всех других звуков.
Я использую термин «условное подкрепление» вместо «вторичного подкрепления», потому что это дает немного другой, очень важный акцент. Во-первых, это что-то нейтральное изначально, что собаку научили любить. Нет ничего интересного в звуке кликера. Только ассоциация с поощрением, приобретенная в результате обучения, придает ему значимость для собаки. И во-вторых, этот термин не умаляет значения условного подкрепления (слово «вторичный» выглядит более пренебрежительно). На самом деле, со временем условное подкрепление становится не менее важным, чем безусловное. Поскольку условный сигнал всегда предшествует безусловному поощрению, собака понимает, что без него хорошее не случится, и начинает работать ради «волшебного звука».
Почему кликер?
Вся программа этой книги построена на кликере. Вы можете выбрать любой условный сигнал для собаки. На протяжении всей книги вам будут попадаться буквы Щ/П («щелкнуть-покормить»). Вы можете использовать другие варианты (в том числе и голосовой сигнал), но по моему опыту, лучше кликера нет ничего. Кликер отвечает всем вышеперечисленным критериям. Его звук ясно слышен, он ассоциируется с безусловным подкреплением, он быстр и слышен на расстоянии; и он нейтрален, т.е. на него не влияют ваши эмоции или физическое состояние.
Почему важна нейтральность; или щелчок не есть похвала.
Многие дрессировщики отрицают идею нейтральности. Они хотят «хвалить» собаку. Я не знаю, помогает ли им это, или они считают, что под этим есть какая-то научная основа (энтузиазм имеет какой-то смысл для собаки – насколько я знаю, у подобных теорий нет научного фундамента). Я не против похвалы. Мои собаки получают ее много, в разных обстоятельствах и невзирая на погоду. Однако в процессе обучения информация важнее похвалы. Для собаки, как и для любого ученика, понимание того, что она сделала правильно, становится поощрением само по себе.
Похвала – это не общение. Похвала – это эмоциональное взаимодействие с собакой. В книге «Как стать лучшим другом своей собаке» монахи Нового скита описывают похвалу как «физическое и словесное общение с животным». Она выражает положительные чувства, необязательно положительную информацию.
Кликер не несет никакой эмоциональной оценки того, что делает собака; он просто «отмечает» правильное действие. Это чисто информационное сообщение. Он несет собаке ясное, недвусмысленное сообщение: «То, что ты делаешь, правильно». Это примерно то же, что пятерка, которую учитель ставит вам в тетрадь после диктанта. Вы будете ей рады, даже если он вас не обнимет при этом. Вы знаете, что вы преуспели, и только это вам надо.
Похвала не служит той же цели и не ведет к тому же результату, что и положительное подкрепление. В институте я ужасно учился, и особенно плохо было с химией. Мои родители всегда давали мне понять, что любят меня («хвалили» меня), но это никак не помогало мне преодолеть разочарование от того, что в лаборатории я был полным болваном. И хотя мой преподаватель химии старался меня научить изо всех сил, я так и не научился, как преуспеть в науке (эта неполноценность левого полушария немало повлияла на то, что я так и не стал ветеринаром при всей своей любви к животным).
Это же относится и к собакам. В дрессировке к соревнованиям мы учим собак выполнять определенные действия определенным образом. Эти навыки не имеют «естественного» смысла для собаки, в отличие от пастьбы для бордер колли или хождения по следу для гончих или перевозки нескольких десятков килограммов груза по замерзшей тундре для маламутов. Собака должна не только научиться физическим действиям; она должна выучить, по каким сигналам и когда их выполнять. Это все довольно непонятно. Поэтому самое главное – использовать инструмент, который дает собаке четкий, недвусмысленный сигнал о том, что конкретное действие было правильным. Делая так, мы достигаем ясности (или чего-то близкого к ней) и повышаем вероятность того, что данное действие будет повторяться в будущем.
Ограничения при использовании голосового маркера.
Голосовой сигнал в качестве условного подкрепления менее эффективен, чем кликер. В сравнении по шкале PRIDE он проигрывает по нескольким пунктам.
Во-первых, голос — не такой определенный сигнал, как кликер. Давайте предположим, что вы используете слово «хорошо». Вы, возможно, говорите «хорошая собака» раз 50-60 на дню вне дрессировочного контекста. Слово «хорошо» таким образом не имеет эксклюзивной связи именно с дрессировкой. Вы можете сказать «хорошо» после вкусного обеда, или по телефону, обычно при собаке. Все это размывает особую ценность слова в качестве условного подкрепления.
Слово и не такое «быстрое». Для этого есть несколько причин. Во-первых, поскольку кликер позволяет вам реагировать на действия собаки немедленно, вы должны будете, и это произойдет, выработать отличное чувство своевременной подачи сигнала. При занятиях с кликером вы научитесь вычленять маленькие кусочки поведения, «выхватывать» их и формировать из них что-то лучшее. Хотя у вас в голове всегда цельная картина, вы работаете с деталями. Вы можете отреагировать на движение одной лапой при отработке движения рядом, например. Голосовой сигнал не даст такой точности.
Во-вторых, для большинства людей, когда они привыкнут управляться с кликером, он становится намного быстрее, чем речь. Сколько раз вы хотели сказать одно, а получалось сказать совсем другое? Физический рефлекс нажатия на кнопку при нужном действии выработать легче, чем процесс облечения в слова вашей позитивной реакции.
Когда я выступал с Вуди в Новичках, у нас был с ним этот неприятный опыт. Ко времени, когда мы дошли до подзыва, я был уже в полном смятении от волнения. После того, как Вуди сел передо мной, судья сказал «Закончить упражнение (finish)», и я ляпнул то же самое Вуди — «Finish». Он изумленно посмотрел на меня, как бы спрашивая: «Ты имеешь в виду – рядом?» и прекрасно обошел меня и сел рядом. Еще не родился ни один дрессировщик, которого хоть раз в жизни не выручила бы собака, которая лучше знает, что надо делать.
Еще один пример. Я использовал разные команды для упражнений. В Высшем классе падающий барьер был «Барьер», а высокий барьер «Хоп». На одних соревнованиях я скомандовал Сэму «Барьер» на падающий барьер, но он прослушал команду. Второй раз я сказал «Хоп», и он прыгнул падающий барьер, а не высокий. С кликером вам не надо беспокоиться о том, что вы скажете неправильное слово в неправильное время.
Голос также очень сильно меняется в зависимости от того, жарко ли вам, или вы устали, рады или расстроены, хотите пить – и т.д. Практически невозможно всегда говорить одно и то же слово в одной и той же интонации и с одной и той же громкостью. Поскольку интонация важна для собаки, эти неизбежные вариации будут иметь разное значение. Условное подкрепление должно упрощать вещи; использование голосового маркера усложнит их.
Это не значит, что похвала и похлопывания не нужны или не имеют значения. Это не так. Я много использую и того, и другого. Но они являются безусловным, а не условным подкреплением. Это вещи, ради которых собака работает; они не сообщают собаке о том, что приближается то, ради чего она работает. И они случаются после того, как действие закончено. Они не доставляют информацию во время действия.
Как насчет других звуков?
Что насчет свистка? Он отвечает почти всем критериям, но это не то, что можно использовать на общих занятиях или в помещении, а если вы находитесь близко к собаке, он может быть для нее нестерпимо громким.
Как насчет пищащей игрушки? Полезно, но не очень очевидно на расстоянии.
А щелчок языком? Это подходит под описание голосового маркера. Опять же, в принципе ничего такого, но у вас будут сложности с подачей сигнала вовремя. Пробовали когда-нибудь щелкать языком, когда во рту пересохло?
Щелчок пальцами? Хороший звук, не всегда одинаков, не очень хорошо отличим на расстоянии, и сложно произвести немедленно.
Что, если ваша собака глуха? Хм-м. Главная проблема, если вы полагаетесь на голос и у вас нет хорошего условного сигнала. Кликер она, естественно, тоже не услышит. Как насчет вспышки фонарика? Вспышка будет хорошим визуальным «щелчком». Тот же принцип, что и кликер: нейтральный сигнал, не имеющий изначально никакого значения для собаки. Но связав его с безусловным подкреплением, вы сделаете его столь же могущественным для глухой собаки, как щелчок кликера для слышащей.
«Но кликером нельзя пользоваться в ринге!»
Одно из возражений, которое постоянно появляется в стане оппонентов — «Но кликером нельзя пользоваться в ринге».
Одна моя знакомая рассказала мне, как она учит собаку фронтальному подходу – она зажимает кусочек лакомства между колен, и собака достает его при подходе. Я ей сказал, что одна из причин, по которой я предпочитаю кликер – я могу объяснить собаке, что подходить надо по прямой без этих фокусов с кусочками. Ее реакция? «Да, но ты же не можешь взять кликер в ринг». Я все еще жду, когда она появится в ринге с кусочком лакомства между ног.
Для тех, кто так говорит, я предлагаю простой поединок. Давайте использовать только то, что разрешено иметь в ринге. Давайте посмотрим. На собаке может быть простой или затягивающийся ошейник, так что можете использовать его. Вы можете иметь при себе поводок, но его запрещено использовать для коррекции. Вы не можете использовать игрушки, лакомство, любой другой мотивационный предмет, ничего. Вы не можете говорить с собакой, пока она работает. Ну, давайте начнем тренироваться.
Результат будет очевиден. Любой дрессировщик использует в дрессировке инструменты, которые нельзя взять с собой в ринг. Но вы не можете обойтись без них при подготовке к соревнованиям. Кликер – инструмент для обучения. Вам точно так же надо будет научить собаку работать без кликера, как вы учите ее работать без других дрессировочных инструментов.
Кликер – инструмент для сообщения «Правильно!» во время процесса дрессировки. Когда собака выучит то, что нужно, вы постепенно сведете пользование кликером на нет. Вы также добавите другие виды условного подкрепления, включая голосовые и «активные» (когда следующее действие является поощрением предыдущего). Простой пример: Сэм любит делать «флип» (разворот прыжком) при пересадке из фронтального подхода к левой ноге. Если он выполнил подход хорошо, я позволяю ему сделать флип. Если он неправильно сел или медленно подходил, я приказываю ему занять положение у ноги, обойдя меня вокруг. Я расскажу в других разделах, как этот метод может помочь в выработке навыков.
«Но собака должна работать для меня!»
Еще одно часто встречающееся возражение – дрессировщик говорит, что «Собака должна работать для меня, а не за еду или звук!». Я заметил, что большинство людей, приводящих этот аргумент, склонны к механической коррекции во время дрессировки. При этом они, очевидно, не сознают, что при такой дрессировке собака работает не «для них», а чтобы избежать воздействия.
Более научно, этот подход упускает из виду то, чем по сути является дрессировка. Это процесс обучения. Результатом успешной дрессировки должна быть собака, которая хочет и любит работать, уверена в том, что она делает, уверена в своей способности противостоять неожиданностям. Это делается положительным подкреплением. Дрессировка положительным подкреплением невозможна без использования условного подкрепления.
На деле, мы работаем для себя, и собаки от нас не отличаются. Наш шеф предпочел бы, чтобы мы сохраняли верность фирме, но если зарплату перестают выдавать, верность испаряется. Мы просим собак выполнять для нас задания. Если в них нет ничего положительного для собаки, почему она должна их выполнять?
Некоторые задания сами по себе являются поощрением для собаки. Бордер колли будет счастлив, если ему предоставят стадо овец, чтобы бегать вокруг, бладхаунд – рад запаху, чтобы идти по нему, джек-рассел-терьер – грызуну, за которым можно полезть под землю. Дайте пойнтеру поле с птицами, и ему больше в жизни ничего не нужно.
Но нет породы или собаки, для которой работа по послушанию – врожденный инстинкт, удовлетворение которого является приятным. Некоторые лучше к ней относятся, некоторые хуже, но послушание не «естественно» ни для кого, ни для собаки, ни для человека. Если мы хотим, чтобы наши партнеры-собаки присоединились к нам в этом виде деятельности, будет справедливым дать им для этого основания.
«Мамочкиной (или папочкиной) любви» для этого недостаточно. Собака и так ее получит. Должно быть что-то существенное, чтобы создать необходимую и постоянную мотивацию к работе. Вот зачем нужно положительное подкрепление, и вот назначение кликера как условного подкрепления.
И наконец, эта программа делает именно так, что собака работает «для вас». Собаке будет нравиться работать, и она будет любить вас как часть работы. Вы станете более последовательным и понятным. Собаке будет более комфортно с вами, она будет вам больше доверять. Что вам еще нужно?
Приучение к звуку.
Большинство собак спокойно относятся к звуку кликера. Они немедленно схватывают связь звука с поощрением. Даже у моих чувствительных к звукам шелти не было проблем со звуком щелчка (хотя я изредка встречал собак, которых он пугал). Есть несколько вариантов:
Один из них подсмотрен на странице о дрессировке подружейных собак и основан на постепенной десенсибилизации.
кликер в кармане;
кликер замотан и спрятан за спиной;
кликер замотан и держится в руке в обычном положении;
кликер в руке.
Если ваша собака очень чувствительна к звукам, вы можете начать с щелчка языком.
Другой подход – ввести звук в тот момент, когда собака занята тем, что ей нравится, например, во время кормления. Это убьет сразу двух зайцев: приучит собаку к звуку и свяжет его с приятным для нее. Стив Уайт, дрессировщик собак для полиции в Сиэттле, Вашингтон, рассказывает, что он так делает с подсосными щенками. Когда сука их кормит, он щелкает, когда щенки захватывают сосок (возможно, нет более глубинной ассоциации между щелчком кликера и таким безусловным подкреплением!). Таким образом, к трехнедельному возрасту у щенков уже выработан стойкий рефлекс на щелчок.
Я выяснил, что большинство собак легко привыкают к звуку кликера, если связывать его с пищей. Но, как правило, звук кликера не раздражает собак, так что вы можете спокойно заниматься со своей собакой среди других собак, не обучающихся с кликером.
Время – это все!
Смысл в том, чтобы щелкать точно в тот момент, который вы хотите поощрить. Это значит, что вы должны четко сознавать, что вы хотите получить. Карен Прайор в книге «Несущие ветер» рассказывает, как она пыталась научить дельфина переплывать из одного бассейна в другой. Дельфин проплывал через проход и немедленно разворачивался и плыл обратно, прежде, чем успевали закрыть проход. Когда наконец Карен попросила кого-то посмотреть со стороны, наблюдатель ей сказал, что она свистела ровно в тот момент, когда дельфин начинал разворот. Так что вместо того, чтобы поощрить его переход в другой бассейн, она поощряла разворот. Когда она начала подавать сигнал в нужный момент (речь идет о долях секунды), проблема была решена очень быстро.
Урок, который Карен извлекла из этой ситуации, был следующим: дрессировщик всегда должен спрашивать себя «Что я поощряю?». На самом деле, вопрос состоит из двух частей: 1) что я хочу поощрять? 2) что я на самом деле поощряю. Это требует от вас тщательного планирования занятия и концентрации на протяжении всего процесса.
Вы должны сфокусироваться исключительно на том, что делает собака, чтобы соответствующим образом реагировать на то, что она предлагает. Это будет честно. Ведь в конце концов, вы же требуете, чтобы собака полностью концентрировалась на вас! Это одна из причин, о которой Карен Прайор в «Не рычите на собаку!» говорит, что необоснованное прерывание занятия является наказанием. Перестать обращать на собаку внимание – это убрать возможность у собаки достичь ее цели. Это разрушит весь принцип метода.
Хотя классическое определение поощрения содержит примечание о том, что оно следует за действием, это относится только к безусловному подкреплению. Условное подкрепление должно быть доставлено собаке в момент совершения действия, чтобы оно четко ассоциировалось именно с желаемым поведением. Обычная ошибка для начинающего дрессировщика в использовании кликера – затягивание с щелчком. Щелчок так быстр и конкретен, что всегда поощряет то, что происходит именно в этот момент. Если вы промедлите с подачей условного подкрепления, вы поощрите нечто совсем не то, что намеревались.
Возможно, вам будет легче понять это, если вы будете думать о поощрении процесса, а не поощрении результата. Я хочу, чтобы собака знала, что то, что она делает – правильно, а не то, что она уже сделала. Гораздо важнее, чтобы она поняла, как это делать, а не чтобы она это в принципе сделала. Так что, если я и буду подавать сигнал невовремя, лучше это делать раньше, а не позже. Так я, по крайней мере, поймаю поведение в развитии. Щелчок может «обрубить» поведение слишком рано, но это легко преодолеть. Я просто рассматриваю то поведение, которое я поощрил раньше, чем требовалось, как шаг в правильном направлении, и продолжаю двигаться дальше. Этот вариант не сработает, если я буду щелкать слишком поздно; тогда я теряю все поведение целиком.
Чтобы понять, как это работает, давайте вернемся к обычному «сидеть». Поощряя «попу на земле», я подаю условный сигнал, когда собака садится. При своевременной подаче щелчок раздается в тот момент (или за мгновение до того), как собака касается попой земли. Возможна слишком ранняя подача сигнала: если я щелкну в тот момент, когда собака еще только начала садиться и ей еще легко подняться обратно или зависнуть, щелчок может прервать поведение до того, как получится сесть. Так можно построить «недопосадку». С другой стороны, если я щелкну, когда собака уже села на землю, я поощряю то, что ее попа находится на земле, а не то, как она туда попала. При правильной подаче сигнала я щелкну за мгновение до того, как она коснется земли, поощряя движение мышц – так же, как и результат этого движения, который немедленно последует.
Вернемся к вопросу «Что я поощряю?». В почти каждом случае, когда собака «не понимает», вы можете проследить недопонимание до несвоевременного щелчка. И с другой стороны, точная подача сигнала может решить это недопонимание практически немедленно.
Вот пример того, как несвоевременное подкрепление может нести неверную информацию. Один из моих учеников не хотел использовать кликер. Он занимался «глазками», используя слово «Хорошо», и кормил собаку, когда она на него смотрела. Через два-три повторения он начал говорить «Хорошо». Он успел сказать «Хо…», собака отвернулась, и «… рошо» ушло в пустоту. Дрессировщик был явно смущен и сказал «Я только что поощрил ее за отворачивание». Он все же хотел использовать голосовой сигнал, но с того момента сократил его до «Хо».
Второй пример – я учил Дилана высылу. Он хорошо знал, что надо бежать вперед, и я отдельно научил его разворачиваться и садиться. Теперь нужно было объединить их. Когда я крикнул «Дилан, сидеть!», он развернулся и лег. Я сделал это еще раз, чтобы посмотреть, как это происходит, и заметил, что когда он разворачивается, он присаживается на землю, и уж затем ложится. Так что в третий раз я щелкнул в момент разворота и касания земли попой. Он остался сидеть, округлил глаза и вздернул голову. Это было ясно видимое «А-а-а!». В следующий раз он сел, и больше у нас проблем не было.
Не каждую проблему можно решить так легко. Но точное время подачи условного подкрепления может помочь гораздо больше, чем другие варианты.
Щелчок заканчивает поведение.
Это одна из областей работы с кликером, которую многие сначала понимают с трудом. Сила кликера в точности, с которой он отмечает отдельное правильное действие. Собака, с которой провели подготовительное обучение, понимает, что когда она слышит щелчок, то она заслужила поощрение.
Поэтому это закон – каждый щелчок сигнализирует собаке о том, что она сделала то, что вы от нее хотели и работа окончена. И это закон, что услышав щелчок, собака вольна прекратить то, что она делала, и получить кусочек.
Например, в обучении высылу вы можете щелкнуть, когда собака двигается от вас и уже прошла, скажем, пять шагов по прямой. Когда вы щелкнете, собака может (и так она и сделает!) остановиться; ей позволено вернуться за лакомством. Точно так же в обучении апортировке, если вы щелкнули за подбор предмета, собака имеет полное право его бросить и прийти за лакомством. Это звучит страшновато. «Я не хочу, чтобы собака бросала гантель». Справедливо. Но беспокоиться не о чем.
Помните одно из главных правил отбора поведения: Вы работаете только над одним критерием за раз. В примере с гантелью вы тренируете одну вещь – подбор. Вы получили и поощрили нужное поведение (поднятие гантели). Когда вы добавите «и принеси ее мне», вы больше не будете щелкать за поднятие, а будете подкреплять только полный поднос, нечто более комплексное, чем простой подбор предмета.
Не используйте щелчок в значении «продолжай».
Многие дрессировщики, особенно те, кто относит себя к той или иной «мотивационной» школе – и я сам причисляю себя к таковым в начале своей карьеры – пытаются использовать кликер как поддержку в середине поведения (щелчок — «продолжай»). Я думаю, это наследие смешения понятий положительного подкрепления и поощрения, и кроме того, не совсем верное понимание того, как работает условное подкрепление.
Есть несколько проблем с использованием щелчка в значении «продолжай».
Щелчок означает «хорошо сделано, приходи за поощрением». Это своего рода сделка. Если я использую его в значении «продолжай», я не соблюдаю условия сделки. Я обещал что-то, что не доставил по назначению. Вместо поддержания значимости кликера как условного подкрепления я подрываю ее. Через не очень продолжительное время щелчок станет просто еще одним звуком среди других.
Использование щелчка со значением «продолжай» создает недопонимание. В первый раз, как я щелкну с этой мыслью, собака прекратит делать то, что делала. Теперь я должен объяснить ей, что лакомства не будет. Другими словами, в интересах того, что я считаю ободрением и поддержкой, я на самом деле меняю правила, делая их бессмысленными для собаки, и подрываю наш уже существующий «договор».
Эта та ошибка, которую я прошел и сам. На ранних этапах работы с кликером я тоже использовал его, чтобы сообщить собаке «продолжай в том же духе». Через некоторое время я посмотрел на то, что получилось, и был вынужден признать, что я использовал кликер как похвалу в тех частях упражнений, где собаке недоставало уверенности в себе. Я увидел, что собаке недоставало уверенности потому, что эти части упражнений были недостаточно хорошо отработаны. Когда я переучил их, моя нужда в ободрении собаки прошла. Теперь, когда она знала, что надо делать, я мог щелкнуть за все поведение в целом, не заботясь о том, чувствует ли она себя уверенной в том, что делает.
Это не значит, что я не могу щелкнуть и поощрить собаку в середине поведения без полного разрыва поведенческой цепочки. У меня с собаками есть маленькая система. Когда они занимают статичную позицию и слышат щелчок, они сохраняют эту позицию до специального сигнала, отменяющего эту команду. Так что, например, на укладке во время подзыва я щелкаю в момент укладки, подхожу к собаке, даю ей лакомство и возвращаюсь на место. Затем я либо подзываю ее, либо отпускаю гулять. Я изолирую конкретное поведение для поощрения без нарушения нашей сделки. И есть дополнительный побочный эффект – собака приучается сохранять позицию до получения следующей команды. Это может помочь сделать выполнение всего упражнения более надежным.
«Щелчок» как «мост».
Некоторые из дрессировщиков дельфинов называли свой условный сигнал «мостом» или «соединяющим стимулом». Он имели в виду, что условное подкрепление позволяло им поощрить действие на расстоянии и «заполняло брешь» между моментом подачи условного подкрепления и моментом подачи безусловного подкрепления. Термин постепенно забылся, но смысл не потерялся.
В дрессировке «вкусняшка» не всегда прибывает немедленно. Например, в обучении высылу я щелкаю, когда Сэм касается мишени. Затем он поворачивается и бежит ко мне за лакомством. Так что проходит несколько секунд до получения им поощрения. Но когда он добегает до меня и получает свой кусочек, он знает, за что он его получил. В этом смысле кликер служит «мостом» между поведением и его безусловным подкреплением.
Одно из сильных мест кликера в том, что вы можете сохранять эту ясность, иногда даже 30 секунд и более. Если мои собаки становятся «жрущими собаками», то есть тычутся мне в руки или лезут в сумку на поясе за лакомством, я использую эту идею «моста», чтобы прервать нежелательное поведение. Я складываю все лакомство в пластиковый контейнер, который ставлю на скамейку в нескольких метрах от нас, и мы начинаем заниматься. Когда я вижу то поведение, которое мне нужно, я щелкаю, и затем иду к скамейке за лакомством. Конечно, это немного затягивает занятие, и я не делаю так постоянно. Это мера коррекции чересчур настойчивых шелти, которым я таким образом напоминаю, что они работают, чтобы услышать щелчок, и только после этого появляется еда. При этом собаки, даже пройдя несколько метров до лавочки, все равно знают, за что именно они получат лакомство, потому что им об этом сообщил щелчок.
Отбор поведения с помощью положительного подкрепления.
Словосочетание «положительное подкрепление» (ПП) означает одновременно и подход, и метод. Оба очень важны в философии дрессировки. Когда я говорю «подход», я не имею в виду притворно счастливое лицо. Я говорю о внутреннем убеждении, или вере, в возможность собаки выполнить задачу. Применяя этот метод с умом, и вы как дрессировщик, и собака разовьете эту веру у себя и друг у друга.
Спортивные комментаторы часто гвоорят о команде, играющей «на победу», как о противоположности «играть, чтобы не проиграть». В обоих случаях команда хочет победить, но подход – и часто и результат – очень разный.
Команда, которая играет, чтобы выиграть, играет с внутренней уверенностью в успехе. Эта команда агрессивна, напориста, упорна. Команда, которая играет, чтобы не проиграть, играет с внутренним страхом провала. Эта команда консервативна, медленно реагирует на открывающиеся возможности, легко расстраивается. В славные годы команды «Грин Бэй Пэкерс» Винс Ломбарди говорил после поражения: «Мы не проиграли, просто время матча кончилось». Винс Ломбарди знал, как играть на победу. Еще важнее, он знал, как сохранять позитивное отношение команды даже в трудные времена.
Дрессировка с помощью кликера вырабатывает у собаки характер «игры на победу». Сам процесс обучения дает ей уверенность в том, что она может добиться успеха. Он учит ее, что если она что-то делает достаточно долго и старательно – она получит результат. Дрессировка не учит ее бояться ошибиться, она учит собаку, которая может столкнуться с ошибкой и продолжить работать, зная, что продолжение усилий принесет ей награду. По мере того, как у собаки будет повышаться уверенность, вы, как хэндлер, станете более уверены в собаке. И это будет видно в ринге.
Как постепенный отбор поведения помогает получить стабильное выполнение навыков и уверенность собаки в возможности их выполнения?
Давайте посмотрим на обучение собаки садиться методом отбора поведения. Собака садится на землю (хорошо), но заваливается на бедро (плохо). Эти качества выполнения и другие (скорость и внимательность) – критерии, т.е. необходимые элементы правильного исполнения упражнения. Чтобы обучить собаку садиться – или любому другому навыку – правильно, вам нужно знать критерии выполнения, и продумать, как объяснить их собаке.
Каждый навык содержит несколько критериев, и есть логическая последовательность в их соблюдении. Есть несколько критериев хорошей посадки: 1) Собака должна касаться задом земли; 2) собака должна сидеть сбалансированно по оси «вперед-назад»; 3) собака должна сидеть прямо по оси «право-лево»; 4) посадка должна быть быстрой; 5) собака должна быть способна сидеть продолжительное время.
Вы работаете над одним критерием за один раз. В посадке вы должны сначала поощрять касание задом земли. Потом вы учите собаку правильной «механике» посадки, чтобы она не заваливалась на бедро. Это уже «повышение критериев»: смысл упражнения теперь не «сесть на землю», а «сесть на землю прямо, не заваливаясь». Когда собака усвоит и это новое требование, вы больше не поощряете расхлябанную посадку, только прямую. В научных терминах это «дифференцированное подкрепление» (ДП). Вы поощряете не все подряд, что делает собака, а только попытки определенного типа или качества.
Это не меняет правила «дрессировочного договора». Вы по-прежнему даете собаке то, что она хочет получить в обмен на то, что она делает для вас. Вы просто повышаете уровень требований к выполнению. Собаке теперь приходится стараться немного больше и немного более последовательно, чтобы получить желаемое.
Затем вы можете закрепить правильную посадку тем, что между посадкой и щелчком/поощрением будет проходить больше времени. Вместо того, чтобы щелкать в момент касания попой земли, вы увеличите время, отсчитывая одну секунду в течение пары тренировок, затем три, четыре секунды и так далее. (Я не использую часы. Я считаю «один банан, два банана» и т.д.) Этот процесс не только улучшает качество выполнения упражнения, он дает основу будущей выдержке сидя. Собака учится, что поощрение появится; просто чуть попозже.
Ваша задача – понимать критерии каждого упражнения и планировать, как их отрабатывать в логической последовательности. Когда вы это сделаете, и выстроите мастерство собаки, она всегда будет уверена в том, что она знает, что вы хотите, и в своей способности это сделать. «Технология» дрессировки дает не только нужное поведение, но и отношение, которое вам нужно.
Случайное поощрение.
В каком-то смысле наше поведение «поощряется» каждый день жизнью. Вы улыбаетесь и машете другу, он улыбается и машет в ответ – ваше доброжелательное поведение поощрено. Вы голодны и идете к холодильнику, чтобы поесть, поскольку в прошлом вы не раз находили там еду. Поощрение – часть повседневной жизни.
Дрессировщик использует поощрение сознательно. Мы много работаем над тем, чтобы с большой степенью вероятности собака выполняла определенные действия по команде. Проще говоря, поощрение повышает вероятность повторения поведения в будущем.
Два типа подкрепления.
Подкрепление усиливает поведение. Есть только два типа подкрепления: положительное и отрицательное. Оба призваны достичь одного и того же результата – увеличить вероятность того, что поведение, за которым немедленно следовало подкрепление, повторится. Моя философия заключается в том, что обучение поведению лучше всего происходит с помощью положительного подкрепления.
Обычный синоним подкрепления – поощрение. Я не возражаю против сокращений, но надо четко понимать разницу. Вы можете получить поощрение за что-то, что вы сделали в прошлом, но без особых ожиданий того, что вы повторите это в будущем (как награда за поимку разыскиваемого преступника). Подкрепление же всегда усиливает то поведение, которое его вызвало.
Я не использую термины «положительный» и «отрицательный» как морально-этическую оценку «хороший» и «плохой». Эти термины имеют чисто математический смысл. Положительное подкрепление (+П) означает, что вы даете собаке что-то желаемое, чтобы подкрепить (поощрить) поведение, которое только что произошло (собака села и получила печенье). Отрицательное подкрепление (-П) означает, что вы убираете что-то желаемое собакой, чтобы подкрепить то поведение, которое только что произошло.
Вся дрессировка с помощью поводка основана на отрицательном подкреплении. Вы применяете неприятное (дергаете поводок), чтобы вызвать поведение, и затем убираете неприятное (ослабляете поводок), когда собака делает правильно (идет рядом, садится, ложится и т.д.). Во всех этих случаях реакция собаки на команду происходит, чтобы избежать рывка поводка. -П учит собаку, как избежать неприятностей или наказания. Как говорит Карен Прайор, -П – это то, что заставляет собаку работать, чтобы избежать его.
Вы можете научить собаку навыкам через отрицательное подкрепление, но вы всегда будете работать – и бороться — с неприятным воздействием и его избеганием. Вот почему «мотивационные» методы стали так популярны. Это попытка противодействовать неприятному характеру и последствиям обучения на отрицательном подкреплении. С +П мотивация как таковая становится неуместной; это неотъемлемое следствие самого метода.
Положительное подкрепление (обоюдная победа).
Положительное подкрепление – получение собакой того, что она хочет, в ответ на предложенное ей поведение. В «Не рычите на собаку» Карен Прайор определяет +П как «что-то, ради достижения которого собака будет работать». Скиннер писал, что «положительное подкрепление усиливает любое поведение, результатом которого является».
Если собака села и я дал ей лакомство, поведение закрепляется. Вероятность того, что она снова сядет, возрастает, потому что это действие приносит приятный результат. Использование положительного подкрепления – это одноступенчатый процесс. Когда вы получите нужное вам поведение, поощрите его.
Оперантное научение учит собаку «работать, чтобы заслужить» награду сев, без малейшего негативного оттенка. Другими словами, дрессировщик не реагирует наказанием на то, что собака не села. Он просто положительно реагирует на посадку, когда она случается. Сначала это будет происходить случайно. Но поскольку посадка приносит поощрение, приятное собаке, она будет садиться снова.
Со временем собака обобщает полученный урок. Она выучивает, что у нее есть власть влиять на происходящее: делай правильно, и с тобой будут происходить хорошие вещи. Потом собака начинает предъявлять поведение сама, чтобы вызвать приятные последствия, которых ожидает. Поведение становится оперантным; т.е., по определению Скиннера, «поведение управляет средой, чтобы произвести последствия».
Вот почему оперантное научение с положительным подкреплением, однажды выученное, легче использовать, чем традиционные методы, основанные на «коррекции» или отрицательном подкреплении. Дрессировка с положительным подкреплением гармонизирует желания собаки и дрессировщика. Это дрессировочная «сделка», о которой я писал выше: Хэндлер говорит, «Бафи, сделай то, что мне надо, и я дам тебе то, что хочешь». Бафи отвечает: «Договорились». Вы развиваете утвердительное взаимодействие между собакой и хэндлером. Собака учится получать то, что хочет, делая то, что хотите вы. Когда движение начато, любое новое упражнение, которое вы учите, будет проходить по тем же правилам, и с опытом вам будет все легче.
Положительное подкрепление учит животное не бояться нового. Как указывает Мюррей Сидмэн в его книге «Принуждение и его последствия», «И положительное, и отрицательное подкрепление эффективно учат, но они учат и другим вещам. В этом они отличаются. Положительное подкрепление дает нам свободу потворствовать своему любопытству в изучении новых вариантов. Отрицательное подкрепление прививает узкий поведенческий репертуар, оставляя нас боящимися нового, не решающимися исследовать».
Собака, которая не боится пробовать новые варианты, будет готова принять новое поведение, и будет лучше воспринимать «отрицательную информацию». Что я имею в виду под «отрицательной информацией»? Когда собака делает ошибку, вы можете захотеть сообщить ей, что она ошиблась, но так, чтобы она не начала бояться. Для этой цели часто используется слово «неправильно», тихо сказанное в обычном тоне. Это подсказывает собаке: «Это не то, попробуй еще раз». Правильно развитое и применяемое, оно может помочь собаке еще раз подумать, что именно надо сделать.
Например, в обучении выборке, если Сэм брал неправильную вещь, я мог тихо сказать ему «неправильно», пока он был еще в зоне выборки. Он бросал ее, снова искал и находил правильную. Никакого стресса, никакого шума. В обучении апортировке по направлениям, если я посылал его к вещи №3, а он шел к вещи №2, я мог сказать «неправильно», и он останавливался, задумывался и шел к нужной. Так что в буквальном смысле дрессировка становится диалогом дрессировщика и собаки.
Отрицательная информация – это не отрицательное подкрепление. Она работает только потому, что впереди ждет положительное подкрепление. Собака понимает, что надо сделать правильно, она знает, что именно, так что она может понять подсказку, которая говорит, что она сбилась со следа, как информацию, переработать ее и вернуться на след. Это не работает, если собака боится ошибиться! Как писал Фрэнк Герберт в «Дюне», «Страх убивает разум». В отсутствие страха, разум собаки становится свободным, и она может работать, несмотря на ошибки. Это ведет к надежному выполнению.
«Неправильно».
Гэри Уилкс популяризировал использование слова «Неправильно» в ответ на нежелательное поведение. О цели этого слова были споры. Некоторые расценивали его как наказание (точнее, условное наказание). Я не согласен с этим. Я расцениваю его как подсказку для угасания.
Поведение, которое не подкрепляется, угасает. Если я даю возможность собаке что-то сделать, и она сделает это неправильно, я могу заставить это поведение угаснуть, просто не подкрепляя его. Но этот процесс довольно длительный, особенно, если поведение уже вошло в привычку.
Слово «Неправильно», на мой взгляд, просто сокращает процесс угасания. Оно говорит собаке то же самое, что и лишение ее поощрения в течение некоторого периода времени: «Я не хочу, чтобы ты это делала, так что прекрати так делать».
Хоть слово и полезно, надо быть очень аккуратным в его использовании, особенно на ранних стадиях обучения. Весь смысл оперантного научения в том, чтобы собака училась на своем опыте, как выбрать нужное поведение, основываясь на истории его подкрепления. Слишком раннее введение слова «неправильно» может на вид упростить процесс дрессировки, но на самом деле помешает ему.
Важно, чтобы и собака, и дрессировщик хорошо ориентировались в правилах поощрения. Собака должна научиться определять, когда ее не поощряют, а дрессировщик должен запастись терпением, чтобы не поощрить собаку в случае нежелательного поведения – точнее, не реагировать на него вообще.
Если вы часто используете слово «неправильно», скорее всего, вы просите от собаки слишком многого – т.е. вы просите ее сделать то, что находится за пределами ее понимания. Если вы используете это слово до тоо, как собака поймет критерии и до того, как она поймет, что значит, когда вы не реагируете на предложенное поведение, это слово – не информация, а всего лишь костыль.
Отрицательное подкрепление (обоюдный проигрыш).
ОП, по Скиннеру, «усиливает любое поведение, которое помогает избежать или уменьшить его». Карен Прайор определяет ОП как «то, что заставляет собаку работать, чтобы избежать его». В обычной жизни это обычно процесс объективный. Вы перестаете пить воду, потому что это отрицательно подкрепляется – жажда исчезает после первых глотков. В дрессировке процесс субъективный. ОП в дрессировке имеет два аспекта: предъявление неприятного и его ликвидация. Другими словами, отрицательный раздражитель выполняет две взаимосвязанные функции: а) уменьшает вероятность повторения данного нежелательного действия в будущем; б) увеличивает (при его ликвидации) вероятность повторения желательного действия в будущем.
Это определение отрицательного подкрепления не совсем соответствует научному. Думаю, с этим можно смириться. У теории бихевиоризма развит свой огромный словарь, в основном выработанный в лаборатории, и как все мы, я пленник этого словаря. Так что, как Шалтай-Болтай, я считаю, что «Когда я использую слово, оно значит то, что я в данный момент для него выбрал – ни больше, ни меньше». Но в отличие от этого вздорного яйца, я попробую объяснить, что я имею в виду.
Давайте опять возьмем наш пример с командой «Сидеть». В традиционной дрессировке собака сидит рядом с дрессировщиком. Он говорит «Бафи, сидеть», и тянет поводок назад, в то же время нажимая собаке на круп (или, в некоторых школах, хлопая по крупу, или сгибая ей задние ноги). Когда собака садится, натяжение поводка ослабевает.
Это классическое использование отрицательного подкрепления. Стоять после команды «Сидеть» — нежелательное поведение. Рывок назад — «коррекция» (предъявление неприятного), направленная на исключение неправильного поведения путем связывания его с неприятными последствиями. Ослабление поводка поощряет поведение «сидения» удалением неприятного воздействия в момент совершения требуемого действия. Этот метод учит собаку избегать неприятного воздействия поводком тем, что она не стоит, услышав команду «Сидеть».
Это метод дрессировки, используемый в традиционных школах. Умелый дрессировщик может очень эффективно работать поводком, не дергая постоянно собаку и не вызывая у нее кашель или рвотные позывы от рывков за шею. Но независимо от того, насколько нежна и элегантна работа поводком, она основана на отрицательном подкреплении: собака работает, чтобы избежать воздействия.
«Традиционная», или «основанная на командах», дрессировка основана на отрицательном подкреплении.
«Традиционная», или «основанная на командах», дрессировка основана на отрицательном подкреплении. Основной мотив – неприятные последствия всегда где-то рядом на случай, если собака не выполнит то, что требует от нее дрессировщик. Очень популярна фраза «Собака должна знать, что у нее нет выбора, кроме как послушаться». Эта дрессировочная философия, неважно, задрапированная в «мотивационную» или «позитивную», покоится на том, что послушание – это принудительное подчинение.
Я использую термин «основанная на командах», чтобы описать этот метод дрессировки, потому что он рассказывает, как происходит процесс обучения и показывает различие между традиционной и оперантной дрессировкой. В традиционной дрессировке процесс начинается с того, что дрессировщик дает собаке команду, которую она не понимает (собаки по-английски не говорят, вы знаете?), а потом делает что-то – рывок поводком, щипок за ухо, наведение лакомством или удар током – что заставляет собаку послушаться. Концептуально тип коррекции, или степень гуманности, — нечто нематериальное. Наведение лакомством и удар током – просто противоположные крайности одного и того же: дать команду и заставить ее выполнить.
«Основанная на командах» дрессировка работает на отрицательном подкреплении. Сначала поступает слово, а затем вы заставляете собаку выполнить ее. Она начинается с непонимания и имеет тенденцию вырабатывать поведение, неустойчивое к затуханию.
Оперантное научение основано на положительном подкреплении. Сначала происходит поведение. Вы берете действия собаки, которые она предъявляет сама, и отбираете из них то, что в итоге формирует целый навык. Вы не прилагаете к этому «слово», пока навык не сформирован практически полностью. Так собака учится, что определенное слово связано с определенным действием, которое всегда приносит желаемый результат.
Отличие отрицательного подкрепления от наказания.
Аналитики-бихевиористы, возможно, выделят два элемента в моем описании отрицательного подкрепления, и назовут рывок поводка наказанием, а прекращение натяжения поводка отрицательным подкреплением. Я не собираюсь здесь спорить об академических тонкостях. Я использую термин «отрицательное подкрепление» как для предъявления неприятного стимула, так и для его удаления при выполнении нужного действия, чтобы подчеркнуть связь во времени и единство целей этих действий. Я также люблю отделять предъявление неприятного стимула, чтобы повлиять на текущее действие, от предъявления такового в момент, когда он уже не может повлиять на действие собаки, поскольку случается долгое время спустя. Этот последний тип я называю «наказание».
Различие важно, поскольку освещает два вопроса: 1) время и 2) необходимость представления альтернативного, желательного поведения. Продолжительность концентрации внимания собаки измеряется в секундах (у отдельных знакомых мне экземпляров пшеничников в наносекундах). Так что, чтобы отрицательное подкрепление работало, оно должно немедленно отвечать на нежелательное поведение. И чтобы быть честным, оно должно предоставлять собаке альтернативу – то, что собака может сделать – и она должна это знать – чтобы вы убрали неприятное воздействие.
Отрицательное подкрепление и наказание в реальном мире.
В Калифорнии дорожная полиция использует то, что называется «выговор», чтобы предупреждать превышающих скорость. К примеру, если вы едете со скоростью 72 мили в час там, где можно ехать не быстрее 65, то патруль поравняется с вами и полицейский внимательно на вас посмотрит. Если вы снизите скорость, он оставит вас в покое. Если вы не сбросите скорость, или того хуже, увеличите – он остановит вас и выпишет штраф.
«Выговор» — отрицательное подкрепление. Оно предоставляет неприятное воздействие (присутствие полицейского патруля) и возможность избежать неприятностей (снизив скорость). Удаление неприятного воздействия (полицейская машина удаляется, чтобы сделать еще чью-нибудь жизнь более интересной), когда вы замедляете ход, отрицательно подкрепляет ваши действия.
Выписывание протокола – это наказание. Если вы не сбросили скорость, или еще того хуже, увеличили ее, вас остановят; ваше нежелательное поведение уже в прошлом. Вы не можете избежать неприятных последствий. Штат применит некую степень ответной реакции на ваше нежелание следовать закону (или обычному здравому смыслу), оштрафовав вас или даже отобрав права. Повлияет ли наказание на ваше поведение в будущем? Люди платят штрафы и снова превышают скорость, и наши дороги полны водителей с временным разрешением вместо водительского удостоверения.
Тысячелетиями животные обучались техникой негативных последствий. Она работает. Тем не менее, отрицательное подкрепление – не для меня. Эти штрафы и другие меры могут удержать, а могут и не удержать в рамках правил. Может быть, все, чего они добьются – это вынудят купить антирадар.
«Умная» собака.
В дрессировке собак поведение избегания слишком часто преобладает. Обычное дело – увидеть собак, «сдувшихся» при переходе из Новичков в Открытый класс. Происходит ли это потому, что они слишком тупые, чтобы выучить более сложные упражнения? Нет. Во многих случаях это просто потому, что не делать ничего – самый простой путь избежать неприятных последствий ошибки.
Когда в обучение вводят наказание, субъект слишком быстро учится избегать или обходить его, а не делать правильно. Это как минимум частично объясняет то явление, которое называют «собака знает, что она на соревнованиях, и ведет себя плохо».
Это собака, которая плохо или совсем не работает в ринге. Некоторые спортсмены говорят, что она «издевается» над хэндлером. Некоторые говорят, что «она знает, что может не послушаться на соревнованиях, и ей за это ничего не будет».
Это все чепуха. Такие объяснения обвиняют собаку или приписывают ей какие-то извращенные мотивы, вместо того, чтобы сфокусироваться на неэффективности обучения. Все, что делает собака – результат обучения! Измененное поведение в ринге подпадает под одну из двух категорий: «фальшивый позитив» или избегание.
«Фальшивый позитив».
Собака, которую учили с помощью отрицательного подкрепления, научена, что отсутствие неприятных последствий означает, что она делает правильно. В ринге и без поводка (т.е. при полном отсутствии даже видимости возможности коррекции) никакие действия собаки не вызывают неприятностей. Значит, все, что делает собака в ринге – правильно. Я называю это «фальшивый позитив» — собака неправа, но в соответствии с методикой ее обучения получается, что права.
Избегание.
Неприятные воздействия порождают избегание. При встрече с ними целью становится избежать их. Вы делаете то, что должны, только потому, что иначе не удастся их «выключить». Словами Мюррея Сидмана, «отрицательное подкрепление вызывает побег. Когда мы сталкиваемся с неприятностями, мы любым способом стараемся избежать их. Когда мы сталкиваемся с ними опять, мы используем то, что сработало в прошлый раз». В ринге собака может «смыться» как дословно, убежав оттуда, так и образно (не выполнив команду). И, как замечает Сидман, «если мы контролируем других с помощью неприятных воздействий, мы тоже ассоциируемся с неприятностями». Вот почему часто «отказное» поведение в ринге сопровождается действиями или движениями, показывающими неприязнь или боязнь хэндлера.
Положительное подкрепление – не «мотивационная» дрессировка.
Один из подходов к решению проблем «отказа в ринге» лежит в «мотивационной» технике. Я не буду говорить здесь о «мотивации» как таковой. Тренеры этой школы не отказываются от негативного воздействия на собаку как от основы дрессировки. Они просто «перевешивают» неприятное воздействие игрушками, лакомством и энергичной похвалой. Это как прикрыть печенку взбитыми сливками. Мотивационная дрессировка часто служит для маскировки скрытой проблемы: дрессировка, основанная на негативе, в действительности демотивирует и собаку, и хэндлера. Лучшие спортсмены зачастую долго и упорно ищут собаку, которая могла бы выдержать обучение. И очень мало спортсменов на самом деле могут хорошо дрессировать этим методом.
В отличие от метода дрессировки отрицательным подкреплением обучению с положительным подкреплением свойственно мотивировать обоих. Помните слова Скиннера: «Частое поощрение также строит и поддерживает заинтересованность человека в том, что он делает». С собакой то же самое. Собака работает потому, что она выучила, что ее собственные действия могут принести хороший результат. У нее развивается заинтересованность в том, чтобы сделать правильно.
Многие тренеры традиционной школы, которым понравилась эта идея, возвращаются с вопросом «что же делать, если она не хочет делать то, что нужно?». Вопрос мимо цели.
Во-первых, если вы построили у собаки понимание «дрессировочной сделки» правильно, нет причин, по которым она откажется работать. В конце концов, когда вы даете команду, вы даете возможность «заработать». Почему она не послушается? Это не тот случай, когда собака не работает, пока ее не заставишь.
Во-вторых, если собака не выполнила что-то – это ерунда. Никто не совершенен. Цель дрессировки – получить очень высокую степень вероятности. Но неважно, насколько высока эта степень, все – и люди, и собаки – периодически ошибаются. Задача в том, чтобы получить максимально лучший результат с максимально возможной частотой. Дрессировка с положительным подкреплением дает возможность добиться этого быстрее, более надежно и с более стабильными результатами, чем дрессировка с принуждением.
«Суеверное» поведение.
Отбор поведения начинается с «суеверного поведения». В «Науке и поведении человека» Скиннер утверждает, что «если между действием и предъявлением поощрения связь случайна, то поведение называется «суеверным». Стиви Уандер объяснил это проще: суеверие – когда «вы верите в то, чего не понимаете». В дрессировке это то поведение, которое собака повторяет, потому что по причинам, которые она (еще!) не понимает, оно приносит хорошие результаты.
Например, где-то в пост-юрском периоде, пока дикие пуделя еще скитались по земле, я охотился и собирал плоды и резал что-то мясное на разделочной доске. Поскольку Сэм крутился у меня под ногами, отлетевший кусочек мяса упал на пол, и Сэм его подобрал. С тех пор, как только я достаю разделочную доску и начинаю рубить, Сэм тут как тут. Он не знает, почему он получил вкусное, но оно было, и если по случайности изредка будут падать еще куски (не то чтобы постоянно, но я бываю неуклюж), то это увеличит вероятность того, что при виде доски он будет сидеть и облизываться.
Возможно, я уже рассказал все, что вам надо знать об отборе поведения и его сохранении. Однако я все же допишу книгу, если позволите.
В обычном процессе оперантного научения вы просто положительно реагируете на желательное поведение, предложенное животным. Например, вы учите щенка сидеть. В первое время вы просто поощряете его, когда он садится сам. Через два-три раза щенок начнет садиться при каждой удобной возможности. Я учу «сидеть» с каждой собакой именно так, подлавливая момент. Мы взяли нашего трехлетнего метиса Шкипера в то время, когда у меня вообще не было ни минутки на дрессировку. Но я начал с ним «ознакомление с кликером», и уже после одного занятия он умел сидеть. Когда он думает, что он в беде или просто не уверен в смысле происходящего, он садится.
У одного из моих клиентов собака отказывалась лечь. Неважно, как я двигал рукой, чтобы побудить ее лечь, она только наклоняла голову, оставляя ноги прямыми. Однажды я попробовал нажать на круп, она вывернулась и ушла. Так что я оставил ее в покое, и мы, люди, отправились поговорить о политике за чашкой кофе. Через несколько минут она легла в углу. Я щелкнул и бросил ей кусочек. Еще несколько повторений, и я смог ввести команду при укладке. Владелец занимался с ней всю следующую неделю, и она ложилась по команде.
Начните с того, что дает вам собака. Поощряйте все, что отдаленно напоминает движение в нужном направлении. Поднятие планки просто означает, что собака должна приложить немного больше усилий именно в том направлении, которое нужно вам.
Применение кликера.
В этой книге я говорю о «кликер-дрессировке», что является сокращенным от «метод оперантного научения, основанный преимущественно на положительном подкреплении и включающий систематическое применение условного поощрения». Если вы собираетесь дрессировать собаку так, как я описываю здесь, вам обоим надо чувствовать себя комфортно при использовании кликера.
Ранее я говорил о том, почему надо использовать кликер. Давайте теперь поговорим, как им пользоваться. Первый шаг – сделать кликер для собаки условным поощрением. Вы должны быть уверены, что она поняла и приняла, что «щелк» означает «хорошее на подходе».
Вырабатываем ассоциацию.
Идея проста: создать рефлекторную связь между звуком («щелк») и безусловным подкреплением («лакомство»). Собака учит что щелчок=лакомство. Просто щелкните и немедленно покормите. Повторите так пять раз. Делайте так четыре-пять занятий. Вам может показаться задолго до двадцать пятого повторения, что уже все хорошо, но доделайте до конца. Это настолько важный фундамент всего в будущем, что не надо упрощать себе жизнь. Не торопитесь.
Необходимо обращать внимание с самого начала на время подачи сигнала. На этой стадии вы не подкрепляете никакое отдельно взятое поведение, так что вам не надо думать о времени подачи сигнала в момент нужной вам реакции. Но вы должны стараться дать безусловное подкрепление как можно быстрее после условного. Тогда у собаки будет немедленная ассоциация щелчка и куска. Если же вы будете медлить между подачей сигнала и поощрения, то собака добавит еще какое-нибудь «суеверное» поведение (например, прыжок на вас за лакомством). Щелкните и немедленно кормите!
Я не сторонник того, чтобы позволять собаке подбирать лакомство с пола. Я не хочу, чтобы у нее образовалась привычка вынюхивать еду. Все лакомство должно исходить из моей руки. Если вы уроните кусок, поднимите его раньше, чем собака. Помните Сэма и разделочную доску!
Иногда собака не делает ничего, пока вы устанавливаете ассоциацию с кликером. Но помните, что поведение – это все, что не может сделать мертвая собака, так что ваша собака все же будет делать хоть что-нибудь – сидеть, царапать вас лапой, вставать на вас, что угодно. Каждый раз, как собака делает что-то, что вас устраивает, или отдаленно напоминает то, что вам нужно и из чего вы позже разовьете нужное вам поведение, щелкайте и кормите! Вы будете убивать двух зайцев одновременно: укреплять ассоциацию щелчка с поощрением и поощрять желаемое поведение.
Если хотите, вы можете даже просить собаку сделать маленький кусочек поведения, например, «все четыре лапы на полу». Это хороший способ выработать у щенка поведение, несовместимое с прыжками на вас; это также начальный этап обучения команде «стоять». Но не просите слишком многого! Вы можете просить «приземлиться попой на землю», но не просите о посадке на уровне соревнований. Главное, что собака делает что-то, что может послужить основой для выработки навыков.
Если вы хотите добиться от собаки простого поведения, вы должны быть аккуратны. Надо быть уверенным, что собака понимает, что щелчок=поощрение, независимо от ее позы или местонахождения. Так что щелкайте и кормите ее, когда она стоит, сидит, лежит, идет и т.д. Т.е. собака должна понять, что щелчок означает одно и то же всегда, а не связывать его с одним-двумя вариантами поведения.
Вот пример того, как знакомство с кликером влияет на поведение собаки. Многие дрессировщики часто щелкают и поощряют собаку, когда она сидит перед ними. Не осознавая этого, они учат собаку нескольким вещам одновременно: ассоциации щелчка и куска; посадке; фронтальной посадке. Когда они потом начинают двигаться с собакой у левой ноги, при остановке собака забегает вперед и садится перед ними. Почему? Потому что за это было выдано первое поощрение, выученное собакой.
Скиннер давал условное подкрепление, когда животное смотрело не на него. Не потому, что ему нужно было внимание животного; Просто для того, чтобы научить его, что щелчок будет независимо от того, что оно делает. Постарайтесь привить собаке эту первую ассоциацию в как можно более разнообразных формах, без связи с определенным поведением.
Чтобы было легче
Иногда трудно втянуться в работу с кликером, особенно, если у вас большой опыт традиционной дрессировки. Обычно затруднения вызывают две вещи: как это – подкреплять поведение, не давая команды? И второе – время подачи сигнала. Дальше мы обсудим и то, и другое в деталях; но пока что, если вы чувствуете сложности, то вместо того, чтобы сразу пытаться заниматься формальным обидиенс, попробуйте позаниматься трюками. Поучите собаку «просить», «умри», «дай лапу», «вольт», «поклон» или еще что-нибудь. Попробовав себя в обучении собаки трюкам с помощью кликера, вы научитесь чувствовать нужный момент подачи щелчка и разовьете умение наблюдать. Это забавно и легко. Вы с собакой поймете радость от новых правил игры, не разрушив то, что вы уже успели наработать, и вы можете себе позволить ошибаться, поскольку это не повлияет на выступление собаки.
Проверяем ассоциацию.
Через два-три занятия можно проверить, насколько прочна ассоциация щелчка с поощрением у собаки. Вот пара вариантов проверки:
Собака настораживается при звуке. Что бы не делала в тот момент собака, щелкните. Понаблюдайте за ее реакцией. Если она уже поняла связь, то вы увидите «ожидание» — поднятая голова, настороженные уши, глаза смотрят на вас. Если же заметной реакции не будет – связь не выработана.
Пусть собака предложит поведение. Вы щелкали, когда собака сидела, стояла и лежала, но один из этих вариантов неизбежно повторялся чаще. Ничего не делайте. Подождите, пока собака примет одно из положений и щелкните и покормите. Теперь пусть собака снова начнет двигаться, и подождите, пока она снова предложит это поведение. Это не должно занять много времени. Щелкайте и кормите.
Реакция вашей собаки на проверку в середине процесса приучения подскажет вам, как все идет. Но даже если реакция будет полностью соответствовать описанию, продолжите процесс приучения к кликеру до конца.
Поддерживаем ассоциацию.
Две самых распространенных ошибки – щелкать без поощрения и поощрять без щелчка. Правило таково: один щелчок – одно поощрение. Не щелкайте без подкрепления (в начале оно должно следовать за щелчком немедленно), и не поощряйте собаку без щелчка.
Никогда не щелкайте без поощрения.
Связь щелчка с кусочком – своего рода ваш разговор с собакой, когда вы ей говорите: «Когда ты делаешь то, что мне нужно, ты получаешь то, что хочешь, и этот волшебный звук говорит тебе, что кусок уже идет». Это дрессировочная сделка. Чтобы сделка оставалась в силе, обе стороны должны выполнять обязательства.
Думайте о каждом щелчке как о долговой расписке. Если вы заведете привычку щелкать и не давать лакомство (заменив щелчком слово «хорошо» или используя его в значении «молодец, продолжай»), вы быстро залезете в долги. Ваша собака подумает: «Ага, этот парень не доставляет оплаченный товар». Это разрушит «дрессировочный договор». Звук кликера больше не будет иметь единственного и неповторимого значения. Если это произойдет, он потярет свою силу.
Никогда не кормите, не щелкнув вначале.
Цель установить кликер как волшебный звук», который говорит собаке «Это было правильно». Так что когда собака делает определенное действие правильно, она слышит щелчок (условное поощрение), после которого она ожидает лакомство (безусловное поощрение). Другими словами, получение поощрения зависит от звука. Собака учит, что лакомство не появится, пока она не услышит звук.
Так что, если вы кормите собаку без щелчка, вы уменьшаете значение кликера, показывая ей, что хорошее не обязательно следует после «волшебного звука». Получается, что вы говорите: «Неважно, был ли волшебный звук, вкусное ты все равно получишь». На начальных стадиях это может показаться неважным. Но кликер-дрессировка работает потому, что собака работает за звук. Это становится очевидным в более продвинутых стадиях занятий. Но последовательное соединение условного и безусловного поощрения делает условное поощрение сильным.
Так когда щелкать и кормить?
Время подачи маркера – это все. В начале, вы будете щелкаь немедленно, как только собака дает вам поведение, которое вам нужно. В простом примере с обучением собаки сидеть вы щелкаете в момент касания «штанов» земли. Это обозначает то самое действие, которое хотите поощрить.
Однако очень важно рано приучить собаку к важному принципу: поощрение прибудет, но не всегда немедленно. «Иногда», скажете вы собаке, «надо еще немного поработать за этот щелчок». Это не нарушает дрессировочный договор. Вы все же поощряете, и принцип «один щелчок – одно поощрение» сохраняется. Вы просто увеличиваете время и требуете немного больше усилий.
Важно, чтобы собака рано поняла этот принцип. Он лежит в основе вариабельного подкрепления. Если ваша собака не привыкла к нему в начале, вам будет трудно убедить собаку сделать нужное вам действие два, три или четыре раза, чтобы заработать один щелчок. Собака настолько привыкнет к принципу «одно действие=один щелчок», что отсутствие щелчка будет ее разочаровывать, в то время как должно, наоборот, вдохновлять на увеличение усилий.
Так что, например, в обучении собаки сидеть, как только она начинает садиться регулярно, начните увеличивать промежуток между моментом посадки и щелчком. Пару занятий считайте до двух. Потом пару занятий – до трех, потом до четырех, до пяти и так далее. «Отпускайте» собаку после щелчка (пусть встанет). Это подтвердит, что «щелчок заканчивает поведение».
Давайте посмотрим еще на пару вещей, которые являются базой кликер-тренинга.
Научите собаку ее кличке.
Это может показаться глупым, но… знает ли ваша собака свое имя? Это что-то настолько основное, что мы все считаем, что наши собаки знают, как их зовут. А это совсем необязательно.
Впервые я заметил это у Дилана. Он был так готов что-то делать, что когда я звал Сэма, Дилан тоже прибегал. Потом я заметил в группах, что частенько дрессировщик называет кличку собаки – а в ответ ноль реакции. И конечно, то, что собака не реагирует, вызывает злость и раздражение у владельца. Простой факт же состоит в том, что собака учит свое имя как и все остальное – через позитивную ассоциацию.
Когда я говорю, что собака «должна знать свою кличку», я имею в виду, что она должна реагировать на произнесение клички как на команду. Выполнением команды будет прекращение того, что она делала, и взгляд на хозяина.
На ранних стадиях щенячьего воспитания я учил Боузера приходить ко мне, когда я называл его кличку, даже без команды «ко мне». Это так же то, чем я специально занимаюсь с клиентами. Это не создает проблем для спортсменов, который должен иметь возможность назвать кличку собаки перед командой, не сорвав ее при этом (когда собака выполняет команду, которую еще не произнесли) [в международных правилах по обидиенс произнесение клички расценивается как дополнительная команда]. Несложно в процессе обучения приучить собаку ждать команды после клички. Однако, есть случаи, когда очень полезно иметь возможность вернуть собаку или заставить ее прекратить то, что она делает, просто назвав ее кличку.
Вот пример. Мы переехали в высокогорную пустыню в конце 1995 г. Где-то через месяц после переезда на Дилана напала соседская потеряшка (смесь ротвейлера с койотом, если вы можете себе такое вообразить) и серьезно покусала его. Он выпал из тренировок на три месяца. У нас с ним было уже два квалификационных очка для очередного титула, и наконец в конце апреля я заявил его на соревнования, чтобы набрать последнее очко. Он был очень рад, что он снова в ринге. После апортировки он еще больше перевозбудился, потому что впереди предстояли барьеры. Он пару раз скакнул, сделал пируэт и рванул из ринга. Я спокойным голосом сказал «Дилан», даже негромко, и он немедленно вернулся. Мы получили небольшой штраф; судья потом сказал мне, что он потрясен тем, как просто я восстановил контроль над собакой. С другой стороны, я часто видел собак – даже тех, кто набирал очень высокие баллы за свою карьеру – которые покидали ринг и отказывались вернуться. Если ваша собака действительно знает свою кличку, у вас есть мощный инструмент для контроля над ней в непредвиденных ситуациях.
Мне нравится, чтобы звук клички собаки был для нее очень приятен, чтобы она немедленно переориентировалась на меня.
Обучение собаки кличке – это выработка рефлекторной реакции. Происходит это так же, как и любое другое обучение. Вы пять-десять раз за каждое из пяти или десяти занятий называете кличку собаки, щелкаете и кормите ее. Когда голова собаки начнет поворачиваться к вам без колебаний, увеличьте время между реакцией и щелчком/поощрением. Сначала щелкайте в момент поворота головы. Потом вы молча отсчитываете одну секунду, потом две, три и т.д. перед тем, как щелкнуть. Оставайтесь на каждом этапе не меньше одного дня.
Это научит собаку смотреть на вас все дольше и дольше до получения поощрения. Двигаясь постепенно, шаг за шагом, вы заложите основу для работы «на внимание». Развитие в собаке умения долго и внимательно на вас смотреть с щенячьего возраста – это вклад в банк спортивного обидиенс.
Следующий шаг для вас – стоять неподвижно, позволив собаке свободно гулять (в закрытом пространстве, для ее безопасности), и назвать кличку. Сначала собака, возможно, только повернет голову. Щелкните. Это побудит собаку подойти к вам за лакомством. Это не подзыв. Щелчок за то, что собака посмотрела на вас, а не за то, что она идет к вам. Единственная причина, по которой собака подходит – она знает, что вы не будете за ней гоняться с лакомством, а ей придется прийти за ним самой. Так что побочным эффектом от этих упражнений будет то, что для собаки будет приятно подходить к вам и она это запомнит, но цель обучения не в этом.
Что, если собака не отреагирует на кличку? Значит, она еще не готова к переходу на следующий этап. Не ругайтесь. Просто подойдите к ней поближе, чтобы она обратила на вас внимание, и щелкните. Покормите, когда она взглянет на вас. Потом вернитесь на предыдущую ступень.
Когда собака подходит к вам за лакомством, вы можете попятиться от нее на шаг или два после щелчка. Это побудит ее двигаться быстрее. Теперь кличка начинает приобретать значение подзыва.
Цель этого обучения – выработать у собаки такую реакцию на кличку, чтобы вы могли с легкостью «переключить» ее на себя в сложной ситуации. Это не только хороший механизм «безопасности», он незаменим и в ринге, где представляет собой удобную «ручку» для управления собакой без физического контакта.
Вы можете счесть это чепухой, но это не так. Я уже приводил вам в пример Шкипера. Кроме того, что он умел садиться по команде, он знал, что надо приходить, когда зовут. Я отпускал его свободно гулять по нашим владениям; он гулял по всем 15 акрам, включая неогороженную территорию соседей. Все, что мне нужно было сделать – крикнуть «Скип!», и он тут же прибегал, несмотря на всякое интересное вокруг (а уж поверьте, в краю лошадей и койотов интересного предостаточно).
Как и любая другая команда, кличка собаки должна иметь одно и то же значение всегда. Это означает, что вы должны научить собаку реагировать на нее, даже если вы произносите ее нейтральным тоном. Добавлять к имени цветы и духи из слов неправильно. Не приторность создает связь, а положительное подкрепление.
Режимы подкрепления.
Когда вы начинаете обучение поведению, вы поощряете в соотношении 1:1. Т.е., одно действие собаки приносит один щелчок (и одно поощрение). Это называется постоянно подкрепление. Главная цель – просто объяснить собаке, что есть желаемое поведение.
Когда собака начинает понимать, чего от нее хотят, вам нужно не только сохранить это поведение, но и закрепить его. Закрепить – это сделать выполнение действия не только более стабильным, но и устойчивым к затуханию. Есть два способа достичь этого.
Постоянное подкрепление.
Один способ – это сохранять 100%ный режим подкрепления, но постепенно все увеличивать и увеличивать количество повторений. Используя много (и говоря «много» я имею в виду сотни) повторений на каждой стадии развития, вы установите очень высокое соотношение удачных попыток выполнения к неудачным. Это дает вам вероятность того, что скорее всего, вы получите высокий процент успеха. Главное правило при использовании этого варианта поощрения – вы не должны повышать сложность действия, пока правильное выполнение не составит 8 из 10 на каждом уровне обучения.
Вариабельное подкрепление.
Другой способ достичь этого – начать подкреплять действия собаки в вариабельном режиме. Это значит, что вместо соотношения 1:1 вы будете поощрять собаку 2:1, 3:1 или даже выше. Теоретически вы можете увеличивать соотношение до бесконечности.
Я позже расскажу о настоящем искусстве работы с вариабельным подкреплением.
Что и почему использовать.
Дрессировщики, работающие оперантным методом, могут спорить о превосходстве того или иного режима поощрения бесконечно. На мой взгляд, это прежде всего зависит от того, что вам надо получить. Определенные действия (например, «решения задач» — как выборка) требуют постоянного подкрепления. Собака должна знать, что она права, каждый раз.
Другие действия – например, длительные, как выдержка сидя – могут быть выработаны только при вариабельном режиме, потому что просто нет другого способа научить собаку сохранять положение или продолжать действовать, пока вы задерживаете выдачу поощрения на все более долгое время.
В общем, мое предпочтение (и это только вопрос личного вкуса), при обучении любому действию, требующему точности – например, при посадке перед хэндлером – работать с постоянным подкреплением и большим количеством повторений. Я обычно использую вариабельный режим для действий длительного характера.
Угасание и как оно работает.
Когда вы работаете с вариабельным подкреплением, вы работаете с режимами подкрепления, которые имеют тенденцию способствовать угасанию поведения. Поэтому, чтобы понять, как работает вариабельное подкрепление, вам сначала надо понять, что такое угасание.
Основной принцип отбора поведения – поощряемое поведение имеет тенденцию повторяться, а непоощряемое поведение исчезает или угасает. Угасание полезно. Иногда вы можете прекратить нежелательное поведение, просто игнорируя его (перестав поощрять).
Поведение, которое поощряется постоянно, становится более-менее устойчивым к угасанию, но все же довольно легко поддается ему. Простой пример – когда вы пишете шариковой ручкой. Если она перестает писать, вы ее встряхиваете. Если она все же не пишет, вы ее выбрасываете. Ваш опыт с ручкой был основан на постоянном подкреплении: ручки всегда пишут. Когда ручка закончилась, вы избавились от нее. Поведение – использование этой ручке – немедленно угасло.
Теперь давайте представим, что вы встряхнули ручку, и она снова начала писать. В следующий раз, когда вам покажется, что она закончилась, вы ее снова встряхнете. Если она снова начнет писать, вы будете использовать ее дальше. Теперь ваш опыт пользования ручкой основан на вариабельном подкреплении: ручка иногда перестает писать, но при приложении некоторых усилий начинает писать вновь. Вы будете использовать эту ручку до тех пор, пока не будете уверены, что она точно закончилась. Поведение использования этой ручки устойчиво к угасанию.
Важное следствие идеи угасания — «угасательный взрыв». Т.е., поведение, устойчивое к угасанию, усиливается при отсутствии поощрения перед тем, как начать угасать. Возвращаясь к примеру с ручкой, если она снова начинала писать после одного-двух встряхиваний, а в какой-то момент вы ее встряхнули, а она не пишет, вы ее потрясете сильнее. Это и есть «взрыв».
Еще один пример из жизни: орущий ребенок. Родители пытаются игнорировать крики, и он орет еще громче. Если родители могут перетерпеть, вопли постепенно прекратятся и истерика закончится. Усиление криков – угасательный взрыв.
Так вот. На пути к угасанию поведение, устойчивое к нему, интенсифицируется. Что произойдет, если вы подкрепите поведение в момент усиления? Вы поощрите усиленное поведение, и оно станет еще более устойчивым к угасанию.
В стремлении использовать ручку до конца я доходил даже до того, что зажигал спичку и грел кончик стержня в надежде, что еще появятся чернила. Это настоящий «взрыв угасания». И если ручка снова начнет писать, это поведение еще больше укрепится. Что происходит в случае детской истерики, если у родителей сдают нервы? Они дают ему конфету. В этом случае поведение закрепляется. И истерика становится уже убойной.
Угасание и вариабельное подкрепление.
Если мы будем придерживаться нашего примера с детской истерикой, мы можем рассматривать «сдачу» родителей как вариабельное подкрепление. Родители не поощряют истерику сразу, но заставляют ребенка продолжать ее до какого-то неопределенного предела прежде, чем дать ему подкрепление. Ребенок учится, что чтобы получить поощрение, ему надо усилить истерику и по интенсивности, и по продолжительности.
Вот так и работает вариабельное подкрепление. Как только поведение становится стабильным, вы перестаете подкреплять каждое его предъявление. Вы поощряете каждое второе или каждое третье выполнение. Потом каждое четвертое или пятое. Собака учится, что подкрепление будет позже, но не знает, когда и какой именно вариант выполнения его принесет. Так что собака продолжает работать в отсутствие подкрепления, стараясь все больше и больше, чтобы вынудить вас сделать этот «волшебный звук».
Если вы соедините идеи угасания и подкрепления, то увидите, что вам надо очень тщательно планировать вариабельное подкрепление. Если вы будете осторожничать, то не доведете ситуацию до «угасательного взрыва». Если же перестараетесь, то поведение угаснет. Это искусство.
При описании различных упражнений я буду прикладывать примерные «рецепты» вариабельного подкрепления. Они – точка отсчета, и вы будете их оптимизировать под собственные нужды. Это обязательно. Есть, однако, пара идей, которые должны применяться всегда.
Эффект «йо-йо» (баланс между двумя крайностями).
Планируя любое расписание вариабельного подкрепления (ВП), вы должны попасть в область «угасательного взрыва», не доведя при этом поведение до угасания. Это означает, что вы должны растягивать режим подкрепления до крайностей, в то же время периодически подкрепляя поведение в тех рамках, в которых оно устойчиво. Я называю это «эффект «йо-йо». Типичная программа такого баланса – обеспечить поощрение в рамках плюс-минус 50% от установленного значения.
Вот простой пример. Скажем, собака умеет сидеть на выдержке 5 секунд. Мне нужно довести это время до нескольких минут. Если я просто оставлю ее сидеть на неопределенный период без подкрепления, я вырабатываю угасание (другими словами, я обеспечиваю собаке ошибку в выполнении, потому что он так еще не умеет). Вы все время видите это при занятиях в группах. Собаки сидят несколько секунд, а потом встают и идут заниматься своими делами (и наказывать их за это по меньшей мере нечестно. Вы просите собаку сделать то, что находится пока за пределами ее возможностей, а потом наказываете за то, что она не справилась. Неверно.)
Так что я буду удлинять время выдержки в вариабельном режиме. «Заданное значение» — 5 секунд. Плюс-минус 50% дает нам режим подкрепления от двух до семи секунд. Я буду щелкать и кормить собаку в этом промежутке. Как минимум по три раза будут сделаны обе крайние точки. И иногда я буду поощрять «быстрые» варианты – поощрять одну секунду выдержки. Это фактор «сюрприза», который избавит собаку от убеждения, что дальше будет все сложнее и сложнее.
Когда собака надежно сидит 5 секунд, я начну работать с «заданным значением» 7 секунд. Теперь я поощряю выдержку в промежутке от 3 до 10 секунд. Потом «заданным значением» станут 10 секунд, и промежуток для поощрения будет уже от 5 до 15 секунд. Потом «заданным значением» будет 15 секунд, промежуток для поощрения от 7 до 22 секунд. И так далее.
Вы можете так работать с любым продолжительным поведением (хождение рядом, например).
Вы также можете использовать ВП, чтобы усилить отдельные действия, например, фронтальную посадку или апортировку. Прося собаку сделать это не один раз, а несколько, прежде чем дать ей поощрение, вы учите собаку продолжать стараться. В этих видах действий ВП даст более прямую посадку, более быстрый подход, более качественный подбор гантели. Однако будьте осторожны: поскольку вы просите о точном, повторяющемся поведении, вы можете получить проблему, если переборщите с количеством повторений между подкреплением. Собака может стать «изобретательной», и вы разрушите все то, что уже сделали.
«Джек-поты».
С ВП вы просите собаку стараться больше и дольше, чтобы заработать поощрение. Но здесь есть маленькая скрытая ловушка: если «зарплата» всегда та же самая, вы скоро начнете получать все снижающуюся отдачу. В конце концов, почему собака должна работать больше, если поощрение не увеличивается? У собаки выработается то же чувство обиды и избегание работы, как и у сотрудника, который получает все больше обязанностей за ту же зарплату.
Ответ лежит в выдаче «джек-потов». Расценивайте его как бонус – как говорит Гэри Уилкс, «премия за отличие». Это не значит, что вы должны опустошать всю сумку для лакомства каждый раз, как собака сделает хорошо. Но когда ВП побудит собаку сделать лучше, чем обычно, дайте ей не один кусочек, а два или три, или целую горсть. Или что-нибудь особенное. Можно даже, если задача была сложна для собаки или она сделала что-то экстраординарное, закончить занятие, поиграть с ней немного и дать кость вместо кусочка лакомства.
Джек-пот – мощный инструмент ВП, который может повысить вероятность повторения усиленного поведения в будущем. Собака поймет, что сверхусилия приносят сверхпоощрение, и будет стараться в будущем.
С джек-потом легко перестараться. Не надо использовать его как «мотиватор» в смысле того, что давать его собаке независимо от качества ее работы. И не надо давать его в ответ на плохую попытку (в качестве моральной поддержки). Это только поощрит плохое выполнение, а не побудит собаку лучше стараться. К тому же джек-пот должен быть напрямую связан со сверхусилиями собаки. В конечном итоге вы сможете поощрить джек-потом выполнение собакой всей программы обидиенс полностью, но до этого еще работать и работать. Если вы дадите джек-пот за несколько упражнений, выполненных подряд, и некоторые из них будут отличными, а некоторые выполнены так себе, что именно вы поощрите?
Так что джек-пот – это тоже форма ВП. Используя его вместе с режимом ВП вы можете расширить не только частоту, но и природу и качество безусловного поощрения. Все эти вариации делают дрессировку более интересной для собаки и много дадут для улучшения выполнения.
Ошибки вариабельного подкрепления.
Дрессировщики «приказной» школы иногда беспокоятся: «Когда работаешь с ВП, как собака узнает, она не получает поощрения потому что ошиблась, или потому что она права, но ты хочешь получить от нее больше?» Ответ – собака не знает, да и не должна; и до какой-то степени это неважно.
Если я использую ВП для отработки длительного поведения, я должен сам знать, что не надо просить собаку сделать больше, чем она готова на данный момент. Если я использую ВП для усиления точного поведения, поощряя только третье-четвертое выполнение, проблема возникнет, если я начну это делать прежде, чем собака готова. Я просто не смогу получить три, четыре или даже пять правильных исполнений между поощрениями. Это одна из причин, по которой я предпочитаю постоянное поощрение при отработке однократного точного действия.
Но давайте предположим, что вы работаете с ВП, и собака что-то сделала, а вы ее не поощрили. И давайте предположим, что она ошиблась. Что произойдет дальше? Скорее всего, вы увидите короткий «угасательный взрыв» в одном из двух вариантов. Либо собака снова попробует «неправильное» поведение, либо она постарается и сделает правильный вариант лучше обычного.
Если она предложит неправильный вариант, то что? Пусть работает «угасательный взрыв». Неверное поведение быстро исчезнет. Почему? Потому что вы никогда его не поощряли. Собака «попробовала воду» и обнаружила, что этот неправильный вариант ничего не дает. Больше этого действия в ее репертуаре не будет. Что произойдет дальше? Собака будет выяснять, что же именно вам от нее надо. Когда она сделает то, что надо, что случится? Вы немедленно это поощрите. Это вопрос взаимодействия. После того, как собака сделала ошибку, вы дадите ей знать, что вот теперь она сделала правильно. После пары повторений со стопроцентным подкреплением вы сможете снова вернуться к вариабельному режиму.
С другой стороны, если после совершения ошибки собака «требует» поощрения и предлагает правильное (или, по крайней мере, «более правильное») действие, поощрите ее немедленно. Этот процесс поможет прояснить для собаки, что именно вы от нее хотите.
В этом контексте я могу сказать, что я хочу, чтобы мои собаки ошибались (на тренировке, чтобы мне это удовольствие не стоило двадцати долларов стартовых взносов). Ошибка говорит мне, что собака проверяет рамки действия. Проявив терпение и дав собаке возможность и время проверить и найти все параметры действия, вы через поощрение дадите собаке сделать выбор правильного варианта. Это еще больше укрепит поведение. Не дать собаке возможности ошибаться означает исключить этот процесс познания из обучения. Если вы так сделаете, вы можете быть уверены, что ошибки вылезут на соревнованиях.
Это снова возвращает меня к идее положительного подкрепления как к «отношению». В то время как я часто мечтаю о том, как мои собаки будут выступать идеально, в реальной жизни они иногда делают ошибки. Что-то идет не так. Вопрос в том, как собака реагирует на проблему. Если собака научена, что ошибка приносит наказание, она застынет: безопаснее не делать ничего, чем ошибиться. Я не хочу, чтобы мои собаки боялись ошибиться. Я хочу, чтобы они из нашего тренировочного опыта знали, что когда что-то идет не так, они могут с этим справиться. Я предпочту, чтобы они попытались и не смогли, чем чтобы они не пытались вовсе.
Когда Дилан был готов выступать в первом классе, я заявил его на соревнования. В апортировке через барьер я бросил гантель, и она потерялась в высокой траве. Я ее даже не видел. Дилан прыгнул, поискал ее с любопытством, не нашел и вернулся через барьер без нее. Судья сказал (это были неофициальные соревнования): «Он отказался делать апортировку! Дерни его за ухо!» Я ответил: «Да нет, он ее просто не нашел». Я пошел вместе с Диланом и показал ему гантель. Он ее поднял и вернулся с прыжком через барьер. Потом мы переделали упражнение.
Через несколько месяцев мы снова участвовали в соревнованиях. История повторилась – я бросил гантель, она укатилась в траву. Дилан прыгнул туда, не нашел гантель, подошел опять к барьеру, вопросительно на меня посмотрел, потом повернулся, нашел гантель и принес ее. Поскольку он все это время работал, мы не потеряли баллов. На тех же соревнованиях собака другого спортсмена не нашла гантель и встала на месте, получив за это ноль: этот спортсмен много использует «коррекцию».
Я уверен, что если бы я дернул Дилана за ухо на тех неофициальных соревнованиях (я, кстати, никогда этим не пользовался, но об этом позже), он не был бы уверен в том, что надо делать, если не можешь найти гантель на соревнованиях. Вместо этого он отлично справился, потому что знал, что бояться нечего, если ошибся.
Команды шепотом.
Хотя АКС не допускает глухих собак на соревнования, большинство из выступающих должны быть глухими – так много спортсменов выкрикивает команды, даже на движении рядом. Странно, что за это редко снимают баллы, хотя в правилах написано совершенно четко: «Громкие команды спортсменов собакам создают неприятное впечатление от спорта и надо избегать их применения. Кричать необязательно даже в шумном месте, если собака хорошо обучена слушать команду, поданную нормальным тоном. Команды, которые, по мнению судьи, подаются излишне громко, должны штрафоваться».
Хотя я не могу поручиться за точность передачи последнего предложения, это простой факт – не надо кричать собаке, которая не бывает в ринге дальше 15 м. Слух собаки примерно в 20 раз острее, чем у человека. Насколько немедленно реагирует ваша собака на шуршание целлофанового пакетика? Собака может за 400 м услышать то, что мы не услышим за 100 м. Пастухи в Шотландии, Уэльсе и Новой Зеландии управляют собаками с помощью свистка на расстоянии до 3 км.
Давайте все команды в разговорном тоне. Помните, дрессировка – это общение. Вы говорите со своей собакой. Так что… говорите. Не кричите. Это даст вам несколько преимуществ.
Ваши занятия станут спокойнее. Вы будете более расслаблены. Ваша собака тоже. Для собак громкие звуки, издаваемые кем-то, признак стресса или агрессии. Если собака будет считать, что вы в стрессе или злитесь, она будет реагировать на это, а не фокусироваться на работе. Вы удивитесь, насколько лучше она начнет работать, если вы «уменьшите громкость».
Улучшится ваша работа в ринге. При работе тихим голосом собака должна больше концентрироваться на вас, не только глазами, но и ушами. Она учится слушать команды, даже когда вокруг шумно. Другими словами, она учится отсекать ненужный шум. Командуйте тихо, но ясно. Однажды в соревнованиях судья мне сказал, что на следующем уровне я смогу жульничать, потому что он еле слышал мои команды, стоя рядом со мной. Моя собака не пропустила ни одной.
Вводим команды.
До того, как вы можете «назвать» поведение при помощи команды, т.е. ожидать его исполнения от собаки по особому сигналу или слову, поведение должно быть оперантным – собака должна его добровольно предъявлять, чтобы получить поощрение. Только тогда можно вводить усложнение – поведение подкрепляется только в том случае, когда предъявляется в ответ на команду.
Сначала давайте разберемся, что такое команда.
Дифференцировочный раздражитель (ДР).
Команда – стимул (раздражитель) для выполнения поведения, т.е. что-то, что вызывает поведение в определенное время. Стимул не то же самое, что поощрение. Раздражитель вызывает поведение; поощрение усиливает поведение. Пример: жажда – стимул для меня пойти к крану и включить воду; когда вода течет, это поощряет поворот крана.
Мы должны отличать стимулы, которые вызывают поведение от раздражителей, которые не вызывают его. И те, и другие – дифференцировочные раздражители. Те, которые вызывают поведение, обозначаются Sd. Те, которые способствуют исчезновению поведения – SΔ (S delta). Помните слово «Нет»? Вот это оно.
Sd для одного поведение может одновременно являться SΔ для другого. Например, команда сидеть, данная, когда собака стоит, вызывает поведение сесть и прекращает поведение стоять. Конкретная команда, таким образом, дает собаке знать, какое именно поведение требуется в данный момент (и только оно одно). Я расскажу об этом больше в разделе про «стимульный контроль». Сейчас же это должно прояснить, почему вы не называете действие какой-либо командой, пока это действие полностью не сформировано у собаки: собака не может четко понять, что означает команда, потому что само действие для нее еще не ясно.
Если вы скажете «сидеть», ожидая от собаки всего лишь касания попой земли, потом будете говорить «сидеть» о конкретной позиции сидя, а потом добавите эту же команду для положений перед и рядом с вами, то вы хорошо объясните собаке, что «сидеть» относится к нескольким схожим (но качественно различным!) действиям. И поскольку вы добавляли критерии по ходу тренировок, не исключив как следует промежуточные, но более не нужные варианты действий, то получится, что вы постоянно работаете против себя. Вы не даете собаке четкой информации о том, как разобраться в целой куче разных действий, которую вы всю целиком называете «сидеть».
Пример «из жизни» может помочь вам разобраться, как нам приходится действовать даже в простейшей ситуации, чтобы вычленить нужный сигнал и ответить на него адекватно. Давайте представим, что вы ведете машину и приближаетесь к перекрестку со светофором. Подъезжая, вы видите красный свет. Как Sd, это сигнал к совершению определенного действия, в данном случае к остановке. Как SΔ, это сигнал, исключающий другие действия, т.е. движение вперед.
Вы также выучили, что «стой, пока горит красный свет, когда увидишь зеленый – двигайся». Но это не всегда так. Если вы подъезжаете к мигающему красному, это «остановись и двигайся дальше, когда путь свободен». Это еще один схожий сигнал с двумя значениями. Если же это мигающие стоп-сигналы автобуса, вы остановитесь в любом случае.
Не всегда красный свет означает «остановка». Если это мигающая аварийкой машина, которую тянут на тросе, вам необязательно останавливаться (если, конечно, вы не уперлись ей в бампер – в этом случае сделать правильный выбор вам поможет и то, что задние фонари будут вам видны очень большими из-за близкого расстояния).
Все эти вещи – это дифференцировочные раздражители. Сначала мы учим общее значение красного света, а уж потом все возможные вариации. Мы действуем, основываясь на этих выученных различиях. Но если вы внезапно столкнулись с вариантом, который вам раньше не встречался (например, одновременно горящие красный и желтый свет), от вас потребуется: а) осознать наличие нового сигнала; б) понять его значение; в) выбрать правильное действие. Скорее всего, вы поведете себя неуверенно, а то и неверно.
То же касается и дрессировки. Команда – дифференцировочный раздражитель. Она дает собаке информацию о том, какое действие из всех в ее репертуаре требуется именно сейчас, т.е., какое поведение принесет поощрение именно в данных обстоятельствах. Обычно при начале обучения вы начинаете заниматься в спокойной обстановке, чтобы помочь себе и собаке изолировать ее действия от окружающих факторов. Позже вы добавляете отвлечений, и вы должны научить собаку, что команда означает то же самое, что и раньше «в лаборатории».
Степень сложности дискриминации возрастает по мере вашего прогресса. Одной из проблем спорта является то, что в классах Новичков и Открытом хэндлер пользуется преимущественно голосовыми командами, а в Мастере – жестами. Так что собака должна выучить, что определенное движение руки – это дифференцировочный раздражитель, соответствующий определенной голосовой команде, выученной ранее. К тому же, поскольку сигналов несколько, а рук всего две, собака должна научиться различать разные движения одной руки. Здесь уже хэндлер должен отвечать за то, чтобы все сигналы были легко отличимыми и четкими.
В тренировке мы также очень часто сопровождаем команду разным тоном, движениями рук, корпуса, поводка и т.д. Большинство из этого случается бессознательно. Когда я готовил Вуди к классу Новичков, меня вел один из опытных спортсменов нашего клуба. Однажды, когда мы отрабатывали переход из фронтальной посадки в основную позицию, она посмотрела, как мы сделали это, и попросила меня прижать правую руку к бедру и просто сказать «Рядом». Я сделал так, и Вуди не шевельнулся. За месяцы дергания поводком вправо, хоть и слегка, я выработал рефлекс дергания правой рукой, который стал для Вуди составной частью команды обойти меня и сесть слева. Это была «темная сторона» стимульного контроля: он знал команду («Рядом»+движение рукой), и не собирался двигаться, пока не получит ее полностью. Хорошая собака; небрежный дрессировщик.
Огромная часть времени, проведенного на тренировках, на самом деле тратится на борьбу с этими посторонними дифференцировочными раздражителями. Возможно, самый явный пример – переход от движения рядом на поводке к движению без поводка. Позже мы обсудим это во всех подробностях, но сейчас позвольте мне краткое замечание: если собака действительно понимает команду «рядом» как «двигайся около меня и оставайся в правильной позиции», то проблем с переходом не будет.
А когда собака без поводка не двигается немедленно вместе с вами по команде «Рядом», или не держит заданную позицию у ноги, это говорит о том (среди прочего), что собака привыкла к целому набору стимулов, означающему «рядом»: наличие поводка, рывки поводком (вперед, к себе, от себя, назад), к ощущению строгого ошейника на шее (если вы его используете), и так далее. Не «непослушание» собаки делает этот переход к движению без поводка таким сложным, а борьба с дополнительными дифференцировочными раздражителями.
Вот почему важно ограничить дополнительные стимулы в начальном дрессировочном процессе. Например, присутствие гантели должно быть достаточным Sd, чтобы запустить «апортировку». Когда вы дотренируетесь до этого уровня, очень просто ввести команду («Апорт», «Неси» — неважно, какую). Теперь у вас два ДР работают одновременно, и собака понимает оба. Если вы введете команду до того, как собака начнет воспринимать наличие гантели как сигнал к апортировке, вы опять будете пытаться выучить две вещи сразу: а) поднос предмета б) команду для того действия, которое собака еще не понимает.
Все это усложняется тем, что собаки воспринимают гораздо больше, чем мы. Поскольку человек не может знать, что видит, слышит и чует собака, и еще меньше о том, как она ее перерабатывает, никто не знает, какие стимулы собака на самом деле ассоциирует с данным поведением. Все, что мы действительно можем знать – это само поведение. Чтобы максимально изолировать поведение от случайных ненужных стимулов, мы должны нейтрализовать их как можно раньше.
Давайте вернемся к более раннему примеру обучения посадке отбором поведения. Когда вы начинаете обучение, собака в основном находится перед вами. Теперь предположим, вы добавляете команду «Сидеть», не отработав ее сначала из всех мыслимых положений. Для вас это кажется неважным. «Сидеть» означает попу на земле, собака садится, всем все понятно. Но для собаки место посадки – это часть общей топографии упражнения. Когда вы попытаетесь получить посадку у ноги, собака попытается забежать перед вами, чтобы сесть. Почему? Потому что посадка перед вами – это то, как собака выучила команду «Сидеть».
Как крайний вариант, одна из моих приятельниц по интернету учила пуделя принятию основной позиции у себя в подвале. Не очень об этом задумываясь, она всегда стояла лицом в одну и ту же сторону. На стене была картина. Однажды она встала лицом в другую сторону, и собака продолжала двигаться, пока ей не стала видна картина. Оказывается, именно по картине она «высчитывала» свое положение.
Это также помогает объяснить, почему если вы все время тренируетесь в одном и том же месте или на одном и том же оборудовании, при перемене места или оборудования собака перестает работать. Все факторы, окружающие собаку в обычном месте занятий, становятся до некоторой степени ДР, которые собака ассоциирует с занятиями обидиенс. Так что генерализация в известной степени состоит из универсализации всех посторонних стимулов, чтобы собака поняла, что «сидеть» означает «сидеть» везде, хоть в помещении, хоть на площадке, хоть на горной тропе.
Среди других своих преимуществ, отбор поведения с помощью оперантного минимизирует (а точнее, уменьшает почти до нуля) эту проблему. Вы работаете с поведением, которое предлагает собака, и вы поощряете и усовершенствуете его. Вы совсем или почти не вмешиваетесь. Вы не добавляете команду, пока не поощрили поведение в различных ситуациях и из разных позиций, и поведение уже похоже на то, что вы хотите увидеть в идеале. Так что когда вы вводите команду, вы уже «убрали» посторонние стимулы, и только добавляете один ДР (команду) в смесь.
Стимульный контроль.
Мы говорим о том, что поведение находится под стимульным контролем, когда собака надежно исполняет действие по команде. В терминах предшествующей дискуссии, у вас есть стимульный контроль, когда собака распознает команду как Sd для определенного поведения и как SΔ для всех остальных действий. Цель всей дрессировки – установить стимульный контроль над всеми необходимыми действиями. Есть несколько аспектов этого.
Три части.
Чтобы поведение случалось «по команде», должны присутствовать три элемента: 1) раздражитель 2) поведение 3) поощрение.
Мы имеем дело с оперантным поведением, что означает, что мы учим собаку предлагать действия в надежде на поощрение. Поощряя определенные действия, мы повышаем вероятность того, что собака их предложит в будущем. Добавляя команду и поощряя выполнение действия по команде, мы увеличиваем вероятность того, что действие будет происходить только в ответ на команду.
Давайте рассмотрим пример. На полу лежит предмет. Собака проходит мимо и из любопытства обнюхивает его. Это предложенное поведение. С собакой это происходит инстинктивно, и еще потому, что когда-то в прошлом исследование нового принесло приятный результат. Если в это время вы поощрите собаку за касание предмета, она будет касаться его чаще. Если вы потом введете слово «touch» в момент касания, а затем щелкнете и поощрите, очень скоро вероятность того, что собака по команде «touch» будет касаться этого предмета, возрастет очень сильно. Если вам это нужно, вы можете генерализовать реакцию собаки, раскладывая все больше и больше предметов по полу и поощряя собаку за касание каждого из них, чтобы команда означала «коснись того, что лежит на полу».
Есть еще одна причина, по которой надо сначала выучить действие, а потом вводить команду. Это обеспечивает максимальную вероятность успеха, поскольку мы увеличиваем вероятность и без того часто повторяющегося поведения.
Теперь и предмет, и команда стали дифференцировочными раздражителями. Если вы учите собаку мишеням, можете перенести команду «тач» с таргета на любую другую мишень (например, крышку от банки кофе, приклеенную к дверному звонку, чтобы научить собаку звонить в него, когда ей хочется гулять).
Если вы учите апортировке, оперантным дифференцировочным раздражителем будет гантель. Если вы начнете с деревянной гантели, вы позже перенесете тот же смысл и на металлическую и кожаную гантели. Вам, естественно, требуется, чтобы все три разновидности означали для собаки одно и то же: «Подними меня». Потом, в классе Utility, вы добавите еще один раздражитель (запах), чтобы помочь объяснить собаке, какую именно гантель из нескольких она должна принести [по правилам АКС выборка в высшем классе, Utitlity, делается 2 раза,на гантели, один раз – на кожаную, второй раз – на металлическую].
Но неважно, насколько усложнится упражнение, все эти действия покоятся на трех китах.
«Тест из четырех частей».
Другой аспект стимульного контроля – надежность. Ее можно измерить четырьмя критериями, три из которых прямиком вытекают из «трех китов». Вот они:
1.Собака делает Х, когда вы командуете Х (садится, когда вы говорите «сидеть»)
2.Собака не делает У, когда вы командуете Х (не ложится, когда вы говорите «сидеть»)
3.Собака не делает Х, когда вы командуете У (не садится, когда вы командуете «лежать»).
Когда все эти три элемента присутствуют, вы знаете, что команда «сидеть» — это Sd для этого поведения и ни для какого другого. Другими словами, вы успешно исключили все другие действия кроме посадки, когда присутствует стимул «сидеть».
Вы можете добиться первого и второго пунктов очень быстро, если вы ничего больше не делаете, кроме как отбираете и подкрепляете посадку. Собака будет пробовать делать что-то еще, но если вы поощряете ее только за то, что она садится, скоро она будет садиться вместо того, чтобы предлагать другие варианты. Затем вы можете ввести команду, и у вас будет надежная посадка.
Третий критерий вступает в игру, когда вы начинаете заниматься другим поведением. В нашем примере вы занимаетесь отбором и посадки, и укладки. Чтобы оба поведения попали под стимульный контроль, собака должна быть способна различать стимулы для каждого действия. И конечно, чтобы она их различала, она должна иметь некоторое представление о значении именно этих слов. Вот почему не надо пытаться взять под команду несколько действий одновременно. По мере того, как собака «учится учиться», становится все легче и легче добавлять команды, поскольку собака понимает связь между словом и делом.
Обычно именно с четвертым критерием возникает большинство проблем.
4. Собака делает Х только по команде.
Ошибки случаются, когда собака предлагает поведение до команды. Дрессировщики-спортсмены называют это «проблемой упреждения». На подзыве можно увидеть разные варианты. Собака не дожидается на месте, пока вы ее позовете. Или она приходит во фронтальную позицию, но занимает позицию у ноги раньше, чем вы дадите на это команду. Или еще хуже, она сразу занимает позицию у ноги без фронтальной посадки.
Чтобы прояснить: этот последний критерий применяется только на время работы собаки. Если мы не занимаемся, мне все равно, что она делает – сидит, лежит, лезет на дерево или скачет вокруг. Но когда она работает, она должна делать то, что скажут, и только тогда, когда скажут.
Чтобы добиться выполнения этого четвертого критерия, вам надо сначала отработать первые три элемента в каждой части упражнения. Вот почему я так много внимания уделяю частям упражнения. Поддержание четвертого критерия также требует того, чтобы когда все упражнение готово целиком, вы периодически отрабатывали и поощряли его элементы по отдельности, чтобы собака не смешала их в одно неразделимое целое. Я буду говорить об этом позже в описании каждого упражнения.
В добавок к этим четырем критериям вы можете взять пятый: Стимульный контроль означает, что собака будет выполнять данное поведение при любых условиях. Это включает то, что дрессировщики традиционной школы называют «закрепление», и что я здесь называю генерализацией. Позже мы поговорим об этом подробнее.
Пауза и ограниченное предложение.
Другим критическим элементом стимульного контроля является то, что действие должно быть выполнено немедленно после команды. Во время обучения иногда надо давать собаке время сообразить, что надо делать. На соревнованиях же собака должна работать максимально быстро.
Пауза означает промежуток между командой и ее исполнением. В идеале он составляет 0, т.е. «нулевая пауза».
В укладке на подзыве, у собаки нулевая пауза, когда она «жмет на тормоза», пока рука спортсмена поднимается в жесте. В движении рядом нулевая пауза – когда собака начинает двигаться в момент сгибания вашей левой ноги и ее отрыва от земли. В прыжке через барьер нулевая пауза – когда собака направляется к барьеру в момент жеста. И так далее.
Слишком легко создать себе проблемы, давая собаке слишком много времени на реакцию. Медленный подзыв может привести к медленной посадке, замедлению на барьерах и т.д.
В оценке времени реакции собаки не позволяйте себе быть одураченным мифами о породных свойствах данной собаки, якобы влияющих на время реакции. Да, бассет не будет так летать, как бордер. Но это не значит, что он должен медленно работать. Даже «медленная» собака может немедленно реагировать на команду и выполнять действие без паузы.
Если вы не научили собаку реагировать немедленно и работать быстро, то вы можете переучить ее.
Ограниченное предложение — это один из способов сократить паузу. Вы будете с помощью поощрения уменьшать время от момента подачи команды (или того сигнала, который запускает нужное поведение) до момента, когда собака начинает действовать. Например, при обучении апортировке отбором поведения, вы выставляете гантель у пасти собаки. Сначала до того, как собака откроет пасть и возьмет ее, пройдет, скажем, 10 секунд. Вы поощрите взятие гантели за этот промежуток времени. Через некоторое количество успешных попыток собака возьмет ее через 8 секунд, и отныне вы будете поощрять только взятие не позднее чем через 8 секунд. Вскоре собака начнет брать ее еще быстрее, и вы начнете поощрять за более быстрые попытки. И так далее.
Что, если собака не взяла гантель в «предустановленное» вами время? Вы просто убираете гантель на секунду и затем снова показываете ее собаке. Убирая ее, вы как бы говорите собаке, что она не может заслужить поощрение, реагируя медленно. Не используйте при этом никаких слов.
Пауза как привычка.
Важный аспект паузы между стимулом и реакцией на него заключается в том, что если вы настаиваете на немедленном выполнении команды в одной области, вы получите более быстрое выполнение и в других областях. Это привычка. Если вы всегда работаете быстро и обычно поощряете только быстрые реакции, ваша собака привыкнет работать быстро, и вы обнаружите, что вам не надо на это специально обращать внимание. Ваша собака всегда будет стараться работать быстро просто потому, что это станет ее привычкой: это ваша с ней манера работать.
Энергия «перетекает» в другие упражнения, так же как и лень. Поэтому следите за тем, чтобы поощрять только немедленную реакцию на команду везде. Даже если вы не работаете по заранее составленному графику уменьшения времени реакции, постоянно поощряя только более быстрые действия, собака сама начнет действовать быстрее и в том числе в других упражнениях.
Не притворяясь, что точно знаю, что происходит у собаки в голове, могу хотя бы сказать, что собака привыкает работать быстро, как она приучается сидеть прямо.
Пауза и упреждение.
Когда вы доведете паузу перед реакцией почти до нуля, вы скорее всего столкнетесь с проблемой «упреждения». Т.е., собака будет так нацелена на работу, что начнет выполнять упражнение раньше, чем вы подадите ей сигнал. В обидиенс я предпочитаю бороться с преждевременными действиями собаки, чем разгонять медленную реакцию на команду. Но все же и эта проблема может вызвать те же последствия, что и полный отказ собаки выполнить команду.
У вас есть узкая дорожка, по которой идти в решении этой проблемы: с одной стороны, вам надо избавиться от предвосхищения ваших действий собакой; с другой стороны, вам надо избежать увеличения времени реакции на стимул. Мы снова возвращаемся к четвертому элементу стимульного контроля: собака должна выполнять Х только по команде.
Чтобы решить проблему преждевременности, вы должны проанализировать ее истоки. Мэриан Бэйли представила простую формулу для такого анализа:
прошлый опыт
поведение
последствия
Эта формула разъясняет то, что я прежде описал как «три части». От дрессировщика требуется оценить: 1) что вызвало поведение; 2) какое именно поведение я пытаюсь изменить; 3) как это поведение поощрялось.
Чтобы проанализировать «прошлое», вам надо высмотреть, какие еще дополнительные сигналы вы подаете. Опыт с Вуди и моим шевелением правой рукой при занятии исходной позиции — один из примеров. Или посмотрите на сигналы, которые вы подаете собаки от небрежности. Например, в «апортировке в указанном направлении» одна из дрессировщиц вместе с жестом слегка сгибала колени. Собака срывалась раньше. Когда она немного изменила жест, собака все же продолжала срываться по движению коленей. Все эти вещи можно исправить. Вам просто надо идентифицировать проблему.
Можно также посмотреть на «последствия», это еще один способ пересмотреть историю поощрения собаки. Вовремя ли вы щелкали кликером? Поощряли ли вы неосознанно что-то, что в развитии стало тем действием, которое сейчас нежелательно?
Если считать, что ваши команды четки и свободны от дополнительных сигналов и что вы подаете сигнал условного поощрения вовремя, единственный путь решения проблемы упреждения без замедления времени реакции собаки на стимул — это подкрепление стимульного контроля. В примере с «апортировкой в указанном направлении» можно восстановить стимульный контроль, щелкая и поощряя собаку за взгляд на руку, когда она начинает подачу жеста. Когда собака выучит эту паузу, начните поощрять ее за то, что она начинает действие только когда рука полностью вытянута вперед. Другими словами, это форма «селективного поощрения». Когда собака смотрит на руку и работает по команде, вы можете снова «собрать» упражнение целиком.
Когда бы не обсуждался «разгон» отдельных упражнений, я буду говорить о паузе между стимулом и реакцией на него, ограниченном предложении и от том, как применять эти идеи в реальности. Сейчас же достаточно помнить, что главный принцип — «быстро, быстро, быстро». Это будет иметь побочный эффект. Ваши занятия станут четче и эффективнее. По мере прогресса собака будет работать быстрее, сокращая дрессировочный процесс. Когда вы будете в ринге, вы будете работать быстрее, что поможет быть более внимательными и не отвлекаться.
Генерализация (закрепление).
Меня часто спрашивают «А что если вы с собакой попадаете в новую ситуацию и она не слушается? Если вы не корректируете собаку физически, то что же вы делаете?» Это поднимает вопрос закрепления, или правильнее, «генерализации». Это область, где вы можете четко увидеть принципиальную разницу между кликер-дрессировкой и традиционной дрессировкой.
В любой дрессировке требуется, чтобы собака научилась выполнять нужные действия при любых обстоятельствах. Цель обучения — стимульный контроль, т.е. «данная команда всегда и везде означает данное действие». Чтобы понять, насколько хорошо выучен навык, надо отработать его с собакой в самых разных ситуациях.
В «традиционной» дрессировке тренер «закрепляет» поведение, помещая собаку в ситуацию, где она скорее всего совершит ошибку, и «корректируя» ее за это. Например, если ваша собака может сидеть одну минуту в вашем заднем дворе, вы берете ее в общественное место и заставляете там сидеть. Вы ожидаете, а иногда даже надеетесь, что она сорвет выполнение упражнения. Если так и происходит, вы ее от души «корректируете». Цель — научить собаку, что одни и те же правила действуют повсюду: «Делай как я сказал, а не то…».
Я не использую слово «закрепление», частично потому, что оно неточно, частично потому, что у него сильный негативный подтекст. Он подразумевает провокацию собаки на ошибку. Я предпочитаю термин «генерализация». Это подчеркивает, что цель обучения — научить собаку применять навыки в разных ситуациях, т.е. научить ее работать в большом разнообразии внешних условий. Но целью «закрепления» не должно быть «подставить собаку». Помните, наша цель — научить собаку добиваться успеха.
Основным правилом отбора поведения, упоминаемым Карен Прайор, является следующее: «при введении нового критерия должны быть облегчены предыдущие». Проще говоря, когда вы добавляете что-то новое в упраженние, вы должны быть готовы к тому, что уже выученный навык немного «сползет», пока новое не будет усвоено. Когда новый элемент отработан, уже существующий уровень готовности собаки вернется к ранее установленной планке.
Новое место — это новый критерий. Прайор приводит в пример репетицию в костюмах у хора в опере: и хор, и певцы знают свои реплики и время вступления, когда они без костюмов во время полного «прогона», но во время генеральной репетиции их выступление разваливается, пока они выясняют, что им делать с тяжелым реквизитом в руках и с лестницами вместо стремянок, использовавшихся раньше.
Когда вы помещаете собаку в новую и незнакомую для нее обстановку, вы должны ожидать, что она не будет работать на том же уровне, которого она уже достигла в «лаборатории». Это неизбежно. Вопрос в том, как вы отнесетесь к этому.
Если вы расцените откат в качестве исполнения как «ошибку» и будете «корректировать» собаку, вы пойдете в неверном направлении. Это не даст собаке уверенности при работе в незнакомых местах. Да вы и не сможете проработать все возможные варианты обстановки, которые могут встретиться собаке за ее спортивную карьеру. Вам всего лишь надо работать над тем, чтобы собака чувствоавала себя спокойно в незнакомом месте вообще. Физическая «коррекция» — в лучшем случае, очень «топорный» инструмент для этого. В худшем — деструктивный.
Когда вы помещаете собаку в новое место, вы должны «вернуться в детский сад», говоря словами Прайор, в выученных упражнениях. Если собака может сидеть в течение одной минуты дома, в новом месте начните с 10 секунд и стройте выдержку заново. Если она может пройти 30 шагов по прямой, начните с пяти шагов, и стройте отсюда. Если она делает высыл на пятьдесят шагов, начните с высыла на 2-3 м, и работайте дальше. И так далее.
Надо использовать новую обстановку как обучающий фактор. Вы говорите собаке «Делай то же самое, что и дома». Это позволяет убить несколько зайцев.
Во-первых, вы не давите на собаку завышенными ожиданиями. Вы просите всего лишь сделать то, что ей легко на данном этапе подготовки на знакомой территории. Это исключает стресс во время начальных занятий.
Во-вторых, вы закрепляете действия собаки тем, что повторяете весь путь обучения заново. Вы не просите собаку делать что-то новое, только то, что она уже и так давно знает, как делать.
В-третьих, вы укрепляете доверие собаки к вам. Она учится, что когда она попадет в новую ситуацию, вы будете рядом и попросите ее сделать то, что она умеет, а не что-то новое и рискованное или непонятное. Это повышает ваш авторитет.
В-четвертых, вы укрепляете уверенность собаки в том, что она может работать в любой ситуации. Когда вы представляете ей новые раздражители и незнакомые места, она с опытом начнет переносить свои умения в новые ситуации. Она, возможно, никогда раньше не видела именно этих детей, играющих в футбол, но она уже сидела на выдержке рядом с другими играющими детьми. Она не была в этом парке, но она делала это упражнение в десяти других парках. Со временем это станет привычным.
Процесс генерализации проверяет вашу гибкость, воображение и чувствительность как дрессировщика гораздо больше, чем выполнение собакой конкретного упражнения. Вы занете , что выученное поведение «развалится» в новой ситуации, пока собака не привыкнет к этому. Это данность. Реальный вопрос в следующем: как вы собираетесь на это реагировать?
Ответ на вопрос «Что делать, если вы начали заниматься с собакой в незнакомом месте и она ошибается?» очень прост: «Когда вы занимаетесь в новой ситуации, снизьте свои ожидания до того уровня, на котором собака не совершит ошибки. Затем снова пройдите все этапы усложнения упражнения». Вы не столкнетесь с ошибкой, если не просите от собаки больше, чем она может. Чувствуйте, на что ваша собака способна в новой необычной обстановке, и вы сможете использовать генерализацию как еще один путь к успеху.
«Закрепление».
Когда мы жили в Пасадене, Калифорния, я теринровался в парке. Это была наша «домашняя площадка». Сэм и Дилан начинали тренироваться здесь с 3 месяцев. Они с первого дня учились при детях, играющих в мяч, ревущих мотоциклах, подростках с магнитофонами и несметных количествах других собак. Они с детства привыкли работать при людях и не обращать внимания на раздражители. Это было огромным преимуществом.
Когда мы переехали в высокогорную пустыню, мы потеряли это преимущество. У меня на участке было полно места для занятий, но оно было уединенным. Собаки быстро привыкли к одиночеству и тишине. В конце концов, тишина и была причиной переехать сюда. Когда мы снова начали заниматься, я обнаружил, что они стали чувствительны к раздражителям и новым местам. И мне пришлось специально заниматься приучением их работать в шумных местах.
Цепочка поведения.
Цепочка поведения — это упражнение, состоящее из различных, узнаваемых действий, которые должны исполняться в определенной последовательности, обычно включающей более одной команды (хотя могут быть «мини-цепочки» внутри большой цепи, которые производятся по одной команде, например, собака бежит вперед, подбирает гантель и возвращается во фронтальную посадку — все эти части делаются по одной команде).
Цепочка поведения может быть одной неразрывной связкой действий, или серией связанных друг с другом действий, или комбинацией из обоих вариантов. Общая характеристика — действия должны производиться в определенной последовательности от начла до конца, и каждое действие производится по команде и полностью под стимульным контролем.
В Новичках единственная цепочка — подзыв. Он состоит из «сидеть», «ждать», «ко мне», «рядом». В этом упражнении каждое звено выполняется по отдельной команде. Ошибка, когда собака выполняет следующее действие, не дождавшись команды, будет оштрафована или даже все упражнение не будет засчитано.
В Открытом и Рабочем классах все упражнения — цепочки действий. Их четыре в Открытом (укладка на подзыве, «гладкая» апортировка, апортировка через барьер и через прыжок в длину) и семь в Рабочем классе (комплекс, две выборки, апортировка в указанном направлении, остановка из движения и два высыла на барьеры).
Отбор действий для цепочки.
Обучение «с конца».
При выполнении цепочки действий собака переходит от одного элемента к другому. Лучший вариант обучения — «с конца», т.е. отработка цепочки от конечного действия к первому. При этом собака переходит от нового элемента к уже знакомому. Это позволяет ей уверенно выполнять новое действие — она знает, что будет дальше.
Другой важнейший элемент отработки с конца — до того, как вставить новое «звено» на его место, оно должно быть названо командой (т.е. собака должна точно понимать значение команды) и взято под стимульный контроль. Если я добавляю действие в цепочку, оно должно быть полностью отработано как самостоятельное действие. Иначе мне придется заниматься и отработкой самого действия, и его отработкой в цепочке, что только путает собаку (снова вспоминаем сентенцию Карен Прайор об отработке только одного критерия за один раз).
Когда действие занимает свое место в цепочке, оно приобретает характер поощрения. Я называю это «репертуарным подкреплением». Смысл в том, что внутри цепочки каждое последующее действие является поощрением за предыдущее. Обратная сторона — «репертуарный стимул» — каждое предыдущее действие запускает следующее. Вот как это работает.
Репертуарное подкрепление.
Предположим, мы имеем цепочку из действий А, Б и В. «Репертуарное подкрепление» просто означает, что команда (или другой стимул) выполнить действие Б является поощрением за правильное выполнение действия А. Очень хороший пример этого — высыл в Рабочем классе (на барьер в указанном направлении). На тренировке собака получает возможность прыгнуть барьер, только если она хорошо сделает высыл. Если она сделает высыл неправильно, я позову ее обратно и переделаю. Когда собака уяснит себе связь между этими двумя звеньями цепочки, возможость прыгнуть напрямую будет поощрять высыл. И наоборот, отзыв от барьера будет показывать ей, что высыл был сделан плохо (неважно, что именно было не так — это я буду решать при отработке высыла отдельно; смысл в том, что если действие А было выполнено неправильно, действие Б не происходит вообще).
В виде уравнения это выглядит так:
Команда «А» → действие А = Клик-кусок
Команда «Б» → действие Б=Клик-кусок
В этой конструкции поощрение следует за каждым действием, выполненным «по команде». Но когда вы «собираете» действия А и Б вместе, мы получаем следующее:
Команда «А» → действие А → Стимул «Б» → Действие Б=Клик-кусок
Теперь подкрепление поступает только за действие Б. Поведение А не поощряется щелчком. Единственное, что поощряет за действие А — это команда (или другой стимул) на выполнение действия Б. Когда вы даете собаке команду «Б», вы тем самым подтверждаете ей, что «А» она сделала правильно. Это «репертуарное подкрепление».
«Репертуарный стимул»
Это случается каждый раз, когда собака должна выполнить больше одного действия по единственной команде. Очень наглядный пример — апортировка. По одной команде «Апорт» собака должна уйти от вас, пойти к гантели, поднять ее, вернуться к вам и сесть перед вами (удерживание гантели, пока вы ее не заберете — это длительное действие). В этой цепочке пять действий, но только одна команда. Следуя той же формуле, получаем:
Команда «А» → действие А → действие Б … → действие Д=клик-кусок
Вы научили собаку каждому действию по команде, но когда вы собрали их все в цепочку, вы не можете обозначать каждое действие командой. Что же говорит собаке, когда и что делать? Каждое поведение является стимулом для запуска следующего. Уход от вас — сигнал искать гантель. Найти гантель означает взять ее в пасть. Поднятие гантели означает, что надо вернуться к вам. И так далее.
«Репертуарный стимул» позволяет вам создавать цепочки действий, не переучивая каждое из них заново. Независимо от того, что должна принести собака, взятие предмета в пасть означает возвращение к вам, что в свою очередь означает сесть перед вами. Собака выучивает эти сигналы и применяет их во всех новых ситуациях апортировки.
Избегаем угасания промежуточных действий.
Я называю «промежуточным» любое действие в цепочке, которое не подкрепляется прямо. Например, посадка перед началом подзыва — промежуточное действие. На тренировке вы обычно не опощряете посадку, но собака садится перед вами. Типичная ошибка начинающего дрессировщика — собака срывается с места раньше, чем услышит команду. Почему? Что можно сделать, чтобы убрать это?
Три основных элемента для понимания проблемы: «репертуарное подкрепление», «репертуарный стимул» и «угасание». Простой факт — если вы сводите несколько действий в цепочку и подкрепляете только одно из них, остальные будут угасать. В спортивных кругах это обозначается термином «упреждение» (срыв выдержки). Собака не ложится до конца при укладке из подзыва, или сразу же вскакивает. Или она садится перед вами, и до команды «Рядом» пересаживается к левой ноге. Что происходит?
Промежуточное действие переживает угасание. Это происходит потому, что вы не уделяли достаточно внимания его подкреплению. Вы поощряли только «фронт», так что начала исчезать. В каждом случае действие уходит не потому, что собака не знает, что должна его сделать, а потому, что оно не подкреплялось.
Стимульный контроль тоже разрушается. В его терминах «сидеть» означает «сесть на землю и сидеть так пока я не скажу тебе еще что-нибудь делать». Когда собака приходит к вам без команды, вы теряете этот стимульный контроль. Почему? Потому что собака получает «репертуарный стимул». Вы ушли на другой конец ринга, и собака расценивает это как сигнал подойти к вам. Основания для этого — собака получала клик-кусок за то, что подходила к вам, а не за то, что оставалась далеко.
Использование репертуарного подкрепления.
Один из способов решить эту проблему — использовать репертуарное подкрепление. Проще говоря, вы требуете, чтобы каждое действие было выполнено правильно, прежде чем разрешить выполнить следующее. Я часто вижу, что дрессировщики используют это бестолково. Собака бежит к тренеру, но не ложится по команде. Дрессировщик идет к собаке, толкает ее вниз, потом возвращается на исходную позицию и подзывает собаку. Что происходит? Вопреки задуманному смыслу «коррекции» на самом деле дрессировщик убивает укладку, потому что позволяет собаке продолжить выполнение упражнения — и таким образом заслужить поощрение! — даже несмотря на то, что собака неправильно выполнила укладку.
Для того, чтобы репертуарное подкрепление работало, надо настаивать на том, чтобы каждый элемент цепочки был выполнен правильно. Так что если собака не легла хорошо, вы прерываете упражнение и начинаете его заново. Она не сможет закончить упражнение посадкой около вас до тех пор, пока не выполнит хорошую укладку.
Здесь присутствует элемент «наказания», поскольку вы придерживаете поощрение (подход к вам), ожидать которого вы уже приучили собаку раньше. Но его «токсичность» невысока. Целью его, как и любого другого задерживания подкрепления — вызвать «угасательный взрыв». Вам нужно, чтобы собака сфокусировалась на том действии, которое должно принести поощрение, и улучшила его выполнение.
Использование изолированного подкрепления.
Другой способ решить эту проблему — использовать изолированное подкрепление. Т.е. вы изолируете этот элемент и подкрепляете его отдельно, а затем снова включаете его в цепочку. Когда я использую репертуарное подкрепление, я просто не даю собаке перейти к действию Б, пока он не сделает А правильно. При использовании изолированного подкрепления я буду поощрять только А отдельно.
На самом деле, в дрессировке своих собак, я использую оба варианта, и стараюсь использовать их до того, как проблема появится. Я часто использую «нет уж, сначала сделай правильно это», и не менее часто я отрабатываю отдельные элементы, чтобы напомнить собаке, что они тоже имеют свою ценность и их надо делать хорошо. Что я предпочту в каждом конкретном случае — вопрос тактики.
«Три — это образ жизни».
Когда я вижу проблему с любым действием, я применяю мое «правило трех». «Один раз — ошибка, два — тенденция, три — стиль жизни.»
Дилан и я занимаемся укладкой на подзыве. Я даю сигнал лечь; Дилан продолжает двигаться. Может быть целый букет причин, по которым он не лег. Суть в том, что он не лег, и он не должен закончить упражнение, но это не решит проблему. Я должен уделить внимание («один раз — ошибка», а ошибки случаются). Может быть, простое прерывание упражнения и возвращение его на исходную позицию вернет его на правильный путь.
Если мы повторяем упражнение, и он снова ошибается, у нас есть проблема («два — это тенденция»). Возможно, я даю команду не так, как обычно. Возможно, он отвлекся. Что бы это ни было, я должен начать разбираться с проблемой сейчас («три — это стиль жизни», я просто не должен дать ему возможность ошибиться третий раз).
Теперь я изолирую укладку и отрабатываю ее отдельно в четыре этапа:
1.Оставляю его стоять, отхожу на 3-4 метра, даю ему команду «Лежать». Если он ложится, клик-кусок.
2.Повторяю. Если он снова ложится, я возвращаю укладку в общую цепочку укладки на подзыве, поэтапно.
3.Оставляю его, подзываю, даю команду лечь. Если он ложится по команде, клик-кусок!
4.Оставляю его, подзываю, даю команду лечь. Если он ложится по команде, позволяю закончить упражнение фронтальной посадкой, клик-кусок.
В первые два повторения я занимаюсь «лечением» угасания, изолируя и поощряя то действие, которое стало проблемным. На третьем повторении я занимаюсь стимульным контролем, возвращая укладку в схему подзыва, но поощряю отдельно от второго подзыва. Это напоминает ему, что когда он лег, надо лежать (если он вскочит, я удлиню время лежания). И четвертым повторением я ввожу репертуарное подкрепление, поощряя снова, но только после успешно выполненного второго подзыва.
НОВОЕ
Избавляемся от кликера.
Как я упоминал ранее, самый распространенный укол в адрес кликер-тренера: «Но вы ж не можете взять кликер в ринг». Конечно, нет. Так же, как и вы не можете взять туда лакомство, игрушку или удавку. Независимо от того, чем вы пользуетесь в дрессировке, главный и необходимый аспект дрессировки — это избавление от инструментов, которые помогают вам на тренировке.
Любой, кто сталкивался с проблемой избавления от игрушек или лакомства, подозрительно отнесется к тому, что от кликера тоже надо избавиться. Это задача не из легких. Я видел, как одна из опытнейших и отлично выступающих спортсменок прятала пищащую игрушку подмышкой перед выходом в ринг, а затем незаметно для собаки передавала ее помощнику, стоявшему рядом. И этот человек уже имел несколько высоких титулов в послушании!!! Хорошая новость — от кликера намного легче отойти, чем от игрушек и лакомства.
Этот процесс состоит из нескольких аспектов. 1) это один из побочных продуктов вариабельного подкрепления, с помощью которого собака учится работать дольше и тяжелее, чтобы получить поощрение. 2) При выработке цепочки действий команда на выполнение следующего действия заменяет щелчок за выполнение предыдущего 3) Когда действие является частью большой цепочки (где, например, вся цепочка происходит по одной команде), «репертуарное поощрение» заменяет щелчок. 4) Во время дрессировки вы добавляете к щелчку другие условные маркеры. Вы можете добавить вербальные поощрения («молодец», «хорошо»), и 5) во время обучения вы даете собаке и другие виды безусловного подкрепления кроме пищи. Вы можете использовать поглаживания или игры — например, прыжки собаки в воздух.
Но что действительно делает возможным отказ от дальнейшего использования кликера — это сам кликер. Кликер — это маркер события, который ясно сообщает собаке, что она делает правильно. Во время обучения получение четкой информации дает собаке все больше уверенности. Она знает, что права, даже если вы ей об этом не сообщаете. И собака заставляет вас щелкать. Если вы не щелкаете каждый раз, собака просто учится больше стараться.
Когда собака выучивает действие — а при использовании кликера вы можете больше быть уверенным в том, что знает собака, чем при использовании традиционных методов — вам не надо ни отрабатывать, ни поощрять это снова и снова. Рассмотрим обычную математику. Сначала вы учите сложение и вычитание, и сдаете по ним контрольную. Потом переходите к умножению. Вам не надо больше писать отдельных контрольных на сложение; вы пишете контрольную на общие задачи. И если в вашей работе учитель напишет «Отлично складываешь!», вы будете удивлены. Возможно, вы даже обидитесь. «Конечно, я же это уже давно умею», скажете вы.
То же самое верно и для собаки. Не надо поощрять каждую посадку. Собака знает, как и когда садиться. Она постепенно начинает получать подкрепление от всей картины — всей цепочки действий или всего выступления в ринге. Но вы придете к этому только потому, что вы строили это во время обучения от успеха к успеху.
Переходная собака, переходный тренер.
Возможно, вы никогда не учили собаку большему, чем делать дела на улице. Если так, прекрасно. В этом случае методы, описанные в книге, будут для вас ясны и понятны. Но я предполагаю, что многие, если не большинство читающих эту книгу, имеют опыт дрессировки традиционными методами. Основной темой этой вступительной главы было сравнение между оперантным методом и так называмым «традиционным». Это будет продолжаться и на протяжении всей книги. Для меня, и для многих моих знакомых — и их ранее обученных собак — применение оперантного метода будет являться опытом перехода.
«Переходный» дрессировщик — это дрессировщик, который выучил традиционный, основанный на приказах, метод дрессировки. «Я альфа-лидер, слушай как я рычу». В программе оперантного метода, которую я описываю в этой книге, вы будете работать без поводка (или как минимум, «без рук») всегда. Вы никогда не будете иметь средств принудить собаку работать. Вы будете учить собаку что-то делать другими средствами. Это будет слегка дезориентировать вас обоих. Я знаю, со мной так было. Но это и поучительно.
Переходная собака.
«Переходную» собаку уже дрессировали раньше, но с помощью традиционных методов. Эта собака выучила определенный набор правил занятий. Теперь эти правила меняются.
Подумайте о том, как вы тренировались. Чтобы научить собаку сидеть, вы говорили «Сидеть» и дергали поводок, одновременно нажимая на круп собаки (или подсекая ей задние ноги). Сначала идет команда, затем принуждение. В результате, собака учится садиться, чтобы избежать определенных неприятных последствий от вас. И так было со всем: команда, принуждение (или побуждение), действие.
Как собака должна понять, что «правильно»? Дрессировка, основанная на командах, строится на отрицательном подкреплении. Т.е., поведение подкрепляется тем, что не происходит что-то неприятное. В сущности, «правильность» приравнивается к отсутствию действий, которые сообщают о «неправильности». Т.е. это, например, отсутствие рывка поводком, ну или рывка за ухо, или словесного «Нет!», или удара током.
С кликером, мы возвращаем все с головы на ноги. Теперь вы учите собаку тому, что «правильно», поощряя нужное поведение. И вместо того, чтобы «командовать» собаке, вы будете учить собаку сигналам, которые говорят, что в данный момент выполнение этого действия может принести поощрение.
Наиболее распространенная вещь, которую я наблюдаю с переходными собаками — и степень выраженности зависит от того, насколько много с собакой занимались — это то, что где-то во время тренировочного процесса собака становится неуверенной и сомневающейся в себе ненадолго. Например, у меня было много клиентов, пришедших после стандартного двадцатинедельного курса обучения. Когда они приходили ко мне, одним из первых упражнений было намотать поводок на пояс, выпустить его из рук и сделать шаг вперед с командой «Рядом». Девяносто с лишним процентов собак при этом ничего не делали. Или, если собака все же двигалась вперед, она делала это неуверенно.
Собака в действительности не выучила упражнение. Ее не научили по сигналу двигаться вперед вместе с хэндлером. Вместо этого ее научили избегать «коррекции». Снимите поводок — и собака не знает, что делать. Ведь она уже не может получить «коррекцию». Что еще надо?
Собака также путается, потому что владелец не может использовать те сигналы, к которым она привыкла: «Услышать «рядом», получить рывок, пойти вперед». Рывка-то теперь и нету.
Вы увидите и более хитрые вещи. Собака, наученная традиционным методом, не делает без команды ничего. Собака, наученная оперантным методом, знает, что если сомневаешься — делай что-нибудь, потому что ее научили, что если она сделает правильно — неважно, случайно или додумавшись до этого — то она получит поощрение. Что самое плохое может с ней случиться? Она не получит поощрение.
Традиционно обученная собака выучила противоположное: если сомневаешься, не делай ничего (в основном, сиди спокойно). Неприятная сторона традиционного обучения собаки: она знает, что наказание за ошибку перевешивает шанс поощрения за попытку что-то сделать. Такая собака консервативна.
Когда вы начинаете процесс переучивания, вы увидите «распад» выученных навыков. Он неизбежен и очень положителен. Это происходит из-за того, что я уже описал. Ваша собака научилась работать, чтобы избежать неприятностей; а вы их больше не доставляете ей. Собаке надо переучиваться с мысли, что «если больно не стало, ты сделала правильно», на мысль, что значение имеет только наличие или отсутствие поощрения. Во время этого переучивания собака выучит, что от нее хотят, и будет предлагать это с желанием. Это не значит, что переходная собака не может переучиться, просто ей надо на это время.
Поработав с большим количеством переходных собак, я пришел к заключению, что кратчайший путь лежит в том, чтобы предположить, что собака не умеет ничего. Заставьте себя начать с чистого листа, как вы бы начали с необученной собакой. Это будет непросто. Но это лучший способ, чтобы переформировать навыки в «оперантные». Обучение будет идти быстрее и результат будет надежнее, чем когда вы использовали традиционные методы.
Больше никаких «плато».
И в заключение о «переходной» собаке. С «плато» в обучении я часто сталкивался, работая традиционными методами, и не встречал в оперантной дрессировке. Теория гласит, что «плато» — это когда обучение застопоривается в одной точке на день-два или даже на неделю и более.
Я думаю, что это случается в традиционной дрессировке потому, что дрессировщик пытается научить собаку слишком многому сразу. Довольно естественно, что в какой-то момент мозг отказывается принимать новую информацию и пытается обработать то, что уже получено.
Как я уже сказал, в оперантной дрессировке я с этим не сталкивался. Я думаю, причина в том, что метод отбора поведения требует от вас очень тщательного дозирования увеличения сложности. Вы ограничены самим методом от того, чтобы перегрузить собаку больше, чем она способна «взять», потому что вы работаете с тем арсеналом действий, который она сама предлагает. Поэтому собака может впитать — и удержать! — каждый урок и двигается вперед постоянно.
Переходный дрессировщик.
Правила поменялись и для вас. Вам тоже надо научиться новому. И не получится «вырезать и вставить» куски нового метода в то, что вы делаете сейчас.
Мы все приучены смешивать. Ходить на все семинары, читать все книги, покупать все видео, взять немного из столбца А и немного из колонки Б. Я сомневаюсь, что я единственный тренер по обидиенс, чья сумка для занятий — молчаливый свидетель того, что было перепробовано все. Но этот подход не работает с новой системой. Дрессировочная техника не сложна. На самом деле, многие находят ее более простой. Самое сложное — в голове.
Самый важный шаг — избавиться от поводка. «Кожаный костыль» вызывает зависимость не хуже никотина. Дрессировщики привыкли таскать своих собак, вместо того, чтобы заставить собаку делать это самой. Дрессировщики впадают в привычку дергать почти бессознательно, независимо от того, что делает собака. Поскольку дрессировщик может вынудить собаку совершить действие с помощью поводка, он часто впадает в заблуждение, что оно выучено. Ан нет. Если вы не тренируетесь с поводком, вы никогда не попадете в эту ловушку. Вы всегда будете видеть, что собака может — а что нет.
Избавьтесь от поводка — и удавки, и строгача, и рывка за ухо. Вы не будете больше заставлять собаку. Теперь вам надо научиться сообщать собаке о том, чего вы хотите, тем способом, который будет ей понятен и желателен. Вы должны «пойти ей навстречу». Вы должны прянть, что если собака не выполняет упражнение правильно, это потому, что она не понимает, как надо. И вам придется взять на себя ответственность за обучение собаки.
Вы не можете доверять своей собаке без поводка в общественном месте? Тогда занимайтесь в безопасном месте и не выводите собаку в место с сильными раздражителями, пока она не готова к ним.
Ваша собака ходит рядом на поводке 20 минут подряд, а без поводка проходит только несколько шагов? Эти несколько шагов — это то, на что реально подготовлена ваша собака. Примите этот факт и работайте от него. Вы не знаете, как донести до собаки, что вам нужно, не применяя принуждение? Эта книга — для вас.
Словечко о принуждении.
Многие тренеры, ступившие на стезю оперантной дрессировки, оставляют себе возможность «заставить» собаку выполнить упражнение. Их оправдания выглядят по-разному, но сводятся к следующему: «Послушание — не игрушки; собака должна знать, что она не может ослушаться, когда я даю команду». В ответ я предлагаю два вопроса:
1.Вы сами скорее сделаете то, что вам хочется сделать, или то, что вы должны сделать? (спорим, ваша собака ответит так же?)
2.Если вы делаете то, что хотите, вы будете делать это более-менее заинтересованно и с энтузиазмом? (опять же — ваша собака наверняка ответит так же)
Оперантный метод строится на том, что собака делает то, что ВЫ хотите, потому что она знает, что тогда получит то, что ОНА хочет. Собака начинает хотеть делать то, что вы от нее хотите. Стабильность выполнения практически «встроена» в обучение, если оно происходит правильно.
У собаки всегда есть выбор.
Что, если собака думает, что у нее есть «выбор» — послушаться или нет? Любой, кто думает, что может этого избежать, обманывает себя. В чем самообман? Вера в то, что отрицательное подкрепление («коррекция») может убрать альтернативу у собаки. Собака ВСЕГДА выбирает, делать или нет. Помните о «умной собаке в ринге»? Если собака действительно отказывается работать, вы видите избегание. «Ты не можешь меня заставить, так что я делать ничего не буду». Это выбор, нравится вам это или нет.
Мы все видели собак, делающих выбор. Они получают свои титулы в Новичках, и не могут получить титулы в Открытом или Рабочем классах обидиенс. Тренеры традиционной школы избегают таких учеников, потому что понимают, что эти собаки всегда будут выступать ниже среднего. Собак клеймят как «не годной для обидиенс породы», или имеющих недостаток «драйва», или упрямых, или тупых. Однако чаще всего правда гораздо проще: собака обнаружила, что работать в обидиенс совсем не приятно, так что она уклоняется от нее. Проблема в методе обучения, а не в собаке.
Некоторые спортсмены высокого уровня специально выискивают «правильного» щенка. Они хотят, чтобы собака не «гнулась» под давлением и в стрессе. Эти качества должны быть врожденными, потому что метод обучения их не разовьет. Несколько лет назад Берни Браун, известный спортсмен и судья со Среднего Запада, написал серию статей в журнал по обидиенс «Фронт и финиш» о новом щенке, с которым он работал, тервюрене по кличке Изюм. В первых статьях он писал о качествах, которые хотел бы видеть. В результате он отдал щенка. Собака не смогла выдержать его методов дрессировки, и он отдал ее «на диван».
Дрессировка с принуждением создает «узкие и полностью неудовлетворительные результаты»? Она создает собаку, которая работает из страха, а не собаку, которая активно сотрудничает с владельцем. Еще раз позвольте мне процитировать Мюррея Сидмана, ученого, автора книги «Насилие и его последствия» (Coercion and Its Fallout, Murray Sidman). Он пишет, что отрицательное подкрепление, «особенно интенсивное и продолжительное, может узко ограничить наши интересы, даже вызвать эффект «туннельного зрения», который ограничивает нашу жизнь пережитым стрессом. Мы можем выполнять привычные действия очень хорошо, но чисто механически, вынужденно».
Звучит знакомо? Это так называемая собака с выученным стереотипом, которая делает все неплохо, пока соблюдается привычная последовательность действий. Но когда ей приходится решать проблему или реагировать на неожиданное, то выученное поведение распадается. Что еще хуже, у собаки нет ресурсов, чтобы справиться с проблемой. Почему? Потому что ее научили пассивности перед лицом неуверенности. Для этой собаки лучше ничего не делать, чем попытаться что-то сделать и ошибиться. У нее нет «выбора»; но нет и жизнестойкости.
Тренируйтесь, чтобы быть лучше, а не чтобы быть идеалом.
Значит ли это, что отбором поведения с положительным подкреплением вы получите собаку, которая никогда не ошибается? Нет. Никто не идеален. Мы говорим о максимизации вероятности правильного выполнения в конкретный момент.
Наблюдая за соревнованиями по гимнастике на Олимпийских играх 1996 года я был поражен ложным представлением о совершенстве. Это были молодые, сильные спортсмены на пике формы, которые посвящали дни и недели своему спорту. Большинство из них в месяц тренируется больше, чем спортсмены по обидиенс в год. И у всех одна цель: золото Олимпиады.
И что происходит? Рука чемпиона мира соскальзывает с кольца. Другой чемпион мира выходит за пределы ковра на упражнении. Национальная чемпионка падает с бума. Двое или трое падают с брусьев. И это люди, которые посвятили свою жизнь этому спорту, оттачивая мастерство, которые делают столько, сколько нам с нашими собаками и не снилось. «Совершенство», чем бы оно ни было, не может быть мерилом вашего успеха.
Чего мы в действительности ожидаем от наших собак? Только что они очень постараются, когда мы этого попросим. Дрессировка на положительном подкреплении повышает вероятность того, что это произойдет.
Необходимость принуждения возникает из ошибки дрессировщика.
В большинстве случаев, когда дрессировщик чувствует необходимость «заставить» собаку сделать что-то, он перестарался. Он просит от собаки больше, чем она может на этом этапе, слишком много сразу или слишком скоро. Он берет собаку в незнакомое место, говорит «Глазки», собака не смотрит, он ее дергает. Собака не послушалась? Есть несколько причин, и непослушание — ни одна из них.
Возможно, собаке показали слишком высокий уровень раздражителей, ее еще не поощряли за это поведение в такой обстановке, и дрессировщик не снизил требования сообразно обстановке. Принуждение в этой ситуации не только не выполнит предполагаемых функций, оно вредно и нечестно. Собаку наказывают за то, чего она еще не умеет. Вы хотите, чтобы ваша собака боялась наказания в новой обстановке в ринге?
Или собака пытается сообщить что-то хэндлеру. Турид Ругос, этолог из Норвегии, написала книгу о сигналах примирения у собак. Она описывает около тридцати сигналов, которые собака подает другой собаке, чувствуя стресс, чтобы успокоить ту. Один из них — отвернуть голову. Возможно, в данной ситуации это именно этот сигнал. Возможно, нет. Но это может быть. И если это хоть частично так, что хорошего в том, что на попытку успокоить его человек отвечает применением силы? Это только заставит собаку еще больше пытаться его успокоить — другими способами, которые человек может расценить как еще большее непослушание (например, небольшой отход от него). Есть такой «традиционный» дрессировщик, который не сталкивался бы с таким развитием событий?
Я не этолог, и не могу обсуждать эту теорию с научной точки зрения, но она мне созвучна. Похоже, что в ней есть зерно истины. Если мы признаем, что не слишком-то хорошо «читаем» своих собак, и если она права в своих предположениях о таком типе общения, не будет ли самым мудрым найти способ, который не будет запускать врожденное поведение псовых, которое мешает тому, что мы тренируем (внимание, например)?
Забудьте слово «коррекция».
Я часто слышу слово «коррекция» от дрессировщиков, но не думаю, что они точно знают, о чем говорят. Применение этого термина настолько расплывчато, что даже отдаленно не может быть рассмотрено с научной точки зрения. Я видел дрессировщиков, «подвешивающих» собак за агрессивное поведение, и называющих это «коррекцией». Тренер не дает собаке шанса проявить неагрессивное поведение, так что действие является наказанием в чистом виде. Я видел дрессировщиков, дергающих собаку за медленную посадку. Это дает собаке шанс выполнить правильное действие, так что действие поводка здесь похоже на отрицательное подкрепление, но тренер ослабляет поводок до того, как собака заканчивает действие, так что я не уверен, чем должна быть эта «коррекция» или как она должна работать.
Я предлагаю вам простое правило: если во время занятия вам кажется, что собаку нужно «корректировать», чтобы добиться нужного вам поведения, вы — а не собака! — делаете что-то неправильно. Будьте честны и справедливы. Сделайте перерыв, сядьте и подумайте, что делать дальше, прежде чем продолжить работу.
По всем этим причинам вы не найдете описание применения «коррекции» в этой книге. Вместо этого я снова и снова пишу об обдуманном, постепенном развитии упражнения, чтобы вы никогда не оказались в положении, когда вы просите собаку сделать то, чего она не умеет, и следовательно, никогда не оказались в положении, когда вам приходится заставлять ее. Вы будете строить упражнения на успехе, по очереди.
Давайте работать.