Биологические границы научения. Континуум готовности к научению
В эпоху господства бихевиоризма — с начала и до середины 20 века — в науке о поведении считалось, что все животные, включая человека, рождаются «tabula rasa», то есть с сознанием подобным чистому листу, без врожденного видоспецифического опыта, психических качеств и наклонностей; а все личностные характеристики формируются исключительно в результате полученных чувственных восприятий и личного опыта. Основоположник бихевиоризма Дж.Уотсон даже хвастал, что из нормального, здорового младенца, при направленной организации среды можно вырастить кого-угодно – врача, торговца, водителя, и т.д. Сейчас это звучит странно, но эти учёные действительно отрицали – несмотря на оппозицию со стороны видных этологов — наличие инстинктов у животных.
Одним из столпов классических теорий научения (Торндайка, Павлова,Уотсона, Скиннера) был эмпирический принцип эквипотенциальности, согласно которому законы научения относятся в равной степени ко всем типам стимулов и реакций. Другими словами, бихевиористы утверждали, что установление нервных связей происходит с одинаковой легкостью между всеми стимулами и реакциями, и у любых видов. Надо сказать, что они не делали больших различий между разными видами животных, и с легкостью переносили свои выводы — полученные на голубях, крысах, собаках, свиньях — как между различными видами животных, так и на человека. То есть, они считали, что можно сформировать любую реакцию по отношению к любому стимулу; следовательно, научить кого угодно чему угодно (в рамках его двигательных возможностей). Хотя затруднения с этим принципом возникали ещё в некоторых ранних исследованиях поведения. Торндайк, к примеру, говорил, что кошки могут научиться ряду реакций лапами для получения вознаграждения в виде еды, но они не научаются вылизываться с той же целью. То есть, кошка не была биологически готова ассоциировать чистку шерсти с едой. Правда, на эти данные, до поры до времени, никто не обращал никакого внимания.
Однако позднейшие исследования научения принесли ещё больше данных, противоречащих воззрениям бихевиористов.
Так, в экспериментах Петрайнович и Боллс одну группу крыс учили поворачивать налево, а вторую направо в Т-образном лабиринте. При этом, половину крыс не кормили, а вторую лишали воды; соответственно, первые получали в качестве вознаграждения еду, а вторые воду. Оказалось, что крысы получавшие в награду воду, справлялись с заданием лучше тех, что работали за еду.
В следующем эксперименте, крыс снова лишали еды и питья. Но теперь они получали их в первый раз за поворот в любую сторону, а в дальнейшем при повороте в противоположную предыдущей попытке сторону. Таким образом, крысы получали вознаграждение за чередование правосторонней и левосторонней реакции. В этот раз, крысы получавшие еду научались быстрее тех, что получали воду. С точки зрения бихевиористов, этому нет объяснения, поскольку вид поощрения не должен влиять на результаты научения. Петрайнович и Боллс объясняли это тем, что поскольку крысы всеядные, у них есть врожденные предубеждения искать пищу там, где она была в прошлый раз, поскольку для всеядных, пища – нестабильный ресурс, который вряд ли сегодня будет там же, где и вчера. В то время как вода – более стабильный ресурс; маловероятно, что река или пруд исчезнут за ночь.
Таким образом, крысы проявили врожденные тенденции реагирования. Иначе говоря, крысы были биологически готовы идти в одном и том же направлении за водой, но не были биологически предрасположены искать пищу в том же месте более одного раза.
Весьма любопытен в этом отношении эксперимент, поставленный Гарсией и Келлингом, результаты которого, получившие известность как «эффект Гарсиа», внесли большой вклад в понимание роли врожденной готовности к научению.
Гарсиа и Келлинг давали крысам, которые хотели пить, получить воду в четырёх ситуациях. Первой группе предложили подсвеченную воду, питьё которой сразу же сопровождалось ударом током по лапам. Второй группе дали подсвеченную воду, но вместо электрошока крыс облучали рентгеном, чтобы вызвать тошноту. Третья группа получала воду без подсветки, но со вкусом сахарина; эти животные, как и в первой группе, подвергались электрошоку сразу после питья раствора сахарина. Четвертой группе дали раствор сахарина и просветили рентгеновскими лучами, после чего они чувствовали недомогание.
Гарсиа и Келлинг обнаружили, что крысы из первой группы стали избегать подсвеченную воду; а с животными из второй группы этого не произошло. У третьей группы не сформировалось отвращение к воде со вкусом сахарина, тогда как у четвёртой оно проявилось.
Из этого видно, что подсвеченная вода становится условным сигналом опасности в паре с электрошоком, но не с тошнотой. Также обстоит дело со вкусом сахарина, становящимся тревожным сигналом в сочетании с тошнотой, но не электрошоком.
Гарсиа и Келлинг объяснили полученные результаты наличием естественных взаимосвязей между внешними событиями и болью, которую испытывали животные. Проще говоря, боль приходила извне, и поэтому крысы искали её предвестник во внешней среде, которым в данном случае была подсветка, ассоциированная с питьём. Тошнота же переживалась внутренне, поэтому животные связывали с ней вкус сахарина, а не подсветку. Можно сказать, что крысы были биологически готовы создать ассоциацию между подсвеченной водой и болью, но не готовы связать подсвеченную воду с тошнотой. Точно так же животные имели врожденную предрасположенность сформировать ассоциацию между вкусом сахарина и тошнотой, и не были биологически готовы связать вкус сахарина с болью.
Другое исследование является примером концепции готовности к научению, продемонстрировавшим различия между видами. В этом исследовании, крысам и перепёлкам давалась солёная вода голубого цвета, вызывавшая у них болезненное состояние. После того, как оба вида пили предложенную воду и заболевали, им предлагался выбор между голубой и солёной водой. Крысы избегали пить солёную воду, а перепёлки – голубую. Полученные данные отражают тот факт, что крысы в еде/питье полагаются на вкус, а перепёлки – на визуальные признаки. Таким образом, каждый вид образовал взаимосвязь в соответствии со своими генетическими особенностями.
Следующим примером влияния врожденных тенденций на научение являются случаи, описанные супругами Бриленд. Бывшие сотрудники Скиннера, они основали собственное предприятие, и, вооружившись принципами оперантного научения, занялись дрессировкой животных. Чета Брилендов сумели обучить огромное количество разнообразных животных различным трюкам и фокусам. Дрессированные животные демонстрировались на выставках, собраниях, парках развлечений и по телевизору.
Всё складывалось хорошо, пока они не стали свидетелями срывов сформированного поведения. Бриленды обнаружили, что хотя поначалу животные обучались очень хорошо, в конце концов у них проявлялось инстинктивное поведение, которое препятствовало проявлению выученного. Например, они взялись обучать енотов поднимать монеты и складывать их в жестяную коробку. Научить енота поднимать одну монету не составило труда. Но когда его начали учить опускать её в коробку, возникли проблемы. Выяснилось что енот ни в какую не хотел расставаться с монетой, он просто не мог позволить ей упасть в коробку. Енот почему-то начинал втирать монету во внутреннюю поверхность коробки, затем вынимал её и крепко держал в течении нескольких секунд. Тем не менее, в конечном итоге енот всё-таки опускал монету в коробку и получал за это лакомство.
Однако, когда от енота потребовалось опустить в коробку две монеты, обнаружилось что он не способен выпустить их из лап. Вместо этого, он начинал тереть их друг о друга, класть в коробку и тут же доставать их обратно. Поведение, связанное с трением, становилось все более и более явным, несмотря на то, что задерживало или вовсе препятствовало получению вознаграждения. Бриленды пришли к выводу, что обучить енота класть в коробку две монеты невозможно. Создавалось впечатление, что врожденное поведение, связанное с приёмом пищи, оказалось слишком сильным, чтобы оперантные принципы могли его преодолеть. Иначе говоря, врожденная склонность енота мыть еду и проделывать над ней видоспецифические манипуляции уверенно взяла вверх над выученным поведением.
Исходя из этого, и других похожих наблюдений, Бриленды пришли к заключению, что если у животного есть сильные инстинктивные паттерны поведения в области приобретенной реакции, то после продолжительной работы поведение животного сместиться в сторону инстинктов, в ущерб выученным элементам, даже если этим задержит или вовсе предотвратит получение вознаграждения. То есть, приобретенное поведение имеет склонность смещаться к инстинктивному поведению. Процесс вытеснения приобретенной программы поведения врожденными элементами они назвали инстинктивным дрейфом.
Ещё одним примером ограничения гибкости приобретаемого поведения врожденными шаблонами хорошо демонстрируют эксперименты на избегание. Так, не раз отмечалось, что было легко обучить крысу нажимать на рычаг для получения корма, но необычайно трудно, чтобы избежать удара током. Зато, если для избежания негативных последствий требовалась видоспецифическая защитная реакция – застывание на месте, бегство, визг, подпрыгивания – то обучение происходило моментально.
Также легко происходило и обучение голубей перелетать с ветки на ветку для избегания удара током, но практически невозможно было научить их клевать с той же целью кнопку.
Однако, во многих экспериментах голуби клюют подсвеченную кнопку для получения пищевого вознаграждения. Как и голуби, зяблики научаются клевать кнопку для получения корма; но, хотя они способны выучить ряд реакций для того, чтобы услышать запись с пением другого зяблика, они не научаются клевать кнопку с этой целью.
Дело в том, что клевание является естественной реакцией, относящейся к пищевому поведению, но зяблики генетически не предрасположены ассоциировать клевание с пением птиц.
Мой собственный (почти 20-летний) опыт дрессировки собак также содержит ряд примеров, показывающих роль врожденных склонностей в обучении. Например, кавказцы, и — в несколько меньшей степени — среднеазиаты, предпочитают работать по человеку укусами. Большинству из них крайне затруднительно поставить глубокую крепкую хватку. В то время как поставить «мёртвую» хватку собакам бойцовых пород – стаффам, питбулям, бультерьерам – как правило не составляет труда. При этом, кавказцы обычно обладают естественной ярко выраженной склонностью к охранному поведению, которую редко удаётся выработать у тех собак, которые сами её не проявляют.
Есть и другие показательные случаи. Так, в конце 90-х у нас на площадке встречались стаффы, которые несмотря на постановку атаки в руки, на пусках упорно охотились за ногами. Такие же «подлецы» встречались и у нашего коллеги, тренировавшего собак на рукав, но вынужденного периодически спасать свои многострадальные ноги от их укусов.
Кто увлекался собачьими боями или хотя бы наблюдал их, знает, что стиль боя бойцовской собаки – «головник», «низовик» или «универсал» — закладывается от рождения, а не является результатом тренировки. По-видимому, нам попадались как раз такие «низовики», чьё инстинктивное стремление к работе по ногам пересиливало проводимое обучение.
Бывали и обратные случаи, когда собаки дрессируемые по всем правилам на ноги, в упор их игнорировали, соглашаясь хватать только руки.
Очевидный прогноз, вытекающий из всего вышесказанного, состоит в том, что каждый вид животных, и каждое его ответвление (порода) имеет свой – естественный или сформированный селекцией — континуум готовности к научению. И чем ближе требуемая от животного реакция к его континууму готовности, тем легче будет проходить обучение. Если же необходимая реакция не является частью врожденного поведенческого репертуара, то она будет формироваться с большим трудом, а то и вовсе не сформируется.
По словам Роберта Боллса:
«Даже случайное наблюдение за крысами в различных ситуациях научения избеганию обнаруживает огромную значимость типа реакции, который требуется от животного; это может определить, состоится ли научение с первой попытки или не произойдет и за тысячу проб. Это гораздо важнее, чем вероятность подкрепления, различные параметры эксперимента, предыдущий опыт животного или различные виды физиологических вмешательств. Выбор необходимой реакции, очевидно, не является делом случая или просто вопросом убеждений, это главный фактор, от которого зависит скорость научения. Серьезным обвинением в адрес классических теорий научения является то, что они не делали и намека на важность выбора реакции».
Другой вывод заключается в следующем – континуум готовности к научению подразделён на несколько секторов, где каждый связан со своей потребностью, служит её удовлетворению и ограничен ею. То есть животному будет очень трудно научиться поведению, которое противоречит естественному поведению в данной ситуации. Например, оно не выучит реакцию, относящуюся к избеганию, в целях получения доступа к пище, равно как и peaкцию связанную с добыванием пищи для избежания опасных или болезненных стимулов. При этом, данные сектора обладают различной степенью пластичности. У крыс и голубей, как видно из приведенных экспериментов, сектор пищевого поведения наиболее гибок и допускает формирование самых разнообразных реакций, в то время как сектор обслуживающий потребность самосохранения накладывает гораздо более строгие ограничения на приобретаемые реакции. По-видимому, это связано с тем, что данные виды имеют множество природных врагов, а угрожающая жизни ситуация не допускает перебора вариантов путём проб и ошибок; попытка спастись должна быть успешна с первого раза. У собак же, судя по всему, поведение формируемое на мотивации самосохранения (посредством парфорса) может быть не менее гибким, чем пищевое поведение.
Подвести итог можно хорошо известной питменской мудростью, слегка перефразированной мною: самая большая ошибка в дрессировке собаки – дрессировка не тому и не той собаки!