Условные рефлексы второго типа и драйв
В предыдущей главе было показано (эксперименты VII и VIII), что образования условного рефлекса второго типа на спорадический раздражитель не происходит, если движение просто сочетается с этим раздражителем и подкрепляется пищей. Для выработки этого рефлекса необходимо, чтобы раздражитель иногда применялся отдельно без движения и без предъявления пищи. В соответствии с тем, что говорилось в гл. VI (разд. 4), отдельные случаи неподкрепления этого раздражителя предотвращают образование на него условного пищевого исполнительного рефлекса и сохраняют его способность вызывать драйв голода, что необходимо для образования инструментального рефлекса. Таким образом, наше положение о частично тормозном характере условного раздражителя второго типа (в отношении пищевого исполнительного рефлекса) в некотором смысле подтверждается, поскольку торможение условного рефлекса на пищу позволяет проявиться условному рефлексу голода. Напротив, тормозной эффект на инструментальные реакции со стороны пищевого исполнительного условного сигнала, показанный в предыдущей главе в эксперименте XIV (фиг. 75), оказывается еще одним подтверждением существования антагонизма между условным рефлексом на пищу и условным рефлексом голода. Этот антагонизм, как отмечалось в гл. I, имеет одностороннюю направленность.
В хорошем соответствии с этой трактовкой отношений между условным рефлексом первого типа (на пищу) и условным рефлексом второго типа (рефлекс голода) оказываются данные о трудности переделки классического пищевого условного рефлекса в инструментальный [19, 20]. Было показано, что такая переделка для животного гораздо труднее, чем образование инструментального рефлекса на новый раздражитель. Условный сигнал второго типа, переделанный из условного сигнала первого типа, в течение долгого времени остается более слабым, чем условный сигнал второго типа, который был таковым с самого начала (фиг. 85). Более того, угашение условного рефлекса на первоначально условный сигнал второго типа происходит значительно труднее, чем угашение рефлекса на переделанный сигнал.
Это объясняется тем, что если на данный раздражитель уже выработан условный исполнительный рефлекс, то этот раздражитель вызывает антидрайв голода, который задерживает образование условного драйв-рефлекса, контролирующего данный инструментальный ответ. Если данный условный рефлекс первого типа частично тормозится неподкреплением (когда заученное движение не выполняется), то условный драйв-рефлекс голода возрастает. Однако позже, при пищевом подкреплении того условного сигнала, который вызвал движение, условный рефлекс на пищу восстанавливается и опять начинает мешать выполнению движения. Вместе с тем первоначальный условный рефлекс второго типа не всегда является чистым драйв-рефлексом голода. В действительности при прочно выработанной инструментальной реакции каждое предъявление условного сигнала регулярно сопровождается пищей, что усиливает тенденцию этого раздражителя стать условным сигналом исполнительного рефлекса.
Эксперимент VII. Собаке, у которой уже был выработан ряд классических пищевых условных рефлексов, стали давать новый раздражитель— бульканье. После 10 сек действия этого раздражителя в течение 5 сек производилось пассивное сгибание правой передней лапы (с помощью веревки и системы блоков) и давалась пища.
Результаты экспериментов оказались следующими:
1) после нескольких сочетаний бульканье стало условным сигналом первого типа, о чем свидетельствовала обильная слюноотделительная реакция;
2) активные движения в большом количестве появились в межсигнальных интервалах, но, поскольку они не подкреплялись пищей, они вскоре исчезли;
3) в период, когда собака повторно поднимала правую переднюю лапу в межсигнальных промежутках, бульканье немедленно подавляло это движение. Только тогда, когда бульканье стали применять без сгибания лапы и предъявления пищи, животное начало активно выполнять движение сразу же после условного раздражителя, а затем и в его присутствии.
Эксперимент VIII. Поскольку было подозрение, что бульканье как сильный раздражитель «маскирует» пассивное сгибание, у другой собаки в качестве условного раздражителя был использован легкий шум.
Результат опытов был таким же, как и с бульканьем. Легкий шум стал вызывать незначительное слюноотделение, которое усиливалось при присоединении пассивного сгибания лапы. Очень скоро в интервалах между предъявлениями появились активные движения. Однако животное не производило их во время действия шума до тех пор, пока этот раздражитель не стали иногда применять без поднятия лапы и без подкрепления.
Таким образом ясно, что при обычной выработке инструментальных рефлексов условный драйв-рефлекс голода и условный исполнительный рефлекс «смешиваются» друг с другом в различных соотношениях; преобладание одного из них зависит от характера первоначальной методики и от некоторых других обстоятельств (см. ниже разд. 4). Эти взаимоотношения схематично представлены на фиг. 86.
Настоящее обсуждение проливает свет еще на одно важное различие между выработкой классических и инструментальных условных рефлексов, которое связано с режимом подкрепления.
Хорошо известно, что классический условный рефлекс на пищу, измеряемый величиной слюноотделения, весьма чувствителен к неподкреплению и требует дачи пищи практически при каждой пробе. Для инструментальных условных рефлексов такой строгой процедуры не требуется. Хорошо известно, что в тех экспериментах, где требуется, чтобы животные для получения пищи «работали» в течение длительного времени, применяется обычно именно так называемое «частичное» подкрепление.
Хорошо известно также, что успешность выработки пищевых условных исполнительных рефлексов сильно зависит от величины порций пищи, даваемых при каждом подкреплении. Если эти порции слишком малы, то условный рефлекс оказывается слабым или вовсе не возникает. Кроме того, большой экспериментальный материал павловских лабораторий свидетельствует о том, что промежутки между сочетаниями условного и безусловного раздражителей должны быть довольно большими. Оптимальным является; промежуток 4—5 мин. Наоборот, при инструментальных условных рефлексах оказывается достаточным подкрепление минимальными порциями пищи, поедаемыми в течение секунды. У нас даже сложилось впечатление (правда, не проверенное систематическими исследованиями), что эти рефлексы делаются более стабильными и надёжными, если порции пищи малы, а предъявления часты.
Все эти факты легко объяснить с точки зрения нашей концепции. Большие порции, применяемые для подкрепления, способствуют доминированию исполнительных условных рефлексов над условными рефлексами голода. Малые же и часто подаваемые порции пищи вызывают повторное появление условного драйв-рефлекса, предвосхищающего момент дачи пищи, и условного драйв-рефлекса последействия, сопровождающего проглатывание пищи. Все это повышает «тонус» драйва голода. Что касается нерегулярного подкрепления, то оно может даже улучшить инструментальные, реакции, поскольку при этом исполнительный условный рефлекс на пищу уменьшается, а условный драйв-рефлекс не страдает, будучи явлением тоническим, более устойчивым к угашению.
Отрывок из книги «Интегративная деятельность мозга» Ежи Конорски (1967 г.)