Условные рефлексы и подкрепление

Судаков Константин ВикторовичКак условный рефлекс, так и инструментальные реакции отчетливо проявляются только при наличии соответствующей мотивации. И в том, и в другом случае имеется подкрепление, удовлетворяющее данную мотивацию. Все различие заключается в том, каким образом осуществляется в каждой из этих реакций подкрепление. В случае условного рефлекса оно пассивно предоставляется животному экспериментатором вслед за условным сигналом. В инструментальной реакции животное для того, чтобы получить подкрепление должно активно совершить ряд действий (нажать на рычаг, толкнуть дверцу и т. д.), т. е. получить предварительный этапный результат и активно оценить его.
В выработанном рефлексе тот или иной сигнал уже заключает в себе надежную гарантию будущего подкрепления, которое осуществляет экспериментатор. Для того чтобы получить его, животное не должно осуществлять никакой деятельности. Таким образом, акцептор результатов действия в случае условного рефлекса заключает в себе только параметры следующего за сигналом подкрепления. Совершенно другая картина наблюдается в случае инструментальной реакции. Здесь для того, чтобы получить соответствующее подкрепление, животное должно еще путем проб и ошибок совершить этапные действия, оценить их и получить адекватное подкрепление. Следовательно, аппарат акцептора результатов действия в этом случае более сложен. Он включает в себя не только свойства подкрепления, но и параметры результатов тех этапных действий, которые ведут к этому подкреплению.

Судаков К.В. «Биологические мотивации» (1971 г.)

О зависимости мотивации от подкрепления

Собака не видит вознаграждения.Если тот или иной раздражитель внешнего мира длительное время или на протяжении даже всей жизни данного индивидуума успешно сигнализирует животному о последующем подкреплении, то в этом случае происходит процесс автоматизации этой деятельности. Соответствующий внешний раздражитель заставляет животное принудительно совершать определенную деятельность даже при отсутствии соответствующей потребности.
Однако подчеркнем, что и в этих случаях, если соответствующий раздражитель внешнего мира перестает по каким-либо причинам сигнализировать о последующей жизненно важной деятельности, он утрачивает свое сигнальное значение, т. е. теряет свои связи с подкреплением.


Судаков К.В. «Биологические мотивации» (1971 г.)

Законы оперантного научения Скиннера

Беррес Фредерик Скиннер1. Закон приобретения. Голубь, помещенный в клетку, на стенке которой имеется точка, лишь случайным образом может клюнуть в неё. Но если сразу вслед за этим он получит пищу — зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал «законом выгоды (приобретения)», иногда его еще называют первым законом оперантного научения. (По сути, частное выражение закона эффекта Торндайка).

2. Закон соответствия (Хернштейна). Частота поведения прямо пропорциональна частоте подкрепления. В случае, когда две альтернативные реакции управляются двумя независимыми режимами подкрепления, сравнительная частота реагирования на альтернативные стимулы приблизительно соответствует сравнительной частоте их подкрепления.
Читать дальше

Законы Высшей нервной деятельности по Павлову

Иван Петрович Павлов1. Закон образования временной нервной связи. При многократном подкреплении нейтрального раздражителя безусловным (жизненно значимым) раздражителем между корковыми центрами этих воздействий образуется временная нервная связь.

Для образования условных рефлексов необходимо:

а) Наличие двух раздражителей: индифферентного (будущего условного) и безусловного, вызывающего ответное действие собаки.

б) Применение этих раздражителей (сочетание) должно совпадать во времени в пределах 0,5–2 секунд.

в) Действие сигнального раздражителя должно предшествовать действию безусловного в пределах 0,5–2 секунд.

г) Нервные центры коры головного мозга в момент выработки условного рефлекса должны быть свободными от других видов нервной деятельности и находиться в активном состоянии.

д) Сила возбуждения на безусловный раздражитель должна быть большей, чем на сигнальный, но не вызывать торможения рефлекса.

е) Посторонние раздражители, вызывающие ориентировочную реакцию и отвлечение, должны отсутствовать.

Читать дальше

Законы научения Торндайка

Эдвард Ли Торндайк

1. Закон эффекта. Поощрение увеличивает вероятность повторения предшествующего ему поведения, а наказание — снижает. Кратко: «Последствия поведения определяют вероятность его повторения».

2. Закон готовности. Суть которого в том, что образование новых связей зависит от состояния субъекта. Чем сильнее потребность, тем успешнее научение.

3. Закон упражнения. Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем она прочнее.

Читать дальше

1 2 3 4 5