Оперантное научение: Оперантное научение в психологии

Содержание

Оперантное научение в психологии

Сущность понятия «оперантное научение»

Определение 1

Оперантное научение – это вид научения, которое происходит на основе подкрепления реакций, относящихся к типу оперантов.

Данный вид научения описали американские ученые-психологи Б. Скиннер и Э. Торндайк. Они считали, что подкрепления результатов упражнений необходимо внести в схему научения.

Основу оперантного научения составляет схема «ситуация-реакция-подкрепление». В качестве первого звена Э. Торндайк в схему научения вводит проблемную ситуацию. Выход из этой ситуации сопровождался пробами и ошибками, которые могли привести к случайному успеху.

Закономерности решения проблемных ситуаций Торндайк первоначально изучал на животных, а позднее на маленьких детях. Анализируя сложное спонтанное поведение животных в поисках выхода, определить стимул на определенную реакцию было сложно. Постепенно у животных стали наблюдаться реакции, ведущие к цели. Торндайк вывел формулу для всех типов поведения, как животных, так и человека – «пробы, ошибки и случайный успех» и высказал предположение, что данный процесс определяют три закона поведения:

  • готовность, определяемая навыком в организме нужного состояния, которое будет толкать к активности, например, чувство голода;
  • упражнения (повторение) – часто совершаемое действие чаще выбирается в последствии;
  • эффект (подкрепление) дает чаще повторяемое действие.

Что касается проблем школьного обучения, то Торндайк определяет их как искусство создавать и задерживать стимулы. Это необходимо для того, чтобы предотвратить или, наоборот, вызвать какие-либо реакции.

Замечание 1

Стимулами для ребенка могут быть слово, фраза, взгляд, обращенные к нему, а ответной реакцией будет состояние ученика, его действия, мысли и чувства.

Активность организма при оперантном научении очень большая и контролируется результатами. В общем, получается, что если действия привели к положительному и позитивному результату и успех достигнут, то эти действия будут закрепляться и повторяться.

На основании собственного опыта, ребенок имеет разнообразные интересы, и задача учителя заключается в том, чтобы среди них увидеть «хорошие» для дальнейшего их развития. Для того чтобы направить интересы ребенка в нужное русло учителю необходимо связать выполняемую работу с чем-то важным для ребенка, например, с его статусом в классе.

Также можно использовать механизм подражания, когда учитель, влюбленный в свой предмет передает эту любовь своим ученикам, заинтересовывает их своим предметом.

Ещё один путь учителя к ученику – это сообщать ему такую информацию, которая вызовет интерес к предмету.

Если говорить в целом, то опыты Торндайка с лабиринтом являются упрощенной моделью окружающей среды. В какой-то мере лабиринтная методика действительно моделирует отношения организма и среды, но односторонне и очень ограниченно, поэтому переносить открытые закономерности на социальное поведение человека довольно трудно.

Оперантное научение Б.Ф. Скиннера

В психологии существует много интересных теорий и методик. Такие методики, как оперантное научение оказывают помощь семье, оказывают влияние на успеваемость детей, повышают самооценку и др.

Замечание 2

Суть оперантного научения заключается в установке ассоциативной связи между поведением и следствием этого поведения.

Научение – это своеобразный метод обучения, требующий конкретного действия. Часто оперантное научение называют методом Скиннера, который был убежден, что любое поведение мыслями или мотивацией объяснить невозможно.

Скиннер использовал термин оперантный для описания любого поведения, говоря другими словами, Скиннер объяснил на примере научения, как люди приобретают привычки и модель поведения в повседневной жизни.

Рисунок 1. Оперантное научение. Автор24 — интернет-биржа студенческих работ

Теория оперантного научения Скиннера включает следующие положения:

  • На основе реакций вырабатываются классические условные рефлексы, а на основе оперантов вырабатываются инструментальные рефлексы. Условный рефлекс вырабатывается в результате образования ассоциации между безусловным и нейтральным раздражителями. Инструментальный рефлекс образуется между определенным поведением и его последствиями;
  • Только при наличии подкрепления возможно любое научение. Скиннер, исходя из закона эффекта Торндайка, определил подкрепление, убрав из него субъективное понятие, связанное с состоянием удовлетворения. Любое событие, сочетающееся с каким-либо видом поведения, Скиннер понимает как подкрепление. Например, для голодного животного в его ящике подача пищи будет подкреплением;
  • Любое поведение можно создать подкреплением – на основании этого положения ученый разработал способ формирования поведения через последовательные приближения. Суть его заключается в том, что путь от исходного поведения до конечной реакции, разбивается на несколько этапов. Каждый из этапов необходимо систематически подкреплять, приближаясь к нужной форме поведения;
  • Поведение человека и животного зависит от внешней среды и системы внешних подкрепляющих факторов. Человек только думает, что свободен в выборе поведения и что сам решает свою судьбу, но, на самом деле он похож на животное, помещенное в ящик Скиннера. В повседневной жизни можно увидеть множество примеров оперантного научения с перспективой награды и использование этого научения с целью отучить человека от нежелательной привычки наказанием или лишением желаемого.

Выделяется два вида подпитки:

  1. позитивное подкрепление используется для поощрения нужной модели поведения;
  2. негативное подкрепление – это действия, не несущие в себе удовольствие.

Наказание используется при необходимости прекратить нежелательную модель поведения. Выделяется два вида наказаний – позитивное и негативное.

Примеры и формы оперантного научения

Примерами оперантного научения являются катание на доске, игра на музыкальном инструменте, метание дротиков – это образцы оперантной реакции. Эти реакции самостоятельно приобретены, поэтому для них стимул, который можно было бы распознать, существовать не может.

Рассуждать о возникновении оперантного метода поведения бессмысленно, и Скиннер этого не отрицал.

Стимулы или внутренне причины, ответственные за их появление не могут быть известны, а это значит, что возникают они спонтанно.

В случае благоприятного отражения последствий на организме, вероятность их повторения будет сильнее, это значит, что последствия подпитываются, благодаря которому происходит оперантное обусловливание.

Величина стимула позитивного подкрепления воздействует на последующую частоту реакции соответственно.

Теория, таким образом, действует и в обратном направлении – если реакция неблагоприятная и отсутствует подкрепление, то значительно уменьшается вероятность получения операнта.

Являясь следствием, оперантное обусловливание, считал Скиннер, может контролироваться неприятными последствиями. Агрессивное или негативное последствие может ослабить поведение, и оно же усиливает поведение, которое их устраняет.

Научение можно рассматривать как форму обучения.

Встречается оперантный метод поведения в каждой семье и с самого раннего детства – это плач. Когда маленький ребенок плачет, возникает моментальная реакция родителей, что является выражением внимания и других подкреплений.

Подкрепляющим фактором для плачущего ребенка будет внимание родителей. Однако учитывать надо и то, что плач может быть не всегда следствием боли, а просто желанием внимания.

Интересным примером являются дрессировки животных в цирке, когда их побуждают совершать какие-либо действия и затем угощают небольшим кусочком пищи, чаще всего кусочком сахара.

Когда животное освоило действие, его побуждают совершить новое и, если это новое действие животное не осваивает, то остается без лакомства.

Поэтому каждая новая попытка будет продолжаться до достижения цели. Поведение, при необходимом порядке подпитки, поддается контролю и управлению.

Замечание 3

Проведя многочисленные эксперименты, Скиннер утверждал, что научения одинаково закономерны и для людей, и для животных.

§ 3. Оперантное научение

Экспериментальное исследование условий приобретения действительно нового поведения, а также динамики научения находилось в центре внимания американского психолога Э. Торндайка. В работах Торндайка изучались преимущественно закономерности решения проблемных ситуаций животными. Животное (кошка, собака, обезьяна) должно было самостоятельно найти выход из специально сконструированного «проблемного ящика» или из лабиринта. Позже в качестве испытуемых в аналогичных опытах участвовали и маленькие дети.

При анализе такого сложного спонтанного поведения, каким представляется поиск способа решения лабиринтной задачи или отпирания дверцы (в отличие от ответного, респондентного), трудно выделить стимул, вызывающий определенную реакцию. По данным Торндайка, первоначально животные совершали множество хаотичных движений — проб и лишь случайно производили нужные, которые приводили к успеху. При последующих попытках выйти из этого же ящика наблюдалось уменьшение числа ошибок, и сокращение количества затраченного времени. Тип научения, когда испытуемый, как правило, неосознанно пробует разные варианты поведения, операнты (от англ. operate — действовать), из которых «отбирается» наиболее подходящий, наиболее адаптивный, получил название оперантного обусловливания. Метод «проб и ошибок» в решении интеллектуальных задач стал рассматриваться как общая закономерность, характеризующая поведение и животных, и человека. Торндайк сформулировал четыре основных закона научения.

1. Закон повторения (упражнения). Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем она прочнее.

2. Закон эффекта (подкрепления). При выучивании реакций закрепляются те из них, которые сопровождаются подкреплением (положительным или отрицательным).

3. Закон готовности. Состояние субъекта (испытываемые им чувства голода, жажды) небезразлично для выработки новых реакций.

4. Закон ассоциативного сдвига (смежности во времени). Нейтральный стимул, связанный по ассоциации со значимым, тоже начинает вызывать нужное поведение. Торндайком были выделены также дополнительные условия успешности научения ребенка — легкость различения стимула и реакции и осознание связи между ними. Оперантное научение происходит при большей активности организма, оно контролируется (определяется) его результатами, последствиями. Общая тенденция такова, что если действия привели к позитивному результату, к успеху, то они будут закреплены и повторены.

Лабиринт в опытах Торндайка служил упрощенной моделью окружающей среды. Лабиринтная методика действительно в какой-то мере моделирует отношения организма и среды, но очень узко, односторонне, ограниченно; и переносить закономерности, открытые в рамках этой модели, на социальное поведение человека в сложно организованном обществе чрезвычайно трудно.

Виднейший теоретик строгого бихевиоризма Б.Ф. Скиннер (1904—1990) настаивал на том, что научными методами можно познать все поведение человека, поскольку оно детерминировано объективно (окружающей средой). Скиннер отвергал понятия скрытых психических процессов, таких, как мотивы, цели, чувства, бессознательные тенденции и пр. Он утверждал, что поведение человека почти всецело формируется его внешним окружением. Такую позицию называют иногда инвайронментализмом (от англ. environment — среда, окружение). «Черный ящик человеческой психики» должен быть, по мнению Скиннера, исключен из эмпирического исследования, усилия должны быть направлены на изучение открытого, доступного непосредственному наблюдению, поведения человека, на установление тех факторов среды, которые, в конечном счете, определяют и контролируют действия человека.

Скиннер считал, что экспериментальный анализ поведения животных (крыс, голубей) позволит открыть принципы поведения, общие для животных и человека. С опорой на всеобщие закономерности поведения важнейшая практическая психолого-педагогическая задача обучения и воспитания становится решаемой. Манипулируя переменными окружающей среды (т.е. независимыми переменными), можно прогнозировать и контролировать поведенческие реакции индивида (зависимые переменные). Скиннер признавал существование двух основных типов поведения: респондентного и оперантного. Однако он полагал, что главное — оперантное поведение, т.е. спонтанные действия, для которых не существует первоначального стимула, поддающегося распознаванию. Для животных и человека важны последствия — события, наступающие в результате поведения. В зависимости от последствий складывается определенная тенденция в отношении такого поведения в будущем. Оперантные реакции постепенно приобретают характер произвольных. По оперантному типу научения происходит формирование множества форм человеческого поведения (умение одеваться, привычка читать книги, сдерживать проявления агрессии, преодолевать застенчивость и т.
п.). Реакция, за которой следует позитивный результат, стремится повториться. Так, в большинстве семей можно наблюдать оперантное научение плачу. Крик и плач как безусловные реакции ребенка на физический дискомфорт вызывают у родителей стремление подойти к ребенку, успокоить его, оказать помощь и внимание. Такая забота оказывается мощным позитивным подкреплением для плача ребенка; и плач становится оперантно обусловленным средством контроля за поведением родителей. В то же время вероятность повторения реакции, за которой следует негативный результат или наказание, уменьшается. Если знакомый в ответ на приветствие поджимает губы и делает вид, что нас не замечает, мы скоро перестанем здороваться с ним. Подкрепление — ключевое понятие концепции Скиннера. Подкрепление усиливает реакцию, увеличивает вероятность ее появления. В бихевиоральном научении признавали два типа подкрепления: первичное (или безусловное — вода, еда, секс) и вторичное (или условное — деньги, внимание со стороны значимого другого, одобрение родителей, сверстников, учителей). По Скиннеру, вторичные подкрепляющие стимулы становятся подкреплением в результате прошлого опыта, они общие для большинства людей и оказывают сильное влияние на их поведение. Скиннер выделял также подкрепление позитивное и негативное. Позитивное подкрепление усиливает реакцию, сопровождая ее приятными последствиями (пища, внимание). Негативное подкрепление тоже усиливает поведенческую реакцию, но за счет устранения раздражающих стимулов (подросток начинает употреблять ругательные слова и выражения, стремясь избежать насмешек приятелей типа «маменькин сынок, малыш»).

Поведение может контролироваться также с помощью наказания (мать подростка может ударить его по губам за ругательства или лишить карманных денег). Такое последствие призвано прекратить, изжить поведенческую реакцию. Техника наказания в современном обществе применяется чаще всего, но Скиннер стремился доказать, что подобный контроль поведения неэффективен (лишь временно откладывает нежелательное поведение) и, что еще хуже, вызывает негативные побочные эффекты (страх, тревогу, падение самооценки, грубые формы асоциального поведения). Он настаивал на том, что позитивное подкрепление (поощрение желательных образцов) гораздо более надежный метод формирования поведения и у детей, и у взрослых. В случае научения сложному поведению (такому, как навыки письма или межличностного общения или выработка аккуратности) используется метод последовательного приближения, или формирования. Шаг за шагом, ступенька за ступенькой, подкрепление многократно включается при изменении поведения в направлении желаемого. Другой принцип научения — незамедлительность подкрепления. При обучении самостоятельной аккуратной еде ребенка последовательно подкрепляют: хвалят за попытку взять ложку в руку, направить ее в рот, восхищаются его усилиями, подбадривают малыша, хотя на первых порах он и теряет по дороге почти все содержимое. И только в результате постепенного приближения к нужному результату добиваются от ребенка аккуратности и чистоты одежды и стола.

Скиннер утверждал, что даже вербальное поведение, или устная речь, приобретается через процесс успешного последовательного приближения. Однако многие психологи совершенно не согласны с тем, что язык может быть усвоен таким способом, подчеркивая тем самым столь высокую скорость речевого развития в раннем детстве, которую невозможно объяснить, исходя из принципов оперантного обусловливания. Проблема социализации человека рассмотрена Скиннером в книгах «По ту сторону свободы и достоинства» (1971), «Размышления о бихевиоризме и обществе» (1978). В концепции Скиннера развитие ребенка — это обучение его нормативному поведению в соответствии с направлениями подкрепления. На ранних этапах агентами социализации и источниками подкрепления выступают родители, позже число источников подкрепления расширяется — это и соседи, и школа, и мнение сверстников. Скиннер придерживался мнения, что поведение человека в течение жизни изменяется, и периодически возникают кризисы. Кризисные явления вызываются такими изменениями среды, к которым индивид не имеет адекватного набора поведенческих реакций. В бихевиоризме не стоит проблема возрастной периодизации развития, так как считается, что среда формирует поведение ребенка постоянно, непрерывно и постепенно. Периодизация развития зависит от среды. Не существует единых для всех детей закономерностей развития в данный возрастной период: какова среда, таковы и закономерности развития данного ребенка. Речь может идти только о создании функциональной периодизации, которая позволила бы наметить этапы научения, формирования определенного навык (этапы развития игры, обучения письму или игре в теннис).

Постоянный опыт научения создает то, что в других психологических школах называют личностью. Личность — это тот опыт, который человек приобрел в течение жизни. Уникальность человека задается своеобразным сочетанием генетических характеристик и

индивидуальным репертуаром научения. Психическое развитие, таким образом, отождествляется с научением, т.е. с любым приобретением знаний, умений, навыков — и в условиях специального обучения, и возникающих стихийно. Человек таков, каким он научился быть.

Таблица 10

Теория оперантного научения — Теория оперантного научения и образование

Оглавление:

Важной отправной точкой для понимания теории Б. Ф. Скиннера является его классификация типов поведения. Классификация типов поведения Ф. Скиннера. Он провел различие между «ответным поведением» и «оперантным поведением». Поведение испытуемого вызывается известным стимулом. Примером реагирующего поведения являются все безусловные реакции, они возникают в результате безусловного стимула. Оперантное поведение не вызывается стимулом, оно просто вырабатывается организмом. Поскольку оперантное поведение не связано с известными стимулами, оно возникает спонтанно. Проявления оперантного поведения разнообразны; большинство наших повседневных действий могут быть квалифицированы как оперантное поведение.

Б. Скиннер не утверждал, что оперантное поведение возникает независимо от стимулов, наоборот. Проще говоря, стимул, вызывающий оперантное поведение, неизвестен, и его причина не обязательно известна. Ответное поведение полностью зависит от стимула, который ему предшествовал. В отличие от этого, оперантное поведение определяется его последствиями.

Помимо двух типов поведения, согласно Скиннеру, существует также два типа обусловливания: «отвечающее обусловливание» и «оперантное обусловливание». Реактивное обусловливание идентично павловскому классическому обусловливанию и было названо Скиннером обусловливанием пятого типа. Это подчеркивает важность стимула в вызывании желаемой реакции. Скиннер называет оперантное обусловливание и подчеркивает, что акцент в данном случае делается на ответной реакции.

В кондиционировании типа R сила кондиционирования оценивается по скорости реакции, в то время как в кондиционировании типа 5 сила кондиционирования часто определяется величиной обусловленной реакции. Легко заметить, что R-тип кондиционирования Скиннера очень похож на «инструментальное кондиционирование» Э. Торндайка, а его S-тип — на «классическое кондиционирование» Павлова. В центре внимания собственных исследований Скиннера было оперантное обусловливание, или «R»-тип обусловливания, как он его называл.

Б. Скиннер выделил два основных принципа оперантного обусловливания

  1. Любая реакция, которая следует за подкрепляющим стимулом, предрасположена к повторению.
  2. подкрепляющим стимулом может быть все, что увеличивает скорость возникновения оперантного ответа.

Все, что увеличивает вероятность повторения реакции, может быть подкрепляющим стимулом. Как вы можете легко видеть, принципы оперантного обусловливания можно применять в самых разных ситуациях. Чтобы изменить поведение, необходимо найти что-то, что служит подкреплением для организма. Затем нужно подождать, пока желаемое поведение проявится, и только после этого делать подкрепление.

В увлекательной книге «Не рычите на собаку» американского зоопсихолога и дрессировщика Карен Прайор, последовательницы Б.Ф. Скиннера, описано множество примеров использования оперантного обучения в дрессировке морских животных. Дельфины, участвовавшие в ее исследовании, не только научились выполнять команды человека, но даже успешно решали творческие задачи.
После этого частота желаемого отклика будет увеличиваться. Когда желаемое поведение проявляется снова, оно снова подкрепляется, и скорость реакции продолжает расти. Аналогичное влияние можно оказать на любое поведение организма.

Б. Ф. Скиннер рассматривал социокультурную среду как набор возможностей подкрепления. Из-за различий в социокультурной среде укрепляются разные модели поведения. Согласно Б.Ф. Скиннеру, то, что называется «личностью», — это не более чем последовательные модели поведения, которые являются результатом нашей истории подкрепления.

Теория оперантного научения и образование

Американский психолог Беррес Фредерик Скиннер продолжил развитие поведенческих концепций. Основываясь на теории И.П. Павлова о безусловных и условных рефлексах, исследователь предложил теорию оперантного обучения. Согласно этой концепции, организм приобретает новые реакции через подкрепление. В зависимости от того, является ли подкрепление положительным или отрицательным, поведенческое действие либо повторяется, либо формируется тенденция, либо его избегают, либо не придают ему значения. Скиннер предложил четыре типа подкрепления с различными формами ответа:

  • с постоянным соотношением;
  • постоянный интервал;
  • с переменным коэффициентом;
  • переменный интервал.

На основе концепции оперантного обучения Б. Ф. Скиннер предложил программу модификации поведения для психиатрических больниц, школ, социальных служб и исправительных учреждений. Программа модификации поведения была основана на использовании положительного подкрепления для контроля или изменения человека или группы.

По словам Б. Ф. Скиннера, на поведение всегда влияет подкрепление, даже если человек этого не осознает. Решающий вопрос заключается не в том, контролируется ли поведение, а в том, кто или что его контролирует. Благодаря подкреплению наше поведение контролируется многочисленными факторами окружающей среды. Например, родители или педагоги могут направлять развитие личности ребенка, намеренно подкрепляя определенные модели поведения, но они также могут вольно или невольно отдавать предпочтение подкреплению со стороны сверстников, телевидения или Интернета. Как бы просто это ни казалось на первый взгляд, очень трудно действительно использовать подкрепление, чтобы задать направление развития. Чтобы успешно решить эту задачу, Б.Ф. Скиннер и его последователи разработали ряд рекомендаций для родителей и педагогов.

Во-первых, они предлагают воспитателям (родителям или учителям) решить, какими личностными характеристиками они хотят наделить своего ребенка. Например, они предполагают, что ребенок должен вырасти творческой личностью.

Во-вторых, педагогов просят выразить свои цели в терминах поведенческих намерений. В нашем случае это предполагает поиск ответа на вопрос: «Что будет делать ребенок, когда создаст себя?»

В-третьих, необходимо вознаграждать поведение, соответствующее этим целям. Если воспитатели имеют представление о наиболее желательных формах поведения, они могут поощрять творческие действия, когда они происходят.

В-четвертых, воспитателей поощряют быть последовательными и формировать важные аспекты окружения ребенка, включая поощрение тех форм поведения, которые считаются наиболее ценными.

Применение этих простых правил, по мнению Б. Ф. Скиннера и его последователей, обязательно приведет к успеху. Напротив, если этим пренебречь, педагоги могут злоупотреблять механизмом оперантного обусловливания. В результате они могут достичь эффектов, прямо противоположных желаемым.

Как научить ребенка вас раздражать

Б. Ф. Скиннер в одной из своих работ приводит пример того, как поведение матери приводит к результатам, прямо противоположным желаемым. Поскольку мать озабочена, она часто не реагирует на просьбы или призывы ребенка, высказанные спокойно и тихо. Она начинает реагировать на ребенка только тогда, когда он повышает голос. Это переводит среднюю интенсивность вокального поведения ребенка на другой уровень. Со временем мать привыкает к этому уровню и снова усиливает еще более громкие звуки. Создается порочный круг, который только еще больше увеличивает громкость голоса. Б.Ф. Скиннер отметил, что мать вела себя так, как будто это ее работа — научить ребенка злиться.

Окружающая среда, по словам Б. Ф. Скиннера, постоянно подкрепляет каким-то образом поведение живых существ. Педагог либо позволяет принципам обучения непроизвольно влиять на поведение своих учеников, либо сам задает направление их развитию путем систематического применения этих принципов

Поведение, по мнению Б. Ф. Скиннера, сохраняет поведение, потому что оно подкрепляется. Это касается как нежелательного, так и желательного поведения. Чтобы избавиться от нежелательного поведения, мы должны определить источник его подкрепления и нейтрализовать его. Поведение, которое не сопровождается подкреплением, исчезает.

В увлекательной книге преемницы Б.Ф. Скиннера, американского зоопсихолога и дрессировщика Карен Прайор «Не рычите на собаку» описано множество примеров использования оперантного обучения в дрессировке морских животных. Дельфины, участвовавшие в ее исследовании, не только научились выполнять команды человека, но даже успешно решали творческие задачи.

После этого частота желаемого отклика будет увеличиваться. Когда желаемое поведение проявляется снова, оно снова подкрепляется, и скорость реакции продолжает расти. Аналогичное влияние можно оказать на любое поведение организма.

Б. Ф. Скиннер рассматривал социокультурную среду как набор возможностей подкрепления. Из-за различий в социокультурной среде укрепляются разные модели поведения. Согласно Б.Ф. Скиннеру, то, что называется «личностью», — это не более чем последовательные модели поведения, которые являются результатом нашей истории подкрепления.

Смешанное программирование. Ветвящееся программирование, как и линейное, подвергается критике. Возражение вызывает, прежде всего, способ представления ответов. Распознавание одного правильного ответа среди нескольких (нескольких десятков) неполных или неправильных ответов не только не приводит к положительным результатам обучения, но и фактически ослабляет их. Аргументы были следующими: заставляя студентов выбирать ответы, мы заставляем их запоминать и неправильные ответы.

Ленивые или даже амбициозные студенты могут пойти по пути наименьшего сопротивления и просто попытаться угадать ответы.

Практика неустойчивого обучения, принятая в разветвленной учебной программе, также вызвала критику. Это приводит к неспособности обучающегося работать систематически без сбоев. Постоянное обращение к подфрагментам не позволяет ему сосредоточиться на главной теме и не дает возможности отделить главную тему от подтем.

Сторонники смешанного программирования критиковали своих предшественников за попытку втиснуть такой сложный вид деятельности, как обучение, в узкие рамки «обучения через письмо», а сторонники разветвленного программирования — в рамки «обучения через угадывание». По их мнению, гораздо продуктивнее сочетать обе формы представления ответов, что позволит создать более рациональную программу, напоминающую реальный механизм человеческого обучения.

Программированное обучение

Линейное программирование. Как упоминалось ранее, Б.Ф. Скиннер был очень заинтересован в практическом применении теории оперантного обучения в образовании. Он знал, что принципы оперантного обучения обычно игнорируются и не применяются в традиционной педагогике. Чтобы изменить эту ситуацию, он предложил свою альтернативу традиционному обучению, которую назвал «программированное обучение».

Согласно теории Б. Ф. Скиннера, обучение эффективно при трех основных условиях:

  • когда информация, необходимая для обучения, представляется постепенно;
  • когда учащийся получает немедленную обратную связь об адекватности своего обучения;
  • когда обучение происходит в темпе, приемлемом для учащегося.

На этой основе он разрабатывает собственные принципы программированного обучения. Среди наиболее значимых из них — Б. Ф. Скиннер:

  1. принцип маленьких шагов. Учебный материал должен быть разделен на минимально возможные части (шаги). С ними студентам легче справиться, чем с большими.
  2. принцип немедленного подтверждения ответа. После того, как ответ дан, студент должен немедленно проверить его. Только если у них все получилось, они могут переходить к следующему шагу.
  3. принцип индивидуализации темпа обучения. Студент может добиться успеха в учебе только в том случае, если он работает в оптимальном для него темпе.
  4. принцип постепенного увеличения сложности. Уровень сложности программы должен повышаться постепенно, эго путем постепенного уменьшения ведущих инструкций.
  5. принцип дифференцированного углубления знаний. Каждое обобщение, встречающееся в тексте программы, должно быть повторено несколько раз в различных смысловых контекстах и проиллюстрировано достаточным количеством тщательно подобранных примеров.
  6. принцип равномерной прогрессии инструментального обучения. Учащийся подвергается воздействию упорядоченного набора стимулов, на которые он реагирует определенным образом. Его ответы немедленно оцениваются положительно или отрицательно путем сравнения его собственных ответов с эталонами, содержащимися в программе. Делая мало ошибок и отвечая правильно, он приобретает знания «маленькими шажками».

Этот вариант программированного обучения широко известен как «линейное программирование». Изложенные выше принципы составляют его теоретическую основу; что касается специфики разработки «содержательных рамок», форм организации и методов обучения при его применении, то это исключительно педагогические вопросы. Они подробно описаны в работах по дидактике, и мы не будем на них останавливаться.

Ветвящееся программирование. Другой вариант программированного обучения был предложен коллегами Б.Ф. Скиннера — С.Л. Пресси из Огайо и Н.А. Краудером из Чикаго. Эти психологи критиковали линейное программирование Б.Ф. Скиннера, поскольку оно не допускало ошибок при разработке обучающих текстов. Они настаивали на том, что нельзя исключать возможность ошибок, допускаемых учащимися в процессе обучения. Их можно использовать для оптимизации процесса обучения, придав им статус контроля качества и сделав их средством определения того, что ученик не понял.

Более того, авторы нового подхода выступили против идеи Б. Ф. Скиннера о принципе «маленьких шагов» (микроинформация). С. П. Пресси и Н. А. Краудер считают, что ученик, который обречен двигаться к цели маленькими шажками, тем самым лишается возможности достичь цели большими скачками. Вскоре он устает и ему становится скучно. Еще одним недостатком принципа маленьких шагов является то, что он не позволяет индивидуализировать обучение. С его помощью можно лишь регулировать темп обучения и адаптировать его к способностям отдельных учеников.

H. А. Краудер подверг критике практику «конструирования ответа обучающегося», характерную для линейного программирования. В книге Б. Ф. Скиннера учащийся должен заполнить пробел в тексте. Вместо этого Н. А. Краудер предлагает студенту сделать выбор из ответов, приведенных в тексте. По мнению Н. А. Краудера, в этом случае студент затрачивает больше интеллектуальных усилий и более свободен в своей работе.

Оперантное научение в работах Э. Торндайка

Экспериментальное изучение условий приобретения действительно нового поведения, а также динамики научения, было в центре внимания американского психолога Э. Торндайка1. Его работы в основном исследовали закономерности решения проблемных ситуаций у животных. Животное (кошка, собака, обезьяна) должно было самостоятельно найти выход из специально построенного «проблемного ящика» или лабиринта. Позже в подобных экспериментах в качестве испытуемых участвовали и маленькие дети.

При анализе такого сложного спонтанного поведения, каким представляется поиск способа решения лабиринта или отпирания двери (в отличие от реагирующего, ответного поведения), трудно определить стимул, вызывающий определенный ответ. Согласно Торндайку, животные сначала совершали множество хаотичных движений-испытаний и только случайным образом производили правильные, которые приводили к успеху. В последующих попытках выбраться из того же ящика наблюдалось уменьшение количества ошибок и сокращение затраченного времени. Тип обучения, при котором субъект обычно бессознательно пробует различные вариации поведения, операнты, из которых «выбирается» наиболее подходящий, наиболее адаптивный, был назван оперантным обусловливанием.

Метод «проб и ошибок» при решении интеллектуальных задач считался общей закономерностью, характеризующей поведение животных и человека. Торндайк сформулировал четыре основных закона обучения.

  1. закон повторения (практики). Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем сильнее.
    2-й закон действия (усиления). Когда реакции усваиваются, те из них, которые сопровождаются подкреплением (положительным или отрицательным), становятся фиксированными.
  2. закон готовности. Состояние субъекта (чувство голода, жажды) не безразлично для производства новых реакций.
  3. закон ассоциативного сдвига (временной смежности).

Нейтральный стимул, связанный со значимым стимулом, также начинает вызывать желаемое поведение.

Торндайк также определил дополнительные условия для успешного обучения ребенка — легкость в различении стимула и реакции и осознание взаимосвязи между ними.

Оперантное обучение происходит при большей активности организма, оно контролируется (определяется) его результатами, последствиями. Общая тенденция заключается в том, что действия, которые привели к положительному результату, успеху, должны быть зафиксированы и повторены.

Лабиринт в экспериментах Торндайка служил упрощенной моделью окружающей среды. Техника лабиринта в какой-то степени моделирует отношения между организмом и окружающей средой, но очень узким, односторонним, ограниченным образом; и чрезвычайно трудно применить паттерны, обнаруженные в рамках этой модели, к социальному поведению человека в сложно организованном обществе.

Постоянный опыт обучения порождает то, что другие школы психологии называют личностью. Личность — это опыт, который человек приобретает на протяжении всей жизни. Уникальность человека определяется определенным сочетанием генетических характеристик и его учебным репертуаром. Таким образом, психическое развитие отождествляется с обучением, то есть с любым приобретением знаний, навыков и умений — как в условиях специального обучения, так и возникающих спонтанно. Человек — это то, чем он научился быть.

На странице курсовые работы по педагогике вы найдете много готовых тем для курсовых по предмету «Педагогика».

  • Здесь темы рефератов по педагогике

Читайте дополнительные лекции:

  1. Организация контроля качества образовательных результатов при обучении
  2. Задачи гражданского воспитания
  3. Музыкальное воспитание как педагогическая система
  4. Технология музыкального воспитания школьников Кабалевского
  5. Особенности обучения детей с задержкой психического развития в классах коррекции
  6. Аудит профессиональной компетенции педагогов доо
  7. Методика воспитания эстетической культуры личности
  8. Мастерство и творчество педагога
  9. Содержание когнитивного, поведенческого, институционального блоков в структуре педагогической культуры
  10. Управление аксиологическим потенциалом школьника в условиях общеобразовательной школы

Что такое оперантный метод обучения собак?

24 сентября 2019

Petstory

Оперантный метод обучения собак — это обучение, основанное на закономерностях формирования оперантного (условного) рефлекса. Иногда этот же рефлекс называют инструментальным, иногда — условным рефлексом II типа, а иногда даже и гетерогенным условным рефлексом.

Фото: PetstoryPetstory

От классического условного рефлекса имени И.П. Павлова этот рефлекс отличается тем, что основывается на активной целенаправленной деятельности животного, вызванной какой-либо потребностью. И подкреплением при этом является результат этой самой активной и целенаправленной деятельности. В то время как при классическом условном рефлексе подкреплением является безусловный или просто второй по действию раздражитель.

Видео дня

Оперантное научение было открыто американским ученым Э.Л. Торндайком благодаря сообразительности кошек и собак. Дело в том, что Торндайк, выясняя способность животных к обучению, сконструировал специальную клетку, снабженную дверцей с несложным запором. Закрывая в этой клетке кошек и собак, он со здоровым злорадством ученого наблюдал, как братья его меньшие обучались эту дверцу открывать. А обучались открывать дверцу братья и сестры меньшие посредством совершения разнообразных попыток, некоторые из которых были удачными, а некоторые нет. Поэтому Торндайк так и назвал открытую им форму научения «методом проб и ошибок».

Рефлексом же эту форму научения окрестил гораздо позже еще один известный американский ученый Б.Ф. Скиннер и посвятил ему всю свою научную жизнь. Именно поэтому среди нескольких отцов оперантного рефлекса Скиннер считается главным отцом. Однако, справедливости ради отметим, что впервые в мире дрессировку, основанную на оперантном научении, описал наш замечательный дрессировщик Владимир Дуров в своей книге «Дрессировка животных. Психологические наблюдения над животными, дрессированными по моему методу. 40-летний опыт». Таким образом, о русском варианте оперантной дрессировке вы можете прочитать в книге Владимира Дурова, а американский вариант оперантной дрессировки хорошо описан в книге психолога и дрессировщицы Карен Прайор «Не рычите на собаку!», которую, кстати, тоже советую прочитать.

Общую методику оперантной дрессировки по Скиннеру можно описать в виде следующих этапов:

Этап депривации. Так называл этот этап Скиннер в 30-х годах прошлого века. Однако сейчас этот этап следует называть как «этап выбора и создания базовой потребности».

При формировании оперантного условного рефлекса могут быть использованы практически все из известных собакам потребности, однако Скиннер чаще использовал пищевую потребность. И смысл этапа депривации заключался в том, что Скиннер либо недокармливал животных какое-то время или морил их голодом. Считалось что пищевое подкрепление только тогда становилось значимым для животного и эффективным для научения, когда это животное теряло около 20% живого веса. О времена, о нравы!

Этап формирования условного пищевого подкрепления. В своих исследованиях Скиннер использовал автоматические кормушки, звук которых должен был стать для животных сигналом к появлению гранулы корма. И для этого требовалось время. Этап считался завершенным, когда в ответ на звук механизма подачи корма, крыса тут же бежала к кормушке.

По сути этот этап является формированием классического условного звукового рефлекса с пищевым подкреплением. Он также служит основанием так называемой кликер-дрессировке — способа дрессировки с использованием условного звукового пищевого положительного подкрепления.

И приходится признать, что школу оперантной дрессировки от отечественной традиционной дрессировки выгодного отличает внимание, которое оперантная дрессировка уделяет вопросу подкрепления. Особенно положительному и вероятностному подкреплению.

Этап формирования реакции. В качестве модельного поведения Скиннер обучал своих крыс нажимать на педаль, а голубей клевать клавишу. Формирование реакции нажатия на педаль осуществлялось одним из трех способов: способом проб и ошибок (спонтанного формирования), путем направленного или последовательного формирования и способом мишени.

Спонтанное формирование заключалось в том, что животное, путешествуя по ящику Скиннера, случайно нажимало на педаль и постепенно связывало нажатие на нее с включением автокормушки.

При направленном формировании включал автокормушку исследователь, подкрепляя вначале любую ориентацию в сторону педали, затем приближение к ней и, наконец, нажатие на нее. Ну чем не кликер-дрессировка!

А способ мишени заключался в том, что на клавишу наклеивали гранулу корма, попытки оторвать которую и приводили к нажатию на рычаг.

Современная методика оперантной дрессировки для инициации нужного поведения допускает использование практических всех известных способов воздействия на животное. Однако считается неэффективным использование аверсивных (приводящих к боли или неприятным ощущениям) воздействий.

Подведение поведения под стимульный контроль или введение дифференцирующего стимула. Другими словами, введение условного раздражителя или команды.

Скиннер и его сторонники считали, что формирование действия и одновременная параллельная выработка его связи с условным раздражителем (командой) — два разных процесса. А одновременное усвоение двух разных вещей осложняет научение. Поэтому традиционные оперантники сначала формируют поведение, а затем вводят команду.

Следует особо подчеркнуть, что в оперантном научении, дифференцирующий стимул по большому счету не является командой в нашем понимании. Команда — это ведь как приказ? Мы обычно так трактуем ее. А дифференцирующий стимул — это информация о том, что именно сейчас исполнение поведения наиболее эффективно и вообще возможно. Таким образом «команда» в оперантной дрессировке несет функцию позволения и разрешения совершить поведения.

Чтобы стало понятней, разберем введение в эксперимент лампочки как дифференцировочного раздражителя. И так, крыса научилась нажимать на педаль и нажимает на нее, когда хочет есть. Исследователь включает лампочку на пару секунд и создает условия, при которых нажатие на педаль только при включенной лампочке приводит к подаче корма. А когда лампочка выключается, то сколько не нажимай будет тебе комбинация из трех пальцев! Т.е. включение лампочки создает, разделяет, различает, дифференцирует разные условия. И крыса это скоро начинает понимать. А поскольку она очень хочет есть (у нее же создана пищевая потребность!), то увидев включенную лампочку, тут же бежит к педали и ну на нее нажимать! Со стороны кажется, что включенная лампочка заставляет крысу, приказывает ей нажимать на педаль. Но теперь-то вы понимаете, что это не так. Включенная лампочка говорит: теперь можешь нажимать на педаль. И только!

Закрепление поведения. Закрепление сформированного поведения до навыка осуществляется путем повторения с использованием вероятностного подкрепления. Полезно также для этого же использовать различные потребности и, соответственно, применять разное подкрепление.

Отечественный вариант оперантной методики дрессировки, берущий начало от Владимира Дурова, отличается только тем, что позволяет сразу вводить исполнительный стимул (команду, дифференцирующий стимул, условный раздражитель). Практика показывает, что навык формируется ничуть не медленнее, чем при импортной методике. А поскольку позволяет исключить целый этап, то экономит время. Так что есть смысл поддержать отечественного производителя дрессировочных методик!

Petstory – знаем все о кошках и собаках

Petstory – знаем все о кошках и собаках

Другое,Владимир Дуров,

Что такое оперантное обусловливание и научение, как ими управлять и чего можно добиться

В психологии существует масса очень интересных теорий и методик. На первый взгляд, это всего лишь часть работы психоаналитиков. Но именно такие методики, как оперантное научение или оперантное обусловливание, помогают многим людям: спасают семьи, влияют на успеваемость детей, на повышение самооценки и т. д.

  • Способ формирования
  • Примеры основ научения
    • Имеющиеся компоненты оперантного научения
  • Примеры оперантного научения
  • Формы научения
  • Голодный голубь

Оперантное научение – это неестественный путь возникновения условных рефлексов, заключается он в подпитке спонтанно появившейся реакции у определённого субъекта, но не стимула, это происходит благодаря последствиям: подкрепления (увеличение) либо наказания (уменьшение).

Способ формирования

Оперантное обусловливание имеет способность формировать поведение, в случаи, когда подпитываемые действия постепенно меняются, плавно превращаясь к исполнению, что мы хотим видеть в итоге.

Научение имеет в себе целую систему наказаний и особых поощрений, целью которых является усилить либо ограничить выбранный тип поведения.

Суть оперантного научения – это установка ассоциативной связи между основным поведением и следствием того самого поведения. Научение можно отнести к своеобразному методу обучения, только этот способ требует конкретного действия. Нередко оперантное научение называют методом Скиннера — в честь Бихевиориста Фредерика Скиннера. Скиннер был убеждён в том, что объяснить любое поведение мыслями или мотивацией – невозможно. По этой причине он пробовал обращать внимание на причины внешнего характера которые влияют на поведение людей.

Такой термин, как «оперантный», Скиннер использовал как описание любого поведения, которое можно отнести к влиянию внешних факторов, выливших в определённые последствия. Проще говоря, Скиннер на примере научения объяснил нам, как люди приобретают привычки и модель поведения которые используются ежедневно.

Примеры основ научения

Если только задуматься, примеров оперантного научения (оперантное обусловливание) в повседневной жизни встречаются очень часто: школьники, что делают заданные домой упражнения, взамен на это получат награду от родителей; сотрудники, которые при достижении заданной нормы получат повышение зарплаты или служебное продвижение. Это лишь те примеры, что показывают на перспективу награды в случае выполнения задания, но научения можно использовать и для того, чтобы отучить человека от привычки наказанием либо лишением желаемого.

К примеру, школьников можно отучить разговору на уроках, нужно просто лишить их возможности развлекаться на ожидаемой перемене.

Имеющиеся компоненты оперантного научения

Подпитка либо же подкрепление – это неопределённое действие, что способно повлиять на развитие необходимой модели поведения.

Всего существует 2 вида подпитки:

  1. Позитивное оперантное обусловливание – вознаграждение, его используют для того, чтобы поощрить необходимую модель поведения: к примеру, это может быть похвала или желаемая награда;
  2. Негативное оперантное обусловливание – действия или результаты не приносящие удовольствия, что прекращаются для поощрения при достигнутом поведении.

И первый и второй вид подкрепления используют для поощрения той модели поведения, которой вы добиваетесь. Наказание используется для тех случаев, когда необходимо прекратить нежелательную модель поведения.

Всего можно выделить 2 вида наказаний:

  1. Позитивное наказание – в этом случаи используют нежелательное действие, для того чтобы снизить последующую реакцию;
  2. Негативное наказание – прекращение не желаемого действия, чтобы ослабить реакцию за ним. Оба вида используют для снижения нежелательной модели поведения.

Оперантное обусловливание, поведение (поведение которое было вызвано научением) можно определить особыми событиями, что обычно следуют за реакцией. Таким образом, за определённым поведением идёт следствие, и образование того самого следствия заменяет тенденцию организма отражаться данным поведением в дальнейшем.

Примеры оперантного научения

Как пример, можно рассмотреть катание на доске, метание дротиков, игру на фортепиано или написание своего же имени – это считается образцами оперантной реакции, результаты, которые возможно контролировать, следующем за поведением. Это самостоятельно приобретённые реакции, для них не может существовать стимул, который мы могли бы распознать.

Скиннер не отрицал, что рассуждать о возникновении оперантный метод поведения – бессмысленно. Ведь нам не могут быть известны стимулы или внутренние причины, что ответственны за появление его. То есть, оно возникло спонтанно.

В случаях, когда последствия благоприятно отражаются на организме, вероятность повторения в дальнейшем операнта будет усиливаться. Когда это происходит – любые последствия подпитываются, и оперантное обусловливание, получены благодаря подкреплению – обусловливаются. Величина стимула позитивного подкрепления определяется соответственно воздействию на последующую частоту реакции, что ранее ему предшествовали. Таким образом, теория действует и противоположно, в случаи, когда реакция неблагоприятно и не имеет подкрепления, вероятность получения операнта значительно уменьшается.

Формы научения

Скиннер уверял, что, как следствие, оперантное обусловливание может контролироваться неприятными последствиями. Как правило, негативное либо агрессивное последствие способно ослабить поведение, что порождало их, кроме этого, оно усиливает поведение, которое устраняет их. Мы уже говорили о том, что научение можно рассматривать как определённую форму обучения. Он основан связью раздражитель – реакция – подкрепление, благодаря которому поведение формируется и поддерживается в силу определённых последствий.

Оперантный метод поведение присутствует с самого детства и встречается она практически в каждой семье – это оперантное обусловливание, научение такому поведению, как плач.

Все мы знакомы с детским плачем, когда те испытывают боль, конечно же, моментальная реакция родителей – выражение внимания и других возможных подкреплений. Внимание и есть тот самый подкрепляющий фактор для ребёнка, с этого можно понять обусловленность реакции плача. Но, стоит учесть и то, что плач может возникнуть при отсутствии боли. Несмотря на то, что большинство родителей склонны утверждать, будто они могут различить, плач вызван расстройством или плач вызван желанием внимания, все же многие родители предпочитают упорно подкреплять последнее.

Не менее интересный пример можно рассмотреть на дрессировщиках в цирке, они побуждают совершить определённое действие самых разных зверей, после чего хвалят их и угощают небольшим кусочком пищи. Как только животное освоило новое задание, это животное побуждают совершить новое действие.

Если в итоге дрессировщик не получает необходимого действия от животного, то оно остаётся без лакомства. В результате животное снова и снова делает попытки до тех пор, пока цель не будет достигнута.

Если вы имеете собаку, можно также понаблюдать за её поведением, например, когда она играет мячом, скорее всего, она его будет кусать, прижимать к полу или подкидывать вверх. В обыденной среде проживания, организм способен не только на то, чтобы отвечали стимулы, но и на воздействие окружению. Но, когда организм сумел совершить новое действие, то дальнейшее проявления этого действия будет зависеть от того, каков был его результат. То есть, собака станет подкидывать мяч чаще, если его поощрить кусочком мяса либо же другого лакомства.

Любое поведение поддаётся контролю, кроме того им возможно управлять, создав необходимый порядок подпитки. Сканнер очень много экспериментировал на животных утверждая, что научения одинаково закономерны как для животных, так и для людей.

Голодный голубь

На примере Сканнера разберём и последний приём. Голодного голубя сажали в особый ящик. В середине ящика не было ничего, кроме небольшой кнопки и, кормушкой что располагалась под кнопкой. Голодный голубь, как только попадает в клетку начинает обследовать её, в результате чего находит и клюёт кнопку. Поиск повторяется: птица клюёт кормушку или пол, по итогу снова клюёт кнопку. В течение небольшого отрывка времени птица несколько раз клюёт кнопку. Затем, включают кормушку, теперь после каждого удара на кнопку, голубь будет получать по зёрнышку. Далее, чем чаще голубь клюёт по кнопке, тем больше еды он получает.

Если птица станет клевать кнопку на высокой частоте, то это можно назвать высоким оперантным уровнем, когда будет клевать её слишком редко, действия будут иметь непосредственно низкий оперантный уровень.

www.Psyarticles.ru — учебные статьи по психологии

Учебные материалы по психологии и психологические статьи — основное содержание сайта.

Проект в значительной степени рассчитан на самообразование читателей, ранее систематически не изучавших психологию, однако может оказаться полезным и для специалистов, расширяющих свой профессиональный кругозор.

Материалы сайта представляют собой наиболее важные и интересные фрагменты из учебных пособий и научных работ из самых разнообразных отраслей психологии.

Проект будет полезен психологам и врачам, студентам и преподавателям, специалистам в области управления, а также широкому кругу читателей, интересующихся вопросами современной психологии.

Предпосылки возникновения конфликта в процессе общения

Рассмотрим особенности поведения человека в конфликтной ситуации прежде всего в процессе общения. В процессе человеческих взаимоотношений, как вы уже знаете из предыдущих разделов, процесс общения предполагает наличие следующих трех факторов: восприятия, эмоций и обмена информацией. В конфликтных ситуациях легко забыть об этом. Поэтому кратко рассмотрим, что же может создавать почву для их возникновения.

Социально-психологические предпосылки. Первая трудность — это разногласия из-за несовпадения ваших рассуждении с рассуждениями другой стороны. Ведь то, какой вы видите проблему, зависит от того, с какой колокольни, образно говоря, смотрите на нее.

Специфика конфликтов в образовательных процессах

В культурно-историческом подходе Л.С. Выготского процессы образования рассматриваются, с одной стороны, как предназначенные для разрешения противоречий развития общества, с другой — как обладающие внутренне противоречивым характером.

Мы придерживаемся именно этого подхода, и вслед за Л.С. Выготским и его последователями исходим из того, что конфликт представляет собой механизм развития человеческой деятельности и соответственно личности.

Современная психология: ее задачи и место в системе наук

В последние годы наблюдается бурное развитие психологической науки, обусловленное многообразием теоретических и практических задач, встающих перед нею. В нашей стране интерес к психологии особенно показателен — ей наконец-то начинают уделять то внимание, которого она заслуживает, причем практически во всех отраслях современного образования и бизнеса.

Основной задачей психологии является изучение законов психической деятельности в ее развитии. В течение последних десятилетий значительно расширились диапазон и направления психологических исследований, появились новые научные дисциплины.

Методы психологии

Методы научных исследований — это те приемы и средства, с помощью которых ученые получают достоверные сведения, используемые далее для построения научных теорий и выработки практических рекомендаций.

Сила науки во многом зависит от совершенства методов исследования, от того насколько они валидны и надежны, как быстро и эффективно данная отрасль знаний способна воспринять и использовать у себя все самое новое, передовое, что появляется в методах других наук.

Алгоритм оценки достоверности информации в результате психофизиологического исследования с применением полиграфа

Двадцать лет назад использование прибора способного отличить ложь от правды – «детектора лжи» было исключительной прерогативой спецслужб ведущих мировых держав. За прошедшие годы ситуация кардинально изменилась.

Проверки на «детекторе», стали доступными для широкого круга потребителей – правоохранительных органов, руководителей коммерческих и банковских структур, представителей кадровых служб, частных охранных предприятий и просто граждан, желающих получить достоверную информацию.

Процесс формирования двигательного навыка. Принцип активности и его развитие Н.А. Бернштейном

Переходим к следующей важной теме, совершенно по-новому раскрытой Н. А. Бернштейном, — механизмам формирования навыка. Эта проблема очень важна для психологии, так как формирование навыков составляет, как вы уже знаете, основу всякого обучения.

Процесс формирования навыка описан у Бернштейна очень подробно. Он выделил много частных фаз — порядка семи, которые объединяются в более общие периоды. Для первого знакомства достаточно будет разобрать эти периоды.

Проблема психодинамического диагноза

Психодинамическая диагностика, в отличие от дискретно-описательного диагностического подхода, укоренившегося в отечественных медицинской и психологической традициях, представляет собой прежде всего диагностику структуры личности с точки зрения ее развития.

Подобный подход, обеспечивающий целостный и всесторонний анализ личности и ее психопатологии, определяет и специфику терапевтических методов.

Психологическая профилактика конфликтов в коллективе

Многие организационные конфликты легче предупредить, чем разрешить.

Поскольку центральными фигурами конфликтов в организации являются конкретные личности, то такая профилактика должна быть личностно-ориентированной.

Остановимся на некоторых особо значимых организационно-управленческих условиях, способствующих снижению конфликтности личности.

Четыре элемента процесса убеждения

Процесс убеждения складывается из следующих элементов: агент влияния (источник сообщения), само сообщение, условия, в которых передается сообщение (контекст), и реципиент, то есть тот индивид, которому предназначено сообщение.

Само сообщение, в зависимости от его содержания, от того, как оно сформулировано и в какой форме преподнесено, также может либо убеждать, либо внушать. Но может и не иметь вообще никакого эффекта.

Повышение уровня сознания. Насколько это важно?

Тема самосовершенствования и развития человеческих качеств, можно сказать, вечная, при этом мудрые люди часто повторяют, что самой важной задачей для каждого человека является развитие его собственного сознания.

Несмотря на очевидную важность темы, серьезных и качественных материалов, посвященных этому вопросу, не так уж и много, хотя периодически все же появляются интересные работы.

Что это такое и как он работает

от Сайруса Уэхоме

Медицинский анализ Poonam Sachdev 27 апреля 2022 г.

В этой статье

  • Операционное поведение
  • Операционная теория кондиционирования
  • положительное достоприме
  • Графики подкрепления
  • Наказание
  • Экономика жетонов

Оперантное обусловливание, иногда называемое инструментальным обусловливанием, представляет собой метод обучения, в котором для изменения поведения используются поощрения и наказания. Благодаря оперантному обусловливанию вознаграждаемое поведение, скорее всего, будет повторяться, а наказуемое поведение встречается редко.

Например, когда вы на работе получаете бонус за исключительную работу, вы будете склонны продолжать работать на более высоком уровне в надежде получить еще один бонус в будущем. Поскольку за этим поведением последовал положительный результат, оно, вероятно, будет повторяться.

Оперантное поведение

При оперантном поведении стимулы могут быть аппетитными или отталкивающими. Аппетитные стимулы — это те, к которым вы приближаетесь добровольно, в то время как аверсивные стимулы — это те, которые вы пытаетесь избежать или избежать. Ответы на такие стимулы могут быть как положительными, так и отрицательными. В данном случае положительное и отрицательное не означает хорошее или плохое. Вместо этого положительное подкрепление означает введение стимула для увеличения вероятности повторения поведения, в то время как отрицательное подкрепление включает устранение стимула для поощрения хорошего поведения.

Теория оперантного обусловливания

Оперантное обусловливание впервые было описано бихевиористом Б. Ф. Скиннером. Его теория основывалась на двух предположениях. Во-первых, причиной поведения человека является что-то в его окружении. Во-вторых, последствия поведения определяют возможность его повторения. Поведение, за которым следуют приятные последствия, с большей вероятностью будет повторяться, а поведение, за которым следуют неприятные последствия, повторится с меньшей вероятностью.

Хотя Скиннер был пионером теории оперантного обусловливания, его идеи основывались на законе эффекта Торндайка. Скиннер также считал, что у нас есть разум. Поэтому было более продуктивно изучать наблюдаемое поведение, а не внутренние психические события.

Скиннер также был образцовым изобретателем. Среди его гаджетов была коробка Скиннера, которая использует такие объекты, как крысы и голуби, для записи поведения животных в сжатые сроки.

В ходе своих экспериментов Скиннер определил три типа реакций, которые следуют за поведением:

Нейтральные реакции. Это реакции окружающей среды, которые не производят никаких стимулов, кроме концентрации внимания. Они не увеличивают и не уменьшают вероятность повторения поведения.

Усилители. Это реакции окружающей среды, которые увеличивают вероятность повторения поведения. Они могут быть как положительными, так и отрицательными.

Каратели.  Это отрицательные операнты, которые снижают вероятность поведения. Наказание ослабляет поведение.

Положительное подкрепление

Положительное подкрепление включает в себя предъявление аппетитного стимула для увеличения вероятности того, что поведение произойдет в будущем. Например, если ваш ребенок занимается домашними делами без просьбы, вы можете вознаградить его, отведя в парк или вручив лакомство.

Скиннер использовал голодную крысу в ящике Скиннера, чтобы показать, как работает положительное подкрепление. В коробке сбоку был рычаг, и когда крыса двигалась по коробке, она случайно сталкивала рычаг. Сразу после этого в контейнер рядом с рычагом падала пищевая гранула. Последствие получения пищи каждый раз, когда крыса нажимала на рычаг, гарантировало, что животное повторяло действие снова и снова.

Положительное подкрепление не обязательно должно включать материальные предметы. Вместо этого вы можете положительно подкрепить своего ребенка с помощью:

  • Похлопать в ладоши
  • Аплодисменты
  • Обнять или похлопать по спине
  • Поднять большой палец вверх
  • Предложить особое занятие, например поиграть в игру или вместе почитать книгу
  • Рассказать другому взрослому, как вы гордитесь поведение вашего ребенка, пока ваш ребенок слушает
  • Похвала
  • Дай пять

Отрицательное подкрепление

При отрицательном подкреплении что-то неприятное прекращается в ответ на стимул. Со временем поведение усиливается с ожиданием того, что аверсивный стимулятор исчезнет. Если, например, ребенок отказывается есть овощи во время обеда, а родитель в ответ убирает овощи, удаление овощей является негативным подкреплением.

Графики подкрепления

График подкрепления — это компонент оперантного обусловливания, в котором указывается, какие примеры поведения будут подкрепляться. Он включает в себя набор правил, определяемых временем и количеством ответов, необходимых для предъявления или удаления поощрения.

Различные модели подкрепления по-разному влияют на скорость обучения. Графики армирования включают:

Армирование с фиксированным соотношением. Награды зависят от определенного количества повторений поведения. Например, ребенку аплодируют после правильного написания 10 слов.

Армирование с фиксированным интервалом. Награды выдаются в определенное время. Например, еженедельная зарплата. Другой пример: ребенок получает вознаграждение раз в неделю, если посуда вымыта.

Армирование с переменным соотношением сторон. Это подкрепление непредсказуемо и дает большое количество ответов. Например, азартные игры могут предлагать выигрыши после нескольких непредсказуемых попыток.

Армирование с переменным интервалом. Ответы вознаграждаются по прошествии непредсказуемого количества времени. Примером могут служить непредсказуемые проверки санитарным инспектором.

Непрерывное армирование. Это подкрепление поведения каждый раз, когда оно происходит. Примером может служить вознаграждение малыша каждый раз, когда он использует горшок.

Наказание

При оперантном обусловливании наказание определяется как любое изменение в окружающей среде, которое снижает вероятность повторения реакции или поведения. Наказание может работать либо путем непосредственного применения неприятного стимула, такого как ругань , либо путем устранения потенциально полезного стимула, такого как вычет чьего-то суточного содержания для наказания за нежелательное поведение.

Хотя наказание эффективно снижает нежелательное поведение, оно связано со многими проблемами, такими как:

  • Повышенная агрессия
  • Наказуемое поведение скорее подавляется, чем забывается.
  • Страх
  • Наказание не обязательно ведет к хорошему поведению
  • Наказание может легко превратиться в жестокое обращение фальшивые деньги, еда, наклейки, покерные фишки или кнопки, которые впоследствии обмениваются на вознаграждения. Например, в условиях больницы вознаграждение в виде символических денег может предлагаться в обмен на еду, доступ к телевидению и другие бонусы.

    Экономика жетонов доказала свою эффективность не только в лечении психически больных, но и в школе. Эта система может быть использована в классах для уменьшения деструктивного поведения и повышения академической вовлеченности.

    Теория оперантного обусловливания (+ как применять ее в жизни)

    Оперантное обусловливание – хорошо известная теория, но как вы применяете ее на практике в повседневной жизни?

    Как вы используете свое знание его принципов для создания, изменения или отказа от привычки? Как вы используете его, чтобы заставить своих детей делать то, о чем вы их просите, — с первого раза?

    Изучение поведения увлекательно, и тем более увлекательно, когда мы можем связать полученные данные о поведении с нашей жизнью за пределами лаборатории.

    Наша цель — сделать именно это; но сначала необходимо сделать исторический обзор.

    Прежде чем вы продолжите чтение, мы подумали, что вы можете бесплатно загрузить три наших упражнения по позитивной психологии. Эти научно обоснованные упражнения исследуют фундаментальные аспекты позитивной психологии, включая сильные стороны, ценности и сострадание к себе, и дадут вам инструменты для улучшения благополучия ваших клиентов, студентов или сотрудников.

    Эта статья содержит:

    • Наши главные герои: Павлов, Торндайк, Ватсон и Скиннер
    • Оперантное обусловливание: определение
    • Принципы оперантного обусловливания
    • 10 примеров оперантного обусловливания
    • Оперантное обусловливание против классического обусловливания
    • Оперантное обусловливание в терапии
    • Применение в повседневной жизни
    • Взгляд на графики подкрепления
    • Полезные техники для практиков
    • Интересное видео
    • 5 книг по теме
    • Сообщение на вынос
    • Каталожные номера

    Наши главные герои: Павлов, Торндайк, Ватсон и Скиннер

    Как и все великие истории, мы начнем с действия, которое дало толчок всему остальному. Давным-давно Павлов пытался разгадать тайны слюноотделения у собак. Он предположил, что у собак выделяется слюна в ответ на поднесение пищи. То, что он открыл, подготовило почву для того, что сначала было названо павловским обусловливанием, а затем классическим обусловливанием.

    Какое отношение это имеет к оперантному обусловливанию? Другие ученые-бихевиористы сочли работу Павлова интересной, но раскритиковали ее за упор на рефлексивное обучение. Он не ответил на вопросы о том, как окружающая среда может формировать поведение.

    Э. Л. Торндайк был психологом, проявлявшим большой интерес к образованию и обучению. Его теория обучения, названная коннекционизмом , доминировала в системе образования Соединенных Штатов. Короче говоря, он считал, что обучение является результатом связи между сенсорным опытом и нейронными реакциями (Schunk, 2016, стр. 74). Когда эти ассоциации возникали, возникало поведение.

    Торндайк также установил, что обучение является результатом процесса проб и ошибок. Этот процесс требует времени, но не сознательной мысли. Он изучил и развил наши первоначальные концепции подкрепления оперантным обусловливанием и того, как различные типы влияют на обучение.

    Принципы обучения Торндайка включают:

    • Закон Упражнения, который включает в себя Закон Использования и Закон Неиспользования. Они объясняют, как связи укрепляются или ослабевают в зависимости от их использования/неиспользования.
    • Закон Эффекта фокусируется на последствиях поведения. Поведение, которое приводит к вознаграждению, усваивается, но поведение, которое приводит к воспринимаемому наказанию, не усваивается.
    • Закон готовности касается готовности. Если животное готово действовать и делает это, то это награда, а если животное готово и не может действовать, то это наказание.
    • Ассоциативное смещение возникает, когда реакция на определенный стимул в конечном итоге вызывает другой.
    • Идентичные элементы влияют на передачу знаний. Чем больше похожи элементы, тем больше вероятность перехода, потому что ответы тоже очень похожи.

    Более поздние исследования не подтвердили Законы Упражнения и Эффекта Торндайка, поэтому он отказался от них. Дальнейшее исследование показало, что наказание не обязательно ослабляет связи (Schunk, 2016, стр. 77). Первоначальный ответ не забыт.

    Все мы хоть раз сталкивались с этим. Вы превышаете скорость, вас останавливают и вы получаете штраф. Это на короткое время подавляет ваше поведение, связанное с превышением скорости, но не мешает вам когда-либо снова превышать скорость.

    Позже Джон Б. Уотсон, другой бихевиорист, подчеркивал методический, научный подход к изучению поведения и отвергал любые идеи об интроспекции. Бихевиористов интересуют наблюдаемые явления, поэтому изучение внутренних мыслей и их предполагаемой связи с поведением не имеет значения.

    Эксперимент «Маленький Альберт», увековеченный в большинстве учебников по психологии, заключался в том, чтобы заставить маленького мальчика бояться белой крысы. Уотсон использовал классическое обусловливание для достижения своей цели. Страх мальчика перед белой крысой перешел на других животных с мехом. Исходя из этого, ученые пришли к выводу, что эмоции могут быть обусловлены (Stangor and Walinga, 2014).

    В 1930-х годах Б. Ф. Скиннер, познакомившийся с работами этих и других исследователей, продолжил изучение того, как организмы учатся. Скиннер изучил и разработал популярную сегодня теорию оперантного обусловливания.

    После проведения нескольких экспериментов на животных Скиннер (1938) опубликовал свою первую книгу «Поведение организмов» . В издании 1991 года он написал предисловие к седьмому изданию, вновь подтвердив свою позицию в отношении исследования стимула/реакции и самоанализа:

    «… нет необходимости обращаться к внутреннему аппарату, будь то ментальный, физиологический или концептуальный».

    С его точки зрения, наблюдаемое поведение, основанное на взаимодействии стимула, реакции, подкрепления и лишения, связанного с подкреплением, — это единственные элементы, которые необходимо изучить, чтобы понять человеческое поведение. Он назвал эти случайности и сказал, что они «обусловливают внимание, запоминание, обучение, забывание, обобщение, абстрагирование и многие другие так называемые познавательные процессы».0185 ».

    Скиннер считал, что определение причин поведения является наиболее важным фактором для понимания того, почему организм ведет себя определенным образом.

    Шунк (2016, стр. 88) отмечает, что теории обучения Скиннера были дискредитированы более современными теориями, рассматривающими более высокий порядок и более сложные формы обучения. Теория оперантного обусловливания этого не делает, но она по-прежнему полезна во многих образовательных средах и при изучении геймификации.

    Теперь, когда у нас есть четкое представление о том, почему и как ведущие бихевиористы открыли и развили свои идеи, мы можем сосредоточить свое внимание на том, как использовать оперантное обусловливание в нашей повседневной жизни. Однако сначала нам нужно определить, что мы подразумеваем под оперантным обусловливанием.

    Оперантное обусловливание: определение

    Основная концепция оперантного обусловливания заключается в том, что стимул (антецедент) приводит к поведению, которое затем приводит к последствию. Эта форма обусловливания включает подкрепление, как положительное, так и отрицательное, а также первичное, вторичное и обобщенное.

    • Основными подкреплениями являются такие вещи, как еда, кров и вода.
    • Вторичные подкрепления — это стимулы, которые становятся обусловленными из-за их ассоциации с первичным подкреплением.
    • Обобщенные подкрепления возникают, когда вторичное подкрепление сочетается с более чем одним основным подкреплением. Например, работа за деньги может повысить способность человека покупать различные вещи (телевизоры, автомобили, дом и т. д.)

    Поведение является оперантным. Отношения между дискриминационным стимулом, реакцией и подкреплением влияют на вероятность повторения поведения в будущем. Подкрепление — это своего рода вознаграждение или, в случае неблагоприятных исходов, наказание.

    Принципы оперантного обусловливания

    Подкрепление возникает при усилении реакции. Подкрепление зависит от ситуации. Это означает, что то, что может быть подкрепляющим в одном сценарии, может не быть в другом.

    Вас может побудить (побудить) пойти на пробежку, если вы увидите свои кроссовки возле входной двери. Однажды ваши кроссовки окажутся в другом месте, и вы не пойдете на пробежку. Другая обувь у входной двери не производит такого же эффекта, как ваши кроссовки.

    Существует четыре типа арматуры, разделенных на две группы. Первая группа действует, чтобы усилить желаемое поведение. Это известно как положительное или отрицательное подкрепление.

    Вторая группа предназначена для уменьшения нежелательного поведения. Это называется положительным или отрицательным наказанием. Важно понимать, что наказание, хотя и может быть полезным в краткосрочной перспективе, не останавливает нежелательное поведение в долгосрочной или даже постоянной перспективе. Вместо этого он подавляет нежелательное поведение на неопределенное время. Наказание не учит человека правильно себя вести.

    Эдвин Гутери (цитируется по Schunk, 2016) считал, что для изменения привычки, которой становятся некоторые негативные формы поведения, необходима новая ассоциация. Он утверждал, что существует три метода изменения негативного поведения:

    1. Порог — ввести слабый раздражитель, а затем увеличивать его с течением времени.
    2. Усталость – Повторяйте нежелательную реакцию на раздражитель до тех пор, пока не устанете
    3. Несовместимый ответ – Соедините стимул с чем-то более желательным.

    Другим ключевым аспектом оперантного обусловливания является концепция угасания. Когда подкрепление не происходит, поведение снижается. Если ваш партнер отправляет вам несколько текстовых сообщений в течение дня, а вы не отвечаете, со временем он может перестать отправлять вам текстовые сообщения.

    Точно так же, если у вашего ребенка случилась истерика, а вы ее проигнорировали, у вашего ребенка могут прекратиться истерики. Это отличается от забывания. Когда возможности реагировать на стимулы практически отсутствуют, об условном рефлексе можно забыть.

    Обобщение реакции является важным элементом оперантного обусловливания. Это происходит, когда человек может обобщить поведение, которому научились в присутствии стимула, а затем обобщить эту реакцию на другой, похожий стимул. Например, если вы умеете водить один тип автомобиля, скорее всего, вы сможете управлять другим подобным автомобилем, минивэном, внедорожником или грузовиком.

    Вот еще один пример, предложенный PsychCore.

    10 Примеры оперантного обусловливания

    Сейчас вы, вероятно, думаете о своих собственных примерах как классического, так и оперантного обусловливания. Пожалуйста, не стесняйтесь поделиться ими в комментариях. Если вам нужно еще несколько, вот 10 для рассмотрения.

    Представьте, что вы хотите, чтобы ребенок тихо сидел, пока вы переходите к новой задаче. Когда ребенок это делает, вы подкрепляете это тем, что каким-то образом узнаете ребенка. Многие школы в Соединенных Штатах используют билеты в качестве поощрения. Эти билеты используются студентом или классом для получения будущей награды. Другим подкреплением было бы сказать: « Мне нравится, как Сара спокойно сидит. Она готова учиться ». Если вы когда-либо были в классе с детьми дошкольного возраста и второклассниками, вы знаете, что это работает как волшебство. Это положительное подкрепление.

    Примером отрицательного подкрепления может быть удаление чего-то, чего ученики не хотят. Вы видите, что студенты добровольно предлагают ответы во время урока. В конце урока вы можете сказать: « Ваше участие в этом уроке было великолепным! Нет домашнего задания! ” Обычно учащиеся предпочитают избегать домашних заданий (негативное подкрепление). Они узнают, что если они участвуют во время урока, то учитель с меньшей вероятностью будет задавать домашнее задание.

    Ваш ребенок плохо себя ведет, поэтому вы даете ему дополнительную работу по дому (негативное наказание – предоставление отрицательного подкрепления).

    Вы используете лакомство (позитивное подкрепление), чтобы научить собаку выполнять трюк. Вы говорите своей собаке сесть. Когда он это сделает, вы дадите ему лакомство. Со временем собака начинает ассоциировать угощение с поведением.

    Вы лидер оркестра. Когда вы встаете перед своей группой, они успокаиваются и кладут свои инструменты в положение готовности. Вы являетесь стимулом, вызывающим конкретную реакцию. Следствием для членов группы является ваше одобрение.

    Ваш ребенок не убирает свою комнату, когда ему говорят. Вы решаете отобрать у него любимое устройство (отрицательное наказание — удаление положительного подкрепления). Он начинает уборку. Через несколько дней вы хотите, чтобы он убрал свою комнату, но он не делает этого, пока вы не пригрозите отобрать его устройство. Ему не нравятся ваши угрозы, поэтому он убирает свою комнату. Это повторяется снова и снова. Вы устали от необходимости угрожать ему, чтобы заставить его делать свою работу по дому.

    Что делать, если наказание неэффективно?

    В предыдущем примере вы могли совместить менее привлекательное занятие (уборка комнаты) с чем-то более привлекательным (дополнительное время за компьютером/устройством). Вы можете сказать: « За каждые десять минут, которые вы тратите на уборку своей комнаты, у вас может быть пять дополнительных минут на вашем устройстве. ” Это известно как принцип Премака. Чтобы использовать этот подход, вам нужно знать, что человек ценит больше всего, а что меньше всего. Затем вы используете наиболее ценный элемент, чтобы подкрепить выполнение менее ценных задач. Ваш ребенок не ценит уборку своей комнаты, но он ценит время, проведенное за устройством.

    Вот еще несколько примеров использования принципа Премака:

    Ребенок, который не хочет выполнять математическое задание, но любит читать, может заработать дополнительное время для чтения, поход в библиотеку, чтобы выбрать новую книгу, или один- на одно время чтения с вами после того, как они выполнят свое математическое задание.

    За каждые X математических задач, которые решит ребенок, у него может быть X минут использования iPad в конце дня.

    За каждые 10 минут тренировки вы получаете 10 минут просмотра любимого шоу в конце дня.

    Ваш ребенок может выбирать между тем, чтобы мыть грязную посуду в посудомоечной машине, или мыть посуду вручную.

    Какие у вас есть примеры оперантного обусловливания? Когда вы использовали принцип Премака?

    Оперантное обусловливание в сравнении с классическим обусловливанием

    Классическое обусловливание проще всего рассматривать как рефлексивное. Это поведение, которое организм делает автоматически. Павлов соединил колокольчик с поведением собаки (слюноотделением), когда ему подают еду. После нескольких испытаний Павлов научил собак выделять слюну при звонке колокольчика.

    До этого звонок был нейтральным раздражителем. У собак не было слюны, когда они это слышали. Если вы не знакомы с исследованиями Павлова, это видео объясняет его знаменитые эксперименты.

    Оперантное обусловливание связано с последствиями поведения; поведение меняется по отношению к окружающей среде. Если среда диктует, что определенное поведение не будет эффективным, то организм меняет поведение. Организму не нужно сознательно осознавать этот процесс, чтобы произошло изменение поведения.

    Как мы уже узнали, подкрепление имеет решающее значение для оперантного обусловливания. Поведение, приводящее к приятным результатам (последствиям), повторяется, а поведение, приводящее к неблагоприятным результатам, обычно не повторяется.

    Если вы хотите научить свою кошку подходить к вам, чтобы вы могли дать ей лекарство или вылечить блох, вы можете использовать оперантное обусловливание.

    Например, если ваша кошка любит жирные продукты, такие как масло, а вам нравится есть попкорн, вы можете научить свою кошку прыгать на прилавок рядом с раковиной, где вы ставите грязный мерный стакан.

    • Шаг 1: Перелейте масло и зерна из мерного стакана в кастрюлю.
    • Шаг 2: Позвольте кошке лизнуть мерный стаканчик.
    • Шаг 3: Поставьте чашку в раковину.
    • Шаг 4. Выполняйте эти действия каждый раз, когда готовите попкорн.

    Кошке не потребуется много времени, чтобы связать звук «зерен в горшке» с «мерным стаканом в раковине», что приводит к их награде (маслу). Кошка может даже ассоциировать звук горшка скользят по плите, получая награду.

    После того, как вы научились этому поведению, все, что вам нужно будет делать, это двигать кастрюлю по плите или встряхивать пакет с зернами попкорна. Ваша кошка запрыгнет на прилавок в поисках награды, и теперь вы без проблем сможете дать лекарство или средство от блох.

    Оперативное обусловливание полезно в учебных и рабочих условиях, для людей, желающих сформировать или изменить привычку, а также для дрессировки животных. Подходит любая среда, в которой есть желание изменить или сформировать поведение.

    Оперантное обусловливание в терапии

    Кумар, Синха, Датта и Лахири (2019) использовали виртуальную реальность (VR) и оперантное обусловливание, чтобы помочь пациентам, перенесшим инсульт, чаще использовать паретическую ногу.

    Пациенты, перенесшие инсульт, склонны переносить больший вес на непаретическую ногу, что обычно является выученной реакцией. Однако иногда это происходит потому, что инсульт повреждает одну сторону их мозга.

    Полученное повреждение заставляет человека игнорировать или становиться «слепым» к паретичной стороне тела.

    Кумар и др. (2019) разработали систему V2BaT. Он состоит из следующего:

    1. Задача на основе виртуальной реальности
    2. Распределение веса и оценка порога
    3. Балансировочная доска Wii – рукопожатие VR
    4. Обнаружение подъема пятки
    5. Оценка производительности
    6. Модули переключения задач

    Используя балансировочные доски Wii для измерения смещения веса, они приучили участников использовать паретическую ногу, предложив внутриигровое вознаграждение (звезды и поощрение). Балансировочные доски давали показания, которые подсказывали исследователям, какая нога больше всего использовалась во время переноса веса.

    Они провели несколько обычных испытаний с разными уровнями сложности. Промежуточные испытания улова позволили им проанализировать изменения. Когда первое испытание на улов сравнивали с окончательным испытанием на улов, наблюдалось значительное улучшение.

    Оперантное и классическое обусловливание являются основой поведенческой терапии. Каждый из них может быть использован для помощи людям, борющимся с обсессивно-компульсивным расстройством (ОКР).

    Люди с ОКР испытывают «повторяющиеся мысли, идеи или ощущения (навязчивые идеи), которые заставляют их постоянно что-то делать» (American Psychiatric Association, n.d.). Оба типа обусловливания также используются для лечения других типов тревоги или фобий.

    Применение в повседневной жизни

    Мы — смесь наших привычек. Некоторые из них автоматические и рефлекторные, другие более целенаправленные, но, в конце концов, все это привычки, которыми можно манипулировать. Непрофессионалу, пытающемуся изменить привычку или приобрести новую, может помочь оперантное обусловливание.

    Это основа петли привычки, ставшей популярной в книге Чарльза Дахигга (2014) Сила привычки .

    Сигнал (триггер, антецедент) приводит к рутине (поведению), а затем к награде (последствию).

    Все мы знаем, как сложно изменить привычку. Тем не менее, когда вы понимаете основные принципы оперантного обусловливания, вам нужно разбить привычку на составные части. Наша цель — изменить поведение, даже если вознаграждение от первоначального поведения невероятно привлекательно для нас.

    Например, если вы хотите выработать привычку заниматься спортом, но в течение нескольких месяцев ведете сидячий образ жизни, ваша мотивация не поможет вам. Это одна из причин, почему эта конкретная привычка в качестве новогоднего решения часто терпит неудачу. Людям не терпится пойти в спортзал и сбросить несколько килограммов за праздничный сезон. Затем, примерно через две недели, их стремление сделать это постепенно уступает место дюжине других вещей, которые они могли бы сделать в свое время.

    Используя метод оперантного обусловливания, вы можете разработать свою новую привычку к упражнениям. Б. Дж. Фогг, исследователь из Стэнфорда, выступает за то, чтобы начинать с чего-то настолько малого, что это может показаться нелепым.

    В своей книге Крошечные привычки: небольшие изменения, которые меняют все, Фогг (2020) проводит читателей через шаги к долгосрочным изменениям. Одна из ключевых вещей, о которой следует помнить, — сделать привычку как можно проще и привлекательнее. Если это привычка, которую вы хотите сломать, то вы сделаете ее труднее и менее привлекательной.

    В нашем примере вы можете начать с выбора одного типа упражнений, которые хотите выполнять. После этого выберите наименьшее действие к этому упражнению. Если вы хотите сделать 100 отжиманий, вы можете начать с одного отжимания от стены, одного отжимания на коленях или одного армейского отжимания. Все, что займет у вас менее 30 секунд, будет работать.

    Когда закончите, мысленно дайте себе пять, поставьте галочку в настенном календаре или в приложении на телефоне. Вознаграждение может быть любым, что вы выберете, но это важная часть изменения привычки.

    Часто, когда вы начинаете с малого, вы будете делать больше, но важно то, что все, что вам нужно сделать, это ваш минимум. Если это одно отжимание, отлично! Ты сделал это! Если это надевание кроссовок, круто! Следование этому подходу помогает остановить умственную гимнастику и чувство вины, которые часто сопровождают привычку заниматься спортом.

    Эта же методика полезна для самых разных привычек.

    Предупреждение: если вы имеете дело с зависимостью, вам стоит подумать о помощи профессионала. Это не мешает вам использовать этот подход, но он может помочь вам справиться с любыми симптомами отмены, которые могут у вас возникнуть, в зависимости от вашей конкретной зависимости.

    Взгляд на графики подкрепления

    Время вознаграждения важно, так же как и понимание того, насколько быстрым или медленным является ответ и как быстро вознаграждение теряет свою эффективность. Первое называется скоростью отклика, а второе — скоростью угасания.

    Ферстер и Скиннер (цитируется по Schunk, 2016) определили, что существует пять типов подкрепления, и каждый из них по-разному влияет на время отклика и скорость угасания. Schunk (2016) дал объяснение нескольким, но основные схемы подкрепления таковы:

    • Непрерывная: Награда за каждое правильное действие
    • Фиксированное соотношение: Каждый n-й ответ вознаграждается, и n остается постоянным.
    • Фиксированный интервал: Время получения награды фиксировано. Это может происходить после каждого пятого правильного ответа.
    • Переменное соотношение: Каждая n-я реакция подкрепляется, но значение колеблется вокруг среднего числа n.
    • Переменный интервал: Интервал времени варьируется от экземпляра к экземпляру вокруг некоторого среднего значения.

    Если вы хотите, чтобы какое-то поведение сохранялось в обозримом будущем, наиболее эффективным является график с переменным соотношением. Непредсказуемость поддерживает интерес, а скорость угасания вознаграждения самая низкая. Примерами этого являются игровые автоматы и рыбалка. Незнания того, когда произойдет вознаграждение, обычно достаточно, чтобы заставить человека работать за вознаграждение в течение неопределенного периода времени.

    Непрерывное подкрепление (вознаграждение) имеет самую высокую скорость угасания. Интуитивно это имеет смысл, когда объектами являются люди. Мы любим новизну и склонны быстро привыкать к новым вещам. Одна и та же награда, выдаваемая в одно и то же время за одно и то же неоднократно, скучна. Мы также не будем работать усерднее, только достаточно усердно, чтобы получить награду.

    Полезные техники для практикующих

    Терапевты, консультанты и учителя могут использовать оперантное обусловливание, чтобы помочь клиентам и учащимся лучше управлять своим поведением. Вот несколько предложений:

    • Создайте договор, в котором будут определены обязанности и ожидаемое поведение клиента/учащегося, а также действия практикующего врача.
    • Сосредоточьтесь на подкреплении, а не на наказании.
    • Геймифицируйте процесс.

    Интересное видео

    PsychCore собрал серию видеороликов об оперантном обусловливании, среди других бихевиористских тем. Вот один из них, объясняющий некоторые основы. Несмотря на то, что вы прочитали всю эту статью, это видео поможет закрепить то, что вы узнали. Различные модальности важны для обучения и удержания.

    Если вам интересно узнать больше о классическом обусловливании, на PsychCore также есть видео под названием Обусловливание респондента . В нем кратко обсуждается понятие вымирания.

    5 Книг по теме

    Доступно несколько учебников, охватывающих как классическое, так и оперантное обусловливание, но если вы ищете практические советы и шаги, не ищите дальше этих пяти книг.

    1.

    Наука и поведение человека – Б. Ф. Скиннер

    Если ваша цель – получить лучшее, чем обычно, понимание человеческого поведения, эта книга – для вас.

    Его часто назначают для курсовой работы по прикладному анализу поведения, области, основанной на бихевиористских принципах.

    Доступно на Amazon.

     

     


    2.

    Атомарные привычки: простой и проверенный способ выработать хорошие привычки и избавиться от плохих – Джеймс Клир

    использовать.

    Джеймс Клир начал свое путешествие по формированию привычек, экспериментируя со своими собственными привычками.

    Одним из интересных дополнений является его пересмотренная версия петли привычки, которая явно включает «тягу». Его версия: сигнал > тяга > реакция > награда. Совет Клира начинать с малого аналогичен подходу Фогга и Маурера.

    Доступно на Amazon.


    3.

    Сила привычки: почему мы делаем то, что делаем в жизни и бизнесе – Чарльз Дахигг

    Возможно, книга, которая сделала петлю привычки реальной для каждого неученого, Сила привычки занимательная и практично.

    Дахигг приводит несколько примеров предприятий, которые поняли, как использовать привычки для достижения успеха, а затем рассказывает, как это может сделать и обычный человек.

    Доступно на Amazon.

     


    4.

    Крошечные привычки: небольшие изменения, которые меняют все  – Би Джей Фогг

    Фогг увлечен формированием привычек, и он точно понял, как это сделать.

    Исследователь из Стэнфорда работает с крупными и малыми предприятиями, а также с частными лицами.

    Вы узнаете о мотивации, способностях и подсказках (MAP) и о том, как использовать MAP для создания устойчивых привычек. Его пошаговое руководство ясно и лаконично, хотя и требует некоторого начального планирования.

    Доступно на Amazon.


    5.

    Один маленький шаг может изменить вашу жизнь: путь кайдзен – Роберт Маурер

    Если вы хотите преодолеть страх и прокрастинацию, то эта книга – отправная точка вашего пути. Маурер представляет и объясняет Кайдзен, японскую концепцию, направленную на постоянное совершенствование.

    Он разбирает основные страхи людей и объясняет, почему мы откладываем дела на потом. Затем он делится семью маленькими шагами, которые направят нас на новый путь к формированию полезных привычек.

    Доступно на Amazon.


    Если вы знаете замечательную книгу, которую мы должны добавить в этот список, оставьте ее название в разделе комментариев.

    Важная информация

    Оперантное и классическое обусловливание — это два способа обучения животных и людей. Если вы хотите тренировать простой стимул/реакцию, то последний подход наиболее эффективен. Если вы собираетесь выработать, изменить или сломать привычку, тогда вам подойдет оперантное обусловливание.

    Оперантное обусловливание особенно полезно в образовательной и рабочей среде, но если вы понимаете основные принципы, вы можете использовать их для достижения своих личных привычек.

    Подкрепления и графики подкрепления имеют решающее значение для успешного использования оперантного обусловливания. Положительное и отрицательное наказание уменьшает нежелательное поведение, но его последствия недолговечны и могут причинить вред. Положительные и отрицательные подкрепления усиливают желаемое поведение и обычно являются лучшим подходом.

    Как вы используете оперантное обусловливание, чтобы добиться устойчивых изменений в своей жизни?

    Надеемся, вам понравилась эта статья. Не забудьте бесплатно скачать три наших упражнения по позитивной психологии.

    • Американская психиатрическая ассоциация (без даты). Что такое обсессивно-компульсивное расстройство? Получено 26 января 2020 г. с https://www.psychiatry.org/patients-families/ocd/what-is-obsessive-compulsive-disorder
    • .
    • Клир, Дж. (2018). Атомарные привычки: простой и проверенный способ выработать хорошие привычки и избавиться от плохих s. Эйвери.
    • Дахигг, К. (2014). Сила привычки: почему мы делаем то, что делаем в жизни и бизнесе. Рэндом Хаус Торговля в мягкой обложке.
    • Фогг, Би Джей (2020). Крошечные привычки: небольшие изменения, которые меняют все . Хоутон Миффлин Харкорт.
    • Кумар, Д., Синха, Н., Датта, А., и Лахири, У. (2019). Система тренировки баланса на основе виртуальной реальности, дополненная парадигмой оперантного обусловливания. BioMedical Engineering OnLine, 18 , 90.
    • Маурер, Р. (2014). Один маленький шаг может изменить вашу жизнь: путь кайдзен. Рабочий.
    • PsychCore (2018, 9 сентября). Нас спросили об эффектах обобщения ответов [видео]. YouTube. https://youtu.be/9U5xylxV0AE
    • PsychCore (2016, 28 октября). Продолжение оперантного обусловливания [Видео]. YouTube. https://youtu.be/_JDalbCTpVc
    • Шунк, Д. (2016). Теории обучения: образовательная перспектива . Пирсон.
    • Скиннер, Б. Ф. (1991). Поведение организмов: экспериментальный анализ. Копли.
    • Скиннер, Б. Ф. (1953). Наука и поведение человека . Макмиллан.
    • Стангор, К. , и Валинга, Дж. (2014). Введение в психологию (1-е канадское изд.). Открытое издание кампуса Британской Колумбии. Получено 27 января 2020 г. с https://opentextbc.ca/introductiontopsychology/
    • .

    Что такое оперантное обусловливание? (и как это объясняет вождение собаки?)

    Хотя вождение автомобиля является второй натурой для многих из нас, на самом деле это довольно сложный процесс. В самой упрощённой версии сначала садишься за руль, потом заводишь двигатель, потом включаешь передачу, а потом надо одновременно рулить, удерживая ногу на педали газа. Это не включает в себя такие вещи, как регулировка зеркал, проверка того, что вы не будете врезаться в другого человека или машину и так далее.

    В каком-то смысле невероятно впечатляет тот факт, что три собаки в Новой Зеландии научились — довольно элементарным образом — водить машину. Они садятся на место водителя, включают передачу, управляют рулем и нажимают на педаль газа. Однако настоящей похвалы заслуживают не собаки, а люди-дрессировщики за их впечатляющее терпение и целеустремленность.

    Обучение, которое привело лучшего друга человека к управлению автомобилем, ничем не отличается от обучения на выставках птиц, которые проходят в зоопарках по всему миру, или на выставках дельфинов, косаток, тюленей или морских львов, которые вы можете см. в Морском мире. Это тот же вид обучения, который ученые используют для исследования эмоциональной и когнитивной жизни крыс, мышей и других существ, населяющих их лаборатории. В конце концов, все сводится к форме обучения, впервые описанной Эдвардом Л. Торндайком в начале XIX века.00s, который позже был расширен и популяризирован Б. Ф. Скиннером и преподавался каждому студенту вводной психологии: оперантное обусловливание .

    Что такое оперантное обусловливание?

    В то время как классическое обусловливание является формой обучения, которая связывает внешние стимулы с рефлекторными, непроизвольными реакциями, оперантное обусловливание включает произвольное поведение и поддерживается с течением времени последствиями, которые следуют за этим поведением. В одном эксперименте Скиннер поместил голубей по отдельности в экспериментальные камеры (иногда называемые «ящиками Скиннера»), которые были предназначены для доставки пищевых вознаграждений через систематические промежутки времени. Он обнаружил, что, поощряя птицу после того, как она продемонстрировала желаемое поведение, он мог мотивировать птицу увеличить частоту этого конкретного поведения.

    Инструменты, используемые в оперантном обусловливании, известны как положительное и отрицательное подкрепление, а также положительное и отрицательное наказание.

    Итак, в чем разница между положительным подкреплением и отрицательным наказанием? Отрицательное подкрепление? Положительное наказание? ПОМОЩЬ!

    Не один студент, изучающий психологию, был сбит с толку различиями между положительным и отрицательным, между подкреплением и наказанием. Вот три (с половиной) вещи, которые вам нужно знать:

    1. Поощрение используется для поддержания или усиления желаемого поведения, а наказание используется для ослабления или устранения поведения. (Скиннер утверждал, что подкрепление более эффективно, чем наказание в изменении поведения.)

    2. Положительный предполагает введение или добавление стимула к ситуации. Отрицательный означает, что стимул снят или удален.

    3. Если стимул доставляет удовольствие или вознаграждает, в учебниках по психологии он может называться «аппетитным». Если стимул невознаграждающий или нежелательный, его можно назвать «аверсивным».

    3а. Положительное подкрепление и отрицательное наказание включают стимулы аппетита. Положительное наказание и отрицательное подкрепление включали аверсивные стимулы.

    Многие студенты думают о самих стимулах как о положительных или отрицательных, и здесь все запутывается. Скажи это вместе со мной: положительное и отрицательное относятся к добавлению или удалению раздражителя, а не к самому раздражителю.

    Положительное поощрение может включать в себя вознаграждение ребенка конфетами, чтобы поощрить его за хорошую игру со своим братом. Конфеты — это стимул для аппетита, который используется для усиления или поддержания желаемого поведения.

    Если ребенок плохо себя ведет, его права на просмотр телевидения могут быть аннулированы. Это негативное наказание , потому что вы убрали стимулирующий аппетит (ТВ), чтобы устранить нежелательное поведение.

    Если ребенок продолжает плохо себя вести, родитель может накричать на него или на нее; это составило бы положительное наказание . Он включает в себя применение аверсивного стимула (крик) для устранения нежелательного поведения.

    Наконец, расстроенный родитель может договориться со своим непослушным ребенком, предложив сократить объем работы по дому, которую он или она должны выполнять на этой неделе, в обмен на желаемое поведение. это форма отрицательное подкрепление , поскольку неприятный стимул (хлопоты) удаляется в целях повышения хорошего поведения.

    Но подождите, есть еще

    Когда дело доходит до дрессировки животных (а иногда и людей), подкрепление доставляется в соответствии с заранее определенным графиком. Если стимул доставляется после определенного количества ответов, он считается графиком с фиксированным соотношением . Например, голубь может получать награду в виде еды после каждого десятого нажатия на кнопку. Голубь узнает, что для получения награды требуется десять нажатий кнопок.

    Если количество ответов, необходимых для получения стимула, варьируется, то вы используете график с переменным соотношением . Лучшим примером для этого является игровой автомат, который имеет фиксированную вероятность получения вознаграждения с течением времени, но переменное количество рывков между вознаграждениями. Неудивительно, что схемы подкрепления с переменным соотношением являются наиболее эффективными для быстрого установления и поддержания желаемого поведения.

    Если стимул дается через определенное время, независимо от количества ответов, то вы получаете фиксированный интервал расписание. Независимо от того, сколько раз голубь клюет кнопку, он получает только одну награду каждые десять минут. Это наименее эффективный график подкрепления.

    Наконец, если стимул дается через переменное количество времени, у вас есть график с переменным интервалом . Стимул может применяться каждую неделю в среднем , что означает, что иногда это происходит чаще, чем один раз в неделю, а иногда и реже. Популярные викторины — самый известный пример графиков подкрепления с переменным интервалом, поскольку точное время, в которое они происходят, непредсказуемо. Искомая реакция в данном случае — учеба.

    В целом, пропорциональные графики более эффективны для изменения поведения, чем интервальные графики, а переменные графики более эффективны, чем фиксированные графики.

    Собираем все воедино

    Скиннер извлек уроки, извлеченные из своих ранних экспериментов с голубями, и продолжил разработку методов получения более сложных форм поведения путем разделения их на сегменты, каждый из которых затем можно было индивидуально обусловливать. Это называется цепью и служит основой для обучения собак вождению автомобилей. Бихевиористы, которые работали с ездовыми собаками, сначала научили их управлять рычагом, затем использовать рулевое колесо для регулировки направления движущейся тележки, а затем нажимать или выжимать педаль, чтобы ускорить или замедлить тележку. По мере того как каждая собака осваивала каждый шаг, добавлялся дополнительный сегмент до тех пор, пока они не усвоили все целевое поведение. В отличие от голубей, для которых еда — лучшая награда, процесс одомашнивания означает, что собак можно вознаграждать только словесной похвалой (хотя еда определенно помогает).

    Как вообще возникает такое неестественное поведение? Используя комбинацию поощрения и наказания, тренер может формировать желаемое поведение, вознаграждая последовательно более близкие значения. Скиннер правильно назвал этот процесс формированием . В 1953 году Скиннер описал это так (выделено мной):

    Мы впервые даем птице корм, когда она слегка поворачивается в сторону пятна из любой части клетки. Это увеличивает частоту такого поведения. Затем мы удерживаем подкрепление до тех пор, пока не будет сделано легкое движение в сторону точки. Это снова изменяет общее распределение поведения, не создавая новой единицы. Мы продолжаем подкреплять позиции последовательно ближе к точке, затем подкрепляя только тогда, когда голова немного выдвинута вперед, и, наконец, только тогда, когда клюв действительно касается точки. … Первоначальная вероятность ответа в его окончательном виде очень мала; в некоторых случаях он может быть даже равен нулю. Таким образом, мы можем строить сложные операнты, которые иначе никогда бы не появились в репертуаре организма. Подкрепляя серию последовательных приближений, мы доводим редкий ответ до очень высокой вероятности за короткое время. … Совокупный акт поворота к точке из любой точки ящика, движения к ней, поднятия головы и удара по точке может показаться функционально последовательной единицей поведения; но он строится в результате непрерывного процесса дифференцированного подкрепления недифференцированного поведения, подобно тому, как скульптор лепит свою фигуру из куска глины.

    Таким же образом можно научить собак танцевать сальсу:

    Или способ, которым эта мышь была обучена преодолевать полосу препятствий:

    Или эта курица:

    Или эта коза:

    используется многими для дрессировки собак, сочетает в себе классическое и оперантное обусловливание. Классическое обусловливание используется для превращения щелкающего звука в условный стимул, который затем используется для положительного подкрепления в оперантном обусловливании.

    Оперантное обусловливание в дикой природе

    Уже упоминалось несколько реальных примеров оперантного обусловливания: поощрение ребенка за хорошее поведение или наказание ребенка за плохое поведение, игровые автоматы и популярные викторины. В зоопарках и других учреждениях для животных смотрители используют оперантное обусловливание, чтобы научить животных перемещаться между различными частями их вольеров, предъявлять части тела для осмотра или обеспечивать безопасное проведение ветеринарных осмотров.

    Оперантное обусловливание также может объяснить, почему некоторые животные зоопарка демонстрируют стереотипии или повторяющееся поведение. Чтобы понять, как это работает, вернемся к голубям Скиннера. В одном из экспериментов Скиннер поместил птиц в их коробки и установил, что вознаграждение в виде еды будет доставляться с систематическим интервалом 90 184 независимо от поведения птиц 90 185 . У голубей развилось то, что Скиннер назвал «суеверным поведением», в результате случайного сопоставления их явного поведения и представления пищевого вознаграждения. Один голубь повернулся в клетке против часовой стрелки незадолго до вручения награды, в результате чего голубь узнал связь между поворотом против часовой стрелки и едой. Голубь крутился вокруг да около в ожидании награды. Другой сунул голову в угол клетки, чтобы добыть пищу. Две птицы покачали головами слева направо, а еще одна птица была приучена клевать — почти, но не совсем касаясь — пола.

    Стереотипное поведение животных, содержащихся в неволе, может быть вызвано рядом причин, но большую их часть можно объяснить случайным оперантным обусловливанием. Действительно, наиболее распространенной формой стереотипного поведения у животных в зоопарке является хождение взад-вперед в сочетании со стереотипными моделями плавания, за которыми следуют различные формы покачивания или кивания головой. К счастью, принципы оперантного обусловливания также можно использовать для решения подобных проблем.

    Можете ли вы привести другие реальные примеры оперантного обусловливания? Оставляйте их в комментариях!

    Скиннер Б. Ф. (1948). «Суеверие» у голубя., Журнал экспериментальной психологии, 38 (2) 168–172. DOI: 10.1037/h0055873

    Шайн А. (2006). Метааналитический обзор влияния обогащения на стереотипное поведение млекопитающих в зоопарках, Zoo Biology, 25 (4) 317-337. DOI: 10.1002/zoo.20091

    Связанный:

    Что такое классическая обусловленность? (И почему это имеет значение?)

    Выраженные взгляды принадлежат автору (авторам) и не обязательно совпадают с мнением Scientific American.

    ОБ АВТОРАХ

      Джейсон Г. Голдман — научный журналист из Лос-Анджелеса. Он писал о поведении животных, биологии дикой природы, охране природы и экологии для журналов Scientific American , Los Angeles , Washington Post , Guardian , BBC, журнала Conservation и других источников. Он участвует в подкасте Scientific American «60-Second Science» и является соредактором Ведение научных блогов: основное руководство (издательство Йельского университета). Ему нравится делиться своими знаниями о дикой природе по телевидению и по радио, и он часто говорит с общественностью о дикой природе и научном общении. Подписывайтесь на Джейсона Г. Голдмана в Твиттере

      Наука об оперантном обучении

      Тренировка с положительным подкреплением включает в себя вознаграждение вашей собаки за то, что она делает правильно. Наградой может быть игрушка, игра или угощение — все, ради чего ваша собака хочет работать. Для некоторых людей это звучит как взятка, а не дрессировка, и они хотят, чтобы их собака слушалась только потому, что они должны. Но тренинг с положительным подкреплением — это не взятка и не уловка. Он основан на науке об обучении животных и невероятно эффективен.

      Что такое оперантное обусловливание?

      Возможно, вы слышали о Павлове и его собаках. Когда прозвенел звонок к обеду, у собак потекла слюна. Они научились ассоциировать колокольчик с приближающейся едой, поэтому еще до того, как их еда была доставлена, они пускали слюни от предвкушения. Это явление известно как классическое обусловливание или ассоциативное обучение. Это случается с вашей собакой все время. Например, когда звонит ваш дверной звонок, ваша собака волнуется, потому что она ожидает посетителя на крыльце. Они научились ассоциировать звон колокольчика с людьми за дверью.

      Но классическое обусловливание происходит непроизвольно. А как насчет всех активных тренировок, которые вы проводите со своей собакой? Вот где вступает в действие оперантное обусловливание. Также известное как обучение методом проб и ошибок, это когда собаки учатся связывать свое поведение с его последствиями. А собаки увеличивают частоту поведения с приятными последствиями и снижают частоту поведения с неприятными последствиями. Итак, если ваша собака лает на вас, пока вы разговариваете по телефону, и вы даете ей кость, чтобы заставить ее замолчать, ваша собака, скорее всего, будет лаять снова в следующий раз, когда вы ответите на звонок. Кость была приятным следствием. Или, если ваша собака беспокоит кошку, а кошка чешет нос, они дважды подумают, прежде чем беспокоить кошку в будущем. Царапина была неприятным последствием.

      Четыре квадранта оперантного обусловливания

      Поскольку поведение определяется последствиями, дрессировка заключается в том, чтобы контролировать последствия действий вашей собаки, чтобы влиять на поведение, которое она выбирает для выражения. Но как именно это работает? Итак, оперантное обусловливание работает в двух разных измерениях. Во-первых, добавляете ли вы что-то или удаляете что-то. Например, если вы даете своей собаке лакомство, вы что-то добавляете. Это известно как позитив. Если вы убираете игрушку, вы что-то убираете. Это известно как негатив. Не думайте об этом с точки зрения хорошего или плохого, просто сложения или вычитания.

      Второе измерение заключается в том, увеличивает ли последствие частоту поведения или уменьшает ее. Это известно как подкрепление (все, что делает поведение более вероятным) и наказание (все, что делает поведение менее вероятным). Опять же, не думайте о хорошем или плохом, а просто о том, становится ли данное поведение более или менее распространенным.

      Эти два измерения в совокупности образуют четыре квадранта оперантного обусловливания. И вы можете использовать эти квадранты, чтобы повлиять на поведение вашей собаки.

      Положительное подкрепление

      Первый квадрант — это то, на чем вы должны сосредоточиться в своем обучении: положительное подкрепление. Помните, что позитив означает добавить что-то, а подкрепление означает усиление поведения. Давая вашей собаке что-то, что она любит (положительное), когда она сидит, она будет сидеть чаще в будущем (подкрепление). Это также называется вознаграждением вашей собаки.

      Положительное наказание

      Второй квадрант известен как положительное наказание. Хотя это наказание в известном смысле, помните, что эти термины означают на научном жаргоне. Вы добавляете что-то, что собаке не нравится (положительное), например шлепок по заднице, чтобы снизить вероятность повторения такого поведения в будущем (наказание).

      Отрицательное подкрепление

      Третий квадрант называется отрицательным подкреплением. В этом случае вы убираете что-то неприятное, чтобы сделать поведение более частым. Это кажется нелогичным. Но вы, вероятно, все время предпринимаете действия, чтобы избежать плохих вещей, например, убираетесь на кухне, чтобы ваш супруг перестал придираться. С собаками подумайте о том, чтобы натянуть удушающую цепочку, когда собака не делает то, что вы хотите. Если вы ослабите давление (отрицательное), как только ваша собака подчинится, она с большей вероятностью сделает то, что вы хотите, в следующий раз (подкрепление).

      Отрицательное наказание

      Последний квадрант называется отрицательным наказанием и должен быть вторым вариантом в вашем поясе с тренировочными инструментами. В этом случае вы удаляете что-то, что нравится вашей собаке (негатив), чтобы уменьшить частоту поведения (наказание). Подумайте об игнорировании вашей собаки, когда она прыгает на вас. Вы убираете свое внимание, то, чего хочет ваша собака, чтобы отбить у нее охоту прыгать в будущем.

      Сосредоточьтесь на положительном подкреплении

      Хотя собаки одинаково учатся во всех четырех секторах, вы не хотите использовать их все одинаково. На самом деле тренеры по положительному подкреплению сосредотачиваются только на двух квадрантах: положительном подкреплении и отрицательном наказании. Это означает, что они имеют дело с вещами, которые нужны собакам, такими как угощения, игры или внимание, и они в основном доставляют их или иногда забирают. Они не используют неприятные вещи, которые собаки находят отталкивающими, как вы бы использовали с положительным наказанием или отрицательным подкреплением.

      Исчезло использование аверсивов. Благодаря непроизвольному усвоению классического обусловливания собаки, обученные неприятным действиям, часто связывают эти аверсивные действия с дрессировщиком и тренировочным процессом. Эти собаки не хотят учиться, они не хотят пробовать что-то новое, и их связь с хозяином разрушается.

      Однако сосредоточенность на поощрении не только влияет на поведение собаки, но и учит собак любить дрессировку. Положительное подкрепление — это получение хороших вещей. Не боясь сделать что-то не так, ваша собака может стать активным участником процесса дрессировки. Они начнут пробовать что-то новое, много умственных упражнений и будут активно искать способы заработать вознаграждение. Кроме того, вместо того, чтобы просто узнать, чего не следует делать, они узнают, что вы ожидаете в каждой ситуации. Наконец, из-за классического обусловливания ваша собака будет ассоциировать вас с замечательными наградами, которые вы даете, что укрепляет вашу связь. И это ли не прекрасный способ воспользоваться преимуществами науки.

      Примеры оперантного обусловливания

      Оперантное обусловливание — это процесс обучения, при котором преднамеренное поведение подкрепляется последствиями. Он отличается от классического обусловливания, также называемого респондентным или павловским обусловливанием, при котором непроизвольное поведение вызывается внешними раздражителями.

      Собака получает лакомство за то, что сидит, как примеры оперантного обусловливания

      При классическом обусловливании собака, которая выучила звук колокольчика до поступления еды, может начать выделять слюну при звуке колокольчика, даже если еда не поступает. Напротив, собака может понять, что, сидя и оставаясь, она получает лакомство. Если собака затем лучше сидит и остается, чтобы получить лакомство, то это пример оперантного обусловливания.

      Реклама

      Оперантное обусловливание и синхронизация

      Основная концепция оперантного обусловливания проста: когда определенное преднамеренное поведение подкрепляется, это поведение становится более распространенным. Психология делит подкрепление на четыре основные категории:

      • Положительное подкрепление
      • Отрицательное подкрепление
      • Наказание
      • Угасание

      Время и частота очень важны для подкрепления.

      • График непрерывного подкрепления (обычно сокращенно CRF) обеспечивает подкрепление для всех отмеченных моделей поведения. То есть каждый раз, когда поведение происходит, обеспечивается подкрепление.
      • График прерывистого подкрепления (обычно сокращенно INT) подкрепляет некоторые целевые модели поведения, но не все из них. Думайте об этом как об игровом автомате. Вы не будете выигрывать при каждом нажатии на рычаг, но иногда вы выигрываете, и это усиливает поведение при нажатии на рычаг.

      Примеры положительного подкрепления

      Положительное подкрепление описывает наиболее известные примеры оперантного обусловливания: получение вознаграждения за определенные действия.

      • Многие люди дрессируют своих питомцев с помощью положительного подкрепления. Похвала питомца или предоставление лакомства, когда он подчиняется инструкциям, например, когда ему говорят сесть или присесть, помогают животному понять, чего от него хотят, и побуждают его выполнять будущие команды.
      • Когда ребенка хвалят за выполнение работы без жалоб, например за уборку в комнате, он, скорее всего, продолжит выполнять эту работу в будущем.
      • Когда работник получает бонус за выдающиеся показатели продаж, он склонен продолжать работать на высоком уровне в надежде получить еще один бонус в будущем.

      Примеры отрицательного подкрепления

      Отрицательное подкрепление — это другая, но столь же простая форма оперантного обусловливания. Отрицательное подкрепление вознаграждает поведение, удаляя неприятный стимул, а не добавляя приятный.

      • Работодатель предлагает работнику выходной — пример отрицательного подкрепления. Вместо того, чтобы давать ощутимое вознаграждение, они уменьшают присутствие чего-то нежелательного; то есть количество времени, проведенного на работе.
      • В каком-то смысле маленькие дети обусловливают своих родителей отрицательным подкреплением. Крики, истерики и другие проявления «отыгрывания» обычно предназначены для того, чтобы привлечь внимание родителей. Когда родитель ведет себя так, как хочет ребенок, неприятное состояние — крик и плач — прекращается. Это отрицательное подкрепление.
      • Негативное подкрепление распространено в системе правосудия. Тюрьмы иногда смягчают правила для хорошо ведущего себя заключенного, а приговоры иногда сокращают за хорошее поведение. Последнее, в частности, представляет собой классическое негативное подкрепление: удаление чего-то нежелательного (дней в тюрьме) в ответ на данное поведение.

      Реклама

      Примеры наказания

      В психологии наказание не обязательно означает то, что оно означает при обычном использовании. Психология определяет наказание как нечто, совершаемое после определенного преднамеренного действия, которое снижает вероятность того, что это действие произойдет в будущем. В то время как подкрепление предназначено для поощрения определенного поведения, наказание предназначено для предотвращения определенного поведения.

      • Сотруднику, пропустившему работу, может быть сокращена заработная плата. Потеря дохода (нежелательное последствие) является наказанием за пропуск работы (нежелательное поведение).
      • Резкое «Нет!» адресованное питомцу, проявляющему недопустимое поведение, является классическим примером наказания. Крик наказывает питомца, заставляя его избегать неправильного поведения в будущем.
      • Наказания обычно используются в лабораторных экспериментах. Чаще всего за определенное поведение лабораторное животное наказывают легким электрошоком.

      Наряду с примерами положительного и отрицательного подкрепления существуют также примеры положительного наказания (подобного приведенным выше) и отрицательного наказания. При последнем устраняется положительная ситуация при выполнении нежелательного поведения. Например, родитель может отобрать любимую игрушку у непослушного ребенка.

      Примеры угашения

      Психология определяет угасание как потерю условного рефлекса с течением времени, когда кондиционирующие стимулы больше не присутствуют. Со временем животное (или человек) станет менее обусловленным, если стимулы, которые его обусловили, не будут повторно применены.

      • Сотрудник, которого однажды наказали за пропуск работы, а затем никогда больше, может впоследствии с большей вероятностью пропустить работу, потому что он больше не ожидает наказания за отсутствие.
      • Животные часто проверяют пределы своей физической подготовки. Например, кошка, которую наказывают пульверизатором каждый раз, когда она взбирается на прилавок, может приблизиться к прилавку или прыгнуть на прилавок, когда считает, что вокруг никого нет. Если наказания не происходит, кошка, скорее всего, будет продолжать прыгать на прилавок, потому что обусловливание, направленное против нее, исчезнет.
      • В школе, если учащийся получает золотую звезду за отличный результат теста, но не получает больше золотых звезд в последующих тестах, он может потерять мотивацию к хорошей успеваемости в будущих тестах. Оперантное обусловливание положительного поведения (хорошее выполнение теста) угасает.

      Реклама

      Б. Ф. Скиннер и обусловливание

      Берхус Фредерик Скиннер был психологом и исследователем, которому приписывают установление принципов оперантного обусловливания. Б. Ф. Скиннер начал с закона эффекта Торндайка, который гласит, что поведение, приводящее к удовлетворительным результатам, будет повторяться. Скиннер считал удовлетворение недостаточно конкретным для измерения и намеревался разработать средства измерения усвоенного поведения.

      Камера для оперантного кондиционирования, широко известная как ящик Скиннера, была его решением. Он держал своих подопытных, прежде всего голубей и крыс, в условиях, которые позволяли ему внимательно наблюдать за их поведением. Он изолировал животное, и каждый раз, когда животное выполняло определенное поведение, например, нажимало на рычаг, оно вознаграждалось едой. Когда животное начнет надежно нажимать на рычаг, он поймет, что оно обработано.

      Работа Скиннера взяла этот первый принцип и применила его к человеческому поведению, представив школу психологии, называемую бихевиоризмом. Бихевиоризм определил большую часть психологии во второй половине 20-го века, но в настоящее время он сочетается с другими психологическими точками зрения.

      Оперантное обусловливание и вы

      Говорить о человеческом поведении на языке клинической психологии может быть неудобно. Тем не менее, оперантное обусловливание описывает простое явление, которое происходит во всех сферах жизни. Это всего лишь один из механизмов, с помощью которых люди учатся. Очень важно понять, как работает этот механизм, чтобы убедиться, что он работает лучше всего для вас.

      Чтобы узнать больше о науке обусловливания, ознакомьтесь с нашей статьей «Примеры бихевиоризма». Это школа психологии, которая фокусируется на наблюдаемом поведении, а не на эмоциях или мотивах, чтобы объяснить, как и почему люди делают то, что они делают.

      24 Примеры оперантного обусловливания в повседневной жизни

      Содержание

      • Классическое обусловливание
      • Закон эффекта и оперантное обусловливание
      • Оперативное обусловливание
      • 24 Примеры оперантного кондиционирования
      • Графики подкрепления

      Оперантное обусловливание , также известное как инструментальное обусловливание, представляет собой процесс обучения, в котором поведение изменяется с помощью поощрений или наказаний. При многократном сочетании желаемого поведения с последствиями формируется ассоциация для создания нового обучения.

      Напр. дрессировщик дает своей собаке лакомство каждый раз, когда собака поднимает левую лапу. Собака узнает, что поднятие левой лапы может принести ей пищевое вознаграждение. Он будет снова и снова поднимать лапу, чтобы получить больше лакомства.

      Классическое обусловливание как основа бихевиоризма

      Мы можем проследить происхождение оперантного обусловливания до его предшественника, классического обусловливания.

      Классическое обусловливание, также известное как обусловливание по Павлову, также включает обучение новому поведению в процессе ассоциации. ​2​  

      Русский физиолог Иван Павлов впервые экспериментировал с классическим обусловливанием в конце 1800-х годов. Он заметил, что у его собак выделялась слюна всякий раз, когда он входил в комнату, чтобы их покормить.

      В своих экспериментах Павлов звонил в колокольчик каждый раз, когда кормил своих собак. Со временем собаки научились выделять слюну, когда слышали звук колокольчика, даже когда еды не было.

      Пища, способная естественным образом вызвать слюноотделение, является безусловным раздражителем. Звук колокольчика, который начинал вызывать слюноотделение после приема пищи, был условным раздражителем.

      Когда безусловный раздражитель (еда) и условный раздражитель (звук) ассоциировались, условный раздражитель мог вызвать одинаковую реакцию. Эта недавно выученная реакция стала условной реакцией. Это форма обучения через ассоциации.

      Павловское обусловливание стало основой бихевиоризма, ведущей области психологии того времени. Бихевиористы считают, что поведение — это реакция на внешние стимулы, и люди учатся только через ассоциации, а не через мысли, чувства или внутренние психические события.

      Закон эффекта и оперантное обусловливание

      Позже психолог Эдвард Торндайк выдвинул концепцию инструментального обусловливания , когда он наблюдал влияние подкрепления в экспериментах с коробкой-головоломкой с кошками, пытающимися сбежать. Он назвал этот процесс обучением методом проб и ошибок.

      Торндайк предложил Закон Эффекта 3 , который гласил, что если при наличии стимула за реакцией следует удовлетворяющее событие (подкрепление), то связь между стимулом и реакцией усиливается. И наоборот, если за ответным стимулирующим событием следовало неудовлетворяющее событие (каратель), связь ослаблялась.

      В начале 1900-х годов психолог-бихевиорист Б. Ф. Скиннер, также известный как отец оперантного обусловливания, опираясь на концепции подкрепления и наказания, создал теорию оперантного обусловливания (теория подкрепления).

      Скиннер считал, что павловское обусловливание слишком просто, чтобы полностью объяснить сложное человеческое поведение. Он считал, что лучший способ понять оперантное поведение — это наблюдать его причины и последствия 1 .

      В парадигме оперантного обусловливания Скиннера наблюдаемым поведением можно манипулировать, если за ним следует подкрепление или наказание.

      В отличие от классического обусловливания, которое включает бессознательное рефлекторное поведение, оперантное поведение — это поведение, находящееся под сознательным контролем. Применение подкрепления и наказания создает преднамеренный и сознательный процесс обучения.

      Оперантное обусловливание

      Для изучения оперантного обусловливания Б. Ф. Скиннер сделал камеру, названную Ящиком Скиннера , и поместил внутрь небольшое животное. В опытах каждый раз, когда животное нажимало на рычаг или планку, оно получало пищу или воду в качестве подкрепления ​4​ .

      Поощрение увеличивает целевое поведение, а наказание снижает его.

      С помощью своих экспериментов Скиннер выделил два типа последствий, которые могут повлиять на новое обучение: подкрепление и наказание.

      Подкрепление

      Существует два типа подкрепления – положительное подкрепление и отрицательное подкрепление.

      В психологии под положительным понимается добавление стимула, а под отрицательным — удаление.

      Положительное подкрепление добавляет вознаграждающее последствие в качестве положительного подкрепления к поведению, тем самым усиливая или увеличивая вероятность того, что желаемое поведение появится снова.

      Отрицательное подкрепление  устраняет  неприятный стимул для усиления желаемого поведения в будущем.

      Наказание

      Наказание противоположно подкреплению. Он направлен на снижение плохого поведения.

      Как и поощрение, наказание бывает двух видов: положительное наказание и отрицательное наказание.

      Положительное наказание добавляет неприятный стимул, чтобы ослабить или устранить поведение. Позитивное наказание — это обычно то, что мы называем «наказанием» в повседневной жизни.

      Негативное наказание удаляет приятный стимул, чтобы остановить нежелательное поведение.

      24 Примеры оперантного обусловливания

      Вот примеры различных типов оперантного обусловливания.

      Пример положительного подкрепления

      • Родитель дает ребенку дополнительное пособие (поощрение) за мытье посуды (желаемое поведение)
      • Менеджер предлагает бонусы (поощрение) своим работникам за своевременное завершение проекта (желаемое поведение).
      • Учитель дает учащимся золотые звезды (поощрение) за то, что они поднимают руки перед тем, как говорить (хорошее поведение).
      • Вы получаете аплодисменты публики (подкрепление) после игры на фортепиано (желаемое поведение) на сольном концерте.
      • Маленькие дети гладят собаку по голове (поощрение), когда она спокойно сидит перед ними (желаемое поведение).0011

      Пример отрицательного подкрепления

      • Ребенку не нужно убирать со стола (неприятное событие) после еды, если он съел свой овощ (желаемое поведение.)
      • Вынос мусора (желаемое поведение) убирает гнилой запах (неприятный раздражитель) на кухне.
      • Чистка зубов (желаемое поведение) предотвращает кариес (неприятное событие).0011
      • Подросток убирает в своей комнате (желаемое поведение), чтобы у него не отобрали телефон (неприятное событие). )

      Пример положительного наказания

      • Родитель поручает ребенку дополнительную работу (неприятные последствия) за то, что он слишком много играет в видеоигры (плохое поведение). (нежелательное поведение.)
      • Родители шлепают детей (неприятный раздражитель) за пропуск занятий (нежелательное поведение).
      • Ребенка ругают (неприятное событие) за игнорирование домашнего задания (нежелательное поведение).
      • Родитель дает ребенку тайм-аут (неприятное последствие) за истерики (нежелательное поведение.)
      • Полиция выписывает водителю штраф (неприятный раздражитель) за превышение скорости (нежелательное поведение.)

      Пример отрицательного наказания

      • Родитель отбирает у ребенка телефон (приятный раздражитель) за смотреть слишком много видео (плохое поведение)
      • Полиция лишает водительских прав (приятный стимул) за безрассудное вождение (нежелательное поведение). приятный стимул) за пропуск комендантского часа (плохое поведение.)
      • Мальчик теряет время на планшете (приятный стимул) за издевательства над другими в школе (нежелательное поведение.)
      • Воры лишаются свободы (приятный стимул) за воровство (плохое поведение. )

      Использование оперантного обусловливания широко распространено. Вы можете видеть это повсюду. Его используют родители, учителя, компании и правительство.

      См. также: Психология формирования

      Графики подкрепления — ключевой компонент

      Модификация поведения с использованием подкреплений и наказаний требует постоянного применения, чтобы оставаться эффективной. Как только подкрепление или наказание прекращаются, усвоенное поведение постепенно ослабевает и, наконец, исчезает в процессе, называемом угасанием.

      Что удивительно даже для Скиннера, так это то, что частота и характер применения подкрепления могут влиять на то, насколько быстро работает подкрепление и насколько устойчивым остается обучение ​5​ .

      Существует два типа графиков подкрепления: графики на основе интервалов и графики соотношений.

      Графики на основе интервалов: подкреплений доставляются через определенный период. Период может быть фиксированным (график с фиксированным интервалом) или переменным (график с переменным интервалом).

      Расписания, основанные на соотношении : поощрения доставляются после определенного количества ответов. Количество ответов может быть фиксированным (график с фиксированным соотношением) или переменным (график с переменным соотношением).

      Исследования показали, что поведение, усвоенное с помощью графиков с переменным соотношением, является наиболее устойчивым и наименее подверженным исчезновению.

      Это важное открытие, потому что теперь мы можем эффективно использовать подкрепление и наказание в различных ситуациях.

      при использовании вознаграждений для подкрепления желаемого поведения мы теперь знаем, что должны давать их только изредка (расписание с переменным соотношением).

      Когда малыш закатывает истерику на рынке, мы теперь знаем, что ни в коем случае не должны покупать конфеты. Иногда уступая, вы сделаете так, что избавиться от привычки будет гораздо труднее.