НАУЧЕНИЕ Оперантное обусловливание Оперантное обусловливание Ú Оперантное

НАУЧЕНИЕ Оперантное обусловливание

Оперантное обусловливание Ú Оперантное обусловливание является активным поведением, которому человек или животное обучаются в определенной ситуации. Название происходит от латинского слова operatio, что в переводе обозначает действие.

Оперантное обусловливание Ú «Обусловливание» же свидетельствует о том, что обучение действию требует конкретного условия. При этом ассоциативная связь возникает между конкретным поведением и стимулом, который называется подкреплением, при определенных условиях.

Ú Этот тип обучения позволяет организму менять свои действия в зависимости от тех последствий, которые оно порождает. Некоторые последствия увеличивают вероятность повторения в будущем, и они называются подкреплением. Другие последствия снижают вероятность его повторения и называются наказанием.

Ú Например, если маленький ребенок, случайно произнес два раза подряд слог: «Ма» , – а вслед за эти услышит восторженные слова матери и увидит счастливую улыбку, то вероятность того, что он тут же произнесет это еще раз, резко возрастет.

Ú Если же за этими звуками не последует определенных действий, то, скорее всего, они исчезнут из его набора словесных реакций. Предполагается, что само начало вербальной активности у детей включается этим механизмом. Дальнейшее развитие речи объясняется другими механизмами.

подкрепление Ú Таким образом, подкрепление – это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции

Положительное подкрепление Ú Описаны положительное и отрицательное подкрепление. Положительным подкреплением считается событие, сочетающееся с каким-либо действием и ведущее к повышению вероятности его повторения.

наказание Ú Так, похвала, услышанная ребенком после того, как он вымыл посуду после обеда, увеличивает вероятность того, что он сделает это еще раз. Однако негативное замечание, что посуда вымыта плохо, снизит эту вероятность, а потому будет называться наказанием.

Отрицательное подкрепление Ú Отрицательным подкреплением называется негативная реакция, которую человек или животное предпочитают избегать. Например, в эксперименте, в котором после звукового сигнала на дно клетки подавался электрический ток, подпрыгивая, крыса избегала удара током. Звук служил сигналом животному к прыжку.

Аверсивное подкрепление Ú Более точным было бы говорить в данном случае не об отрицательном, а об аверсивном (аверсивное поведение – поведение избегания) подкреплении, поскольку оно позволяет избежать неприятного воздействия стимула.

Ú Примером отрицательного подкрепления является, ситуация, когда ребенок выполняет некоторую работу не для того, чтобы получить что-то приятное, а для того, чтобы избежать неприятных для него нареканий со стороны родителей.

Наказание и подкрепление Ú Следует различать подкрепление и наказание. Наказание – это событие, приводящее к исчезновению того или иного поведения, тогда как после подкрепления, даже негативного, вероятность появления поведения еще раз только увеличивается.

Наказание и подкрепление Ú Следовательно, наказание ведет к исчезновению реакции, тогда как негативное подкрепление ведет к формированию реакции избегания. Например, после наказания подросток перестает курить, а после негативного подкрепления он избегает встречаться с отцом, когда курит, и тщательно скрывает от него этот факт (но курить не бросает).

Наказание и подкрепление Ú При этот и наказание, и негативное подкрепление могут внешне не отличаться одно от другого. Отец, застав ребенка за курением, достает ремень и бьет его. Но на завтра ребенок начинает тщательнее скрывать факт курения: он научился избегать встречи с отцом во время курения.

Наказание и подкрепление Ú Другой отец, узнав о том, что его ребенок курит, показал своему сыну свои негативные переживания по этому поводу. Возможно, он даже кричал. Но затем он стал чаще уделять внимание сыну, вместе заниматься спортом. И подросток сам бросил курить. Это все свидетельствует о том, что при этом типе обучения результат в значительной мере зависит от условий обучения.

Виды оперантного обусловливания Ú Выделяют несколько типов оперантного обусловливания. Американский психолог Э. Торндайк (Thorndike, 1911) исследовал метод проб и ошибок. Он предложил эксперименты на животных в особых «проблемных» клетках, то есть в таких, в которых определенные действия животных могли иметь те или иные последствия.

ÚВ одном из них животное помещалось в «проблемную» клетку, рядом с которой находилась пища, которую животное могло видеть.

Проблемная клетка ÚОно могло выйти и взять пищу, если нажимало на деревянную педаль, встроенную в клетку. Двигаясь внутри нее, животное случайно наступало на педаль, дверь открывалась и пища становилась доступной.

ÚПосле каждого случайного открытия клетки вслед за нажатием педали поведение животного менялось: время следующего нажатия на педаль сокращалось и оно освобождалось быстрее и быстрее.

ÚСледовательно, животное научалось с помощью определенного действия добиваться результата и случайные движения замещались закономерными.

Закон эффекта ÚЭ. Торндайк назвал это явление «законом эффекта» . Согласно этому закону, вероятность повторения действия, которое ранее привело к желательному результату, в дальнейшем поведении резко возрастает.

ÚЕсли же последствия этого действия вызывают нежелательный результат, то оно, напротив, будет воспроизводиться все реже и реже.

Ú В начале 20 века в Германии была известна лошадь по имени Умный Ганс. Ударами копыт она считала цифры, складывала из букв слова, и даже извлекала квадратные корни. Ее хозяин наивно, но искренне, полагал, что он некоторым образом обучил ее думать.

Ú Однако, проведенное исследование независимыми экспертами поведения животного показало, что лошадь ориентировалась в своих ответах на поворот головы хозяина, который ходил в широкополой шляпе, а потому слабое движение его головы усиливалось шляпой.

ÚКогда хозяин считал, что число ударов копыт при ответе достаточно, он непроизвольно наклонял голову.

Ú Лошадь, для которой это движение было подкреплением, прекращала бить копытом. В тех случаях, когда предлагались вопросы, на которые никто из присутствующих, и хозяин в том числе, не знали ответа, удары копыт были неопределенными.

Ú Другой тип оперантного обучения был описан Б. Ф. Скиннером (Skinner, 1969). Он показал, что поведение у человека и животных может формироваться не только случайным образом, но и целенаправленно, постепенно за счет подкрепляющих факторов.

Ú Такой тип обучения был назван формированием поведения путем последовательных приближений. Например, от животного требуется сложное действие, состоящее из нескольких мелких. Это часто бывает в цирке, когда животное перепрыгивает через барьер, а затем, например, идет по бревну.

Ú Дрессировщик разбивает общее поведение на ряд этапов. Сначала он подкрепляет движения, которые приводят животное к барьеру. Затем оно получает кусочек еды, когда просто перепрыгивает через преграду.

Ú Затем – только за то, что подходит и перепрыгивает через преграду. Позднее – за то, что идет отдельно по бревну и отдельно подходит к барьеру и прыгает. Наконец, пища достается лишь в том случае, когда животное выполняет всю последовательность действий.

Ú Следовательно, при этом типе обучения расчленяется сложное поведение на отдельные этапы, на каждом из которых постепенно случайное движение приближается к запланированному за счет подкрепления нужных и пренебрежения ненужными компонентами сложного двигательного акта.

ÚПри этом формируется ассоциативная связь между определенным поведением животного и последствиями этого поведения.

Ú С помощью этой модели можно объяснить быстрое обучение ребенка произнесению первых слов (но не всего языка в целом). Известно, что в первые месяцы жизни дети произносят более 80 звуков, что может соответствовать звуком всех языков мира. Ребенок, перебирая различные звукосочетания, случайно говорит что-то похожее на: «Мо-мо» .

Ú Радостная мама тут же подкрепляет эти звуки поцелуем, демонстрируя всем, что ее ребенок начал говорить слово «мама» . Однако, через некоторое время родительские восторги пойдут на убыль, тогда как более близкое и отчетливое произнесение вновь вызовет бурю восторгов. Так, методом последовательного приближения ребенок будет набирать свои первые слова, соответствующие ожиданиям родителей.

Ú Описаны требования, предъявляемые к подкреплению при формировании определенного поведения. Подкрепление тем успешнее, чем более оно близко по времени к действию. Чем дальше оно от него отстоит, тем медленнее формируется поведение.

ÚЕсли ребенка хвалить за выполненное им задание на следующий день, это не произведет того эффекта, который будет, если мы сразу же выразим свою радость от достигнутого им результата.

Ú Скорость выработки действия определяется также величиной подкрепления. Желательно, чтобы подкрепление не было слишком большим или сильным. Например, в процессе обучения животного это может быть маленький кусочек пищи, а не полная миска; при обучении ребенка или взрослого – небольшой подарок.

ÚСытое животное перестанет обучаться. Согласно русской пословице: «Сытое брюхо к учению глухо» . Если ребенку предложен большой подарок, то следующий за ним маленький вызовет лишь угашение реакции, а не ее усиление.

Ú При выработке поведения играет роль и очень большое подкрепление. Его влияние часто наблюдается у азартных игроков, которые, впервые получив значительный выигрыш, не могут прекратить игру даже при постоянных проигрышах в дальнейшем.

Ú Слишком интенсивное переживание при случайном мощном подкреплении будет удерживать человека за игорным столом или у игрового автомата. Именно поэтому, завлекая игроков в игорных домах, им сначала позволяют выиграть, а потом возвращают все и даже больше, пока человек не лишается всех своих средств.

Ú На этом эффекте работают широко распространенные на улицах «наперсточники» и другие мошенники. Случайное большое подкрепление может вызвать продолжительную стойкую реакцию у человека и животного. По этому механизму формируются и суеверия.

Ú Кроме уже описанных видов подкрепления выделяют вариативное. Его действие ограничено следующими условиями. Вырабатывается определенное поведение, связанное с тем или иным подкреплением. Затем подкрепление убирается и поведение ослабевает.

Ú Случайное подкрепление этого поведения вызывает резкое усиление угасшей реакции. Чем реже такого рода подкрепление, тем дольше держится восстановленная реакция. На этом механизме основано стойкое поддержание аддиктивного (зависимого) поведения, когда одна сигарета, одна рюмка, одна ссора усиливают никотиновую, алкогольную зависимость или снятие стресса за счет выплескивания эмоции на другого человека, провоцируя скандал (Прайор, 1995).

ÚЭффективность формирования поведения методом последовательных приближений зависит не только от типа подкрепления, но и от числа этих приближений и их последовательности.

Ú Основная характеристика этого вида обучения - его поэтапность, последовательность приближения к окончательному эталону. Следовательно, весь процесс выработки поведения делится на отрезки, в течение которых добиваются конкретного действия.

ÚЭто действие должно быть таким, чтобы обучаемый человек или животное могли реально его выполнить и, в результате, получить подкрепление.

Ú Например, желая научить ребенка красиво писать или качественно делать любую другую работу, родитель не может этого требовать сразу. Сначала он хвалит ребенка за то, что тот просто написал палочки, затем - за то, что некоторые из них написаны ровно, затем - что большая часть написана ровно и т. д.

Ú Требование выполнить работу качественно без тренировки может привести к тому, что у ребенка вовсе отпадет желание что-то делать. Точно также, желая поменять поведение супруга, второй член семьи может постепенно наращивать свои требования, а не ставить ультиматум. Невыполнение этого условия часто является причиной неудач воспитания детей и безуспешных попыток супругов переделать друга.

Ú Итак, эффект обучения определяется числом последовательных приближений и тем, какие действия вырабатываются на каждом этапе. Важное требование к этому действию состоит в том, что вырабатывать его можно только по одному, а не по нескольким критериям одновременно.

Ú Например, при обучении ребенка качественно читать, нельзя сразу же требовать понимания прочитанного и быстрого чтения; от молодой жены нельзя одновременно требовать готовить обед и готовить его вкусно. Сначала, например, можно выработать желание готовить обед, а затем вырабатывать навык готовить вкусно.

ÚПрежде чем увеличить или повышать критерий, нужно пользоваться подкреплением текущего уровня, то есть подкреплять любые исполнения данного действия. Вводя новый критерий лучше временно ослабить предыдущий.

ÚНапример, желая научить ребенка читать быстро, на первом этапе можно пожертвовать качеством чтения и при наборе им определенной скорости, начать вновь следить и за качеством понимания текста.

Ú Еще одним условием эффективности такого обучения является то, что заканчивать ежедневный курс тренировки следует всегда на фоне поощрения. Если это условие нарушено и ребенку сегодня предъявляется требование, за которое он не получает поощрения (в виде похвалы или поглаживания), то он будет воспринимать это как наказание (а мы помним, что наказание устраняет уже существующий навык).

Ú Часто именно из-за этого дети, учащиеся хорошо и не получая никакой оценки от своих родителей, начинают учиться плохо, поскольку только в этом случае взрослые начинают интересоваться успехами ребенка (Прайор, 1995). И дело пойдет на лад, если взрослые поймут, что не ребенок сам, а они собственным поведением направили его на другое отношение к учебе.

Ú Следовательно, одно и то же действие может быть и наказанием, и поощрением в зависимости от обстоятельств, в которых оно происходит. И если наказание может не меняться, то поощрение меняет свой смысл при монотонности. Эффективность же навыка определяется не наказанием, а поощрением.

Ú Обнаруженные тонкости в выработке оперантного обучения заставили Б. Ф. Скиннера прийти к выводу, что общество в процессе воспитания подрастающего поколения должно не столько заботится о подавлении социально неадекватного поведения (наказание), сколько о выработке социально одобряемого поведения у будущих граждан.

Ú Именно поэтому и законы в обществе должны поддерживать активность лояльных к нему граждан, а не только подавлять тех, кто его разрушает. Ú В настоящее время обнаружен нейрофизиологический механизм, контролирующий процесс подкрепления.