Илл. 2.8. Процесс оперантного обусловливания: обзор




Вопрос. Оперантное обусловливание: научение через поощрение и наказание

Вообразите себя в роли шеф-повара, работающего в компании общественного пита­ния, где вы занимаетесь планированием специального меню для капризного клиента. Ес­ли ваше меню будет принято, а блюда попадут «в точку», компанию ожидает хорошая воз­можность получения большого нового заказа. Вы упорно работаете, прикладывая макси­мум своих усилий, и представляете свой плод кулинарного воображения на суд скептиче­скому клиенту. Каков же финал этой истории? Если клиенту придется по душе ваше блю­до, ваш благодарный босс поощрит вас серьезным повышением. Однако если у клиента блюдо вызовет отвращение, ваш босс предложит вам расстаться с вашим колпаком шеф-повара. Независимо от того, какое из продолжений последует, одна вещь бесспорна: что бы вы ни сделали в данной ситуации, вы будете уверены, что сделаете это снова, если это привело к успеху, и не повторите этого, если это привело к неудаче. Данная ситуация хорошо иллюстрирует важный принцип оперантного обусловливания (известного так­же как инструментальное обусловливание), а именно: наше поведение имеет свои последствия, и то, как мы поведем себя в будущем, зависит от того, каковы эти последствия.

Оперантное обусловливаниеформа научения, при которой люди соотносят последствия своих действий с самими действиями. Поступки с позитивными последствиями люди добавляют к набору приемлемых действий; поступки с отрицательными последствиями стараются из него исключить.

Если наши действия привели к прият­ным результатам, тогда мы, вероятно, будем повто­рить их в дальнейшем. Если же наши действия приве­ли к неприятным результатам, едва ли мы станем по вторять их в будущем.

Это явление, известное как закон результата, — основополагающее для опе-рантного обусловливания. Наши представления об этом явлении идут от работы известного ученого Б.Ф. Скиннера (В.Р. 8ктпег)39. Он впервые проде­монстрировал, что именно благодаря связи между нашими поступками и их последствиями мы учим­ся тому или иному образу действий. В обобщенном виде данный процесс показан на илл. 2.8

Инструментальное обусловливание См. оперантное обусловливание.

Закон полученного результататенденция закрепления поведения,ведущего к желаемым последствиям,и ослабления поведения, ведущего к нежелательным последствиям.

Ситуации подкрепления. Оперантное обуслов­ливание основывается на идее, поведение осваива­ется вследствие приятных последствий, которые мы с ним соотносим. К примеру, люди в организа­циях часто находят приятным и желаемым получе­ние денежных вознаграждений, оплачиваемого от­пуска и различных форм признания. Процесс, по­средством которого люди научаются совершать поступки, которые приводят к таким же­лаемым последствиям, известен как позитивное подкрепление. Любое поведение, которое привело к таким позитивным последствиям, имеет тенденцию к повторению, подкреп­ляющему таким образом данное поведение.

Позитивное подкреплениепроцесс,посредством которого люди научаются поведению, ведущему к желаемым результатам.

Так, например, если торговый представитель награждается премией после удачной торговой сделки, эта премия будет подкреплять действия этого человека только в том случае, если она соотносится с фактом этой выгодной сделки. Если это про­исходит, индивидуум с большей вероятностью будет стремиться к совершению каких-либо действий, способствующих привлечению очередного крупного платежа.

Также мы научаемся иногда выполнению некоторых действий, поскольку они позво­ляют нам избежать нежелательных последствий. Неприятные события, такие, как выговор, отказ, испытательный срок или увольнение, яв­ляются примерами последствий, вытекающих из ка­ких-либо негативных действий на рабочем месте.

Илл. 2.8. Процесс оперантного обусловливания: обзор

Исходной предпосылкой оперантного обусловливания является то, что люди научаются, устанавливая взаимосвязи между последствиями своего поведения и самим поведением. В данном примере оценка руководителя усиливает стремление подчиненных к надлежащему выполнению работы в будущем. Научение происходит за счет обусловливания соответствующих событий прошлого и их последствий.

Этапы процесса оперантного обусловливания


События прошлого

(условия, определяющие-поведени)


Поведение

(совершаемые действия)


Последствия

(резултаты поведения)


Пример процесса оперантного обусловливания


Руководитель демонстрирует подчи­ненному, как необходимо выполнять работу


Работник выполняет работу надлежащим образом

 


Руководитель хвалит работника


Процесс, посредством которого люди научаются со­вершать поступки, ведущие к избежанию подобных негативных последствий, известен как негативное под­крепление, или избежание.

Негативное подкрепление — процесс, посредством которого люди научаются совершать поступки, помогающие избежать нежелательных событий.

Избежание- См. негативное подкрепление.

Любая реакция, ведущая к устранению подобных нежелательных событий, имеет тенденцию повторяться, подкрепляя тем самым эту реакцию. Например, однажды вечером вы можете за­держаться в офисе для корректировки торговой пре­зентации, поскольку полагаете, что шеф вас «съест за­живо», если она не будет готова к утру. Вы научились тому, как избегать неприятную ситуацию такого типа. и будете вести себя сообразно приобретенному опыту. До сих пор мы останавливались на поведенческш реакциях, подкрепляющих поведение, поскольку они либо ведут к позитивным последствиям, либо к избе­жанию негативных. Однако связи между поведением и его последствиями не всегда бывают подкрепляю­щими — такие связи также могут быть и ослабляю­щими. Именно так происходит в ситуации наказания.

Наказание — ослабление негативного поведения из-за нежелательных последствий.

Наказание подразумевает нежелательные или крайне негативные последствия в ответ на неуместное пове­дение. Поведение, сопровождаемое нежелательным результатом, гораздо с меньшей вероятностью повто­рится, если личность связывает возникающие нега­тивные последствия с этим поведением. Например, если шеф наказал вас за чрезмерно продолжительные перерывы на кофе, вы можете предполагать наказа­ние за эти действия. В результате маловероятно, что вы будете продолжать длительные перерывы в дальнейшем.

Связь между поведением и его последствиями также может быть ослаблена непредо­ставлением вознаграждения. Такой процесс известен как угасание. Если поведенческая реакция однажды была вознаграждена и больше не вознаграждается, то она склонна ос­лабевать и со временем отмирать, или угасать.

Угасание —• процесс, в котором не подкрепляемая более поведенческая реакция имеет тенденцию к постепенному уменьшению своей силы.

Давайте рассмотрим такой пример. Пред­положим, что в течение нескольких месяцев на еженедельные собрания персонала ком­пании вы для всех приносили пончики. Уничтожая пончики, ваши коллеги всегда бла­годарили вас. Их одобрение воодушевляло вас, и вы продолжали приносить им пончи­ки. Потом, после нескольких месяцев питания пончиками, ваши коллеги сели на диету. В результате, оставаясь по-прежнему соблазнительными, пончики оказывались не съе­денными. Несколько месяцев отсутствия похвал за вашу щедрость, вероятно, умерят ваш энтузиазм в снабжении коллег пончиками. Когда-то вознаграждаемое похвалой, теперь ваше поведение обречено на отмирание и угасание.

Различные взаимосвязи между поведением человека и вытекающими из него по­следствиями — позитивное подкрепление, негативное подкрепление, наказание и угасание - все вместе известны как ситуации подкрепления.

Ситуации закрепления результата — различные взаимосвязи между поведением человека и вытекающими из него последствиями, которыми служат позитивное подкрепление, негативное подкрепление, наказание и угасание.

Они описывают условия, при которых вознаграждение и наказание будут либо зафиксированы, либо отвергнуты. Четыре рас­смотренные нами ситуации закрепления результата обобщены в таблице 2.3. Как мы убедимся далее в этой главе, регулирование этих ситуаций может служить эффективным инструментом управления человеческим поведением в организации.

 

ТАБЛИЦА 2.3. СИТУАЦИИ ЗАКРЕПЛЕНИЯ РЕЗУЛЬТАТА: ОБЗОР

Можно выделить четыре ситуации подкрепления результата, демонстрирующие предъявление или устранение приятных или неприятных воздействий. Позитивно или негативно подкрепленное поведение усиливается, в то время как наказанное или погашенное ослабляется.

 

ПРЕДЪЯВЛЕНИЕ ИЛИ УСТРАНЕНИЕ СТИМУЛА ЖЕЛАТЕЛЬНОСТЬ СТИМУЛА НАЗВАНИЕ СИТУАЦИИ ИНТЕНСИВНОСТЬ РЕАГИРОВАНИЯ ПРИМЕР
Предъявление Приятные Положительное подкрепление Усиление Похвала руководства поощряет продолжение одобренного поведения
  Неприятные Наказание Ослабление Критика со стороны руководителя препятствует продолжению не получившего одобрения поведения
Устранение Приятные Угасание Усиление Прекращение похвал за полезный поступок снижает шансы на содействие в будущем
  Неприятные Отрицательное подкрепление Ослабление Избежанию будущей критики способствует поведение в соответствии с желаниями руководителя

Режимы подкрепления: схемы управления воз­награждениями.

До сих пор в нашем обсуждении вопроса, будет ли награда предоставлена или в ней будет отказано, предполагалось, что предъ­явление или устранение последуют в каждом случае проявления поведения. Однако не всегда это практически осуществимо (и, как мы увидим далее, целесообразно). Также необходимо при­нимать во внимание то, когда именно следует подкреплять поведение. Правила управления сроками и частотой поощрения поведения изве­стны как режим подкрепления.

Режимы подкрепления — правила управления сроками и частотой подкрепления поведения.

Вознаграждение каждой желаемой поведенческой ракции называется непрерывным подкреплением.

Непрерывное подкрепление —сценарий закрепления результата, при котором подкрепляются все желательные поступки.

В отличие от животных, демонстрирующих цирковые трюки, людей на работе редко поощряют постоянно. Напротив, в управлении организационным вознаграждением склоняются к сценариям последовательного частичного подкрепления (известного также как прерывистое подкрепление). Это значит, что для поощрения каких-то жела­емых поведенческих откликов при игнорировании других вознаграждение предо­ставляется с управляемыми перерывами.

Частичное подкреплениережим

закрепления результата, при котором поощряются только некоторые из желательных поступков. Виды такого подкрепления включают в себя режимы с фиксированным интервалом, с вариативным интервалом, подкрепление с постоянным соотношением и с переменным соотношением.

 

Четыре разновидности режимов частичного подкрепления имеют свое прямое применение в ор­ганизации40 Это: режимам с фиксированным интервалом, режим с вариативным интервалом, режим с постоянным соотношением и режим с вариативным соотношением.

Режимы с фиксированным интервалом — режимы подкрепления результата, при которых между фактами поощрения поведения должны проходить фиксированные промежутки времени.

К режимам с фиксированным интервалом относят­ся те, при которых закрепление поведения проводит­ся через определенные интервалы времени после первого случая желательного поведения. Например. практика выдачи чеков заработной платы по пятни­цам в 3 часа дня является примером сценария с фик­сированным интервалом, поскольку вознаграждение осуществляется регулярно и систематически. Сцена­рии с фиксированным интервалом не особенно эф­фективны для поддержания желаемого поведения. Например, работники, которые заранее знают, что их босс проходит мимо их рабочего места каждый раз в 11.30 утра, обязательно позаботятся о том, чтобы уси­ленно трудиться именно в это время. Однако если босса, который может похвалить их, нет поблизости, они, напротив, могут трудиться не столь усердно или пораньше уйти на обед, понимая, что их усилия не бу­дут вознаграждены положительной оценкой, а нака­зания за то, что они не работают, не последует.

Режимы с вариативным интервалом — режимы закрепления результата, при которых между фактами поощрения поведения должно проходить переменное количество времени (основанное на некотором среднем значении).

К режимам с вариативным интервалом относятся те, при которых промежутки между поощрениями должны соответствовать меняющимся отрезкам вре­мени (основанным на некоторых средних значениях). Например, банковский аудитор может наносить нео­жиданные визиты в офисы филиалов в среднем 1 раз в полтора месяца (это значит, что может пройти четы­ре недели с даты последнего визита, а в следующий раз может пройти восемь недель). Об аудиторе можно сказать, что он пользуется режимом подкрепления с вариативным интервалом. Поскольку менеджеры банка не могут сказать наверняка, когда возможна следующая проверка их отделения, они не могут поз­волить себе расслабиться. Ведь следующая проверка может случиться раньше, чем они предполагают! Неудивительно, что режимы с вариативными интер­валами обычно являются более эффективными, не­жели фиксированные.

Режимы с постоянным соотношением — режимы закрепления результата, при которых в период между управлением поощрением поведения может произойти фиксированное количество поведенческих реакций.

Режимами с постоянным соотношением являются те, при которых закрепление поведения происходит после совершения определенного количества повторений первого случая желаемой поведенческой реакции. Например, представьте членов персонала по продажам, которые знают, что получат премию каждый раз после продажи товаров на $ 1000. Сразу по­сле получения первого вознаграждения они могут ослабить свой рабочий энтузиазм. Но как только их продажи начнут приближаться к сумме в $2000 — следующему уровню полу­чения ожидаемого вознаграждения, — интенсивность работы может снова возрасти.

Режимы с вариативным соотношением — сценарии закрепления результата,при которых в промежутке между поощрениями поведения должно произойти переменное количество поведенческих реакций (основанных на некотором среднем значении).

Режимами с вариативным соотношением считаются такие, при которых в промежутке между поощре­ниями поведения должно произойти переменное количество желаемых поведенческих реакций (ос­нованных на некотором среднем значении). Хоро­шим примером являются люди, играющие на игро­вых автоматах. Большую часть времени, пока люди опускают монетки в автоматы, они проигрывают. Но после некоего количества попыток автомат платит. Поскольку игроки никогда не могут сказать на­верняка, при какой общей сумме ставок они могут сорвать банк, они предпочитают про­должать свою игру в течение продолжительного времени. Как вы можете представить, ре­жимы с вариативным соотношением могут быть более эффективными, чем режимы с по­стоянным соотношением.

 

(Вставить иллюстрации режимов из Гринберга и Бэйр. С.79)

Различные описанные нами режимы подкрепления обладают рядом существенных сходств и различий. Их мы обобщили в илл. 2.9. При ее просмотре необходимо помнить о том, что данные сценарии представляют собой «чистые» формы. На практике может одновременно сочетаться несколько режимов, образуя в результате новый комплексный вариант. Однако независимо оттого, действуют ли эти режимы по отдельности или в со­четании друг с другом, важно отметить их устойчивое влияние на поведение людей в ор-

ганизации.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-10-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: