Позитивно обучение чрез оперантно кондициониране

Positive reinforcement

Оперантно кондициониране звучи ужасно сложно. Истина е! Дори на мен ми звучи сложно, когато го чуя, а съм го учила, чела, препрочитала хиляди пъти. Сигурно сте чували за класическото кондициониране или опитите на Павлов, но сега ще се опитам да обясня с по-прости думи от къде произлиза оперантното кондициониране и какво означава то.

От къде произлиза Оперантното кондициониране?

Б.Ф. Скинър е смятан за баща на оперантното кондициониране, но работата му се основава на действащия закон на Торндайк. Според този принцип поведението, което е последвано от приятни последици, е вероятно да се повтори, а поведението, последвано от неприятни последици, е по-малко вероятно да се повтори.

Скинър въвел нов термин в Закона за ефекта – подсилване (reinforcement). Подсиленото(окуражено) поведение има тенденция да се повтаря (т.е. засилва); поведение, което не е засилено, има тенденция да изчезва или да изчезне (т.е. отслабва).

Скинър идентифицира три типа отговори(реакции) или оперант, които могат да следват поведението:

  • Неутрални оператори: реакции от околната среда, които нито увеличават, нито намаляват вероятността дадено поведение да се повтори.
  • Подсилващи оператори: реакции от околната среда, които увеличават вероятността дадено поведение се повтаря. Подсилвателите могат да бъдат или положителни, или отрицателни.
  • Наказателни оператори: Отговорите от околната среда, които намаляват вероятността да се повтори поведението. Наказанието отслабва поведението.
operant conditioning, позитивно обучение

Подсилване (reinforcement)

  • Положително подсилване (подсилване, окуражаване, награждаване) – когато поведението бъде следвано от приятен стимул, който увеличава вероятността от това поведение. Плъх – натискане на ръчка, за да падне парченце храна.
  • Отрицателно подсилване (отбягване) – когато поведението бъде последвано от премахване на неприятен стимул, което също увеличава вероятността от това поведение. Плъх – ръчката спира звученето на силен звук.

Наказание (punishment)

  • Положително наказание (наказване) – когато поведението бъде последвано от неприятен стимул, който намалява честотата на поведението. Плъх – натиска ръчката – удар или силен звук.
  • Отрицателно наказание („глобяване“) – когато поведението бъде последвано от премахване на приятен стимул, което също намалява честотата на поведението. Когато кучето скача върху нас в търсене на внимание и ние го игнорираме или отиваме далече от него без да му дадем вниманието, което иска.

И ако не сте се объркали от терминологията до тук и все още четете тази статия, ще се опитам да обясня с примери това, което ние, треньорите, се опитваме да приложим в практиката.

Позитивно обучение

Тъй като изразът „Положително подсилване“ не звучи много добре на български език, това, което повечето треньори използваме като израз е обучение чрез позитивни методи, позитивно обучение. То включва в основата си положително подсилване или даване на награди и окуражаване на правилното поведение. Под „награди“ нямаме предвид само лакомства и храна – всичко е абсолютно индивидуално и ние трябва да открием това, което мотивира нашето куче. Наградата може да лакомство, игра, играчка, погалване или какъвто и да е друг стимул. При 90% от кучетата храната (тъй като е първичен стимул) върши най-добра работа. Можете да видите как да накарате кучето да търси повече храна от вас в статията Дали имате нужда от купичка . Целта ни е да награждаваме всяко поведение, което ни харесва, НО не само командите, които казваме на кучето. Всичко, което кучето прави и на нас ни харесва – когато отиде да си легне на леглото – награда, когато дойде само при нас – ГОЛЯМА награда, когато седне спокойно, вместо да скача по нас – награда, когато гони топка – награда. И така може целият ден да награждавате кучето за нещата, които ни харесват и искаме да се повторят. Нещата, които НЕ ни харесват – ако можем игнорираме. Поведението, което не се награждава и кучето няма изгода от него (да се качи на масата и да изяде пържолите) е по-вероятно да изчезне, от колкото да се повтори.

Отрицателно (негативно) наказание

Наказание звучи много строго, лошо, негативно и страшно. Но истината е, че не всяко поведение може само да бъде окуражавано. Има поведения, които искаме да намалим – кучето да скача по нас, да скача по чужди хора, да се качва на масата, да се дърпа, да лае по велосипеди, да яде боклуци от земята и още много много други. Тогава трябва да „измислим“ начин, по който да покажем на кучето, че това поведение не е приемливо за нас. И тук има една тънкост – в момента, в който кучето прекрати поведението ние го награждаваме – окуражаваме поведението, което ни харесва! Най-честият пример, който давам е с кучета, които много се дърпат – огромен проблем на много стопани. Когато кучето се дърпа напред, за да стигне бързо до любимата поляна, това което трябва да направите е да го спрете на повода – „глобявате“ бързането му, като го наказвате със спиране. Както виждате наказанието не е бой, удряне с вестник или нещо друго страшно и неприятно за кучето, просто не му давате да стигне до целта. Когато обаче то тръгне към вас или отпусне повода веднага казвате „браво“ и давате награда. За да стане по-ясно ще дам и друг пример – когато кучето взима боклуци от земята. Най-вероятно ще се повторя, но пък повторението е майка на знанието! Когато кучето тръгне към боклука – вие го спирате, в един момент на него му писва, отпуска каишката или поглежда към вас и вие давате веднага награда! Много важно в тази ситуация е качеството на наградата, която давате да не е по-малка от качеството на наградата от земята, даже обратното – хубаво е лакомството, което идва от вас да е МНОГО хубаво – я някое дробче, кренвирш или каквото харесва вашето куче (може и да е ласка или игра). И двата примера отнемат много повторения и мноогооо тренировки преди кучето да започне да се води съвсем свободно на каишка или да не взима боклуци от земята. Чрез отрицателното наказание ние се опитваме да кажем на кучето „ако искаш да стигнеш много бързо до поляната, ще трябва да ходиш без да се дърпаш и ще получаваш награди – ако се дърпаш, ще стигнеш по-бавно“.

Правилото „Една стъпка назад“

Това ми е едно от любимите правила – независимо дали в обучението на кучета, във възпитанието на деца, а дори и в моментите, в които аз уча нещо. Когато стигнете до едно ниво на учене и сте сигурни в него – вие се опитвате да минете на по-горно. Ако обаче по-трудното ниво не ви се отдава (или на кучето) и виждате проблемно поведение – то по-добре е да върнете една стъпка назад и да тренирате още малко по-лесното ниво. И пак пример – ако кучето идва всеки път, когато го викате на поляна с кучета на каишка (по-лесно ниво) и когато го пуснете от каишката (по-трудно ниво) то вече не идва, тогава най-правилно е да го вържете пак на каишката и да тренирате пак по-лесното ниво, вместо да проваляте наученото дотук и кучето да не ви слуша. И ще дам един мой любим „човешки“ пример, тъй като съм свирила на пиано като малка – няма да забравя удоволствието да науча нов етюд и да го изсвиря много бързо! Ииииии разбира се, можете да си представите ентусиазма на едно дете – толкова бързо, че всяка 10 нота беше сбъркана. От там учителката ми и майка ми постоянно повтаряха – „Когато не можеш толкова бързо – мини на по-бавно темпо“. И това ми се е отпечатало в мозъка и до ден днешен. Е, бързата работа – срам за майстора.

Тази тема е изключително обширна и обемна, затова няма как да се опише накратко, а според мен ще загубите интерес ако продължа с обясненията и терминологията. Всичко, което трябва да правите е да мислите какво би мотивирало вашето куче да върши „хубави“ неща и да го възнаграждавате за тях. Фокусирайте се върху позитивното и приятното, а не върху забрани и негативното.

Последни публикации