Навчання системі поведінки та винагород через кондиціонування

Собаки, у яких роти поливаються на звук дзвоника. Немовлята плачуть при вигляді білої миші. Морські равлики, які втягують зябра при стимуляції: при асоціативному навчанні нейтральним стимулам надається нове значення.

Якщо пов’язані дві події, які природно не пов’язані між собою, одна говорить про асоціативне навчання.
У тому, що відоме як класична обумовленість, подразник, який викликає вимірювану реакцію, поєднується із стимулом, який не викликає її природним шляхом. Важливо, щоб обидва стимули безпосередньо слідували один за одним.
В оперантному обумовленні особа вчиться пов’язувати стимул з нагородою або покаранням. Це змінює свою поведінку в результаті наслідків. Дофамін є важливою речовиною, що передає інформацію при асоціативному навчанні, і підвищує очікування. Як нейромедіатор очікування, він є важливим мотиватором.

Дофамін є важливою речовиною, що передає центральну нервову систему, яка належить до групи катехоламінів. Він відіграє роль у рухових навичках, мотивації, емоціях та когнітивних процесах. Порушення функції цього передавача відіграють важливу роль при багатьох захворюваннях мозку, таких як шизофренія, депресія, хвороба Паркінсона або залежність від речовин.

Нейромедіатори

Нейромедіатор - це речовина, що передає хімічні речовини, речовина-посередник. Він звільняється від нейрона-відправника в місцях клітинно-клітинної комунікації та надає збуджуючий або інгібуючий ефект на нейрон-реципієнт.

Натхненний, серед іншого, експериментами Павлова щодо класичної обумовленості, американський психолог Джон Б. Уотсон на початку 20 століття започаткував біхевіоризм. Ця школа думок домінувала в американській психології протягом багатьох десятиліть. Така спостережувана поведінка вважалася об'єктом наукових досліджень таких дослідників, як Ватсон або Скіннер. Біхевіористи не хотіли мати нічого спільного зі спекуляціями щодо внутрішніх психічних станів.

Значна частина цього ставлення також знайшла своє відображення в їх розумінні навчання. Навчання проявило себе відповідно у зміні поведінки, пов’язаної з навколишнім середовищем. Щодо біхевіористів, той, хто навчається, по суті пасивний і реагує лише на подразники з його оточення. Він створює зв'язок стимул-стимул і стимул-реакція. Для представників цієї школи думок люди прийшли у світ як чистий аркуш, який поступово наповнюється змістом завдяки досвіду.

Ця думка знайшла своїх критиків у прихильниках когнітивного підходу. Вони виходили не лише із спостережуваних іззовні подразників та реакцій, але й із внутрішньої обробки інформації. Принаймні вищі організми здатні отримувати та зберігати інформацію. Нова інформація може бути пов’язана із збереженою інформацією і, таким чином, призвести до нової поведінки. Таким чином, рішення проблем можна знайти швидко - без необхідності неодноразово реагувати на подразник.

Як це часто буває у дослідженнях, усе почалося з великого збігу обставин - і цього разу це були кроки лаборанта. Російський лікар і фізіолог Іван Павлов (1846-1936) певний час вивчав процес травлення у собак - дослідження, за які згодом йому буде присуджена Нобелівська премія. Роблячи це, він зробив дивовижне відкриття: процес травлення у досліджуваної тварини розпочався не лише тоді, коли їжа їла в роті. Слина почала текти, як тільки собака почула кроки лаборанта - очевидно, сигнал для тварини про те, що вона наближається до їжі.

Павлов викликав інтерес, і він систематично досліджував це явище. Дослідник імплантував трубку в слинну залозу собакам для вимірювання потоку слини. Відтоді він дзвоном оголосив їжу тваринам. Спочатку шум залишав собак холодними. Це навряд чи дивно, адже немає природного зв'язку між звуком дзвона та прийомом їжі. Але через кілька разів дзвін став важливим для тварин і викликав слиновиділення навіть без їжі. Собаки дізналися, що після звуку ємності вона наповнюється. І Павлов відкрив важливий механізм навчання: класичне обумовлення.

Нейтрал стає умовним стимулом

Перш ніж тварини почали пов'язувати звук дзвоника з їжею, дзвін був нейтральним стимулом - без жодного конкретного значення для собак. Але тепер вони пов’язали дві події разом за допомогою асоціативного навчання. Ми говоримо про класичну обумовленість: стимул, який природно викликає вимірювану реакцію, пов’язаний з іншим, який зазвичай не спричиняє такої поведінки.

Павлов описав перший стимул, тобто їжу, як безумовний або безумовний стимул. Тут потік слини викликається "апетитним рефлексом", який є природженим і полегшує транспортування їжі в шлунок. У випадку умовного подразника, звуку дзвона, навпаки, потрібен процес навчання, щоб він викликав бажану реакцію. Як зазначав Павлов, час дуже важливий: ви повинні подавати тварині два подразники одночасно або швидко. Чим коротша затримка між умовним та безумовним подразником, тим швидше та інтенсивніше тварина набуває умовної відповіді.

Не тільки у собак, у людей також може сльозитися, коли вони думають лише про смачне смажене, що кипить у духовці, або коли вони нюхають його смачний запах, що розноситься по кухні - задовго до того, як м’ясо буде в духовці Пластина і закінчується в роті. Американський психолог Джон Б. Уотсон (1878-1959) виявив у 1920 р. У своєму найвідомішому, але також суперечливому експерименті, що класичне обумовлення також працює з Homo sapiens. Ватсон навчив немовля на ім'я Альберт боятися білої миші. Йому вдалося це зробити, неодноразово лякаючи малечу сильним ударом молотка по металевому стрижні і таким чином змушуючи плакати. Тоді ж дослідник показав дитині білу мишку. Через деякий час гризун вже не був нейтральним стимулом для маленького Альберта: він боявся зору, навіть не почувши тріску молотка - і почав плакати.

Морква і паличка

Однак класичне кондиціонування не передає жодної справді нової поведінки. Швидше, природна поведінка викликається - хоча і стимулом з іншого контексту. Якщо, наприклад, собака вчиться трюку, скажімо, виконувати роль за командою, потрібна інша форма навчання: оперантна кондиціонування. Перший крок - це змусити собаку зробити трюк. Якщо йому це вдається, він може розраховувати на винагороду, ласощі або особливу увагу. Якщо собака повинна запам’ятати те, що йому заборонено робити - наприклад, подрібнювати газету свого господаря - це також працює з покаранням. Однак це складніше. Отже, говорять про «навчання через нагороду чи покарання» або «навчання на успіху». Поведінка змінюється в результаті наслідків.

Психолог Едвард Торндайк (1874-1949) з Колумбійського університету був першим, хто детально вивчив оперантну кондицію на рубежі 20 століття - навіть якщо він не назвав цього імені. Торндайк посадив голодних котів у спеціально побудовану клітку і запропонував їм шматок риби - біля в'язниці. Щоб вийти на свободу і, нарешті, до бажаної їжі, їм довелося дізнатись про механізм коробки та запустити затвор. Спочатку тваринам було очевидно важко. Випадково вони отримали затвор під час безцільного блукання, двері відчинились, і вони змогли отримати винагороду. Після кількох випробувань вони почали цілеспрямовано відкривати засувку, як тільки їх поклали в коробку. Вони чогось навчились. Про раптове прозріння, ага-досвід для котів, про це не могло бути й мови, бо вони занадто повільно відчували шлях до розгадки загадки. Швидше за все, домашні тигри виявили бар, заснований на принципі спроб і помилок. Торндайк підозрював, що зв'язок між кліткою та схемами руху, які допомагали котам вільно, посилюється з кожним втечею.

уваги

Увага служить нам інструментом для свідомого сприйняття внутрішніх і зовнішніх подразників. Ми досягаємо цього, концентруючи свої розумові ресурси на обмеженій кількості вмісту свідомості. Хоча деякі подразники автоматично привертають нашу увагу, ми можемо контролювати інші. Мозок також несвідомо обробляє подразники, які не є фокусом нашої уваги.

У вікні Скіннера

Термін "оперантна кондиціонованість" нарешті був введений американським психологом Буррусом Фредеріком Скіннером (1904 - 1990), винахідником знаменитої скриньки Скіннера. У оригінальній, простій формі це коробка, оснащена виступаючим важелем і посудом для їжі, розміщеним під нею. Якщо тварина - Скіннер віддав перевагу голодним щурам і голубам - випадково потягне за важіль, воно отримує харчові кульки. Ця винагорода є стимулом все частіше використовувати важіль із часом. І навпаки, обумовлену поведінку також можна знову видалити, перекривши подаючий кран. Загалом застосовується таке: винагорода, так званий позитивний підкріплювач, збільшує ймовірність розвитку певної поведінки. Покарання, такі як стрибок напруги, знижує їх. Наприклад, у людей поплескування по спині може слугувати соціальним підсилювачем - простий жест вдячності, який спонукає їх частіше проявляти певну поведінку відтепер.