L; помилка підробляє мозок Мозок; Психо

Наш мозок оснащений багатьма системами виявлення, виправлення та перевірки помилок. Він використовує ці системи для навчання. Позбавити його можливості робити помилки означає блокувати його процеси навчання.

Сцена повсякденного життя з дупратами: Людвівін, у 6 класі, приходить додому зі школи і кладе сумку, щоб перекусити. Мати питає її, як пройшов її день. "Був тест з математики ...", - шепоче малеча. Помовчавши, мати знову запитує: «А як воно пройшло? Тоді молода дівчина розплакалася. Між риданнями вона пояснює, що сталося: «На чотири запитання я нічого не відповіла, бо не була впевнена. "

І все-таки, вона б зробила набагато краще, щоб спробувати щастя! Тоді вона вчилася б на своїх помилках. Деякі з його відповідей були б помилковими, інші - правильними. Для його мозку відгук про ці спроби був би важливим матеріалом для навчання, знаючи, що пам’ятати, яких пасток уникати. Ми часто боїмося помилитися, але те, що ми не завжди знаємо, це те, що наш мозок готовий добре використовувати ці помилки. Дослідження з неврології фактично показали за останні двадцять років, що воно оснащене системами автоматичної корекції, поведінковою адаптацією та системами мислення, які інтегрують поняття помилки, забезпечуючи велику гнучкість роботи. Для мозку, без сумніву, ми повинні поважати право на помилки.

Виявлення внутрішніх помилок

Цей попереджувальний сигнал може зупинити дію до завершення і, якщо дозволяє час, запустити виправлення. З іншого боку, цей сигнал не вказує, яку корекцію потрібно зробити, сам по собі не забезпечує рішення, і для цього повинні бути залучені інші механізми управління. Коли наш мозок виробляє такий сигнал раннього виявлення помилок, це призводить до уповільнення «після помилки»: після того, як ми помиляємося, ми, як правило, займаємо більше часу, щоб відповісти, оскільки ми посилюємо контроль над власними рішеннями. Сприяємо успіху.

Отже, ця перша система виявлення помилок - це інструмент, який ми використовуємо в режимі реального часу: коли ми вагаємось і наші дії сповільнюються, це ознака того, що наші дії перевіряються. Наш мозок виявив, що щось не так. Потім він може виправити постріл, щоб з перших часток секунди дізнатися про нашу помилку.

Як виправити поведінку після помилкового кроку

Найчастіше ми дізнаємося про свої помилки, коли результат падає: примітка про іспит, коментар колеги після презентації проекту, кількісні результати комерційної операції ... Більшість випадків результат, незалежно від того, чи це невдача або успіх даються не миттєво. Візьмемо випадок із студентом, який після виконання завдання повинен дочекатися оцінки вчителя, щоб з’ясувати, чи помилився він чи ні. Тут ми говоримо про «зворотний зв’язок», коли інформація надається у відповідь навколишнім середовищем і вказує на невдачу чи успіх. Відгук - це просто вигляд його копії із приміткою, обведеною червоним кольором.

Уявіть, що отримана оцінка набагато нижча за очікувану. У цьому випадку мозок виробляє ще один сигнал помилки, який називається frn, що означає негатив, пов’язаний із зворотним зв’язком. Це негативна мозкова хвиля, пік якої знаходиться через 250 мілісекунд після появи сигналу, що забезпечує зворотний зв'язок. Здається, його джерелом є область, яка називається цингулярною корою і розташована в серединній фронтальній корі, трохи перед джерелом ерн. Іншими словами, студент, який отримав погану оцінку, або тенісист, який бачить, як його м’яч приземляється поза межами майданчика, активує свою пов'язкову кору через чверть секунди після отримання цієї інформації, а потім змінить свою стратегію. . Поясна кора насправді міцно пов’язана як з емоційними зонами мозку, так і з префронтальною корою, яка зможе внести гнучкість у рішення та дії. Таким чином, створення сигналу про помилку в корі повороту є вирішальною подією, яка дозволить адаптувати людину до навколишнього середовища.

Дослідження полярної кори, які ми проводимо в Інституті стовбурових клітин та мозку в Ліоні, показують, що функції та організація цього регіону порівнянні у всіх приматів, мавп чи людей. Ми показали, що активність цингулярних нейронів чутлива до помилок, але не тільки. Активність, спричинена негативними відгуками, є лише окремим випадком. Функція поширювальної кори є більш загальною. Він враховує всю інформацію, корисну для адаптації поведінки. Несподіваний успіх, відкриття - це відповідні повідомлення, що використовуються для прийняття правильного рішення. Помилки та помилки - це також актуальні події, які використовуються як такі, щоб коригувати наші майбутні рішення та вдосконалювати себе. Дуже часто засуджується на уроці як помилка, для мозку помилка - це інформація, подібна до будь-якої іншої, корисної та необхідної для просування на шляху навчання. Інтерпретовані мозком відгуки - як і інші підказки з нашого оточення - дають змогу ефективно змінювати наші способи реагування та адаптувати наші стратегії: похмуре небо говорить про необхідність пристосувати свій одяг, тембр голосу батьків пропонує вам зберігати низький рівень профіль ...

Справжній характер помилки

Помилково ми зазвичай маємо на увазі невдачу або негативний результат. Це здоровий глузд, але розуміти, як працює наш мозок, не є правильним шляхом. Насправді мозок систематично виявляє, чи помиляється він, чи то поганий, чи то добрий. Тут є принципова різниця: те, що виявляє наш мозок, - це відхилення від його очікувань. Отже, це помилки передбачення, і вони можуть піти в обидві сторони.

Візьмемо приклад. Ви вирішили довірити подружжю таємницю, яка важка для вас. Ви думали, що це буде боляче, бо, на вашу думку, те, що ви мали сказати, не збиралося його догодити. Однак після щирого пояснення ви помічаєте, що ваш партнер дякує вам за цю ініціативу. Ваші стосунки набагато кращі, і ви самі відчуваєте себе дуже щасливими.

У цьому конкретному випадку результат суперечить вашим очікуванням. Ваш мозок виявляє там помилку - помилку в своїй схемі прогнозування. І саме ця помилка прогнозування закарбується в його нейронах і призведе до зміни поведінки та реального навчання.

Звичайно, помилка могла статися навпаки. Реакція вашого партнера могла бути навіть гіршою, ніж ви очікували: більше, ніж реакція звинувачення, гостра суперечка або навіть розрив стосунків. Знову ж, ваш мозок надрукував би цю помилку передбачення. Третя можливість, міг би бути випадок, коли реакція вашого друга відповідала б вашим очікуванням, ні вище, ні нижче.

Метод рухатися вперед: передбачити, помітити помилки, виправити.

Як наші нейрони справляються з цими трьома ситуаціями: позитивна помилка, негативна помилка чи відсутність помилки? Це питання досліджувалося в 1990-х роках нейробіологами, які розташували електроди поблизу нейронів у глибокій структурі мозку мавпи (середній мозок). В експерименті на екрані з'явилися нові зображення, а через дві секунди систематично вручали винагороду з фруктовим соком. Під час перших презентацій зображень нейрони середнього мозку (пізніше визначені як нейрони, що продукують дофамін) підвищили свою активність, коли прибула винагорода. Після кількох презентацій активність зросла, як тільки з’явилося зображення, але вже не під час нагородження. Завдяки повторенням зображення стало передбачувальним для майбутньої винагороди: дофамінергічні нейрони мавп посилювали свою активність в очікуванні фруктового соку.

Дослідники також виявили, що, якщо в цей момент ми перестали давати винагороду, яку очікує мавпа, ці нейрони знижують свою активність, коли нагорода повинна була бути отримана. Це принцип помилки прогнозування: на початку навчання винагорода є несподіваною, помилка передбачення позитивна (більше винагороди, ніж очікувалося), а реакція нейронів збільшується; після вивчення винагорода передбачається простим переглядом зображення, а помилка передбачення дорівнює нулю (винагорода очікувана і отримана; передбачення було добрим); в кінці навчального процесу, якщо очікувана винагорода не дається, помилка прогнозування є негативною (менша винагорода, ніж очікувалося). У цих трьох випадках однакові нейрони кодують помилку передбачення.

Таким чином, ситуації з позитивною помилкою, коли результат кращий за очікуваний, призводять до збільшення активності нейронів дофаміну в середньому мозку; ситуації з негативною помилкою, коли результат гірший за очікуваний, супроводжуються зниженням активності тих самих нейронів, а випадки, коли результат відповідає очікуванням, спостерігається активність нейронів, що підтримуються.

Одним з важливих аспектів цих відкриттів є те, що вони долучились до досліджень автоматизму та штучного інтелекту 1980-х та 1990-х років, які припустили, що організм може використовувати помилки прогнозування для покрокової адаптації своєї поведінки. У навчальній моделі, відомій як навчання з підкріпленням, помилка прогнозування дозволяє скорегувати значення або очікування з метою наближення до найбільш ефективної реакції та отримання найкращих результатів. Дослідження в галузі неврології та дослідження штучних систем, приєднані наприкінці 1990-х - на початку 2000-х рр. Тоді було показано, що механізми виявлення помилок прогнозування, що спостерігаються в мозку, надзвичайно близькі до механізмів, передбачених теорією навчання з посиленням. Наші колеги з Інституту інтелектуальних та робототехнічних систем (isir) у Парижі застосовують ці обчислювальні принципи, натхненні функціонуванням мозку. Вони впроваджують їх у штучних системах з метою створення роботів, здатних до автономності навіть у незнайомих умовах.

Чи можемо ми вчитися на чужих помилках ?

Сукупність досліджень у галузі неврології та штучного інтелекту дає вирішальний результат: з одного боку, наш мозок постійно робить прогнози завдяки класу дофамінергічних нейронів, розташованих у середньому мозку; з іншого боку, ці нейрони реагують вираженим чином на помилки прогнозування, надлишком розряду у разі позитивної помилки та зменшенням у разі негативної помилки. Потім це повідомлення надсилається у всі відділи мозку, здатні впливати на нашу поведінку, щоб дозволити їм адаптуватися до ситуації, навчитися та рухатися до кращих результатів.

На сьогоднішній день здається, що кодування помилки прогнозування нейронами середнього мозку передається до зони кори головного мозку, яка, зокрема, містить нейрони для виявлення зворотного зв'язку та дослідження. Вони могли б використовувати його для розробки сигналу вищого рівня (сигнал frn, про який йшлося вище) або для встановлення довгострокових стратегій. Це має місце, наприклад, якщо успіхи чи невдачі не є безпосередньо інформативними: якщо ми накопичуємо з часом набагато більше помилок, ніж винагород за діяльність, це вказує мозку на те, що в середньому рішення є поганими, і краще змінити стратегію.

Математичні моделі, такі як навчання з підкріпленням, є важливими для розуміння того, як мозок навчається. Однак живі істоти функціонують не зовсім як прості машини. На відміну від останніх, котрі мають виконати лише одне завдання, вони обдаровані як емоціями, так і розумом. Це пояснює, чому багато рішень, як у людей, так і в інших тварин, не настільки раціональні, як передбачають прості теоретичні моделі. Іншими словами, якщо з чисто раціональної точки зору було б цілком логічним і продуктивним вчитися на власних помилках, то в істоті плоті та крові певні упередження ускладнюють ситуацію.

Емоції насправді впливають на наш вибір у формі уподобань. Вже в 1956 році психолог Джек Брем виявив, що коли ми змушені вибирати між двома стравами, двома машинами або двома партнерами, апріорі еквівалентно, вибір викликає несвідому переоцінку наших цінностей. Блюдо, машина або вибраний партнер набувають цінності в наших очах, тоді як відхилені варіанти втрачають цінність. Словом, ми віддаємо перевагу тому, що вибрали. І ця зміна помітна навіть у нашому мозку, де область (хвостате ядро), пов’язана із задоволенням, модифікує свою реакцію на дві альтернативи, відразу після вибору, як показали неврологи Талі Шарот та її колеги в 2009 році.

Упередженість вибору, перешкода для навчання

Як це вилікувати? Наші дослідження змусили нас запропонувати цікаве рішення: надавати перевагу методам навчання, заснованим на спостереженні за помилками інших. Дійсно, звільнившись від уподобань, створених власним вибором, мавпи та люди дуже добре вчаться на помилках інших, перевіряючи тим самим прислів'я, згідно з яким людина бачить соломинку в очах свого сусіда, але не промінь у своєму.