Ловушка для дофамина: почему мы повторяем ошибки и как это исправить
Ученые из Sainsbury Wellcome Centre при Университетском колледже Лондона обнаружили, что мозг использует двойную систему обучения методом проб и ошибок.

Это первый случай, когда удалось выявить второй механизм обучения, который, вероятно, объясняет, как формируются привычки. Открытие может стать основой для новых методов лечения зависимостей и навязчивых состояний.
Исследование, опубликованное в Nature, проводилось на мышах, но его результаты могут быть полезны и для разработки терапии болезни Паркинсона.
Как работает система привычек
Доктор Маркус Стивенсон-Джонс, руководитель группы в SWC и ведущий автор исследования, объясняет:
Мы нашли механизм, который, скорее всего, отвечает за привычки. Когда вы раз за разом выбираете одно и то же действие, мозг перестает каждый раз оценивать его пользу и просто воспроизводит прошлый выбор. Это освобождает ресурсы для других решений.
Раньше считалось, что дофамин в мозге работает только как сигнал «ошибки предсказания вознаграждения» (RPE) — он сообщает, было ли полученное вознаграждение лучше или хуже ожидаемого. Но теперь ученые обнаружили второй сигнал — „ошибку предсказания действия“ (APE). Он не оценивает пользу, а просто фиксирует, как часто повторяется действие.
Пример из жизни
Представьте, что вы впервые зашли в кафе. Вы долго выбираете сэндвич, пробуете разные варианты и решаете, какой вкуснее. Но если ходите туда регулярно, перестаете задумываться и автоматически берете привычный. Именно APE-сигнал отвечает за этот автоматизм.
Новая система обучения проще: мозгу не нужно постоянно сравнивать варианты. Это позволяет делать несколько дел одновременно. Например, когда вы научились водить, можете параллельно вести беседу — привычные действия выполняются на автомате, а сознание свободно для других задач.
Где прячется второй механизм
Дофаминовые нейроны, отвечающие за обучение, расположены в трех зонах среднего мозга. Одни связаны с вознаграждением, другие — с движением, но их роль долго оставалась загадкой. Ученые сосредоточились на хвосте полосатого тела — области, которая получает сигналы только от «двигательных» нейронов.
Эксперимент с мышами подтвердил: дофамин здесь выделяется не в ответ на награду, а в связи с действием. Когда эту зону повреждали, мыши учились медленнее — они могли только оценивать пользу выбора (RPE), но не формировали автоматических решений (APE).
Почему так трудно избавиться от вредных привычек
Если заменить одно действие другим (например, жевать жвачку вместо курения), APE-система со временем перестроится. Но пока привычка не перезаписана, старый шаблон будет срабатывать автоматически.
Теперь мы знаем, где искать мишени для терапии зависимостей. Раньше все изучали прилежащее ядро, а оказалось, ключ может быть в хвосте полосатого тела, — говорит Стивенсон-Джонс.
Связь с болезнью Паркинсона
При Паркинсоне гибнут именно «двигательные» дофаминовые нейроны, которые, вероятно, кодируют APE. Это объясняет, почему пациенты теряют автоматические навыки (ходьба), но сохраняют осознанные (катание на коньках).
Теперь у нас есть теория парадоксальных нарушений при Паркинсоне. Поражены нейроны привычных действий, а гибкие решения остаются, — заключает ученый.
Это открытие меняет представление о том, как мозг учится и формирует привычки. Оно дает:
- Новые мишени для терапии — вместо прилежащего ядра можно воздействовать на хвост полосатого тела.
- Стратегии борьбы с зависимостями — понимание APE объясняет, почему замена действий работает лучше запретов.
- Инсайты о Паркинсоне — яснее механизм двигательных нарушений.
Смущает только то, что исследование проведено на мышах, а их мозг отличается от человеческого. APE-система у людей может работать сложнее. Также пока неясно, как именно перезаписывать вредные привычки — нужны клинические испытания.
Ранее ученые проследили в мозге черты характера.