Дофамин для железа: искусственный интеллект обзавелся аналогом инстинкта
Ученые сократили сложную нейросеть до одного элемента, и вот как это работает.

Спайковые нейронные сети (СНС) — один из видов нейроморфных вычислений — привлекают внимание благодаря низкой задержке и высокой энергоэффективности в задачах ИИ. Правило обучения STDP (зависимость синаптической пластичности от времени спайков) позволяет СНС хорошо распознавать статичные образы, но в динамической среде такая сеть работает хуже. В природе эту проблему решает дофамин, регулирующий синаптическую пластичность. Ученые попытались повторить этот механизм, создав R-STDP (STDP с подкреплением), но для его имитации требовалось множество компонентов, что усложняло архитектуру и повышало энергопотребление.
STDP (Spike-timing-dependent plasticity) — правило обучения нейросети, где сила связи между нейронами меняется в зависимости от времени между их импульсами. Если нейрон A срабатывает перед нейроном B, их связь усиливается; если наоборот — ослабевает. Это похоже на то, как мозг запоминает последовательности: например, связывает вспышку света с последующим звуком.
Команда профессоров Лю Ци, Ду Сян и Чжан Сюмэн из Фуданьского университета предложила более изящное решение. Они реализовали R-STDP в одном устройстве — гетероструктуре на основе двумерного сегнетоэлектрика (графен/CuInP₂S₆/MoS₂). В этом устройстве напряжение на затворе и стоке меняет поляризацию сегнетоэлектрика, что влияет на барьер для зарядов и позволяет управлять памятью и синаптической пластичностью. Импульсы на затворе играют роль «вознаграждения», регулируя STDP и даже переключая его в анти-STDP. Так R-STDP уместился в одном элементе, а не в громоздкой схеме.
На основе этого устройства собрали спайковую сеть для задачи захвата роботом статичных и движущихся объектов. В симуляциях робот показал отличные результаты: точность захвата динамичных целей достигла 85,5%, а даже при 10%-ном разбросе параметров устройств она держалась на уровне 80%. Это доказывает надежность системы.
Подробности опубликованы в издании Science Bulletin.
В будущем ученые планируют создать массивы таких мемтранзисторов, используя сегнетоэлектрики вроде BTO, BFO или HZO. Оптимизация структуры может сократить время переключения до наносекунд, а уменьшение толщины слоев снизит рабочее напряжение. В идеале энергопотребление приблизится к уровню биологических нейронов (фемтоджоули на операцию). Для внедрения технологии нужно доработать управляющую электронику, чтобы обеспечить стабильность, скорость и энергоэффективность.
Это исследование открывает путь к компактным нейроморфным системам для роботов, работающих в динамичных условиях.
Главное преимущество — миниатюризация R-STDP. Раньше для его реализации требовались десятки компонентов, теперь — один элемент. Это снижает стоимость, энергопотребление и упрощает интеграцию в робототехнику. Например, дроны или промышленные манипуляторы смогут быстрее адаптироваться к изменяющейся среде без увеличения вычислительной нагрузки.
Еще один плюс — устойчивость к помехам. Даже при 10%-ном разбросе параметров (что неизбежно в массовом производстве) система сохраняет эффективность. Это критично для автономных устройств, работающих в реальном мире, где идеальных условий нет.
Исследование проводилось на модели, а не на физическом роботе. Реальные условия (например, механические задержки, шумы датчиков) могут снизить точность. Кроме того, сегнетоэлектрики вроде CIPS пока нестабильны при длительной эксплуатации — их деградация не учтена.
Ранее стало известно, что заставляет нейросети резко поумнеть.



















