Глазами машины: как ИИ сам научился смотреть по-человечески

Максим Наговицын01.06.2025423

Ученые обнаружили, что ИИ может научиться смотреть на мир так же, как человек — без единой подсказки.

Глазами машины: как ИИ сам научился смотреть по-человечески
Как смотрят люди и ИИ: сравнение точек зрительного внимания человека и фокусов Vision Transformer на одних и тех же видео. Источник: Yamamoto K, Akahoshi H, Kitazawa S. (2025). Emergence of human-like attention in self-supervised Vision Transformers: an eye-tracking study. Neural Networks

Машины учатся видеть мир, как люди. Ученые обнаружили, что модели искусственного интеллекта, анализирующие изображения, могут сами, без подсказок, вырабатывать зрительное внимание, похожее на человеческое.

Результаты исследования опубликованы в издании Neural Networks.

Когда мы смотрим на что-то , мозг автоматически выделяет важное и отсекает лишнее. Для ИИ такое естественное восприятие долго оставалось сложной задачей. Но исследователи из Университета Осаки выяснили: если обучать нейросеть особым способом, она начинает смотреть на мир почти как человек.

Они сравнили, куда падает взгляд людей и ИИ при просмотре видео. Нейросети, обученные методом DINO (без готовых подсказок, только на основе анализа данных), повторяли человеческие паттерны внимания. А модели, обученные стандартным способом, смотрели на картинку неестественно.

Наши модели не просто хаотично сканировали изображения — они сами научились выделять ключевые элементы», — говорит Такуто Ямамото, ведущий автор исследования.

Одна часть нейросети фокусировалась на лицах, другая — на силуэтах, третья — на фоне. Так же работает и человеческое зрение.

Главное — никто не объяснял ИИ, что такое лицо или фон. Он сам понял, что важно, просто анализируя данные.

Это доказывает, что самообучение может раскрывать фундаментальные принципы восприятия, общие для людей и машин, — поясняет Шигеру Китазава, руководитель исследования.

Открытие полезно не только для ИИ, но и для понимания человеческого зрения. Например, оно поможет создавать роботов, которые видят мир понятным для нас способом, или улучшить методы развития детского восприятия.

Этот прорыв важен по нескольким причинам:

  • Для ИИ — модели учатся эффективнее, без тонн размеченных данных.
  • Для нейронауки — помогает понять, как работает зрительное внимание у людей.
  • Для приложений — роботы, диагностика, даже интерфейсы станут интуитивнее.

Хотя результаты впечатляют, пока неясно, насколько точно ИИ копирует человеческое восприятие. Люди видят мир через призму опыта и эмоций — сможет ли машина повторить это?

Ранее ученые сообщили, что социальные роботы учатся общаться без участия людей.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Игра в бога: кто и зачем создает виртуальных близнецов людей
Игра в бога: кто и зачем создает виртуальных близнецов людей

Представьте, что ваше тело можно протести...

ИИ-врачам рано доверять не только жизнь, но и первичные рекомендации
ИИ-врачам рано доверять не только жизнь, но и первичные рекомендации

Искусственный интеллект советует женщинам лечи...

Почему нейросети до сих пор не понимают, что творят
Почему нейросети до сих пор не понимают, что творят

Триллионы параметров, миллиарды вычислений&nbs...

Российские ИИ и 3D-принтеры победили на конкурсе БРИКС
Российские ИИ и 3D-принтеры победили на конкурсе БРИКС

Российские стартапы доказали, что могут к...

Ученые СПбГУ упростили расчеты для стабильной связи
Ученые СПбГУ упростили расчеты для стабильной связи

Представьте, что ваш телефон внезапн...

Невидимый хвост: почему чистка куки не спасает от слежки
Невидимый хвост: почему чистка куки не спасает от слежки

Вы чистите куки и думаете, что тепер...

Ученые изобрели способ записывать информацию во льду
Ученые изобрели способ записывать информацию во льду

Вместо облачных технологий — ледяны...

Чем рискуют ученые, доверяя ИИ свои статьи
Чем рискуют ученые, доверяя ИИ свои статьи

Ошибка алгоритма может стоить исследователю ре...

От 5G до квантов: как сети учатся выживать в мире перегрузок
От 5G до квантов: как сети учатся выживать в мире перегрузок

Иногда один оборванный кабель оставляет целую ...

Ученые нашли способ уменьшить нейросети без потери качества
Ученые нашли способ уменьшить нейросети без потери качества

Глубокое обучение напоминает бардак в шка...

Новый чип ускоряет обработку сигналов в 100 раз
Новый чип ускоряет обработку сигналов в 100 раз

Обычный ИИ тратит на анализ сигналов...

Ученые создали идеальный генератор чисел
Ученые создали идеальный генератор чисел

Что, если случайность — не&nbs

Надежно как в ДНК: когда данные начнут жить тысячелетиями
Надежно как в ДНК: когда данные начнут жить тысячелетиями

Жесткие диски выходят из строя а мол...

ИИ помогает неопытным таксистам работать наравне с профи
ИИ помогает неопытным таксистам работать наравне с профи

Таксисты в Японии случайно доказали, что&...

Как ИИ меняет бизнес и творческие профессии
Как ИИ меняет бизнес и творческие профессии

Споры о том, заменит ли ИИ люде...

Поиск на сайте

ТОП - Новости мира, инновации

Новости компаний, релизы

Больше никаких цифр: теперь квитанции в приложении Альфа-Банка вбиваются сами
Автономные дроны без веб-интерфейса: просто API и никаких сложностей
ITPOD обновил номенклатуру серверов — разбираем обозначения
Стажировка на Казанском вертолетном заводе – как студенты осваивали авиастроение
Код защиты: МИФИ и Яндекс научат ловить хакеров и строить ИИ