Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

Новый подход к обучению систем искусственного интеллекта распознавать объекты и ориентироваться в окружающей обстановке может стать основой для разработки более совершенных систем ИИ для исследования экстремальных сред или далеких миров, говорится в исследовании междисциплинарной команды из Университета штата Пенсильвания.

В первые два года жизни дети видят несколько ограниченный набор объектов и лиц, но с разных точек зрения и при разном освещении. Вдохновленные этим развитием, исследователи представили новый подход к машинному обучению, который использует информацию о пространственном положении для более эффективного обучения визуальных систем ИИ. Они обнаружили, что модели ИИ, обученные по новому методу, превосходят базовые модели на 14,99%. О своих результатах они сообщили в майском номере журнала Patterns.

Современные подходы в области ИИ используют для обучения массивные наборы случайно перемешанных фотографий из интернета. В отличие от них, наша стратегия основана на психологии развития, которая изучает, как дети воспринимают мир, — говорит Лижэнь Чжу, ведущий автор и докторант Колледжа информационных наук и технологий штата Пенсильвания.

Исследователи разработали новый алгоритм контрастного обучения, который представляет собой разновидность метода самоконтроля, при котором система искусственного интеллекта учится обнаруживать визуальные паттерны, чтобы определить, когда два изображения являются производными от одного и того же базового изображения, в результате чего образуется положительная пара. Однако эти алгоритмы часто рассматривают изображения одного и того же объекта, снятые с разных ракурсов, как отдельные сущности, а не как положительные пары. По словам исследователей, учет данных об окружающей среде, включая местоположение, позволяет системе искусственного интеллекта преодолевать эти трудности и обнаруживать положительные пары независимо от изменения положения или поворота камеры, угла или условий освещения и фокусного расстояния, или зума.

Мы предположили, что визуальное обучение младенцев зависит от восприятия местоположения. Чтобы получить эгоцентрический набор данных с пространственно-временной информацией, мы создали виртуальную среду на платформе ThreeDWorld, которая представляет собой интерактивную 3D-среду физического моделирования с высокой степенью достоверности. Это позволило нам манипулировать и измерять расположение камер наблюдения, как если бы ребенок ходил по дому, — добавляет Чжу.

Ученые создали три среды моделирования — House14K, House100K и Apartment14K, причем «14K» и „100K“ означают приблизительное количество образцов изображений, полученных в каждой среде. Затем они прогнали базовые модели контрастного обучения и модели с новым алгоритмом через симуляции три раза, чтобы посмотреть, насколько хорошо каждая из них классифицирует изображения. Команда обнаружила, что модели, обученные по их алгоритму, превосходят базовые модели в целом ряде задач. Например, в задаче распознавания комнаты в виртуальной квартире дополненная модель справилась в среднем на 99,35%, что на 14,99% лучше, чем базовая модель. Эти новые наборы данных доступны для других ученых, которые могут использовать их для обучения на сайте www.child-view.com.

Моделям всегда сложно обучаться в новой среде с небольшим количеством данных. Наша работа представляет собой одну из первых попыток более энергоэффективного и гибкого обучения ИИ с использованием визуального контента, — говорит Джеймс Вон. заслуженный профессор информационных наук и технологий и советник Чжу.

По словам ученых, исследование имеет значение для будущего развития передовых систем искусственного интеллекта, способных ориентироваться и обучаться в новых условиях.

Такой подход будет особенно полезен в ситуациях, когда команде автономных роботов с ограниченными ресурсами необходимо научиться ориентироваться в совершенно незнакомой среде, — заключает Вон.

Чтобы проложить путь к будущим приложениям, мы планируем доработать нашу модель, чтобы лучше использовать пространственную информацию и включать в нее более разнообразные среды.

31.05.2024


Подписаться в Telegram



Net&IT

Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр
Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр

В сериале Звездный путь: Следующее поколение к...

Physical Review X: Сеть квантовых датчиков повышает точность измерений
Physical Review X: Сеть квантовых датчиков повышает точность измерений

Квантовые системы, используемые в квантов...

Scientific Reports: ИИ показал больший творческий потенциал, чем человек
Scientific Reports: ИИ показал больший творческий потенциал, чем человек

Еще один балл в пользу искусственного инт...

Крошечную метку на замену RFID сделали еще надежнее
Крошечную метку на замену RFID сделали еще надежнее

Несколько лет назад исследователи Массачу...

Ученые приблизились к более легким и гибким оптоэлектронным устройствам
Ученые приблизились к более легким и гибким оптоэлектронным устройствам

Органические оптоэлектронные устройства, такие...

PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить
PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить

Атанасиос С. Фокас рассматривает актуальный во...

Nature: ИИ генерирует белки с исключительной прочностью связывания
Nature: ИИ генерирует белки с исключительной прочностью связывания

В новом исследовании, опубликованном 18 декабр...

Nature Computational Science: ИИ может предсказывать события в жизни людей
Nature Computational Science: ИИ может предсказывать события в жизни людей

Искусственный интеллект, разработанный для&nbs...

Nature Electronics: Изменение памяти дает новые вычислительные возможности
Nature Electronics: Изменение памяти дает новые вычислительные возможности

Ученые Рочестерского университета разработали ...

Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта
Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта

Многофункциональные компьютерные чипы эволюцио...

Началась регистрация на конкурс «Битва искусственных интеллектов»
Началась регистрация на конкурс «Битва искусственных интеллектов»

Стартовал отборочный этап Международного техно...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Biology Methods and Protocols: В борьбу с раком бросают искусственный интеллект
Biology Methods and Protocols: В борьбу с раком бросают искусственный интеллект
JCI: Тяжелая форма COVID-19, возможно, связана с аутоантителами
JCI: Тяжелая форма COVID-19, возможно, связана с аутоантителами
Разгадана тайна снижения производительности перспективного катодного материала
Разгадана тайна снижения производительности перспективного катодного материала
Каждый четвертый родитель говорит, что ребенок не может уснуть из-за тревоги
Каждый четвертый родитель говорит, что ребенок не может уснуть из-за тревоги
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
В 40% случаев люди ошибочно называют сгенерированное фото человека реальным
В 40% случаев люди ошибочно называют сгенерированное фото человека реальным
Nature Communications: Открыто революционное явление в жидких кристаллах
Nature Communications: Открыто революционное явление в жидких кристаллах
Nature Communications: В мигрирующих нейронах найден конус роста
Nature Communications: В мигрирующих нейронах найден конус роста
Current Biology: Исследование брачного поведения показывает эволюцию влечения
Current Biology: Исследование брачного поведения показывает эволюцию влечения
BioDesign Research: Для производства каротиноидов разработали специальные дрожжи
BioDesign Research: Для производства каротиноидов разработали специальные дрожжи
Scientific Reports: Реакция на происходящее влияет на понимание будущих событий
Scientific Reports: Реакция на происходящее влияет на понимание будущих событий
IEEE: Экзоскелет поможет перенесшим инсульт вернуться к нормальной жизни
IEEE: Экзоскелет поможет перенесшим инсульт вернуться к нормальной жизни
Богатый белком рацион меняет микробиом кишечника и общее состояние организма
Богатый белком рацион меняет микробиом кишечника и общее состояние организма

Новости компаний, релизы

Биохимики СПбГУ выяснили, что гипоксия плода в сочетании со стрессом матери может приводить к никотиновой зависимости
Новая "Кантиана" поможет студентам быстрее адаптироваться к калининградскому климату
Российские ученые предложили тушить пожары с помощью газогидратного огнетушителя
Минералоги СПбГУ нашли на острове Диско возможный источник фосфора для возникновения первых живых организмов
Московский Политех внедряет ИИ для повышения эффективности приемной кампании и трансформации обучения