Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

Новый подход к обучению систем искусственного интеллекта распознавать объекты и ориентироваться в окружающей обстановке может стать основой для разработки более совершенных систем ИИ для исследования экстремальных сред или далеких миров, говорится в исследовании междисциплинарной команды из Университета штата Пенсильвания.

В первые два года жизни дети видят несколько ограниченный набор объектов и лиц, но с разных точек зрения и при разном освещении. Вдохновленные этим развитием, исследователи представили новый подход к машинному обучению, который использует информацию о пространственном положении для более эффективного обучения визуальных систем ИИ. Они обнаружили, что модели ИИ, обученные по новому методу, превосходят базовые модели на 14,99%. О своих результатах они сообщили в майском номере журнала Patterns.

Современные подходы в области ИИ используют для обучения массивные наборы случайно перемешанных фотографий из интернета. В отличие от них, наша стратегия основана на психологии развития, которая изучает, как дети воспринимают мир, — говорит Лижэнь Чжу, ведущий автор и докторант Колледжа информационных наук и технологий штата Пенсильвания.

Исследователи разработали новый алгоритм контрастного обучения, который представляет собой разновидность метода самоконтроля, при котором система искусственного интеллекта учится обнаруживать визуальные паттерны, чтобы определить, когда два изображения являются производными от одного и того же базового изображения, в результате чего образуется положительная пара. Однако эти алгоритмы часто рассматривают изображения одного и того же объекта, снятые с разных ракурсов, как отдельные сущности, а не как положительные пары. По словам исследователей, учет данных об окружающей среде, включая местоположение, позволяет системе искусственного интеллекта преодолевать эти трудности и обнаруживать положительные пары независимо от изменения положения или поворота камеры, угла или условий освещения и фокусного расстояния, или зума.

Мы предположили, что визуальное обучение младенцев зависит от восприятия местоположения. Чтобы получить эгоцентрический набор данных с пространственно-временной информацией, мы создали виртуальную среду на платформе ThreeDWorld, которая представляет собой интерактивную 3D-среду физического моделирования с высокой степенью достоверности. Это позволило нам манипулировать и измерять расположение камер наблюдения, как если бы ребенок ходил по дому, — добавляет Чжу.

Ученые создали три среды моделирования — House14K, House100K и Apartment14K, причем «14K» и „100K“ означают приблизительное количество образцов изображений, полученных в каждой среде. Затем они прогнали базовые модели контрастного обучения и модели с новым алгоритмом через симуляции три раза, чтобы посмотреть, насколько хорошо каждая из них классифицирует изображения. Команда обнаружила, что модели, обученные по их алгоритму, превосходят базовые модели в целом ряде задач. Например, в задаче распознавания комнаты в виртуальной квартире дополненная модель справилась в среднем на 99,35%, что на 14,99% лучше, чем базовая модель. Эти новые наборы данных доступны для других ученых, которые могут использовать их для обучения на сайте www.child-view.com.

Моделям всегда сложно обучаться в новой среде с небольшим количеством данных. Наша работа представляет собой одну из первых попыток более энергоэффективного и гибкого обучения ИИ с использованием визуального контента, — говорит Джеймс Вон. заслуженный профессор информационных наук и технологий и советник Чжу.

По словам ученых, исследование имеет значение для будущего развития передовых систем искусственного интеллекта, способных ориентироваться и обучаться в новых условиях.

Такой подход будет особенно полезен в ситуациях, когда команде автономных роботов с ограниченными ресурсами необходимо научиться ориентироваться в совершенно незнакомой среде, — заключает Вон.

Чтобы проложить путь к будущим приложениям, мы планируем доработать нашу модель, чтобы лучше использовать пространственную информацию и включать в нее более разнообразные среды.

31.05.2024


Подписаться в Telegram



Net&IT

TheInnovator: Роботы с искусственным интеллектом изменят рынок труда
TheInnovator: Роботы с искусственным интеллектом изменят рынок труда

Если компании и ИИ-стартапы, стремящиеся ...

В КАИ оснащают беспилотники компьютерным зрением
В КАИ оснащают беспилотники компьютерным зрением

Ученые университета разработали специальные пр...

Разработан реалистичный тест для оценки навыков клинического общения ИИ
Разработан реалистичный тест для оценки навыков клинического общения ИИ

Инструменты искусственного интеллекта, такие к...

Сети Wi-Fi-избавили от лишней «информационной нагрузки»
Сети Wi-Fi-избавили от лишней «информационной нагрузки»

Ученые придумали, как сделать информацию ...

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Студенты ТИСБИ разработали проект онлайн-платформы для геймеров
Студенты ТИСБИ разработали проект онлайн-платформы для геймеров

Студенты Университета управления ТИСБИ в ...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

VCU: Аддитивное производство удешевляет производство магнитов
VCU: Аддитивное производство удешевляет производство магнитов
Menopause: ИИ выявляет риск когнитивных нарушений у женщин в период менопаузы
Menopause: ИИ выявляет риск когнитивных нарушений у женщин в период менопаузы
IEEE Access: Разработан метод, лучше справляющийся с переводом языка жестов
IEEE Access: Разработан метод, лучше справляющийся с переводом языка жестов
Ученые опровергли связь между опухолью мозга и гормональной терапией у женщин
Ученые опровергли связь между опухолью мозга и гормональной терапией у женщин
Фаги в сельском хозяйстве защитят растения от бактерий без вредных химикатов
Фаги в сельском хозяйстве защитят растения от бактерий без вредных химикатов
Термоядерный синтез: как ученые пытаются приручить энергию Солнца
Термоядерный синтез: как ученые пытаются приручить энергию Солнца
Новый экологически безопасный реагент поможет с разливами нефти в Арктике
Новый экологически безопасный реагент поможет с разливами нефти в Арктике
SciRep: Разработан новый электроимпульсный метод переработки углеволокна
SciRep: Разработан новый электроимпульсный метод переработки углеволокна
NatComm: Ученые объяснили противораковый и противомалярийный эффект губки
NatComm: Ученые объяснили противораковый и противомалярийный эффект губки
Российские ученые доказали теорию акустической турбулентности
Российские ученые доказали теорию акустической турбулентности
В СПбГУ создали фотокатализатор для очистки воды от органики
В СПбГУ создали фотокатализатор для очистки воды от органики
Ученые исследовали температурные изменения в грунтах под зданиями Салехарда
Ученые исследовали температурные изменения в грунтах под зданиями Салехарда
NTR: Курящие люди зарабатывают меньше некурящих при прочих равных
NTR: Курящие люди зарабатывают меньше некурящих при прочих равных
Мировой рынок фаготерапии достигнет $116 млн к 2028 году
Мировой рынок фаготерапии достигнет $116 млн к 2028 году
TheInnovator: Роботы с искусственным интеллектом изменят рынок труда
TheInnovator: Роботы с искусственным интеллектом изменят рынок труда

Новости компаний, релизы

Университет Иннополис открыл колледж для подготовки ИТ-специалистов и робототехников
МФТИ подготовил более 140 специалистов в области синхротронных и нейтронных исследований
В Москве открыт памятник «отцу» советского ядерного оружия
В Архангельске ведется подготовка к строительству кампуса «Арктическая звезда»
70% составляет готовность 18 корпусов общежитий нижегородского ИТ-кампуса