Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр

В сериале Звездный путь: Следующее поколение капитан Пикард и экипаж Энтерпрайза используют голопалубу — пустую комнату, способную генерировать трехмерное окружение, — для подготовки к миссиям и для развлечения, имитируя все: от густых джунглей до Лондона времен Шерлока Холмса.

Глубоко захватывающие и полностью интерактивные, созданные на голопалубе среды можно бесконечно настраивать, не используя ничего, кроме языка: экипажу достаточно попросить компьютер сгенерировать среду, и это пространство появляется на голопалубе.

Сегодня виртуальные интерактивные среды также используются для обучения роботов перед их внедрением в реальный мир в процессе, называемом «Sim2Real». Однако виртуальные интерактивные среды оказались на удивление дефицитными.

Художники вручную создают такие среды, — говорит Юэ Ян, докторант в лабораториях Марка Яцкара и Криса Каллисона-Берча, ассистента и доцента кафедры компьютерных и информационных наук (CIS) соответственно.

Эти художники могут потратить неделю на создание одной среды, — добавляет Ян, отмечая все решения, начиная от планировки пространства, размещения объектов и заканчивая цветами, используемыми при визуализации.

Нехватка виртуальных сред — это проблема, если вы хотите обучить роботов ориентироваться в реальном мире со всеми его сложностями. Нейронные сети — системы, на которых держится современная революция в области ИИ, — требуют огромных объемов данных, что в данном случае означает симуляцию физического мира.

Генеративные системы ИИ, такие как ChatGPT, обучаются на триллионах слов, а генераторы изображений, такие как Midjourney и DALLE, — на миллиардах изображений, — говорит Каллисон-Берч.

У нас есть лишь малая часть такого количества 3D-среды для обучения так называемого «воплощенного ИИ». Если мы хотим использовать методы генеративного ИИ для разработки роботов, способных безопасно ориентироваться в реальном окружении, то нам нужно будет создать миллионы или миллиарды симулированных сред.

В этом поможет Holodeck — система для создания интерактивных 3D-среды, созданная совместно Каллисон-Берч, Яцкаром, Янгом и Лингджи Лю, доцентом кафедры CIS Аравиндом К. Джоши, а также сотрудниками Стэнфорда, Университета Вашингтона и Института искусственного интеллекта Аллена (AI2). Названный в честь своего предшественника из «Звездного пути», Holodeck генерирует практически неограниченный диапазон внутренней обстановки, используя искусственный интеллект для интерпретации запросов пользователей. „Мы можем использовать язык для управления“, — говорит Янг. „Вы можете легко описать любую среду, которую хотите, и обучить воплощенных агентов ИИ“.

Holodeck использует знания, заложенные в больших языковых моделях (LLM) — системах, лежащих в основе ChatGPT и других чат-ботов.

Язык — это очень сжатое представление всего мира, — говорит Ян.

Благодаря огромному количеству текста, который они получают в процессе обучения, LLM обладают удивительно глубокими знаниями о дизайне помещений. По сути, Holodeck работает, вовлекая LLM в разговор, используя тщательно структурированную серию скрытых запросов, чтобы разложить запросы пользователя на конкретные параметры.

Подобно тому как капитан Пикард может попросить голопалубу Star Trek смоделировать питейное заведение, исследователи могут попросить голопалубу Penn's Holodeck создать «квартиру 1b1b исследователя, у которого есть кошка». Система выполняет этот запрос, разбивая его на несколько шагов: сначала создаются пол и стены, затем дверной проем и окна. Затем Holodeck ищет в Objaverse, обширной библиотеке готовых цифровых объектов, предметы обстановки, которые можно было бы ожидать в таком помещении: журнальный столик, башню для кошки и так далее. Наконец, Holodeck запрашивает модуль планировки, который, по замыслу исследователей, должен ограничивать размещение объектов, чтобы в итоге вы не получили унитаз, торчащий горизонтально из стены.

Чтобы оценить возможности Holodeck с точки зрения их реалистичности и точности, исследователи создали 120 сцен, используя как Holodeck, так и ProcTHOR, более ранний инструмент, созданный AI2, и попросили несколько сотен студентов Penn Engineering указать предпочтительную версию, не зная, какие сцены были созданы с помощью тех или иных инструментов. По всем критериям — выбор активов, согласованность компоновки и общее предпочтение — студенты неизменно оценивали окружение, созданное Holodeck, более положительно.

Исследователи также проверили способность Holodeck генерировать сцены, которые менее типичны для исследований в области робототехники и которые сложнее создать вручную, чем интерьеры квартир, например, магазины, общественные места и офисы. Сравнивая результаты Holodeck с результатами ProcTHOR, которые были созданы с использованием правил, созданных человеком, а не текста, сгенерированного ИИ, исследователи снова обнаружили, что люди, оценивающие результаты, предпочитают сцены, созданные Holodeck. Это предпочтение сохранялось в широком спектре помещений, от научных лабораторий до художественных студий, от раздевалок до винных погребов.

Наконец, исследователи использовали сцены, созданные Holodeck, для «тонкой настройки» воплощенного агента ИИ. „Окончательное испытание Holodeck, — говорит Яцкар, — заключается в том, чтобы с его помощью помочь роботам более безопасно взаимодействовать с окружающей средой, подготовив их к обитанию в местах, где они никогда раньше не бывали“.

В нескольких типах виртуальных пространств, включая офисы, детские сады, спортивные залы и игровые автоматы, Holodeck оказал выраженное и положительное влияние на способность агента ориентироваться в новых пространствах.

Например, если при предварительном обучении с помощью ProcTHOR (в ходе которого агент совершил около 400 миллионов виртуальных шагов) агент успешно находил пианино в музыкальной комнате лишь в 6% случаев, то при тонкой настройке с помощью 100 музыкальных комнат, сгенерированных Holodeck, агент справлялся с задачей более чем в 30% случаев.

В этой области долгое время проводились исследования в жилых помещениях, — заключает Ян.

Но существует так много разнообразных сред — эффективная генерация большого количества сред для обучения роботов всегда была большой проблемой, но Holodeck предоставляет такую возможность.

11.04.2024


Подписаться в Telegram



Net&IT

Сети Wi-Fi-избавили от лишней «информационной нагрузки»
Сети Wi-Fi-избавили от лишней «информационной нагрузки»

Ученые придумали, как сделать информацию ...

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Студенты ТИСБИ разработали проект онлайн-платформы для геймеров
Студенты ТИСБИ разработали проект онлайн-платформы для геймеров

Студенты Университета управления ТИСБИ в ...

Nature: Созданные ИИ тексты будут размечаться водяными знаками
Nature: Созданные ИИ тексты будут размечаться водяными знаками

Исследователи из лондонской лаборатории G...

Российская игра о наполеоновских войнах станет бесплатной
Российская игра о наполеоновских войнах станет бесплатной

У российской аудитории растет интерес к в

В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»
В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»

В Новосибирском государственном университете з...

Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме
Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме

Технологические корпорации всё чаще обращ...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Лазерное шаблонирование против рестеноза: инновационный подход к лечению сосудов
Лазерное шаблонирование против рестеноза: инновационный подход к лечению сосудов
50 оттенков мутаций: прорыв в изучении параганглиом изменит подход к лечению
50 оттенков мутаций: прорыв в изучении параганглиом изменит подход к лечению
Они называли ее земляным червяком: вот почему змеи так триггерят обезьян
Они называли ее земляным червяком: вот почему змеи так триггерят обезьян
В СПбГУ втрое увеличили эффективность свечения многокомпонентной наноструктуры
В СПбГУ втрое увеличили эффективность свечения многокомпонентной наноструктуры
В России и Узбекистане тестируют чат-бота для кардиологов
В России и Узбекистане тестируют чат-бота для кардиологов
Jmor: Новый метод исследования запускает нелетальное изучение зубов животных
Jmor: Новый метод исследования запускает нелетальное изучение зубов животных
Разработана первая в России модель для планирования хмелеводства
Разработана первая в России модель для планирования хмелеводства
Проект «Живая ткань» поможет обучать хирургов на имитации живого тела
Проект «Живая ткань» поможет обучать хирургов на имитации живого тела
Устойчивость к антибиотикам: бизнес может внести вклад в борьбу за человечество
Устойчивость к антибиотикам: бизнес может внести вклад в борьбу за человечество
Наночастицы селена помогут укрепить иммунитет и защитить сердце
Наночастицы селена помогут укрепить иммунитет и защитить сердце
Инструмент редактирования генов уменьшает число прекурсоров бляшек Альцгеймера
Инструмент редактирования генов уменьшает число прекурсоров бляшек Альцгеймера
На СКИФе в Новосибирской области получили первый пучок электронов
На СКИФе в Новосибирской области получили первый пучок электронов
Новый метод сканирования раскрывает секреты работы легких
Новый метод сканирования раскрывает секреты работы легких
В Пензе создали веб-приложение для интерпретации электрокардиосигналов
В Пензе создали веб-приложение для интерпретации электрокардиосигналов
Социальное поведение при синдроме хрупкой Х-хромосомы: новое открытие
Социальное поведение при синдроме хрупкой Х-хромосомы: новое открытие

Новости компаний, релизы

Фонд «Лига выпускников» совместно с научным сообществом поддержали идею создания центра компетенций ТЭК
МФТИ подготовил более 140 специалистов в области синхротронных и нейтронных исследований
В России разработана система «Второе мнение» для ультразвуковой диагностики щитовидной железы
«Это не просто студенческий городок». Как создают межвузовский кампус в городе Челябинске
Ученые Пермского Политеха выяснили, как повысить скорость и качество обработки новых титановых сплавов