С помощью большой языковой модели инженеры Массачусетского технологического института позволили роботам самостоятельно исправлять ошибки и выполнять работу по дому. Роботов учат выполнять все более сложные бытовые задачи — от вытирания пролитых жидкостей до подачи еды. Многие из таких домашних роботов учатся через подражание: их программируют на копирование движений, которые человек выполняет физически. Оказалось, что роботы — отличные имитаторы. Но если инженеры не запрограммируют их на адаптацию ко всем возможным ударам и толчкам, роботы не всегда будут знать, как справиться с подобными ситуациями, если не начать выполнять задание с чистого листа. Теперь инженеры Массачусетского технологического института намерены придать роботам немного здравого смысла, когда они сталкиваются с ситуациями, которые сбивают их с намеченного пути. Они разработали метод, который соединяет данные о движении робота со «здравым смыслом» больших языковых моделей, или LLM. Их подход позволяет роботу логически разбирать многие бытовые задачи на подзадачи и физически адаптироваться к сбоям в рамках подзадачи, чтобы робот мог двигаться дальше без необходимости возвращаться и начинать задачу с нуля — и без необходимости инженерам явно программировать исправление всех возможных сбоев на этом пути.
Ванг и его коллеги подробно описывают свой новый подход в исследовании, которое они представят на Международной конференции по изучению представлений (ICLR) в мае. Соавторами исследования являются аспиранты EECS Цун-Хсуан Ванг и Цзяюань Мао, Майкл Хагеноу, постдок факультета аэронавтики и астронавтики Массачусетского технологического института (AeroAstro), и Джули Шах, профессор аэронавтики и астронавтики Массачусетского технологического института имени Х.Н. Слейтера. Языковая задачаИсследователи иллюстрируют свой новый подход на примере простой задачи: зачерпнуть шарики из одной миски и пересыпать их в другую. Чтобы выполнить эту задачу, инженеры обычно перемещают робота по одной траектории — зачерпывая и пересыпая. Они могут проделать это несколько раз, чтобы дать роботу возможность имитировать несколько человеческих демонстраций.
Команда поняла, что, хотя человек может продемонстрировать одну задачу за один раз, эта задача зависит от последовательности подзадач, или траекторий. Например, робот должен сначала дотянуться до миски, прежде чем зачерпнуть, а затем зачерпнуть шарики, прежде чем переместиться к пустой миске, и так далее. Если робот совершит ошибку во время выполнения любой из этих подзадач, единственным выходом будет остановка и начало работы с самого начала, если только инженеры не обозначат каждую подзадачу и не запрограммируют или не соберут новые демонстрации для восстановления робота после указанного сбоя, чтобы робот мог самокорректироваться в нужный момент.
Вместо этого он и его коллеги обнаружили, что часть этой работы может быть выполнена автоматически с помощью LLM. Эти модели глубокого обучения обрабатывают огромные библиотеки текстов, которые они используют для установления связей между словами, предложениями и абзацами. Благодаря этим связям LLM может генерировать новые предложения, основываясь на том, что он узнал о том, какое слово, скорее всего, следует за предыдущим. В свою очередь, исследователи обнаружили, что помимо предложений и абзацев, LLM можно попросить составить логический список подзадач, которые будут задействованы в задаче. Например, если попросить ЛЛМ перечислить действия, связанные с пересыпанием шариков из одной миски в другую, он может выдать последовательность таких глаголов, как «достать», „зачерпнуть“, „перенести“ и „пересыпать“.
Составление карты шариковДля своего нового подхода команда разработала алгоритм, позволяющий автоматически связывать метку на естественном языке LLM для конкретной подзадачи с положением робота в физическом пространстве или изображением, кодирующим состояние робота. Сопоставление физических координат робота или изображения его состояния с меткой на естественном языке известно как «привязка». Новый алгоритм команды разработан для обучения „классификатора заземления“, то есть он учится автоматически определять, в какой семантической подзадаче находится робот — например, „дотянуться“ или „зачерпнуть“ — с учетом его физических координат или изображения.
Команда продемонстрировала этот подход в экспериментах с роботизированной рукой, которую они обучили задаче по сбору мрамора. Экспериментаторы обучали робота, физически направляя его на выполнение задачи: сначала дотянуться до миски, зачерпнуть шарики, перенести их в пустую миску и высыпать в нее. После нескольких демонстраций команда использовала предварительно обученный LLM и попросила модель перечислить шаги, связанные с зачерпыванием шариков из одной миски в другую. Затем исследователи использовали свой новый алгоритм, чтобы связать определенные LLM подзадачи с данными о траектории движения робота. Алгоритм автоматически научился сопоставлять физические координаты робота в траекториях и соответствующий вид изображения с заданной подзадачей. Затем команда позволила роботу самостоятельно выполнить задачу по зачерпыванию воды, используя только что полученные классификаторы заземления. По мере того как робот выполнял все этапы задания, экспериментаторы толкали и подталкивали его, сбивая шарики с ложки в разных точках. Вместо того чтобы останавливаться и начинать все с начала или продолжать вслепую, не имея шариков на ложке, бот был способен к самокоррекции и завершал каждую подзадачу, прежде чем переходить к следующей. (Например, он убеждался, что успешно зачерпнул шарики, прежде чем переложить их в пустую миску).
Иллюстрация: Jose-Luis Olivares, MIT. Предоставили Yanwei Wang и Julie Shah 25.03.2024 |
Хайтек
В УрФУ разработали технологию 3D-печати из жаропрочных титановых сплавов | |
Технологию создания жаропрочных сплавов на&nbs... |
Ученые ЮУрГУ предложили уникальную технологию повышения надежности сварки | |
Уникальную технологию повышения надежности сва... |
В Томском университете создали интегральные схемы для российских РЛС | |
Первый российский комплект интегральных схем д... |
Российские ученые приблизились к созданию искусственной сетчатки | |
Оптоэлектронный синапс — мемристор ... |
Экологичная замена полиэтиленовым упаковкам разработана в МГУ | |
Биоразлагаемый полимер — полипропил... |
CS: Создана технология производства компонентов для шампуней и лекарств | |
Исследователи из России и Китая разр... |
APN: Фотонные вычисления помогут продвинуться в области аналоговых вычислений | |
Дифференциальные уравнения с частными про... |
Ученые НИТУ МИСИС разработали магнитные микропровода для имплантатов и датчиков | |
Новые ультратонкие аморфные микропровода, кото... |
NP: Открыт новый метод, предлагающий решения для сложных задач визуализации | |
Новый метод вычислительной голографии позволяе... |
В Пермском Политехе усовершенствовали алгоритм оценки состояния оборудования | |
Для оценки состояния оборудования или все... |
NP: Создана фотонная решетка, способная манипулировать квантовыми состояниями | |
Синтетическую фотонную решетку, которая может ... |
Physical Review C: Синтезирован новый изотоп плутония | |
Физики из Китая выяснили, что период... |
В КФУ импортозаместили катализатор, который уже используют на предприятии СИБУРа | |
Технологию производства катализатора скелетной... |
LS&A: Кремниевые метаповерхности открыли доступ к инфракрасной визуализации | |
Инфракрасная визуализация помогает лучше понят... |
ACIE: Синтезированы молекулы, обратимо меняющиеся под воздействием света и тепла | |
В эпоху облачных хранилищ мало кто создае... |
PRXQ: Создана гибридная технология исправления ошибок в квантовых вычислениях | |
Одна из главных задач в создании ква... |
V&PP: Ученые приблизились к созданию печатной активной электроники | |
Активная электроника, которая управляет электр... |
NatComm: Киригами поможет усовершенствовать антенны для беспроводных технологий | |
Будущее беспроводных технологий – от&nbs... |
MIT: С новой технологией 3D-печати — выше скорость изготовления и меньше отходов | |
Если использовать 3D-принтер специальным образ... |
Nature Methods: Ученые добились нанометрового разрешения с обычным микроскопом | |
Более простой и недорогой способ получени... |
PRL: Свет помог визуализировать магнитные домены квантовых антиферромагнитов | |
Визуализировать с помощью света магнитные... |
Science: Найден святой грааль для каталитической активации алканов | |
Новый метод активации алканов, разработанный и... |
AENM: Создан новый метод синтеза для снижения температуры спекания электролитов | |
Новый метод синтеза электролитов разработали у... |
Advanced Science: Разработан клей, отлично схватывающий во влажных условиях | |
Учёные разработали новый клей, вдохновлённые о... |
Advanced Science: Ученые предложили освободить мозг роботов для сложных задач | |
Инженеры придумали, как передавать робота... |
Открыт метод 3D-полимеризации с использованием маломощных лазерных осцилляторов | |
Прямая лазерная запись, LDW, с использова... |
SciAdv: Состоялась первая успешная демонстрация двухмедийной NV-лазерной системы | |
Измерение крошечных магнитных полей, таких как... |
В ПНИПУ нашли способ сохранить данные после тестов высокотехнологичных изделий | |
Стендовые испытания — важный этап р... |
Advanced Materials: ИИ ускоряет открытие энергетических и квантовых материалов | |
Новый инструмент на основе искусственного... |
В КНИТУ получили суперконструкционный полимер для медицины | |
Учёные сразу нескольких кафедр КНИТУ вместе с&... |