Ученые нашли способ заставить языковую модель ИИ сомневаться в неверных ответах

Большие языковые модели помогают в решении множества задач: от перевода до выявления финансового мошенничества. Но иногда они дают неточные ответы, которым сложно доверять из-за самоуверенности модели.

Исследователи обычно проверяют, насколько можно доверять результатам модели машинного обучения. Хорошо откалиброванная модель должна быть менее уверена в неправильном прогнозе.

Но поскольку большие языковые модели (LLM) могут применяться для решения множества разнообразных задач, традиционные методы калибровки не работают.

Исследователи из Массачусетского технологического института и Лаборатории искусственного интеллекта MIT-IBM Watson предложили новый метод калибровки для больших языковых моделей. Он называется Thermometer и предполагает создание вспомогательной модели, которая запускается поверх основной для её калибровки.

Thermometer — эффективный метод, который требует меньше вычислений и при этом сохраняет точность модели. Он позволяет ей давать более точные ответы на новые задачи.

Thermometer помогает эффективно откалибровать LLM для разных задач. Это позволяет выявить ситуации, когда модель ошибается, и предотвратить её неудачное развёртывание.

С помощью Thermometer мы хотим дать пользователю понять, насколько точен ответ модели. Это позволит оценить её надёжность, — говорит Маохао Шен, аспирант факультета электротехники и информатики (EECS) и автор статьи о Thermometer.

Вместе с Шеном над статьей работали Грегори Уорнелл, профессор инженерии Sumitomo, возглавляющий лабораторию сигналов, информации и алгоритмов в Исследовательской лаборатории электроники и являющийся сотрудником лаборатории искусственного интеллекта MIT-IBM Watson; старший автор Сумья Гош, научный сотрудник лаборатории искусственного интеллекта MIT-IBM Watson; а также другие сотрудники MIT и лаборатории искусственного интеллекта MIT-IBM Watson. Исследование было недавно представлено на Международной конференции по машинному обучению.

Универсальная калибровка

Традиционные модели машинного обучения создаются для выполнения одной задачи, поэтому их калибровка включает один метод, подходящий именно для этой задачи.

LLM могут выполнять множество задач, и использование традиционного метода калибровки может снизить эффективность модели для других задач.

Калибровку LLM проводят с помощью многократной выборки из модели для получения разных предсказаний, которые затем объединяют для более точной калибровки. Но из-за большого количества параметров в этих моделях такой подход требует больших вычислительных затрат.

Исследователи из проекта Thermometer разработали универсальный метод калибровки больших языковых моделей.

Этот метод использует классический подход, называемый температурным масштабированием. Он позволяет эффективно настроить модель под конкретную задачу.

В этом контексте «температура» означает параметр, который настраивает уровень доверия к модели и приводит её в соответствие с требуемой точностью предсказания. Раньше для определения правильной температуры использовали валидационный набор данных для конкретной задачи.

Поскольку LLM часто используются для новых задач, может быть сложно получить данные с метками. Например, у пользователя, который хочет применить LLM для ответов на вопросы покупателей о новом продукте, скорее всего, нет такого набора данных.

Вместо этого исследователи обучают модель «Термометр», которая работает поверх LLM и автоматически предсказывает температуру, необходимую для калибровки LLM под новую задачу.

Для обучения модели они используют данные с метками для нескольких репрезентативных задач. После обучения модель может обобщать данные на новые задачи без необходимости получения дополнительных данных с метками.

Модель Thermometer, обученная на множестве вопросов с несколькими вариантами ответов (включая вопросы по алгебре и медицине), может помочь настроить LLM для решения задач по геометрии или биологии.

Модель термометра должна получить доступ к небольшой части внутреннего устройства LLM, чтобы предсказать нужную температуру и настроить модель под конкретную задачу.

Эффективный подход

Техника Thermometer не требует многократного обучения и лишь немного замедляет работу LLM. При этом она сохраняет точность, поскольку температурное масштабирование не изменяет предсказания модели.

Thermometer даёт более точные калиброванные меры неопределённости, чем несколько базовых моделей на разных задачах. При этом он требует гораздо меньше вычислений.

Шен добавляет, что если обучить модель Thermometer на большом количестве задач, она сможет хорошо обобщать информацию и работать с новыми задачами, как и большая языковая модель.

Исследователи выяснили, что модель Thermometer, обученная на небольшом LLM, может быть использована для калибровки более крупного LLM из того же семейства.

В планах — расширить применение модели Thermometer для более сложных задач генерации текста и адаптировать её к ещё более крупным языковым моделям. Также исследователи хотят определить, сколько размеченных данных потребуется модели Thermometer для обобщения информации и выполнения новых задач.

31.07.2024

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Как ИИ выкручивается, когда не знает языковых правил
Как ИИ выкручивается, когда не знает языковых правил

Исследователи из Оксфорда и Allen In...

Банк для бизнеса доступен на российской мобильной ОС
Банк для бизнеса доступен на российской мобильной ОС

СберБизнес — мобильное приложение д...

От частного к общему: как алгоритмы учатся видеть связи между словами
От частного к общему: как алгоритмы учатся видеть связи между словами

В мире обработки естественного языка есть две&...

Заговор в пудре и шелках: как выжить при дворе Елизаветы Петровны
Заговор в пудре и шелках: как выжить при дворе Елизаветы Петровны

Студия Много Много игр выпустила новую ви...

Опасен ли искусственный интеллект для человечества
Опасен ли искусственный интеллект для человечества

Искусственный интеллект перестал быть фантасти...

Люди с ограниченной подвижностью смогут играть в VR
Люди с ограниченной подвижностью смогут играть в VR

Команда исследователей из Университета Ва...

Почти идеально: как квантовые компьютеры обходят суперкомпьютеры
Почти идеально: как квантовые компьютеры обходят суперкомпьютеры

Квантовые компьютеры могут решать задачи оптим...

Дипфейки научились дышать: как подделки имитируют сердцебиение
Дипфейки научились дышать: как подделки имитируют сердцебиение

Представьте мир, где дипфейки стали насто...

ИИ анализирует цветение злаков без помощи человека
ИИ анализирует цветение злаков без помощи человека

Ученые создали алгоритм, который учится сам&nb...

Социальный провал: как ИИ путает разговор с переходом улицы
Социальный провал: как ИИ путает разговор с переходом улицы

Оказывается, люди пока разбираются в соци...

Создана нейросеть для тестирования интерфейсов: как это работает
Создана нейросеть для тестирования интерфейсов: как это работает

Каждый день миллионы людей покупают товары, оп...

Диагноз от ChatGPT: почти как у терапевта, но без очереди
Диагноз от ChatGPT: почти как у терапевта, но без очереди

Использование генеративного ИИ для д...

Облака вместо складов: как ритейл выжимает максимум из цифры
Облака вместо складов: как ритейл выжимает максимум из цифры

Владимир Лебедев, директор по развитию би...

ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?
ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?

Если вы из 1,5 миллиарда пользовател...

ИИ на акустических волнах: тише едешь — дальше будешь
ИИ на акустических волнах: тише едешь — дальше будешь

Искусственный интеллект уже меняет нашу ж...

Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть
Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть

Эксперт по цифровым стратегиям Джулио Тос...

Море данных: физики доверили расчет жидкости ИИ
Море данных: физики доверили расчет жидкости ИИ

Искусственный интеллект уже изменил общес

Не биты, а кубиты: квантовые компьютеры играют в другой лиге
Не биты, а кубиты: квантовые компьютеры играют в другой лиге

Современные компьютеры, от смартфонов до&...

Квантовый мост: ученые соединили микроволны и свет в одном чипе
Квантовый мост: ученые соединили микроволны и свет в одном чипе

Физики из Гарвардской школы инженерии и&n...

40 000 точек вместо 12: наука усовершенствует слежение за взглядом
40 000 точек вместо 12: наука усовершенствует слежение за взглядом

Ученые из Университета Аризоны придумали,...

ИИ наступает: какие профессии выживут, а какие сдадут позиции
ИИ наступает: какие профессии выживут, а какие сдадут позиции

С каждым годом искусственный интеллект станови...

Защита на опережение: почему мир переходит на новое шифрование HQC
Защита на опережение: почему мир переходит на новое шифрование HQC

Национальный институт стандартов и технол...

Поиск на сайте

ТОП - Новости мира, инновации

Как технологии помогают благотворительности
Как технологии помогают благотворительности
Как метавселенные меняют нашу психику
Как метавселенные меняют нашу психику
CBDC — не крипта, но играть будет по своим правилам
CBDC — не крипта, но играть будет по своим правилам
От редактирования ДНК до колонизации Марса: главные технологии XXI века
От редактирования ДНК до колонизации Марса: главные технологии XXI века
Мозг на паузе: ученые научились отключать нейронные связи и включать их обратно
Мозг на паузе: ученые научились отключать нейронные связи и включать их обратно
Ловкость волн и никаких проводов: прорыв в фотонных вычислениях
Ловкость волн и никаких проводов: прорыв в фотонных вычислениях
Новый метод увеличил емкость аккумуляторов на 60%
Новый метод увеличил емкость аккумуляторов на 60%
Как ехидны выращивают детенышей в бактериальном коконе
Как ехидны выращивают детенышей в бактериальном коконе
Город в термосе: как охладить асфальт и укротить ливни
Город в термосе: как охладить асфальт и укротить ливни
Танцы в воде: зачем фламинго топчутся и щелкают клювами
Танцы в воде: зачем фламинго топчутся и щелкают клювами
Биологи включили турбо-режим для бактериальной эволюции
Биологи включили турбо-режим для бактериальной эволюции
Создан язык, который вытаскивает токсины из цифрового шума
Создан язык, который вытаскивает токсины из цифрового шума
Невидимые горы: почему пляжные дюны появляются за минуты и исчезают навсегда
Невидимые горы: почему пляжные дюны появляются за минуты и исчезают навсегда
Дикие шимпанзе не знают, что такое трудное детство
Дикие шимпанзе не знают, что такое трудное детство
Морщины на пальцах от воды — как отпечатки: уникальны и неизменны
Морщины на пальцах от воды — как отпечатки: уникальны и неизменны

Новости компаний, релизы

Пробирки, зелень и взрывы: фестиваль для тех, кто любит науку
Бактерии против грибов: как наука защищает картофель без химии
Овцы вместо мышей: как ученые нашли новый способ тестировать материалы для зубов
Ход конем: в Шагонаре прошел первый шахматный турнир для дошколят
Как СПбГУ готовит инженеров для нефтегазовой отрасли — опыт БРИКС