BMJ Quality & Safety: Слушайте советы доктора, а не чат-бота

Не стоит доверять информации о лекарствах, полученной от поисковых систем и чат-ботов с искусственным интеллектом, уверены ученые. Зачастую такая информация бывает неверной или даже потенциально вредной.

Кроме того, людям без высшего образования может быть сложно разобраться в таких ответах.

В феврале 2023 года в поисковых системах стали заметны изменения. Появились чат-боты на базе искусственного интеллекта, которые должны были улучшить результаты поиска и сделать его более интерактивным.

Хотя эти чат-боты могут многое, так как обучены на больших объёмах данных из интернета, они иногда генерируют вредный или нелепый контент, включая полную дезинформацию.

Предыдущие исследования о влиянии чат-ботов рассматривали их с точки зрения медицинских работников, а не пациентов.

Чтобы исправить это, исследователи изучили, насколько хорошо чат-боты могут отвечать на запросы о 50 самых популярных лекарствах в США в 2020 году. Для этого они использовали Bing Copilot — поисковую систему с функциями чат-бота на базе искусственного интеллекта.

Исследователи смоделировали пациентов, которые обращаются к чат-ботам за информацией о лекарствах. Они изучили исследовательские базы данных и проконсультировались с клиническим фармацевтом и врачами, чтобы определить вопросы, которые пациенты задают чаще всего.

Чат-боту задали 10 вопросов по каждому из 50 препаратов. Всего получилось 500 ответов. Вопросы касались назначения препарата, его действия, инструкции по применению, побочных эффектов и противопоказаний.

Качество ответов чат-бота оценивалось по шкале Flesch Reading Ease Score. Она показывает, насколько текст сложен для восприятия.

Оценка от 0 до 30 баллов говорит о том, что текст очень сложный и его поймёт только человек с высшим образованием. Оценка 91–100 баллов означает, что текст простой и будет понятен даже 11-летнему ребёнку.

Чтобы оценить точность ответов, их сравнивали с информацией о лекарствах на специализированном сайте, предназначенном как для врачей, так и для пациентов.

Эксперты по безопасности лекарственных средств оценили, насколько рекомендации чат-бота могут быть опасны для пациента. Для этого они рассмотрели 20 ответов бота, в которых были неточности или возможные риски.

Эксперты использовали шкалу вреда Агентства по исследованиям и качеству здравоохранения (AHRQ), чтобы оценить возможные проблемы с безопасностью.

По шкале Флеша текст соответствовал уровню сложности чуть выше среднего (37). Это означает, что чтобы понять написанное, читателю потребуется высшее образование.

Полнота ответов чат-бота в среднем составила 77%, а максимальная — 100%. На пять вопросов из десяти ответы были исчерпывающими, а на вопрос №3 ( «Что я должен учитывать при приёме препарата?») — только 23%.

В 126 ответах из 484 утверждения чат-бота не соответствовали справочным данным (26%), а в 16 из 484 (чуть более 3%) — полностью не соответствовали.

Из 20 ответов, которые ученые оценили, только 54% соответствовали научному консенсусу. В 39% случаев ответы противоречили ему, а для оставшихся 6% научный консенсус не был определён.

Вред от следования советам чат-бота может быть высоким (3%) или умеренным (29%). В трети ответов (34%) вероятность вреда низкая или его нет совсем.

Несмотря на вероятность вреда, 42% советов чат-бота могут привести к умеренному или лёгкому вреду, а 22% — к смерти или серьёзным последствиям. Около трети (36%) советов не причинят вреда.

Исследователи признают, что их исследование было недостаточно точным, так как оно не основывалось на реальном опыте пациентов. Кроме того, подсказки из разных стран и языков могли повлиять на качество ответов чат-бота.

Авторы исследования отмечают, что в целом поисковые системы с чат-ботом на базе ИИ давали полные и точные ответы на вопросы пациентов. Однако в большинстве случаев эти ответы было трудно понять, а также встречались неточности, что могло угрожать безопасности пациентов и лекарств.

У чат-бота есть главный недостаток: он не всегда понимает, что хочет узнать пациент. Поэтому авторы считают, что людям пока ещё нужно консультироваться с врачами. Поисковые системы на основе ИИ недостаточно точны, и к ним следует относиться с осторожностью.

Результаты опубликованы в журнале BMJ Quality & Safety.

11.10.2024

Общество

Когда папе грустно: как депрессия отца меняет детей
Когда папе грустно: как депрессия отца меняет детей

В массовой культуре отцов часто изображают сто...

Не просто сюсюканье: материнская ласка в детстве влияет на карьеру
Не просто сюсюканье: материнская ласка в детстве влияет на карьеру

Новое исследование показало: материнская любов...

ИИ не спешит забирать работу, но кое-что уже меняет
ИИ не спешит забирать работу, но кое-что уже меняет

Консалтинговая компания get experts ...

Нефть XXI века: в России делают ставку на кванты
Нефть XXI века: в России делают ставку на кванты

Российский союз промышленников и предприн...

Повтори, если сможешь: как нейросети проверяют знание языка
Повтори, если сможешь: как нейросети проверяют знание языка

В современном мире, где границы между стр...

Паяльник и код: что должен уметь современный разработчик электроники
Паяльник и код: что должен уметь современный разработчик электроники

Доцент кафедры электроники МИФИ Николай Усачев...

Работать или отдыхать? Современные офисы стирают границы
Работать или отдыхать? Современные офисы стирают границы

Современные бизнес-центры выделяют 5-10% площа...

Где искать работу в 2034: 13 профессий, которые не уйдут в архив
Где искать работу в 2034: 13 профессий, которые не уйдут в архив

За последнее десятилетие рынок труда кардиналь...

Не просто скроллинг: как телефон порабощает женскую психику
Не просто скроллинг: как телефон порабощает женскую психику

Новое исследование, представленное на Кон...

TOEFL и IELTS: почему простые выражения важнее сложных слов
TOEFL и IELTS: почему простые выражения важнее сложных слов

Многие изучающие иностранный язык думают: чем&...

Андрей Краснюк: в экосистему электроники входят через три двери
Андрей Краснюк: в экосистему электроники входят через три двери

Существует распространенное мнение, что Р...

Волны против логики: почему в шторм мы хуже соображаем
Волны против логики: почему в шторм мы хуже соображаем

Ученые из СПбГУ, Института психологии РАН...

Почему мотивационные посты о спорте иногда делают только хуже
Почему мотивационные посты о спорте иногда делают только хуже

Соцсети заполнены мотивационными постами о&nbs...

Наука без галстуков: кто сегодня совершает открытия в России
Наука без галстуков: кто сегодня совершает открытия в России

Национальный центр Россия и Российский на

От ДНК до черных дыр: главные открытия XXI века
От ДНК до черных дыр: главные открытия XXI века

XXI век стал свидетелем невероятного уско...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Когда папе грустно: как депрессия отца меняет детей
Когда папе грустно: как депрессия отца меняет детей
24,6% КПД и 3000 сгибаний: что еще показали испытания гибких солнечных элементов
24,6% КПД и 3000 сгибаний: что еще показали испытания гибких солнечных элементов
Как Counterfactual SMOTE улучшает диагностику редких заболеваний
Как Counterfactual SMOTE улучшает диагностику редких заболеваний
Ученые нашли связь между океаном и экстремальными дождями в Китае
Ученые нашли связь между океаном и экстремальными дождями в Китае
NatComm: Электроны в антиферромагнетиках ведут себя не по правилам
NatComm: Электроны в антиферромагнетиках ведут себя не по правилам
Шоколадный тест: как социальный статус меняет наше пищевое поведение
Шоколадный тест: как социальный статус меняет наше пищевое поведение
Нож не нужен: простой тест спасает от инсульта без операции
Нож не нужен: простой тест спасает от инсульта без операции
Sensors: Радары спасают китов от столкновений с лодками
Sensors: Радары спасают китов от столкновений с лодками
Почему одни пары работают как часы, а другие — как разбитый будильник
Почему одни пары работают как часы, а другие — как разбитый будильник
Сезон отстрела: как доступность ружей повышает кривую насилия
Сезон отстрела: как доступность ружей повышает кривую насилия
Генетика против статистики: новый алгоритм спасает тех, кого пропускают врачи
Генетика против статистики: новый алгоритм спасает тех, кого пропускают врачи
Кипяток из недр: зачем химики изучают байкальские термы
Кипяток из недр: зачем химики изучают байкальские термы
Сахар и жир: чем питается самая агрессивная опухоль мозга
Сахар и жир: чем питается самая агрессивная опухоль мозга
Химики из Санкт-Петербурга научились добывать лантаноиды без перегрева
Химики из Санкт-Петербурга научились добывать лантаноиды без перегрева
Ученые поняли, как клетки «переваривают» сахар
Ученые поняли, как клетки «переваривают» сахар

Новости компаний, релизы

Оперировать в VR: студенты придумали симулятор для хирургов
Космический рывок: что скрывает новый нацпроект
Без готовых рецептов: эксперты — о том, как работать с молодежью
Больные вопросы: что мешает лечить ревматизм в России
Кто рулит квадрокоптером лучше всех? Итоги турнира «Новая высота»