Radiology: ChatGPT не справился с интерпретацией радиологических снимков

Исследователи выяснили, что ChatGPT-4 Vision хорошо справляется с текстовыми вопросами экзамена по радиологии, но не может точно ответить на вопросы об изображениях.

Результаты исследования опубликованы в журнале Radiology.

Chat GPT-4 Vision — это первая версия языковой модели, которая может работать и с текстом, и с изображениями.

ChatGPT-4 помогает радиологам упростить подготовку отчётов для пациентов и определить подходящий протокол обследования, — говорит Чад Клочко, доктор медицинских наук. Он специализируется на заболеваниях опорно-двигательного аппарата и исследует искусственный интеллект в Henry Ford Health (Детройт, штат Мичиган). GPT-4 Vision обрабатывает изображения и может найти новые применения в радиологии.

Исследовательская группа доктора Клочко использовала вопросы из экзаменов по диагностической радиологии Американского колледжа радиологии для своего исследования. Эти тесты используются для оценки успехов ординаторов-радиологов.

После исключения дубликатов, исследователи использовали 377 вопросов из 13 областей. Из них 195 были текстовыми вопросами, а 182 — с изображениями.

Модель GPT-4 Vision правильно ответила на 246 из 377 вопросов, набрав 65,3%. Она правильно ответила на 81,5% текстовых запросов и на 47,8% вопросов с изображениями.

Точность ответов на текстовые вопросы составляет 81,5%. Это отражает результаты предшественника модели. Постоянство в ответах может говорить о том, что модель понимает текстовую информацию в радиологии.

В области радиологии мочеполовой системы GPT-4 Vision лучше справилась с вопросами с изображениями (67%, или 10 из 15), чем с текстовыми вопросами (57%, или 4 из 7). В других областях модель лучше отвечала на вопросы без изображений.

Модель лучше всего справилась с вопросами, содержащими изображения в грудной и мочеполовой областях — 69% и 67% правильных ответов соответственно.

Хуже всего модель отвечала на вопросы с изображениями из области ядерной медицины — только 2 ответа из 10 были верными.

Также в исследовании изучалось влияние различных подсказок на работу GPT-4 Vision.

  • Оригинал: Вы сдаете экзамен по радиологии. Изображения вопросов будут загружены. Выберите правильный ответ на каждый вопрос.
  • Основная: Выберите единственный лучший ответ на следующий вопрос экзамена по радиологии.
  • Краткая инструкция: Это вопрос для экзамена по радиологии, который нужен, чтобы проверить ваши медицинские знания. Выберите лучший вариант ответа.
  • Длинная инструкция: Вы являетесь сертифицированным врачом-рентгенологом, сдающим экзамен. Внимательно изучите каждый вопрос, а если вопрос дополнительно содержит изображение, внимательно изучите его, чтобы ответить на вопрос. Ваш ответ должен включать один наилучший вариант ответа. Отсутствие варианта ответа будет считаться неправильным.
  • Цепочка мыслей: Вы сдаете экзамен в исследовательских целях. Учитывая предоставленное изображение, продумайте шаг за шагом ответ на поставленный вопрос.

Хотя модель правильно ответила на 183 из 265 вопросов, она отказалась отвечать на 120. Большинство из них содержали изображение.

Мы не заметили такого поведения модели в ходе первоначального исследования, — говорит доктор Клочко.

Модель показала самую низкую точность (62,6%) при использовании коротких инструкций.

Наше исследование показало, что модель иногда даёт верные ответы на основании неверной интерпретации изображений. Это может иметь серьёзные последствия в клинической практике.

По словам доктора Клочко, необходимо разработать более строгие методы оценки эффективности больших языковых моделей в радиологии.

Он отметил, что GPT-4 Vision пока не подходит для работы в радиологии, поскольку могут возникнуть проблемы с интерпретацией изображений и ответы могут быть недостоверными.

03.09.2024


Подписаться в Telegram



Net&IT

Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом

Генеративный искусственный интеллект часто оши...

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

A&D: Изменения в сосудах мозга помогут прогнозировать когнитивные нарушения
A&D: Изменения в сосудах мозга помогут прогнозировать когнитивные нарушения
Nature Physics: Ученые проследили эволюцию беспорядка в сверхпроводниках
Nature Physics: Ученые проследили эволюцию беспорядка в сверхпроводниках
PNAS: Жидкие кристаллы в движении имитируют биологические системы
PNAS: Жидкие кристаллы в движении имитируют биологические системы
Стандартизация крепежа позволила быстро построить хрустальный дворец в Лондоне
Стандартизация крепежа позволила быстро построить хрустальный дворец в Лондоне
NatComm: Найдены участки в мозге, которые действуют как связи в социальной сети
NatComm: Найдены участки в мозге, которые действуют как связи в социальной сети
Nature Astronomy: Черная дыра способна «морить голодом» галактику-хозяина
Nature Astronomy: Черная дыра способна «морить голодом» галактику-хозяина
КФУ: Кинетическая модель оптимизирует добычу битуминозной нефти
КФУ: Кинетическая модель оптимизирует добычу битуминозной нефти
В ЛЭТИ создали цифрового двойника для оптимизации солнечных электростанций
В ЛЭТИ создали цифрового двойника для оптимизации солнечных электростанций
Дыбка и трещотка: кого еще нашли ученые КФУ во время экспедиции
Дыбка и трещотка: кого еще нашли ученые КФУ во время экспедиции
Advanced Science: Гель из слизи коровы поможет при грыже межпозвоночного диска
Advanced Science: Гель из слизи коровы поможет при грыже межпозвоночного диска
DFCI: Как образ жизни после лечения влияет на результаты после диагноза рака
DFCI: Как образ жизни после лечения влияет на результаты после диагноза рака
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Science: Разработан метод поиска молекул, подходящих всем известным белкам
Science: Разработан метод поиска молекул, подходящих всем известным белкам
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Исследователи используют кантианскую модель рациональности для оценки этичности решений ИИ
Ученые Сеченовского университета разработали новый способ терапии вирусных заболеваний
Ученые СПбГУ и ЛЭТИ разработали методику изучения материалов на основе алмаза для космической электроники будущего
Межсетевой экран защитит компьютерные системы от киберугроз