Radiology: ChatGPT не справился с интерпретацией радиологических снимков

Исследователи выяснили, что ChatGPT-4 Vision хорошо справляется с текстовыми вопросами экзамена по радиологии, но не может точно ответить на вопросы об изображениях.

Результаты исследования опубликованы в журнале Radiology.

Chat GPT-4 Vision — это первая версия языковой модели, которая может работать и с текстом, и с изображениями.

ChatGPT-4 помогает радиологам упростить подготовку отчётов для пациентов и определить подходящий протокол обследования, — говорит Чад Клочко, доктор медицинских наук. Он специализируется на заболеваниях опорно-двигательного аппарата и исследует искусственный интеллект в Henry Ford Health (Детройт, штат Мичиган). GPT-4 Vision обрабатывает изображения и может найти новые применения в радиологии.

Исследовательская группа доктора Клочко использовала вопросы из экзаменов по диагностической радиологии Американского колледжа радиологии для своего исследования. Эти тесты используются для оценки успехов ординаторов-радиологов.

После исключения дубликатов, исследователи использовали 377 вопросов из 13 областей. Из них 195 были текстовыми вопросами, а 182 — с изображениями.

Модель GPT-4 Vision правильно ответила на 246 из 377 вопросов, набрав 65,3%. Она правильно ответила на 81,5% текстовых запросов и на 47,8% вопросов с изображениями.

Точность ответов на текстовые вопросы составляет 81,5%. Это отражает результаты предшественника модели. Постоянство в ответах может говорить о том, что модель понимает текстовую информацию в радиологии.

В области радиологии мочеполовой системы GPT-4 Vision лучше справилась с вопросами с изображениями (67%, или 10 из 15), чем с текстовыми вопросами (57%, или 4 из 7). В других областях модель лучше отвечала на вопросы без изображений.

Модель лучше всего справилась с вопросами, содержащими изображения в грудной и мочеполовой областях — 69% и 67% правильных ответов соответственно.

Хуже всего модель отвечала на вопросы с изображениями из области ядерной медицины — только 2 ответа из 10 были верными.

Также в исследовании изучалось влияние различных подсказок на работу GPT-4 Vision.

  • Оригинал: Вы сдаете экзамен по радиологии. Изображения вопросов будут загружены. Выберите правильный ответ на каждый вопрос.
  • Основная: Выберите единственный лучший ответ на следующий вопрос экзамена по радиологии.
  • Краткая инструкция: Это вопрос для экзамена по радиологии, который нужен, чтобы проверить ваши медицинские знания. Выберите лучший вариант ответа.
  • Длинная инструкция: Вы являетесь сертифицированным врачом-рентгенологом, сдающим экзамен. Внимательно изучите каждый вопрос, а если вопрос дополнительно содержит изображение, внимательно изучите его, чтобы ответить на вопрос. Ваш ответ должен включать один наилучший вариант ответа. Отсутствие варианта ответа будет считаться неправильным.
  • Цепочка мыслей: Вы сдаете экзамен в исследовательских целях. Учитывая предоставленное изображение, продумайте шаг за шагом ответ на поставленный вопрос.

Хотя модель правильно ответила на 183 из 265 вопросов, она отказалась отвечать на 120. Большинство из них содержали изображение.

Мы не заметили такого поведения модели в ходе первоначального исследования, — говорит доктор Клочко.

Модель показала самую низкую точность (62,6%) при использовании коротких инструкций.

Наше исследование показало, что модель иногда даёт верные ответы на основании неверной интерпретации изображений. Это может иметь серьёзные последствия в клинической практике.

По словам доктора Клочко, необходимо разработать более строгие методы оценки эффективности больших языковых моделей в радиологии.

Он отметил, что GPT-4 Vision пока не подходит для работы в радиологии, поскольку могут возникнуть проблемы с интерпретацией изображений и ответы могут быть недостоверными.

03.09.2024


Подписаться в Telegram



Net&IT

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое
Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое

Исследование профессора Университета штата Фло...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Menopause Society: КПТ и гипноз эффективно снимают симптомы менопаузы
Menopause Society: КПТ и гипноз эффективно снимают симптомы менопаузы
Menopause Society: Между ПТСР и ранней менопаузой есть связь
Menopause Society: Между ПТСР и ранней менопаузой есть связь
Environmental Research Letters: Выбросы метана растут быстрее, чем когда-либо
Environmental Research Letters: Выбросы метана растут быстрее, чем когда-либо
Science: Стало возможным массовое производство металлических нанопроводов
Science: Стало возможным массовое производство металлических нанопроводов
Menopause Society: Эстрогеновая терапия хорошо воздействует на сердце и сосуды
Menopause Society: Эстрогеновая терапия хорошо воздействует на сердце и сосуды
Analytical Chemistry: Живые клетки можно увидеть с помощью инфракрасного света
Analytical Chemistry: Живые клетки можно увидеть с помощью инфракрасного света
Насилие со стороны интимного партнера плохо влияет на когнитивные способности
Насилие со стороны интимного партнера плохо влияет на когнитивные способности
NC: Пропофол поможет изучить связь между отделами мозга, отвечающими за сознание
NC: Пропофол поможет изучить связь между отделами мозга, отвечающими за сознание
Nature Genetics: Выяснилось, что заставляет гены вызывать развитие рака простаты
Nature Genetics: Выяснилось, что заставляет гены вызывать развитие рака простаты
Nature Chemistry: Созданы карбиды молибдена,  эффективно преобразующие CO2
Nature Chemistry: Созданы карбиды молибдена, эффективно преобразующие CO2
NatNano: Новый метод молекулярной инженерии позволит создавать сложные органоиды
NatNano: Новый метод молекулярной инженерии позволит создавать сложные органоиды
Journal of Pathology: Открыт новый метод лечения витилиго
Journal of Pathology: Открыт новый метод лечения витилиго
Разработчик рассказал, когда искусственный интеллект превзойдет человеческий
Разработчик рассказал, когда искусственный интеллект превзойдет человеческий
Nature Machine Intelligence: Генеративный ИИ берется за прогнозы в онкологии
Nature Machine Intelligence: Генеративный ИИ берется за прогнозы в онкологии
ERS: Клоуны в детских больницах приближают выздоровление
ERS: Клоуны в детских больницах приближают выздоровление

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Исследования ученых ТПУ помогут в разработке таргетных препаратов для эффективной терапии в онкологии
Время разбрасывать камни: ультразвуковая чистка зубов возвращает уверенность в себе
Экспертный центр Всероссийского студенческого проекта «Твой Ход» совместно с Роскомнадзором запустил опрос «Персональные. Об...
Ученые ТПУ нашли решение фундаментальной проблемы ионной имплантации