Radiology: ChatGPT не справился с интерпретацией радиологических снимков

Исследователи выяснили, что ChatGPT-4 Vision хорошо справляется с текстовыми вопросами экзамена по радиологии, но не может точно ответить на вопросы об изображениях.

Результаты исследования опубликованы в журнале Radiology.

Chat GPT-4 Vision — это первая версия языковой модели, которая может работать и с текстом, и с изображениями.

ChatGPT-4 помогает радиологам упростить подготовку отчётов для пациентов и определить подходящий протокол обследования, — говорит Чад Клочко, доктор медицинских наук. Он специализируется на заболеваниях опорно-двигательного аппарата и исследует искусственный интеллект в Henry Ford Health (Детройт, штат Мичиган). GPT-4 Vision обрабатывает изображения и может найти новые применения в радиологии.

Исследовательская группа доктора Клочко использовала вопросы из экзаменов по диагностической радиологии Американского колледжа радиологии для своего исследования. Эти тесты используются для оценки успехов ординаторов-радиологов.

После исключения дубликатов, исследователи использовали 377 вопросов из 13 областей. Из них 195 были текстовыми вопросами, а 182 — с изображениями.

Модель GPT-4 Vision правильно ответила на 246 из 377 вопросов, набрав 65,3%. Она правильно ответила на 81,5% текстовых запросов и на 47,8% вопросов с изображениями.

Точность ответов на текстовые вопросы составляет 81,5%. Это отражает результаты предшественника модели. Постоянство в ответах может говорить о том, что модель понимает текстовую информацию в радиологии.

В области радиологии мочеполовой системы GPT-4 Vision лучше справилась с вопросами с изображениями (67%, или 10 из 15), чем с текстовыми вопросами (57%, или 4 из 7). В других областях модель лучше отвечала на вопросы без изображений.

Модель лучше всего справилась с вопросами, содержащими изображения в грудной и мочеполовой областях — 69% и 67% правильных ответов соответственно.

Хуже всего модель отвечала на вопросы с изображениями из области ядерной медицины — только 2 ответа из 10 были верными.

Также в исследовании изучалось влияние различных подсказок на работу GPT-4 Vision.

  • Оригинал: Вы сдаете экзамен по радиологии. Изображения вопросов будут загружены. Выберите правильный ответ на каждый вопрос.
  • Основная: Выберите единственный лучший ответ на следующий вопрос экзамена по радиологии.
  • Краткая инструкция: Это вопрос для экзамена по радиологии, который нужен, чтобы проверить ваши медицинские знания. Выберите лучший вариант ответа.
  • Длинная инструкция: Вы являетесь сертифицированным врачом-рентгенологом, сдающим экзамен. Внимательно изучите каждый вопрос, а если вопрос дополнительно содержит изображение, внимательно изучите его, чтобы ответить на вопрос. Ваш ответ должен включать один наилучший вариант ответа. Отсутствие варианта ответа будет считаться неправильным.
  • Цепочка мыслей: Вы сдаете экзамен в исследовательских целях. Учитывая предоставленное изображение, продумайте шаг за шагом ответ на поставленный вопрос.

Хотя модель правильно ответила на 183 из 265 вопросов, она отказалась отвечать на 120. Большинство из них содержали изображение.

Мы не заметили такого поведения модели в ходе первоначального исследования, — говорит доктор Клочко.

Модель показала самую низкую точность (62,6%) при использовании коротких инструкций.

Наше исследование показало, что модель иногда даёт верные ответы на основании неверной интерпретации изображений. Это может иметь серьёзные последствия в клинической практике.

По словам доктора Клочко, необходимо разработать более строгие методы оценки эффективности больших языковых моделей в радиологии.

Он отметил, что GPT-4 Vision пока не подходит для работы в радиологии, поскольку могут возникнуть проблемы с интерпретацией изображений и ответы могут быть недостоверными.

03.09.2024

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

ИИ анализирует цветение злаков без помощи человека
ИИ анализирует цветение злаков без помощи человека

Ученые создали алгоритм, который учится сам&nb...

Социальный провал: как ИИ путает разговор с переходом улицы
Социальный провал: как ИИ путает разговор с переходом улицы

Оказывается, люди пока разбираются в соци...

Создана нейросеть для тестирования интерфейсов: как это работает
Создана нейросеть для тестирования интерфейсов: как это работает

Каждый день миллионы людей покупают товары, оп...

Диагноз от ChatGPT: почти как у терапевта, но без очереди
Диагноз от ChatGPT: почти как у терапевта, но без очереди

Использование генеративного ИИ для д...

Облака вместо складов: как ритейл выжимает максимум из цифры
Облака вместо складов: как ритейл выжимает максимум из цифры

Владимир Лебедев, директор по развитию би...

ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?
ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?

Если вы из 1,5 миллиарда пользовател...

ИИ на акустических волнах: тише едешь — дальше будешь
ИИ на акустических волнах: тише едешь — дальше будешь

Искусственный интеллект уже меняет нашу ж...

Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть
Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть

Эксперт по цифровым стратегиям Джулио Тос...

Море данных: физики доверили расчет жидкости ИИ
Море данных: физики доверили расчет жидкости ИИ

Искусственный интеллект уже изменил общес

Не биты, а кубиты: квантовые компьютеры играют в другой лиге
Не биты, а кубиты: квантовые компьютеры играют в другой лиге

Современные компьютеры, от смартфонов до&...

Квантовый мост: ученые соединили микроволны и свет в одном чипе
Квантовый мост: ученые соединили микроволны и свет в одном чипе

Физики из Гарвардской школы инженерии и&n...

40 000 точек вместо 12: наука усовершенствует слежение за взглядом
40 000 точек вместо 12: наука усовершенствует слежение за взглядом

Ученые из Университета Аризоны придумали,...

ИИ наступает: какие профессии выживут, а какие сдадут позиции
ИИ наступает: какие профессии выживут, а какие сдадут позиции

С каждым годом искусственный интеллект станови...

Защита на опережение: почему мир переходит на новое шифрование HQC
Защита на опережение: почему мир переходит на новое шифрование HQC

Национальный институт стандартов и технол...

Не просто облака, а целая экосистема: бизнес переосмыслил IT
Не просто облака, а целая экосистема: бизнес переосмыслил IT

Российский облачный рынок не просто расте...

Фотоны вместо битов: ученые придумали новый способ защиты данных
Фотоны вместо битов: ученые придумали новый способ защиты данных

Ученые из Пензенского государственного ун...

Сила света: ученые открыли новый способ хранения информации
Сила света: ученые открыли новый способ хранения информации

Ученые из Санкт-Петербургского государств...

ИИ после ChatGPT: куда движется искусственный интеллект
ИИ после ChatGPT: куда движется искусственный интеллект

В журнале Engineering недавно вышла статья, гд...

Индивидуальный подход в облаке: тренды 2025 года
Индивидуальный подход в облаке: тренды 2025 года

В 2025 году бизнес в России предъявляет н...

Облака под замком: как защитить данные в эпоху цифровых угроз
Облака под замком: как защитить данные в эпоху цифровых угроз

Международный облачный провайдер Serverspace п...

Машины, которые видят, слышат и создают: как ИИ меняет реальность
Машины, которые видят, слышат и создают: как ИИ меняет реальность

В последние десятилетия технологии сильно изме...

Банки, мошенники и ИИ: как ученые научили нейросети думать на два уровня
Банки, мошенники и ИИ: как ученые научили нейросети думать на два уровня

Ученые придумали новый способ обучать нейронны...

Облака на заказ: как бизнес находит идеальные IT-решения
Облака на заказ: как бизнес находит идеальные IT-решения

В 2025 году крупный и средний бизнес все&...

ИИ не создает неравенство — он учится ему у нас
ИИ не создает неравенство — он учится ему у нас

Исследователи говорят, что предвзятость И...

Поиск на сайте

ТОП - Новости мира, инновации

Математику лучше осваивать на жизненных задачах, чем на абстрактных примерах
Математику лучше осваивать на жизненных задачах, чем на абстрактных примерах
Контроффер на столе: кто кого переиграет в борьбе за сотрудника
Контроффер на столе: кто кого переиграет в борьбе за сотрудника
Память без розетки: давление заменяет электричество в новых чипах
Память без розетки: давление заменяет электричество в новых чипах
Ученые создали гибкий датчик в форме ДНК
Ученые создали гибкий датчик в форме ДНК
Ученые научили Изинга не жертвовать ни спинами, ни битами
Ученые научили Изинга не жертвовать ни спинами, ни битами
Вселенная под лупой: почему суперземель больше, чем мы думали
Вселенная под лупой: почему суперземель больше, чем мы думали
Секунды на вес золота: самый точный хронометр заработал на МКС
Секунды на вес золота: самый точный хронометр заработал на МКС
ДНК вместо биопсии: так начинается новая эра трансплантологии
ДНК вместо биопсии: так начинается новая эра трансплантологии
Математики определили условия идеальной синхронизации частот
Математики определили условия идеальной синхронизации частот
Разгрузили за ночь: что делает мозг, пока вы спите
Разгрузили за ночь: что делает мозг, пока вы спите
Астрономы увидели свечение водорода в дальнем ультрафиолете
Астрономы увидели свечение водорода в дальнем ультрафиолете
Новый алгоритм решил вековую проблему кристаллографии
Новый алгоритм решил вековую проблему кристаллографии
Не кочевать же с дизелем: как плавучие АЭС меняют правила игры
Не кочевать же с дизелем: как плавучие АЭС меняют правила игры
Железное дерево: ученые превращают дуб в материал будущего
Железное дерево: ученые превращают дуб в материал будущего
Не просто выжить, а двигаться: как спорт стал частью лечения рака
Не просто выжить, а двигаться: как спорт стал частью лечения рака

Новости компаний, релизы

Ход конем: в Шагонаре прошел первый шахматный турнир для дошколят
Пермский край разгоняется в гонке за беспилотными технологиями
В Якутии запустят производство дронов
Крипта для людей: почему сложные сервисы теряют пользователей
«Точки роста» в действии: как школы Симферопольского района перестали быть скучными