Financial Analysts Journal: ChatGPT пока не может заменить финансовых спецов

В то время как большие языковые модели, такие как ChatGPT, хорошо справляются с выбором ответов на вопросы с несколькими вариантами ответов на экзаменах по финансовым лицензиям, они не справляются с более сложными задачами.

В исследовании, проведенном под руководством Университета штата Вашингтон, было проанализировано более 10 000 ответов на вопросы финансовых экзаменов, полученных с помощью языковых моделей искусственного интеллекта BARD, Llama и ChatGPT.

Исследователи попросили модели не только выбрать ответы, но и объяснить, что за ними стоит, а затем сравнили эти текстовые ответы с ответами людей. Хотя две версии ChatGPT лучше всего справились с этими задачами, они все же показали высокий уровень неточности при изучении более сложных тем.

Пока еще рано беспокоиться о том, что ChatGPT полностью займет рабочие места финансистов, — говорит автор исследования Ди Джей Фэйрхерст из Колледжа бизнеса Карсона.

Если речь идет о широких понятиях, по которым уже давно есть хорошие объяснения в Интернете, ChatGPT может проделать очень хорошую работу по синтезу этих понятий. Если же речь идет о конкретном, идиосинкразическом вопросе, то он будет испытывать серьезные трудности.

Для исследования, опубликованного в журнале Financial Analysts Journal, Фэрхерст и его соавтор Дэниел Грин из Университета Клемсона использовали вопросы из лицензионных экзаменов, включая экзамен Securities Industry Essentials, а также Series 6, 7, 65 и 66.

Чтобы выйти за рамки способности ИИ-моделей просто выбирать правильный ответ, исследователи попросили их давать письменные объяснения. Кроме того, они подобрали вопросы, основанные на конкретных рабочих задачах, которые в действительности могут выполнять финансовые специалисты.

Сдать сертификационные экзамены недостаточно. Нам нужно копнуть глубже, чтобы понять, на что действительно способны эти модели, — говорит Фэрхерст.

Из всех моделей платная версия ChatGPT, версия 4.0, показала наилучшие результаты, давая ответы, которые были наиболее похожи на ответы экспертов-людей. Ее точность также была на 18-28 процентных пунктов выше, чем у других моделей. Однако ситуация изменилась, когда исследователи доработали раннюю бесплатную версию ChatGPT 3.5, снабдив ее примерами правильных ответов и объяснениями. После такой настройки модель приблизилась к ChatGPT 4.0 по точности и даже превзошла ее в предоставлении ответов, схожих с ответами людей-профессионалов.

Однако обе модели все равно не справились с некоторыми типами вопросов. Хотя они хорошо справлялись с анализом операций с ценными бумагами и отслеживанием тенденций на финансовом рынке, модели давали более неточные ответы в специализированных ситуациях, таких как определение страхового покрытия клиента и его налогового статуса.

Фэрхерст и Грин вместе с докторантом ВГУ Адамом Бозманом сейчас работают над другими способами определить, что может и чего не может сделать ChatGPT в рамках проекта, в котором ему предлагается оценить потенциальные сделки по слиянию. Для этого они используют тот факт, что ChatGPT обучен на данных до сентября 2021 года, и используют сделки, заключенные после этой даты, когда результат уже известен. Предварительные результаты показывают, что пока модель ИИ не очень хорошо справляется с этой задачей.

В целом, по мнению исследователей, ChatGPT все же лучше использовать как вспомогательный инструмент, а не как замену опытному финансовому специалисту. С другой стороны, ИИ может изменить подход некоторых инвестиционных банков к найму аналитиков начального уровня.

Практика привлечения нескольких человек в качестве младших аналитиков, их соревнование и удержание победителей — все это становится гораздо более дорогостоящим, — говорит Фэйрхерст.

Так что это может означать сокращение числа таких вакансий, но не потому, что ChatGPT лучше аналитиков, а потому, что мы просим младших аналитиков выполнять более трудоемкие задачи.

Ранее ученые заявили, что творческий потенциал ИИ выше, чем у человека.

18.12.2024


Подписаться в Telegram



Net&IT

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Студенты ТИСБИ разработали проект онлайн-платформы для геймеров
Студенты ТИСБИ разработали проект онлайн-платформы для геймеров

Студенты Университета управления ТИСБИ в ...

Nature: Созданные ИИ тексты будут размечаться водяными знаками
Nature: Созданные ИИ тексты будут размечаться водяными знаками

Исследователи из лондонской лаборатории G...

Российская игра о наполеоновских войнах станет бесплатной
Российская игра о наполеоновских войнах станет бесплатной

У российской аудитории растет интерес к в

В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»
В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»

В Новосибирском государственном университете з...

Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме
Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме

Технологические корпорации всё чаще обращ...

HB&ET: Пожилые чаще молодых относятся к ИИ как к кому-то живому
HB&ET: Пожилые чаще молодых относятся к ИИ как к кому-то живому

В исследовании Имперского колледжа Лондона люд...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

В СПбГУ создали спектрофотометр на основе напечатанной люминесцирующей кюветы
В СПбГУ создали спектрофотометр на основе напечатанной люминесцирующей кюветы
Financial Analysts Journal: ChatGPT пока не может заменить финансовых спецов
Financial Analysts Journal: ChatGPT пока не может заменить финансовых спецов
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Global Change Biology: Световое загрязнение манит хищников к коралловым рифам
Global Change Biology: Световое загрязнение манит хищников к коралловым рифам
Нанохранение данных: новый полимер записывает информацию в виде вмятин
Нанохранение данных: новый полимер записывает информацию в виде вмятин
mBio: Как кишечник реагирует на вредные бактерии и что это значит для здоровья
mBio: Как кишечник реагирует на вредные бактерии и что это значит для здоровья
AJL: Обнаружено несоответствие состава атмосферы экзопланеты и окружающего диска
AJL: Обнаружено несоответствие состава атмосферы экзопланеты и окружающего диска
PRX Quantum: Как атомы в оптической полости взаимодействуют со светом
PRX Quantum: Как атомы в оптической полости взаимодействуют со светом
Жизнь без внутреннего голоса: что такое анауралия и как она влияет на людей
Жизнь без внутреннего голоса: что такое анауралия и как она влияет на людей
Бонобо без мамы: реабилитация в заповеднике помогает им стать частью общества
Бонобо без мамы: реабилитация в заповеднике помогает им стать частью общества
Наносистема доставки молекул предвещает безопасную эру в разработке лекарств
Наносистема доставки молекул предвещает безопасную эру в разработке лекарств
Гигантский вирус кодирует ключевую часть белкового механизма клеточной жизни
Гигантский вирус кодирует ключевую часть белкового механизма клеточной жизни
Journal of Ethology: Земляные белки оказались плотоядными животными
Journal of Ethology: Земляные белки оказались плотоядными животными
Эксперт рассказала, как геймификация повышает успеваемость студентов в два раза
Эксперт рассказала, как геймификация повышает успеваемость студентов в два раза
SciRep: Робот-реабилитолог может предложить оптимальное лечение после инсульта
SciRep: Робот-реабилитолог может предложить оптимальное лечение после инсульта

Новости компаний, релизы

Синергия Межвузовского кампуса ускорила патентование сырьевой смеси для строительной 3D-печати
Нижегородский ЗГМ провел испытания разработанных по нацпроекту радиопоглощающих материалов
Набережночелнинский педагогический университет подписал ряд соглашений с университетами Туниса
Пироговский университет стал победителем премии «Сноба» «Сделано в России»
Главный рецепт успешной разработки — это управленческое умение налаживать общение