Financial Analysts Journal: ChatGPT пока не может заменить финансовых спецов

В то время как большие языковые модели, такие как ChatGPT, хорошо справляются с выбором ответов на вопросы с несколькими вариантами ответов на экзаменах по финансовым лицензиям, они не справляются с более сложными задачами.

В исследовании, проведенном под руководством Университета штата Вашингтон, было проанализировано более 10 000 ответов на вопросы финансовых экзаменов, полученных с помощью языковых моделей искусственного интеллекта BARD, Llama и ChatGPT.

Исследователи попросили модели не только выбрать ответы, но и объяснить, что за ними стоит, а затем сравнили эти текстовые ответы с ответами людей. Хотя две версии ChatGPT лучше всего справились с этими задачами, они все же показали высокий уровень неточности при изучении более сложных тем.

Пока еще рано беспокоиться о том, что ChatGPT полностью займет рабочие места финансистов, — говорит автор исследования Ди Джей Фэйрхерст из Колледжа бизнеса Карсона.

Если речь идет о широких понятиях, по которым уже давно есть хорошие объяснения в Интернете, ChatGPT может проделать очень хорошую работу по синтезу этих понятий. Если же речь идет о конкретном, идиосинкразическом вопросе, то он будет испытывать серьезные трудности.

Для исследования, опубликованного в журнале Financial Analysts Journal, Фэрхерст и его соавтор Дэниел Грин из Университета Клемсона использовали вопросы из лицензионных экзаменов, включая экзамен Securities Industry Essentials, а также Series 6, 7, 65 и 66.

Чтобы выйти за рамки способности ИИ-моделей просто выбирать правильный ответ, исследователи попросили их давать письменные объяснения. Кроме того, они подобрали вопросы, основанные на конкретных рабочих задачах, которые в действительности могут выполнять финансовые специалисты.

Сдать сертификационные экзамены недостаточно. Нам нужно копнуть глубже, чтобы понять, на что действительно способны эти модели, — говорит Фэрхерст.

Из всех моделей платная версия ChatGPT, версия 4.0, показала наилучшие результаты, давая ответы, которые были наиболее похожи на ответы экспертов-людей. Ее точность также была на 18-28 процентных пунктов выше, чем у других моделей. Однако ситуация изменилась, когда исследователи доработали раннюю бесплатную версию ChatGPT 3.5, снабдив ее примерами правильных ответов и объяснениями. После такой настройки модель приблизилась к ChatGPT 4.0 по точности и даже превзошла ее в предоставлении ответов, схожих с ответами людей-профессионалов.

Однако обе модели все равно не справились с некоторыми типами вопросов. Хотя они хорошо справлялись с анализом операций с ценными бумагами и отслеживанием тенденций на финансовом рынке, модели давали более неточные ответы в специализированных ситуациях, таких как определение страхового покрытия клиента и его налогового статуса.

Фэрхерст и Грин вместе с докторантом ВГУ Адамом Бозманом сейчас работают над другими способами определить, что может и чего не может сделать ChatGPT в рамках проекта, в котором ему предлагается оценить потенциальные сделки по слиянию. Для этого они используют тот факт, что ChatGPT обучен на данных до сентября 2021 года, и используют сделки, заключенные после этой даты, когда результат уже известен. Предварительные результаты показывают, что пока модель ИИ не очень хорошо справляется с этой задачей.

В целом, по мнению исследователей, ChatGPT все же лучше использовать как вспомогательный инструмент, а не как замену опытному финансовому специалисту. С другой стороны, ИИ может изменить подход некоторых инвестиционных банков к найму аналитиков начального уровня.

Практика привлечения нескольких человек в качестве младших аналитиков, их соревнование и удержание победителей — все это становится гораздо более дорогостоящим, — говорит Фэйрхерст.

Так что это может означать сокращение числа таких вакансий, но не потому, что ChatGPT лучше аналитиков, а потому, что мы просим младших аналитиков выполнять более трудоемкие задачи.

Ранее ученые заявили, что творческий потенциал ИИ выше, чем у человека.

18.12.2024

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Из слов в объем: Kandinsky 3D лепит модели на лету
Из слов в объем: Kandinsky 3D лепит модели на лету

Дизайнеры, инженеры, архитекторы — ...

Лишние узлы — долой: нейросеть научилась видеть главное в графах
Лишние узлы — долой: нейросеть научилась видеть главное в графах

Исследователи из Университета Кумамото ра...

Как ИИ выкручивается, когда не знает языковых правил
Как ИИ выкручивается, когда не знает языковых правил

Исследователи из Оксфорда и Allen In...

Банк для бизнеса доступен на российской мобильной ОС
Банк для бизнеса доступен на российской мобильной ОС

СберБизнес — мобильное приложение д...

От частного к общему: как алгоритмы учатся видеть связи между словами
От частного к общему: как алгоритмы учатся видеть связи между словами

В мире обработки естественного языка есть две&...

Заговор в пудре и шелках: как выжить при дворе Елизаветы Петровны
Заговор в пудре и шелках: как выжить при дворе Елизаветы Петровны

Студия Много Много игр выпустила новую ви...

Опасен ли искусственный интеллект для человечества
Опасен ли искусственный интеллект для человечества

Искусственный интеллект перестал быть фантасти...

Люди с ограниченной подвижностью смогут играть в VR
Люди с ограниченной подвижностью смогут играть в VR

Команда исследователей из Университета Ва...

Почти идеально: как квантовые компьютеры обходят суперкомпьютеры
Почти идеально: как квантовые компьютеры обходят суперкомпьютеры

Квантовые компьютеры могут решать задачи оптим...

Дипфейки научились дышать: как подделки имитируют сердцебиение
Дипфейки научились дышать: как подделки имитируют сердцебиение

Представьте мир, где дипфейки стали насто...

ИИ анализирует цветение злаков без помощи человека
ИИ анализирует цветение злаков без помощи человека

Ученые создали алгоритм, который учится сам&nb...

Социальный провал: как ИИ путает разговор с переходом улицы
Социальный провал: как ИИ путает разговор с переходом улицы

Оказывается, люди пока разбираются в соци...

Создана нейросеть для тестирования интерфейсов: как это работает
Создана нейросеть для тестирования интерфейсов: как это работает

Каждый день миллионы людей покупают товары, оп...

Диагноз от ChatGPT: почти как у терапевта, но без очереди
Диагноз от ChatGPT: почти как у терапевта, но без очереди

Использование генеративного ИИ для д...

Облака вместо складов: как ритейл выжимает максимум из цифры
Облака вместо складов: как ритейл выжимает максимум из цифры

Владимир Лебедев, директор по развитию би...

ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?
ИИ-Тесла против мультяшного Эйнштейна: кому вы поверите?

Если вы из 1,5 миллиарда пользовател...

ИИ на акустических волнах: тише едешь — дальше будешь
ИИ на акустических волнах: тише едешь — дальше будешь

Искусственный интеллект уже меняет нашу ж...

Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть
Цифровой соблазн: почему мы теряем голову от ИИ и как ее вернуть

Эксперт по цифровым стратегиям Джулио Тос...

Море данных: физики доверили расчет жидкости ИИ
Море данных: физики доверили расчет жидкости ИИ

Искусственный интеллект уже изменил общес

Не биты, а кубиты: квантовые компьютеры играют в другой лиге
Не биты, а кубиты: квантовые компьютеры играют в другой лиге

Современные компьютеры, от смартфонов до&...

Квантовый мост: ученые соединили микроволны и свет в одном чипе
Квантовый мост: ученые соединили микроволны и свет в одном чипе

Физики из Гарвардской школы инженерии и&n...

40 000 точек вместо 12: наука усовершенствует слежение за взглядом
40 000 точек вместо 12: наука усовершенствует слежение за взглядом

Ученые из Университета Аризоны придумали,...

Поиск на сайте

ТОП - Новости мира, инновации

Health Data Science: Одиночество повышает риск потери слуха
Health Data Science: Одиночество повышает риск потери слуха
Кожа щек у младенцев предупреждает об экземе раньше других зон
Кожа щек у младенцев предупреждает об экземе раньше других зон
Темная материя — остывший кофе Вселенной
Темная материя — остывший кофе Вселенной
Ударная геология: разлет обломков расскажет все о недрах планет
Ударная геология: разлет обломков расскажет все о недрах планет
Ученые нашли зону мозга, отвечающую за воображаемые страхи
Ученые нашли зону мозга, отвечающую за воображаемые страхи
Загрязнение воздуха повышает риск эпилепсии
Загрязнение воздуха повышает риск эпилепсии
Двуликий CO₂: из угрозы в ресурс за 2000 часов
Двуликий CO₂: из угрозы в ресурс за 2000 часов
Личинки на крючке: ученые нашли способ заманить кораллы на поврежденные рифы
Личинки на крючке: ученые нашли способ заманить кораллы на поврежденные рифы
Антитела-предатели: почему при волчанке кровь становится врагом организма
Антитела-предатели: почему при волчанке кровь становится врагом организма
Ловушка для дофамина: почему мы повторяем ошибки и как это исправить
Ловушка для дофамина: почему мы повторяем ошибки и как это исправить

Новости компаний, релизы

От школьных проектов до заводских решений: чем живет нефтехимия в Нижнекамске
Три кита стабильности и цифровой рубль: о чем говорили на Альфа-Саммите
Бактерии против грибов: как наука защищает картофель без химии
Овцы вместо мышей: как ученые нашли новый способ тестировать материалы для зубов
Пробирки, зелень и взрывы: фестиваль для тех, кто любит науку