Nature Computational Science: ИИ может предсказывать события в жизни людей

Искусственный интеллект, разработанный для моделирования письменной речи, может быть использован для предсказания событий в жизни людей. Исследовательский проект DTU, Копенгагенского университета, МСЭ и Северо-восточного университета США показывает, что если использовать большие объемы данных о жизни людей и обучить так называемые модели-трансформеры, которые, как и ChatGPT, используются для обработки языка, то они могут систематизировать данные и предсказать, что произойдет в жизни человека, и даже определить время его смерти.

В новой научной статье «Использование последовательностей жизненных событий для прогнозирования человеческой жизни», опубликованной в журнале Nature Computational Science, исследователи проанализировали данные о здоровье и выходе на рынок труда 6 миллионов датчан в рамках модели, получившей название life2vec.

После того как модель прошла начальный этап обучения, то есть узнала закономерности в данных, она показала, что превосходит другие продвинутые нейронные сети (см. врезку «Факты») и с высокой точностью предсказывает такие результаты, как личность и время смерти.

Мы использовали эту модель для решения фундаментального вопроса: в какой степени мы можем предсказать события в вашем будущем на основе условий и событий в вашем прошлом? С научной точки зрения, нас волнует не столько само предсказание, сколько те аспекты данных, которые позволяют модели давать такие точные ответы, — говорит Суне Леманн, профессор DTU и первый автор статьи.

Предсказания времени смерти

Прогнозы Life2vec — это ответы на общие вопросы, такие как: «Смерть в течение четырех лет»?

Когда исследователи анализируют ответы модели, результаты согласуются с существующими выводами в области социальных наук; например, при прочих равных условиях люди, занимающие руководящие должности или имеющие высокий доход, имеют больше шансов выжить, в то время как мужчины, квалифицированные специалисты или люди с психическими заболеваниями связаны с более высоким риском смерти. Life2vec кодирует данные в большой системе векторов — математической структуре, которая упорядочивает различные данные. Модель сама решает, куда поместить данные о времени рождения, школьном обучении, образовании, зарплате, жилье и здоровье.

Самое интересное — рассматривать человеческую жизнь как длинную последовательность событий, подобно тому, как предложение в языке состоит из ряда слов. Обычно для решения таких задач используются трансформаторные модели в ИИ, но в наших экспериментах мы используем их для анализа того, что мы называем жизненными последовательностями, то есть событий, произошедших в жизни человека, — говорит Суне Леманн.

Этические вопросы

Исследователи, написавшие статью, отмечают, что модель life2vec окружена этическими вопросами, такими как защита конфиденциальных данных, неприкосновенность частной жизни и роль предвзятости в данных. Эти проблемы должны быть более глубоко изучены, прежде чем модель можно будет использовать, например, для оценки риска заражения человека болезнью или другими предотвратимыми жизненными событиями.

Модель открывает важные позитивные и негативные перспективы для обсуждения и политического решения. Подобные технологии прогнозирования жизненных событий и поведения человека уже используются сегодня в технологических компаниях, которые, например, отслеживают наше поведение в социальных сетях, составляют чрезвычайно точные профили и используют эти профили для прогнозирования нашего поведения и влияния на нас.

Эта дискуссия должна стать частью демократического разговора, чтобы мы задумались о том, куда нас ведут технологии и хотим ли мы такого развития событий, — говорит Суне Леманн.

По мнению исследователей, следующим шагом будет включение других типов информации, таких как текст и изображения или информация о наших социальных связях. Такое использование данных открывает совершенно новое взаимодействие между социальными и медицинскими науками.

Исследовательский проект

Исследовательский проект «Использование последовательностей жизненных событий для прогнозирования человеческой жизни» основан на данных рынка труда и данных Национального реестра пациентов (LPR) и Статистического управления Дании. Набор данных включает все 6 миллионов датчан и содержит информацию о доходах, зарплате, стипендии, типе работы, отрасли, социальных льготах и т. д. Набор данных о здоровье включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и степени срочности.

Набор данных охватывает период с 2008 по 2020 год, но в ряде анализов исследователи сосредоточились на периоде 2008-2016 годов и подгруппе лиц с ограничением по возрасту.

Модель-трансформер

Модель-трансформер — это архитектура данных с глубоким обучением, используемая для изучения языка и других задач. Модели могут быть обучены понимать и генерировать язык. Трансформаторная модель разработана быстрее и эффективнее предыдущих моделей и часто используется для обучения больших языковых моделей на больших массивах данных.

Нейронные сети

Нейронная сеть — это компьютерная модель, созданная по образцу мозга и нервной системы людей и животных. Существует множество различных типов нейронных сетей (например, трансформаторные модели). Как и мозг, нейронная сеть состоит из искусственных нейронов. Эти нейроны связаны между собой и могут посылать друг другу сигналы.

Каждый нейрон получает входные сигналы от других нейронов, а затем вычисляет выходной сигнал, который передается другим нейронам. Нейронная сеть может научиться решать задачи путем обучения на больших объемах данных. Нейронные сети опираются на обучающие данные, чтобы учиться и повышать свою точность с течением времени.

Но как только алгоритмы обучения отлажены, они становятся мощными инструментами в информатике и искусственном интеллекте, позволяющими классифицировать и группировать данные с высокой скоростью. Одна из самых известных нейронных сетей — поисковый алгоритм Google.

18.12.2023


Подписаться в Telegram



Net&IT

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое
Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое

Исследование профессора Университета штата Фло...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

PNAS: В тропосфере микробы могут путешествовать на тысячи километров
PNAS: В тропосфере микробы могут путешествовать на тысячи километров
Nature Photonics: Уникальный нанодиск продвигает исследования в области фотоники
Nature Photonics: Уникальный нанодиск продвигает исследования в области фотоники
FBINF: Искать триггеры рака стало проще — на помощь пришел компьютерный алгоритм
FBINF: Искать триггеры рака стало проще — на помощь пришел компьютерный алгоритм
Nature Biotechnology: Генетический алфавит расширили для создания новых белков
Nature Biotechnology: Генетический алфавит расширили для создания новых белков
PRSBBS: Эволюция крошечной косточки в колене помогла человеку ходить прямо
PRSBBS: Эволюция крошечной косточки в колене помогла человеку ходить прямо
ACS Central Science: Углеводные полимеры помогут очистить воду от загрязнителей
ACS Central Science: Углеводные полимеры помогут очистить воду от загрязнителей
New Phytologist: Длинные стебли цветов помогают мышам находить и опылять их
New Phytologist: Длинные стебли цветов помогают мышам находить и опылять их
Как общение человека и собаки влияет на мозг?
Как общение человека и собаки влияет на мозг?
JAMA Otolaryngology: Проблемы с горлом влияют на регуляцию кровяного давления
JAMA Otolaryngology: Проблемы с горлом влияют на регуляцию кровяного давления
Nature: Погибшие при воспалении клетки «сообщают» о потребности заживления раны
Nature: Погибшие при воспалении клетки «сообщают» о потребности заживления раны
«Зелёное» финансирование сокращает выбросы CO2 и помогает экономическому росту
«Зелёное» финансирование сокращает выбросы CO2 и помогает экономическому росту
Scientific Reports: У рыб обнаружены зачатки самосознания
Scientific Reports: У рыб обнаружены зачатки самосознания
Imaging Neuroscience: Устройство для визуализации мозга поможет понять аутизм
Imaging Neuroscience: Устройство для визуализации мозга поможет понять аутизм
Росатом и НИЯУ МИФИ открыли диджитал-центр в университете «Сириус»
Росатом и НИЯУ МИФИ открыли диджитал-центр в университете «Сириус»
Разработан метод улучшения изображения, полученного при низкой освещенности
Разработан метод улучшения изображения, полученного при низкой освещенности

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Ученые Казанского аграрного университета нашли способ повысить урожайность картофеля в Татарстане
Треть работодателей тратят на адаптацию одного нового сотрудника до 100 тысяч рублей
Ученые СПбГУ нашли «безопасную» зону для проведения операций при ишемии нижних конечностей
Химики СПбГУ: схожие органические катализаторы ускоряют реакции противоположно друг другу