Привыкнув доверять, люди не поймут, когда ИИ начнет манипулировать

Согласно обширному обзору, в настоящее время нет доказательств того, что ИИ можно безопасно контролировать, а без доказательств того, что ИИ можно контролировать, его не следует разрабатывать.

Несмотря на признание того, что проблема управления ИИ может быть одной из самых важных проблем, стоящих перед человечеством, она остается малопонятной, плохо определенной и малоизученной, объясняет доктор Роман В. Ямпольский.

В своей книге «ИИ: необъяснимый, непредсказуемый, неконтролируемый» эксперт по безопасности ИИ доктор Ямпольский рассматривает возможности ИИ кардинально изменить общество, причем не всегда в нашу пользу.

Он объясняет:

Мы столкнулись с почти гарантированным событием, способным привести к экзистенциальной катастрофе. Неудивительно, что многие считают это самой важной проблемой, с которой когда-либо сталкивалось человечество. Результатом может стать процветание или вымирание, и судьба Вселенной висит на волоске.

Неконтролируемый сверхинтеллект

Доктор Ямпольский провел обширный обзор научной литературы по ИИ и утверждает, что не нашел доказательств того, что ИИ можно безопасно контролировать — и даже если частичный контроль существует, его будет недостаточно.

Он объясняет:

Почему так много исследователей полагают, что проблема управления ИИ разрешима? Насколько нам известно, для этого нет никаких доказательств, никаких подтверждений. Прежде чем приступать к созданию управляемого ИИ, важно показать, что проблема решаема.

Это, в сочетании со статистикой, которая показывает, что развитие сверхразума ИИ — почти гарантированное событие, говорит о том, что мы должны поддерживать значительные усилия по обеспечению безопасности ИИ.

Он утверждает, что наша способность создавать интеллектуальное программное обеспечение намного превосходит нашу способность контролировать или даже проверять его. Проведя всесторонний обзор литературы, он считает, что передовые интеллектуальные системы никогда не смогут быть полностью контролируемыми и поэтому всегда будут представлять определенный уровень риска, независимо от того, какую пользу они приносят. Он считает, что целью сообщества ИИ должна быть минимизация такого риска при максимальном увеличении потенциальной пользы.

Каковы препятствия?

ИИ (и сверхинтеллект) отличаются от других программ способностью обучаться новому поведению, корректировать свою работу и действовать полуавтономно в новых ситуациях.

Одна из проблем, связанных с обеспечением безопасности ИИ, заключается в том, что количество возможных решений и ошибок сверхразумного существа по мере роста его возможностей бесконечно, поэтому существует бесконечное количество проблем, связанных с безопасностью. Простого прогнозирования невозможных проблем и защиты от них в патчах безопасности может быть недостаточно.

В то же время, объясняет Ямпольский, ИИ не может объяснить, что он решил, и/или мы не можем понять данное объяснение, поскольку люди недостаточно умны, чтобы понять реализованные концепции. Если мы не понимаем решений ИИ и у нас есть только «черный ящик», мы не сможем разобраться в проблеме и снизить вероятность будущих аварий.

Например, системам ИИ уже поручают принимать решения в области здравоохранения, инвестирования, трудоустройства, банковского дела, безопасности и т. д. Такие системы должны быть способны объяснить, как они принимают решения, в частности, показать, что они не предвзяты.

Ямпольский объясняет:

Если мы привыкнем принимать ответы ИИ без объяснений, по сути, воспринимая его как систему Oracle, мы не сможем определить, что он начинает давать неверные или манипулятивные ответы.

Контроль над неконтролируемым

По мере роста возможностей ИИ его автономность также увеличивается, но наш контроль над ним уменьшается, объясняет Ямпольский, а увеличение автономности — это синоним снижения безопасности.

Например, чтобы суперинтеллект не приобретал неточные знания и не устранял предвзятость своих программистов, он может игнорировать все такие знания и заново открывать/доказывать все с нуля, но это также устранит любую прочеловеческую предвзятость.

Менее интеллектуальные агенты (люди) не могут постоянно контролировать более интеллектуальных агентов (ASI). Это происходит не потому, что мы не можем найти безопасный дизайн для сверхразума в огромном пространстве всех возможных дизайнов, а потому, что такой дизайн невозможен, его не существует. Сверхразум не бунтует, он изначально неконтролируем, — объясняет ученый.

Человечество стоит перед выбором: либо мы становимся похожими на младенцев, о которых заботятся, но не контролируют, либо мы отказываемся от услужливого опекуна, но остаемся ответственными и свободными.

Он предполагает, что можно найти точку равновесия, в которой мы пожертвуем некоторыми возможностями в обмен на некоторый контроль, но при этом предоставим системе определенную степень автономии.

Согласование человеческих ценностей

Одно из предложений по контролю — создать машину, которая будет точно выполнять приказы человека, но Ямпольский указывает на возможность противоречивых приказов, неправильного толкования или злонамеренного использования.

Он объясняет:

Люди в управлении могут приводить к противоречивым или явно злонамеренным приказам, в то время как ИИ в управлении означает, что люди не являются таковыми.

Если бы ИИ действовал скорее как советник, он мог бы обойти проблемы с неправильной интерпретацией прямых приказов и возможностью злонамеренных распоряжений, но автор утверждает, что для того, чтобы ИИ был полезным советником, он должен обладать собственными высшими ценностями.

Большинство исследователей безопасности ИИ ищут способ привести будущий сверхразум в соответствие с ценностями человечества. ИИ, ориентированный на ценности, будет предвзятым по определению, прочеловеческим, хорошим или плохим — все равно предвзятым. Парадокс ИИ, ориентированного на ценности, заключается в том, что человек, явно приказывающий системе ИИ сделать что-то , может получить «нет», в то время как система попытается сделать то, что человек на самом деле хочет. Человечество либо защищают, либо уважают, но не то и другое, — отмечает исследователь.

Минимизация риска

По его словам, чтобы минимизировать риск, связанный с ИИ, необходимо, чтобы его можно было изменять с помощью опций «отмены», ограничить, сделать прозрачным и понятным на человеческом языке.

Он предлагает разделить все ИИ на контролируемые и неконтролируемые, ничего не исключать и рассмотреть возможность введения ограниченного моратория или даже частичного запрета на определенные виды технологий ИИ.

Вместо того чтобы отчаиваться, ученый заключает:

Скорее это повод для большего числа людей копать глубже и увеличивать усилия и финансирование исследований в области безопасности ИИ. Возможно, мы никогда не достигнем 100% безопасного ИИ, но мы можем сделать ИИ более безопасным пропорционально нашим усилиям, а это гораздо лучше, чем ничего не делать. Мы должны использовать эту возможность с умом.

12.02.2024


Подписаться в Telegram



Net&IT

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое
Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое

Исследование профессора Университета штата Фло...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

PNAS: В тропосфере микробы могут путешествовать на тысячи километров
PNAS: В тропосфере микробы могут путешествовать на тысячи километров
FBINF: Искать триггеры рака стало проще — на помощь пришел компьютерный алгоритм
FBINF: Искать триггеры рака стало проще — на помощь пришел компьютерный алгоритм
Nature Photonics: Уникальный нанодиск продвигает исследования в области фотоники
Nature Photonics: Уникальный нанодиск продвигает исследования в области фотоники
PRSBBS: Эволюция крошечной косточки в колене помогла человеку ходить прямо
PRSBBS: Эволюция крошечной косточки в колене помогла человеку ходить прямо
Nature Biotechnology: Генетический алфавит расширили для создания новых белков
Nature Biotechnology: Генетический алфавит расширили для создания новых белков
ACS Central Science: Углеводные полимеры помогут очистить воду от загрязнителей
ACS Central Science: Углеводные полимеры помогут очистить воду от загрязнителей
New Phytologist: Длинные стебли цветов помогают мышам находить и опылять их
New Phytologist: Длинные стебли цветов помогают мышам находить и опылять их
JAMA Otolaryngology: Проблемы с горлом влияют на регуляцию кровяного давления
JAMA Otolaryngology: Проблемы с горлом влияют на регуляцию кровяного давления
Как общение человека и собаки влияет на мозг?
Как общение человека и собаки влияет на мозг?
Nature: Погибшие при воспалении клетки «сообщают» о потребности заживления раны
Nature: Погибшие при воспалении клетки «сообщают» о потребности заживления раны
«Зелёное» финансирование сокращает выбросы CO2 и помогает экономическому росту
«Зелёное» финансирование сокращает выбросы CO2 и помогает экономическому росту
Scientific Reports: У рыб обнаружены зачатки самосознания
Scientific Reports: У рыб обнаружены зачатки самосознания
Imaging Neuroscience: Устройство для визуализации мозга поможет понять аутизм
Imaging Neuroscience: Устройство для визуализации мозга поможет понять аутизм
Росатом и НИЯУ МИФИ открыли диджитал-центр в университете «Сириус»
Росатом и НИЯУ МИФИ открыли диджитал-центр в университете «Сириус»
Разработан метод улучшения изображения, полученного при низкой освещенности
Разработан метод улучшения изображения, полученного при низкой освещенности

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Ученые Казанского аграрного университета нашли способ повысить урожайность картофеля в Татарстане
Треть работодателей тратят на адаптацию одного нового сотрудника до 100 тысяч рублей
Химики СПбГУ: схожие органические катализаторы ускоряют реакции противоположно друг другу
Ученые ТПУ в составе международной коллаборации выяснили, что смертность от болезней сердца в мире снизилась на 35% за после...