Нейронные сети в опасности: как злоумышленники могут запутать ИИ

Большинство искусственных интеллектуальных систем основано на нейронных сетях — алгоритмах, созданных по образцу биологических нейронов, находящихся в головном мозге. Такие сети могут состоять из нескольких слоев, в один из которых поступают входные данные, а в другой — выходные.

Выходные данные могут использоваться для принятия автоматических решений, например, в автомобилях без водителя. Атаки, направленные на введение нейронной сети в заблуждение, могут включать использование уязвимостей во входных слоях, но обычно при разработке защиты учитывается только начальный входной слой. Впервые исследователи дополнили внутренние слои нейронной сети процессом, включающим случайный шум, для повышения ее устойчивости.

Искусственный интеллект (ИИ) стал довольно распространенным явлением: скорее всего, у вас есть смартфон с ИИ-помощником или вы пользуетесь поисковой системой, работающей на основе ИИ. Хотя это широкий термин, который может включать в себя множество различных способов обработки информации и принятия решений, системы искусственного интеллекта часто строятся на основе искусственных нейронных сетей (ИНС), аналогичных мозгу. И, как и мозг, ИНС могут иногда сбиваться с толку, либо случайно, либо в результате преднамеренных действий третьих лиц. Подумайте о чем-то вроде оптической иллюзии — вам может показаться, что вы смотрите на одну вещь, а на самом деле вы смотрите на другую.

Разница между тем, что может запутать ИНС, и тем, что может запутать нас, заключается в том, что некоторые визуальные данные могут выглядеть совершенно нормально или, по крайней мере, быть понятными для нас, но, тем не менее, могут быть интерпретированы ИНС как нечто совершенно иное.

Тривиальным примером может быть система классификации изображений, принимающая кошку за собаку, а более серьезным — автомобиль без водителя, принимающий стоп-сигнал за знак «Право проезда». И это не только уже ставший спорным пример с автомобилями без водителя; существуют системы медицинской диагностики и многие другие чувствительные приложения, которые принимают входные данные и информируют, или даже принимают, решения, которые могут повлиять на людей.

Поскольку входные данные не всегда визуальны, не всегда легко с первого взгляда проанализировать, почему система могла допустить ошибку. Злоумышленники, пытающиеся нарушить работу системы, основанной на ИНС, могут воспользоваться этим, тонко изменяя предполагаемую модель входных данных таким образом, чтобы она была неверно интерпретирована, и система повела себя неправильно, возможно, даже проблемно. Существуют некоторые методы защиты от подобных атак, но они имеют свои ограничения. Недавний выпускник Джумпей Укита и профессор Кеничи Оки с кафедры физиологии Высшей медицинской школы Токийского университета разработали и протестировали новый способ улучшения защиты ANN.

Нейронные сети обычно состоят из слоев виртуальных нейронов. Первые слои часто отвечают за анализ входных данных, определяя элементы, соответствующие определенному входу, — говорит Охки.

Злоумышленник может предоставить изображение с артефактами, которые обманут сеть и заставят ее неправильно классифицировать его. Типичной защитой от такой атаки может быть преднамеренное введение шума в этот первый слой. Звучит нелогично, что это может помочь, но таким образом можно добиться большей адаптации к визуальной сцене или другому набору входных данных. Однако этот метод не всегда столь эффективен, и мы подумали, что можем улучшить ситуацию, заглянув не только на входной слой, но и дальше внутрь сети.

Укита и Оки — не просто ученые-компьютерщики. Они также изучали человеческий мозг, и это вдохновило их на использование известного им явления в ANN. Речь идет о добавлении шума не только во входной слой, но и в более глубокие слои. Обычно этого избегают, поскольку опасаются, что это повлияет на эффективность работы сети в обычных условиях. Однако дуэт обнаружил, что это не так, и вместо этого шум способствовал повышению адаптивности тестовой ANN, что снизило ее восприимчивость к симулированным атакам противника.

В первую очередь мы разработали гипотетический метод атаки, который бы проникал глубже входного слоя. Такая атака должна была бы противостоять устойчивости сети со стандартной защитой от шума на входном слое. Мы назвали эти атаки примерами состязаний в пространстве признаков, — говорит Укита.

Эти атаки осуществляются путем подачи на вход сигнала, заведомо далекого, а не близкого к тому, который ANN может правильно классифицировать. Но хитрость заключается в том, что вместо этого на глубокие слои подаются тонкие вводящие в заблуждение артефакты. После того как мы продемонстрировали опасность такой атаки, мы ввели случайный шум в глубокие скрытые слои сети, чтобы повысить их адаптивность и, следовательно, способность к защите. Мы рады сообщить, что это работает.

Несмотря на то, что новая идея оказалась надежной, команда хочет доработать ее, чтобы сделать еще более эффективной против ожидаемых атак, а также против других видов атак, которые они еще не проверили. В настоящее время защита работает только против этого конкретного вида атак.

Будущие злоумышленники могут попытаться рассмотреть атаки, способные избежать шума в пространстве признаков, который мы рассматривали в этом исследовании, — сказал Укита.

Действительно, атака и защита — это две стороны одной медали; это гонка вооружений, от которой не отступит ни одна из сторон, поэтому нам необходимо постоянно повторять, совершенствовать и внедрять новые идеи, чтобы защитить системы, которыми мы пользуемся каждый день.

16.09.2023


Подписаться в Telegram



Net&IT

Искусственный интеллект может превзойти человеческий мозг
Искусственный интеллект может превзойти человеческий мозг

Ощупывание кошачьей шерсти может дать некотору...

Нейронные сети в опасности: как злоумышленники могут запутать ИИ
Нейронные сети в опасности: как злоумышленники могут запутать ИИ

Большинство искусственных интеллектуальных сис...

ChatGPT почти такой же хороший диагност, как доктор Хаус
ChatGPT почти такой же хороший диагност, как доктор Хаус

Чат-бот с искусственным интеллектом ChatG...

QS&T: Ученые создали самый точный метод управления квантовыми компьютерами
QS&T: Ученые создали самый точный метод управления квантовыми компьютерами

С помощью лазерного излучения исследователи ра...

New Phytologist: ИИ поможет распознавать аллергенную пыльцу
New Phytologist: ИИ поможет распознавать аллергенную пыльцу

Новая система, сочетающая в себе быстрое ...

Российские игры покоряют мир: Atomic Heart заняла первое место на Steam
Российские игры покоряют мир: Atomic Heart заняла первое место на Steam

В этом году российская игровая индустрия продо...

HV&I: ChatGPT помогает выявлять фейки о вакцинации
HV&I: ChatGPT помогает выявлять фейки о вакцинации

Чат-бот ChatGPT может помочь увеличить количес...

Те, у кого нет AR-очков, уязвимы перед теми, у кого они есть
Те, у кого нет AR-очков, уязвимы перед теми, у кого они есть

Тот, кто носит очки дополненной реальност...

Nature: Научная группа разработала критерии определения сознания ИИ
Nature: Научная группа разработала критерии определения сознания ИИ

В этом может помочь контрольный список, состав...

JAMA Oncology: ChatGPT еще не готов заменить врачей-онкологов
JAMA Oncology: ChatGPT еще не готов заменить врачей-онкологов

Когда исследователи попросили чатбот назначить...

Computers in Human Behavior: Социальные сети не провоцируют депрессию у детей
Computers in Human Behavior: Социальные сети не провоцируют депрессию у детей

Дети действительно проводят много времени в&nb...

Что по здоровью на TikTok? Ничего нового
Что по здоровью на TikTok? Ничего нового

Сексуальное здоровье, диета и физические ...

Новый материал повышает эффективность охлаждения электроники на 210%
Новый материал повышает эффективность охлаждения электроники на 210%

Электроника следующего поколения будет иметь б...

Нейросети как люди — учатся всю жизнь
Нейросети как люди — учатся всю жизнь

Нейронные сети или нейросети, а еще&...

Разработано новое сверхнадежное оптоволокно
Разработано новое сверхнадежное оптоволокно

Оптическое волокно служит основой современных ...

Разработана новая архитектура для создания квантового суперкомпьютера
Разработана новая архитектура для создания квантового суперкомпьютера

Квантовые компьютеры могут выполнять определен...

Nike запустил собственную платформу NFT
Nike запустил собственную платформу NFT

Всемирно известный спортивный бренд Nike запус...

Поиск на сайте

Магазин

  
Silicon Power Slim S55 120GB (SP120GBSS3S55S25) SSD-накопитель4290.00 руб.

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Как выглядит работающий рекламный баннер
Как выглядит работающий рекламный баннер
Деревья в опасности: грибы-паразиты могут уничтожить целые леса
Деревья в опасности: грибы-паразиты могут уничтожить целые леса
Древние охотники-собиратели жили в условиях постоянного напряжения и насилия
Древние охотники-собиратели жили в условиях постоянного напряжения и насилия
Алмазные материалы могут превращать парниковый газ в ценное топливо
Алмазные материалы могут превращать парниковый газ в ценное топливо
Новый инструмент редактирования генов может быть опасен для здоровья
Новый инструмент редактирования генов может быть опасен для здоровья
Носимое устройство для родовых кровотечений: спасение или новая угроза?
Носимое устройство для родовых кровотечений: спасение или новая угроза?
Новое покрытие-хамелеон изменит способ обогрева и охлаждения зданий
Новое покрытие-хамелеон изменит способ обогрева и охлаждения зданий
Орангутанг, а не шимпанзе, является предком человека
Орангутанг, а не шимпанзе, является предком человека
Городские птицы заплатили за свет глазами
Городские птицы заплатили за свет глазами
Забудьте о достижениях: исследование показало, что они не делают вас счастливыми
Забудьте о достижениях: исследование показало, что они не делают вас счастливыми
Прекрасным дамам - прекрасные смартфоны
Прекрасным дамам - прекрасные смартфоны
Разработан алгоритм определения продажности сайтов
Разработан алгоритм определения продажности сайтов
Исследована галактика с активным формирование звезд
Исследована галактика с активным формирование звезд
Современные технологии и инновации в полиграфии
Современные технологии и инновации в полиграфии
Разработан новый метод локальной иммунотерапии для лечения меланомы
Разработан новый метод локальной иммунотерапии для лечения меланомы

Новости компаний, релизы

КАИ и Микрон будут готовить инженерные кадры для микроэлектроники
КАИ и Микрон будут готовить инженерные кадры для микроэлектроники
В КНИТУ проходят семинары Минобрнауки России по вопросам защиты государственной тайны
В КНИТУ проходят семинары Минобрнауки России по вопросам защиты государственной тайны
У женщин, прошедших силиконовую имплантацию груди, обнаружены нарушения иммунитета
У женщин, прошедших силиконовую имплантацию груди, обнаружены нарушения иммунитета
Исследование лихенологов СПбГУ поможет вернуть каменным мавзолеям Башкирии средневековый вид
Исследование лихенологов СПбГУ поможет вернуть каменным мавзолеям Башкирии средневековый вид
Ученые ТПУ создали новый вид функционально-градиентной оптической керамики
Ученые ТПУ создали новый вид функционально-градиентной оптической керамики