IEEE Access: Ученые улучшили модели автоматической обрезки изображений

Обрезка изображений — важная задача в разных областях: от социальных сетей и электронной коммерции до компьютерного зрения.

Обрезка помогает сохранить качество изображения, не меняя его размер и не расходуя вычислительные ресурсы. Она также полезна, когда изображение должно соответствовать определённому соотношению сторон (например, в миниатюрах).

За последние десять лет инженеры разработали различные модели машинного обучения для автоматической обрезки изображений. Эти модели сохраняют наиболее важные части входного изображения.

Модели машинного обучения могут ошибаться и быть необъективными, что иногда приводит пользователей к юридическим проблемам. Например, в 2020 году компания X (бывший Twitter) получила иск из-за того, что её функция автоматического кадрирования скрыла информацию об авторских правах на изображении. Чтобы избежать подобных проблем, нужно понять, почему модели машинного обучения для обрезки изображений работают неудачно.

Исследователи из Университета Дошиша (Япония) разработали новые методы создания сложных примеров для задачи обрезки изображений. Они вносят незаметные искажения в изображение, чтобы обмануть модель и заставить её обрезать нужные области, даже если изначально она этого не планировала.

Докторант Масатомо Йошида, ведущий исследователь, объясняет мотивацию работы так:

Нужно доработать модели обрезки изображений, чтобы они учитывали намерения пользователей и были беспристрастными.

В исследовании участвовали Масатомо Йошида и Харуто Намура из Высшей школы науки и техники Университета Дошиша (Киото, Япония), а также Масахиро Окуда с факультета науки и техники того же университета.

Исследователи разработали два подхода для создания негативных примеров: «белый ящик» и „чёрный ящик“.

  • Метод «белого ящика» требует доступа к внутренним механизмам целевой модели. Он предполагает итеративный расчёт возмущений входных изображений на основе градиентов модели. Этот подход использует модель предсказания взгляда, чтобы определить ключевые точки на изображении и затем манипулирует ими. В результате размер возмущений уменьшается на 62,5% по сравнению с базовыми методами на экспериментальном наборе данных изображений.
  • Подход «чёрного ящика» использует байесовскую оптимизацию, чтобы эффективно сузить пространство поиска и сосредоточиться на определённых областях изображения. Как и подход „белого ящика“, он включает повторяющиеся процедуры, основанные на картах салиентности взгляда. Вместо внутренних градиентов используется древовидный оценщик Парзена для выбора и оптимизации координат пикселей, влияющих на солёность взгляда. Это позволяет получить нужные изображения.

Методы «чёрного ящика» более применимы в реальных ситуациях и важны для кибербезопасности.

Аспирант Харуто Намура, один из участников исследования, рассказал, что оба подхода дают хорошие результаты.

Наши методы лучше существующих и могут эффективно применяться на практике, например, в Twitter.

Это исследование — шаг вперёд в создании надёжных систем искусственного интеллекта. Оно важно для доверия общества к таким системам.

Повышение эффективности генерации состязательных примеров для обрезки изображений поможет исследованиям в области ИИ и решению насущных проблем.

По словам профессора Масахиро Окуда, исследование выявляет уязвимые места в моделях ИИ и способствует созданию более справедливых систем.

Результаты опубликованы в издании IEEE Access.

01.08.2024


Подписаться в Telegram



Net&IT

Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом

Генеративный искусственный интеллект часто оши...

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

A&D: Изменения в сосудах мозга помогут прогнозировать когнитивные нарушения
A&D: Изменения в сосудах мозга помогут прогнозировать когнитивные нарушения
Nature Physics: Ученые проследили эволюцию беспорядка в сверхпроводниках
Nature Physics: Ученые проследили эволюцию беспорядка в сверхпроводниках
PNAS: Жидкие кристаллы в движении имитируют биологические системы
PNAS: Жидкие кристаллы в движении имитируют биологические системы
Стандартизация крепежа позволила быстро построить хрустальный дворец в Лондоне
Стандартизация крепежа позволила быстро построить хрустальный дворец в Лондоне
NatComm: Найдены участки в мозге, которые действуют как связи в социальной сети
NatComm: Найдены участки в мозге, которые действуют как связи в социальной сети
Nature Astronomy: Черная дыра способна «морить голодом» галактику-хозяина
Nature Astronomy: Черная дыра способна «морить голодом» галактику-хозяина
КФУ: Кинетическая модель оптимизирует добычу битуминозной нефти
КФУ: Кинетическая модель оптимизирует добычу битуминозной нефти
В ЛЭТИ создали цифрового двойника для оптимизации солнечных электростанций
В ЛЭТИ создали цифрового двойника для оптимизации солнечных электростанций
Дыбка и трещотка: кого еще нашли ученые КФУ во время экспедиции
Дыбка и трещотка: кого еще нашли ученые КФУ во время экспедиции
Advanced Science: Гель из слизи коровы поможет при грыже межпозвоночного диска
Advanced Science: Гель из слизи коровы поможет при грыже межпозвоночного диска
DFCI: Как образ жизни после лечения влияет на результаты после диагноза рака
DFCI: Как образ жизни после лечения влияет на результаты после диагноза рака
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Science: Разработан метод поиска молекул, подходящих всем известным белкам
Science: Разработан метод поиска молекул, подходящих всем известным белкам
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Исследователи используют кантианскую модель рациональности для оценки этичности решений ИИ
Ученые Сеченовского университета разработали новый способ терапии вирусных заболеваний
Ученые СПбГУ и ЛЭТИ разработали методику изучения материалов на основе алмаза для космической электроники будущего
Межсетевой экран защитит компьютерные системы от киберугроз