IEEE Access: Ученые улучшили модели автоматической обрезки изображений

Обрезка изображений — важная задача в разных областях: от социальных сетей и электронной коммерции до компьютерного зрения.

Обрезка помогает сохранить качество изображения, не меняя его размер и не расходуя вычислительные ресурсы. Она также полезна, когда изображение должно соответствовать определённому соотношению сторон (например, в миниатюрах).

За последние десять лет инженеры разработали различные модели машинного обучения для автоматической обрезки изображений. Эти модели сохраняют наиболее важные части входного изображения.

Модели машинного обучения могут ошибаться и быть необъективными, что иногда приводит пользователей к юридическим проблемам. Например, в 2020 году компания X (бывший Twitter) получила иск из-за того, что её функция автоматического кадрирования скрыла информацию об авторских правах на изображении. Чтобы избежать подобных проблем, нужно понять, почему модели машинного обучения для обрезки изображений работают неудачно.

Исследователи из Университета Дошиша (Япония) разработали новые методы создания сложных примеров для задачи обрезки изображений. Они вносят незаметные искажения в изображение, чтобы обмануть модель и заставить её обрезать нужные области, даже если изначально она этого не планировала.

Докторант Масатомо Йошида, ведущий исследователь, объясняет мотивацию работы так:

Нужно доработать модели обрезки изображений, чтобы они учитывали намерения пользователей и были беспристрастными.

В исследовании участвовали Масатомо Йошида и Харуто Намура из Высшей школы науки и техники Университета Дошиша (Киото, Япония), а также Масахиро Окуда с факультета науки и техники того же университета.

Исследователи разработали два подхода для создания негативных примеров: «белый ящик» и „чёрный ящик“.

  • Метод «белого ящика» требует доступа к внутренним механизмам целевой модели. Он предполагает итеративный расчёт возмущений входных изображений на основе градиентов модели. Этот подход использует модель предсказания взгляда, чтобы определить ключевые точки на изображении и затем манипулирует ими. В результате размер возмущений уменьшается на 62,5% по сравнению с базовыми методами на экспериментальном наборе данных изображений.
  • Подход «чёрного ящика» использует байесовскую оптимизацию, чтобы эффективно сузить пространство поиска и сосредоточиться на определённых областях изображения. Как и подход „белого ящика“, он включает повторяющиеся процедуры, основанные на картах салиентности взгляда. Вместо внутренних градиентов используется древовидный оценщик Парзена для выбора и оптимизации координат пикселей, влияющих на солёность взгляда. Это позволяет получить нужные изображения.

Методы «чёрного ящика» более применимы в реальных ситуациях и важны для кибербезопасности.

Аспирант Харуто Намура, один из участников исследования, рассказал, что оба подхода дают хорошие результаты.

Наши методы лучше существующих и могут эффективно применяться на практике, например, в Twitter.

Это исследование — шаг вперёд в создании надёжных систем искусственного интеллекта. Оно важно для доверия общества к таким системам.

Повышение эффективности генерации состязательных примеров для обрезки изображений поможет исследованиям в области ИИ и решению насущных проблем.

По словам профессора Масахиро Окуда, исследование выявляет уязвимые места в моделях ИИ и способствует созданию более справедливых систем.

Результаты опубликованы в издании IEEE Access.

01.08.2024


Подписаться в Telegram



Net&IT

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Студенты ТИСБИ разработали проект онлайн-платформы для геймеров
Студенты ТИСБИ разработали проект онлайн-платформы для геймеров

Студенты Университета управления ТИСБИ в ...

Nature: Созданные ИИ тексты будут размечаться водяными знаками
Nature: Созданные ИИ тексты будут размечаться водяными знаками

Исследователи из лондонской лаборатории G...

Российская игра о наполеоновских войнах станет бесплатной
Российская игра о наполеоновских войнах станет бесплатной

У российской аудитории растет интерес к в

В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»
В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»

В Новосибирском государственном университете з...

Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме
Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме

Технологические корпорации всё чаще обращ...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

IJB: Если дуриан не поливать, он начинает цвести
IJB: Если дуриан не поливать, он начинает цвести
В Сеченовском Университете создали ИИ для прогнозирования метастазов
В Сеченовском Университете создали ИИ для прогнозирования метастазов
Ученые Державинского университета изучают вероятные риски киберспорта для зрения
Ученые Державинского университета изучают вероятные риски киберспорта для зрения
Открыты новые материалы для производства передовых компьютерных чипов
Открыты новые материалы для производства передовых компьютерных чипов
Как физика нейтрино раскрывает секреты Вселенной
Как физика нейтрино раскрывает секреты Вселенной
Science: Ученые сделали картофель безопасным и решили проблему пищевых отходов
Science: Ученые сделали картофель безопасным и решили проблему пищевых отходов
Цифровые этикетки помогут супермаркетам производить меньше пищевых отходов
Цифровые этикетки помогут супермаркетам производить меньше пищевых отходов
Первичные реснички — вероятный ключ к лечению бокового амиотрофического склероза
Первичные реснички — вероятный ключ к лечению бокового амиотрофического склероза
IJMS: Ученые определили функциональность транспортного белка виноградной лозы
IJMS: Ученые определили функциональность транспортного белка виноградной лозы
Найдены древние водоносные горизонты под поверхностью Марса
Найдены древние водоносные горизонты под поверхностью Марса
Океан возможностей: как инновационные компании помогают делать мир устойчивее
Океан возможностей: как инновационные компании помогают делать мир устойчивее
A&D: Плохое состояние сосудов ускоряет старение мозга
A&D: Плохое состояние сосудов ускоряет старение мозга
ИИ-тест крови изменит раннюю диагностику рака груди
ИИ-тест крови изменит раннюю диагностику рака груди
В МФТИ придумали новый способ анализа вещества против тромбоза
В МФТИ придумали новый способ анализа вещества против тромбоза
Вертолеты-«косатки» Ми-8МТВ-1 совершили перелет в 6300 км
Вертолеты-«косатки» Ми-8МТВ-1 совершили перелет в 6300 км

Новости компаний, релизы

В России разработана система «Второе мнение» для ультразвуковой диагностики щитовидной железы
Синергия Межвузовского кампуса ускорила патентование сырьевой смеси для строительной 3D-печати
В Уфе прошёл Science Slam «Нефтяной 2030»
Семинар для учителей «Из школы – в вуз»
В МИФИ разработали критерии для рейтингования вузов в сфере устойчивого развития