Новая система компьютерного зрения учится намного быстрее аналогов

Исследователи продемонстрировали компьютерную систему, способную обнаруживать и распознавать реальные объекты, причем делает она это почти как человек.

Система — это прорыв в области компьютерного зрения, которое позволяет компьютерам считывать и распознавать визуальные изображения.

Это важный шаг на пути к системам искусственного интеллекта (ИИ) — компьютерам, которые самостоятельно обучаются и принимают решения на основе рассуждений и взаимодействуют с людьми наиболее человечным способом.

Хотя современные системы компьютерного зрения становятся все более мощными, они специфичны для конкретных задач, а это значит, что способность видеть и распознавать объекты связана с программой, установленной человеком.

Даже самые умелые современные системы компьютерного зрения не способны создать полную картину объекта, когда видят его часть, а кроме того система может ошибиться, если увидит объект в незнакомой среде.

Инженеры же стремятся создать такую систему, которая поймет, что видит собаку, даже если та прячется за стулом и видны лишь ее лапы и хвост. Если человек без труда понимает, где в этот момент голова собаки и ее тело, то систему компьютерного зрения все еще не способны на это.

А еще современные системы компьютерного зрения не могут самообучаться. Их к этому не готовили. Чтобы они что-то делали, их надо этому научить, например, просматривая тысячи изображений, на которых размещены объекты, требующие идентификации.

Также компьютеры не могут объяснить логику определения объекта на фото, поскольку они не строят внутреннюю картину или модель объекта, как это происходит у людей.

И вот новый метод, разработанный учеными из Калифорнийского университета в Лос-Анджелесе и опубликованный в издании Proceedings of the National Academy of Sciences, показывает, как обойти эти недостатки.

Подход состоит из трех шагов:

  1. Сначала система разбивает изображение на маленькие фрагменты.
  2. Затем компьютер учится совмещать подходящие фрагменты так, чтобы получилось целое изображение.
  3. Наконец, система анализирует другие объекты вокруг основного и пытается понять, имеют ли они к нему отношение.

Чтобы помочь системе обучаться, как это делает человек, ученые погрузили ее в интернет-версию человеческой среды.

— К счастью, интернет предлагает сразу две вещи, которые помогают системам компьютерного зрения обучаться по-человечески, заявил профессор Ввани Ройчоудхури. — Во-первых, в интернете можно найти очень много изображений одного и того же предмета. А во-вторых, эти объекты показаны в разных ракурсах, при разном освещении, с разного расстояния, в разном окружении.

Для разработки фреймворка ученые извлекли идеи из когнитивной психологии и нейробиологии.

— Еще в младенчестве мы начинаем что-то узнавать потому, что видим вокруг много примеров этого в различных контекстах, заметил Ройчоудхури. — Это контекстное обучение является ключевой особенностью нашего мозга, и оно помогает нам создавать надежные модели объектов, которые являются частью интегрированного мировоззрения, где все функционально взаимосвязано.

Исследователи протестировали систему на 9000 изображений, на каждом из которых были люди и объекты. Система сумела построить детальную модель человеческого тела без внешнего управления и предварительной разметки изображений.

Разработчики провели аналогичные испытания с изображениями мотоциклов, автомобилей и самолетов. Во всех случаях система сработала лучше или как минимум так же, как аналоги, прошедшие через многие годы тренировки.

21.12.2018


Подписаться в Telegram



Net&IT

Physical Review X: Сеть квантовых датчиков повышает точность измерений
Physical Review X: Сеть квантовых датчиков повышает точность измерений

Квантовые системы, используемые в квантов...

Scientific Reports: ИИ показал больший творческий потенциал, чем человек
Scientific Reports: ИИ показал больший творческий потенциал, чем человек

Еще один балл в пользу искусственного инт...

Крошечную метку на замену RFID сделали еще надежнее
Крошечную метку на замену RFID сделали еще надежнее

Несколько лет назад исследователи Массачу...

Ученые приблизились к более легким и гибким оптоэлектронным устройствам
Ученые приблизились к более легким и гибким оптоэлектронным устройствам

Органические оптоэлектронные устройства, такие...

PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить
PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить

Атанасиос С. Фокас рассматривает актуальный во...

Nature: ИИ генерирует белки с исключительной прочностью связывания
Nature: ИИ генерирует белки с исключительной прочностью связывания

В новом исследовании, опубликованном 18 декабр...

Nature Computational Science: ИИ может предсказывать события в жизни людей
Nature Computational Science: ИИ может предсказывать события в жизни людей

Искусственный интеллект, разработанный для&nbs...

Nature Electronics: Изменение памяти дает новые вычислительные возможности
Nature Electronics: Изменение памяти дает новые вычислительные возможности

Ученые Рочестерского университета разработали ...

Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта
Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта

Многофункциональные компьютерные чипы эволюцио...

Началась регистрация на конкурс «Битва искусственных интеллектов»
Началась регистрация на конкурс «Битва искусственных интеллектов»

Стартовал отборочный этап Международного техно...

ИИ помогает математикам находить закономерности
ИИ помогает математикам находить закономерности

Применение машинного обучения для поиска ...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

2-фотонная фотоэмиссионная спектроскопия помогла понять поведение электронов
2-фотонная фотоэмиссионная спектроскопия помогла понять поведение электронов
Рост эффективности бифункциональных катализаторов удешевит производства водорода
Рост эффективности бифункциональных катализаторов удешевит производства водорода
Science: Аналоговые вычисления дают решать сложные уравнения и экономят энергию
Science: Аналоговые вычисления дают решать сложные уравнения и экономят энергию
JAAD: Новый метод может помочь дифференцировать два кожных заболевания
JAAD: Новый метод может помочь дифференцировать два кожных заболевания
BioDesign Research: Для производства каротиноидов разработали специальные дрожжи
BioDesign Research: Для производства каротиноидов разработали специальные дрожжи
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Current Biology: Исследование брачного поведения показывает эволюцию влечения
Current Biology: Исследование брачного поведения показывает эволюцию влечения
Печатный полимер позволяет изучить хиральность и спины при комнатной температуре
Печатный полимер позволяет изучить хиральность и спины при комнатной температуре
Долой мифы — вперед к светлому диетическому будущему
Долой мифы — вперед к светлому диетическому будущему
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Прорыв в нанотехнологиях поможет создать дисплей, дающий цвет в реальном времени
Прорыв в нанотехнологиях поможет создать дисплей, дающий цвет в реальном времени
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
Nature Communications: В мигрирующих нейронах найден конус роста
Nature Communications: В мигрирующих нейронах найден конус роста
Scientific Reports: Реакция на происходящее влияет на понимание будущих событий
Scientific Reports: Реакция на происходящее влияет на понимание будущих событий
Science Advances: Мозг формирует эмоции независимо от органов чувств
Science Advances: Мозг формирует эмоции независимо от органов чувств

Новости компаний, релизы

НАИРИТ объявит итоги Всероссийского инновационного конкурса 21 февраля
НАИРИТ объявит итоги Всероссийского инновационного конкурса 21 февраля
«Инструменты инновационного развития»
«Инструменты инновационного развития»
3 причины перехода с печатной рекламы на цифровую
3 причины перехода с печатной рекламы на цифровую
Виды резервирования серверов для задач АСУ ТП
Виды резервирования серверов для задач АСУ ТП
Выбор клиники и лечащего врача с помощью специализированного сервиса
Выбор клиники и лечащего врача с помощью специализированного сервиса