Новая система компьютерного зрения учится намного быстрее аналогов

Исследователи продемонстрировали компьютерную систему, способную обнаруживать и распознавать реальные объекты, причем делает она это почти как человек.

Система — это прорыв в области компьютерного зрения, которое позволяет компьютерам считывать и распознавать визуальные изображения.

Это важный шаг на пути к системам искусственного интеллекта (ИИ) — компьютерам, которые самостоятельно обучаются и принимают решения на основе рассуждений и взаимодействуют с людьми наиболее человечным способом.

Хотя современные системы компьютерного зрения становятся все более мощными, они специфичны для конкретных задач, а это значит, что способность видеть и распознавать объекты связана с программой, установленной человеком.

Даже самые умелые современные системы компьютерного зрения не способны создать полную картину объекта, когда видят его часть, а кроме того система может ошибиться, если увидит объект в незнакомой среде.

Инженеры же стремятся создать такую систему, которая поймет, что видит собаку, даже если та прячется за стулом и видны лишь ее лапы и хвост. Если человек без труда понимает, где в этот момент голова собаки и ее тело, то систему компьютерного зрения все еще не способны на это.

А еще современные системы компьютерного зрения не могут самообучаться. Их к этому не готовили. Чтобы они что-то делали, их надо этому научить, например, просматривая тысячи изображений, на которых размещены объекты, требующие идентификации.

Также компьютеры не могут объяснить логику определения объекта на фото, поскольку они не строят внутреннюю картину или модель объекта, как это происходит у людей.

И вот новый метод, разработанный учеными из Калифорнийского университета в Лос-Анджелесе и опубликованный в издании Proceedings of the National Academy of Sciences, показывает, как обойти эти недостатки.

Подход состоит из трех шагов:

  1. Сначала система разбивает изображение на маленькие фрагменты.
  2. Затем компьютер учится совмещать подходящие фрагменты так, чтобы получилось целое изображение.
  3. Наконец, система анализирует другие объекты вокруг основного и пытается понять, имеют ли они к нему отношение.

Чтобы помочь системе обучаться, как это делает человек, ученые погрузили ее в интернет-версию человеческой среды.

— К счастью, интернет предлагает сразу две вещи, которые помогают системам компьютерного зрения обучаться по-человечески, заявил профессор Ввани Ройчоудхури. — Во-первых, в интернете можно найти очень много изображений одного и того же предмета. А во-вторых, эти объекты показаны в разных ракурсах, при разном освещении, с разного расстояния, в разном окружении.

Для разработки фреймворка ученые извлекли идеи из когнитивной психологии и нейробиологии.

— Еще в младенчестве мы начинаем что-то узнавать потому, что видим вокруг много примеров этого в различных контекстах, заметил Ройчоудхури. — Это контекстное обучение является ключевой особенностью нашего мозга, и оно помогает нам создавать надежные модели объектов, которые являются частью интегрированного мировоззрения, где все функционально взаимосвязано.

Исследователи протестировали систему на 9000 изображений, на каждом из которых были люди и объекты. Система сумела построить детальную модель человеческого тела без внешнего управления и предварительной разметки изображений.

Разработчики провели аналогичные испытания с изображениями мотоциклов, автомобилей и самолетов. Во всех случаях система сработала лучше или как минимум так же, как аналоги, прошедшие через многие годы тренировки.

21.12.2018


Подписаться в Telegram



Net&IT

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Студенты ТИСБИ разработали проект онлайн-платформы для геймеров
Студенты ТИСБИ разработали проект онлайн-платформы для геймеров

Студенты Университета управления ТИСБИ в ...

Nature: Созданные ИИ тексты будут размечаться водяными знаками
Nature: Созданные ИИ тексты будут размечаться водяными знаками

Исследователи из лондонской лаборатории G...

Российская игра о наполеоновских войнах станет бесплатной
Российская игра о наполеоновских войнах станет бесплатной

У российской аудитории растет интерес к в

В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»
В НГУ запустили пилотный кластер суперкомпьютерного центра «Лаврентьев»

В Новосибирском государственном университете з...

Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме
Эксперты МИФИ объяснили решение Microsoft и Google о мирном атоме

Технологические корпорации всё чаще обращ...

HB&ET: Пожилые чаще молодых относятся к ИИ как к кому-то живому
HB&ET: Пожилые чаще молодых относятся к ИИ как к кому-то живому

В исследовании Имперского колледжа Лондона люд...

В МФТИ создали ПО для нефтяников и золотодобытчиков
В МФТИ создали ПО для нефтяников и золотодобытчиков

Сотрудники МФТИ предложили цифровое решение, к...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Внеклеточные везикулы — новое слово в лечении воспалительных заболеваний кишечника
Внеклеточные везикулы — новое слово в лечении воспалительных заболеваний кишечника
The American Journal of Human Genetics: Бесплодие может быть вызвано мутацией
The American Journal of Human Genetics: Бесплодие может быть вызвано мутацией
Surfaces and Interfaces: Куркума и серебро на мембранах стерилизуют вирусы
Surfaces and Interfaces: Куркума и серебро на мембранах стерилизуют вирусы
1 укол вместо 15: в Челябинске предложили революционный метод лечения рака
1 укол вместо 15: в Челябинске предложили революционный метод лечения рака
Ученые из Новосибирска установили возраст шерсти детеныша саблезубой кошки
Ученые из Новосибирска установили возраст шерсти детеныша саблезубой кошки
Исследована двойная роль клеточного регулятора CED-9 в апоптозе
Исследована двойная роль клеточного регулятора CED-9 в апоптозе
PRL: Физики объяснили, как работает дробный заряд в пентаслойном графене
PRL: Физики объяснили, как работает дробный заряд в пентаслойном графене
Челябинские ученые создали систему управления объектами электроэнергетики
Челябинские ученые создали систему управления объектами электроэнергетики
Frontiers in Physiology: Космонавты обычно немного «тормозят» из-за стресса
Frontiers in Physiology: Космонавты обычно немного «тормозят» из-за стресса
PF: Семена чампати помогут физикам лучше понять оползни и каменные лавины
PF: Семена чампати помогут физикам лучше понять оползни и каменные лавины
В Московском Политехе создали алгоритм для прогнозирования пешеходного трафика
В Московском Политехе создали алгоритм для прогнозирования пешеходного трафика
Ученые СПбГУ и Сколтеха открыли секрет появления цыпленка
Ученые СПбГУ и Сколтеха открыли секрет появления цыпленка
JACS: Открыт новый тип наночастиц гидрида палладия, которые запирают водород
JACS: Открыт новый тип наночастиц гидрида палладия, которые запирают водород
NF: Выравнивание спина для термоядерного топлива удешевит ядерную энергию
NF: Выравнивание спина для термоядерного топлива удешевит ядерную энергию
Ученые Пермского Политеха разработали новый способ печати стентов
Ученые Пермского Политеха разработали новый способ печати стентов

Новости компаний, релизы

3D-печать: от самых смелых концепций до твердой реальности
КНИТУ вошёл в тройку лидеров по количеству перспективных российских стартапов
В ПсковГУ состоялось открытие научно-образовательной лаборатории «Когнитивное развитие в образовании»
Квантовая неделя в Санкт-Петербурге пройдет на площадке СПбГУ
Пироговская олимпиада для школьников по химии и биологии