Аналитика

Как искусственный интеллект видит мир через камеры и датчики

Когда мы слышим об искусственном интеллекте, то чаще всего представляем чат-ботов или генераторы изображений. Однако существует еще одно направление, без которого невозможно представить современные автомобили, роботов, дроны и системы видеонаблюдения. Речь идет о компьютерном зрении — способности искусственного интеллекта анализировать окружающий мир с помощью камер и различных датчиков.

Но видит ли ИИ так же, как человек? Ответ — нет.

Как искусственный интеллект видит мир через камеры и датчики, разобрали в данном материале.

Камера — это только источник информации

Для человека достаточно открыть глаза, чтобы увидеть улицу, людей или автомобиль. Искусственный интеллект не обладает подобным восприятием.

Для него изображение с камеры — это всего лишь огромный набор чисел. Каждый пиксель имеет определенный цвет и яркость. Задача нейросети — найти закономерности в этих данных и определить, что именно находится перед ней.

Именно поэтому после получения изображения начинается самый сложный этап — его анализ.

Распознавание объектов

Современные алгоритмы способны за доли секунды определить десятки различных объектов одновременно.

ИИ может обнаружить:

  • людей;
  • автомобили;
  • велосипеды;
  • дорожные знаки;
  • животных;
  • здания;
  • светофоры;
  • препятствия на дороге.

Причем система не просто замечает объект, а определяет его местоположение и зачастую даже направление движения.

Одной камеры часто недостаточно

Если человеку легко оценить расстояние до предмета благодаря двум глазам, то обычная камера такой возможностью не обладает.

Поэтому современные интеллектуальные системы используют сразу несколько источников информации.

Например:

  • стереокамеры;
  • лидары;
  • радары;
  • ультразвуковые датчики;
  • GPS;
  • инерциальные датчики движения.

Каждый из них дополняет картину окружающего мира.

Зачем нужен лидар

Лидар работает иначе, чем камера.

Он испускает лазерные импульсы и измеряет время их возвращения после отражения от объектов. На основе этих данных строится трехмерная карта окружающего пространства.

Благодаря этому автомобиль может понимать не только форму объектов, но и их точное расстояние, даже если освещение оставляет желать лучшего.

Радар видит то, что не видит камера

Во время дождя, снегопада или густого тумана обычная камера начинает работать значительно хуже.

Радар менее чувствителен к таким условиям. Он хорошо определяет расстояние и скорость движущихся объектов, поэтому часто используется вместе с камерами и лидаром.

Именно сочетание нескольких типов датчиков делает современные системы гораздо надежнее.

Искусственный интеллект объединяет всю информацию

Полученные данные поступают в нейросеть.

Она одновременно анализирует изображения, измерения радара, данные лидара и информацию о движении самого устройства.

После этого ИИ отвечает сразу на несколько вопросов:

  • где находятся объекты;
  • что это за объекты;
  • насколько они опасны;
  • куда они движутся;
  • что необходимо сделать дальше.

Например, беспилотный автомобиль должен решить, продолжать движение, затормозить, перестроиться или объехать препятствие.

Почему ИИ иногда ошибается

Несмотря на впечатляющие успехи, компьютерное зрение далеко не идеально.

Проблемы могут возникнуть из-за:

  • плохой погоды;
  • недостаточного освещения;
  • необычных дорожных ситуаций;
  • нестандартных объектов;
  • загрязнения камер и датчиков.

Именно поэтому разработчики используют сразу несколько независимых систем, которые постоянно проверяют друг друга.

Где применяется компьютерное зрение

Сегодня подобные технологии используются практически повсюду.

Они помогают:

  • беспилотным автомобилям;
  • промышленным роботам;
  • медицинскому оборудованию;
  • системам безопасности;
  • дронам;
  • «умным» городам;
  • автоматическим складам;
  • сельскохозяйственной технике.

Во многих случаях искусственный интеллект способен анализировать изображение быстрее человека и замечать мельчайшие детали, которые трудно увидеть невооруженным глазом.