Главная arrow книги arrow Копия Глава 24. Восприятие arrow Движение
Движение

Здесь координаты (х,у) принимают свои значения среди пикселов в блоке с центром в точке. Найдем значения, которые минимизируют выражение для SSD. В таком случае оптический поток в точкепринимает значение. Еще один вариант состоит в том, что можно максимизировать взаимную корреляцию следующим образом:

Метод с использованием взаимной корреляции действует лучше всего, если сцена характеризуется наличием текстуры, в результате чего блоки пикселов (называемые также окнами) содержат значительные вариации яркости среди входящих в них пикселов. Если же рассматривается ровная белая стена, то взаимная корреляция обычно остается почти одинаковой для различных потенциальных согласований ди алгоритм сводится к операции выдвижения слепого предположения.

Допустим, что наблюдатель движется с линейной скоростью (или скоростью переноса) Т и с угловой скоростью ω (таким образом, эти параметры описывают самодвижение). Можно вывести уравнение, связывающее скорости наблюдателя, оптический поток и положения объектов в сцене. Если предположить, что f=l, то из этого следуют уравнения

где Z(x,y) задает координату z точки в сцене, соответствующей точке на изображении с координатами (х,у).

Достаточно хорошего понимания того, что при этом происходит, можно достичь, рассмотрев случай чистого переноса. В таком случае выражения для поля потока принимают следующий вид:

Теперь становятся очевидными некоторые интересные свойства. Оба компонента оптического потока,, принимают нулевое значение в точке с координатами. Эта точка называется фокусом расширения поля потока. Предположим, что мы изменим начало координат в плоскости х-у для того, чтобы оно находилось в фокусе расширения; в таком случае выражение для оптического потока принимает особенно простую форму. Допустим, что (х' , у' ) — это новые координаты, определяемые соотношениями. В таком случае становятся справедливыми следующие уравнения:

Эти уравнения имеют некоторые интересные области применения. Предположим, что летящая муха пытается сесть на стену и хочет определить, в какой момент она коснется стены, если будет сохраняться текущая скорость. Это время задается термом. Следует отметить, что мгновенное значение поля оптического потока не позволяет получить ни данные о расстоянии Z, ни данные о компоненте скорости , но вместе с тем предоставляет значение соотношения этих двух параметров и поэтому может использоваться для управления приближением к поверхности посадки. Эксперименты, проведенные над мухами в реальных условиях, показали, что указанные насекомые действуют именно по этому принципу. Мухи относятся к числу наиболее ловких летающих объектов среди всех живых существ и машин, а интереснее всего то, что они добиваются этого с помощью системы зрения, имеющей невероятно низкое пространственное разрешение (поскольку в глазу мухи имеется всего около 600 рецепторов, тогда как в глазу человека — порядка 100 миллионов), но блестящее временное разрешение.

Чтобы получить данные о глубине, необходимо воспользоваться несколькими кадрами. Если видеокамера направлена на твердое тело, то его форма не изменяется от кадра к кадру и поэтому появляется возможность лучше решать задачу измерения оптического потока, неизменно подверженного шуму. Результаты применения одного из подобных подходов, полученные Томази и Канаде [1511], показаны на рис. 24.8 и 24.9.