Автоматическое наведение закрепилось на потребительском рынке

Современные технологии непрерывно развиваются, и производители электроники стараются предоставить пользователям все новые и новые функции, которые делают использование их продуктов еще более удобным и эффективным. Одной из таких функций, давно применяемой в профессиональных решениях, является автоматическое наведение камеры.

Источник: Apple

Apple включила её в свои устройства на M1 и M2, уже прошло два поколения, но функция все еще присутствует. Это говорит о том, что автоматическое наведение камеры теперь является неотъемлемой частью потребительской электроники и не уступает по значимости другим функциям. Называется Center Stage, реализована на профессиональных устройствах для работы с графикой: iPad Pro последних поколений и мониторе Studio Display.

Технически наведение на участников у Apple реализовано с помощью True Depth камеры. Она обычно используется только для авторизации Face ID и в некоторых приложениях для 3D сканирования. iPad без проблем наводится на одно-два лица, наведение занимает до 2-х секунд. При этом «агрессивность» наведения достаточно низкая, чтобы не отпугнуть пользователей. Apple скорее аккуратно подстраивает кадр, оставляя большую его часть неизменной. Для сравнения, в профессиональных видеобарах из 4K картинки при цифровом ePTZ наведении камеры вырезается кадр размером 1080p или 720p, то есть 1/4 или 1/9 часть от всей зоны обзора камеры.

Работа Center Stage на iPad M1. Источник: MacStories

Однако, важна не столько технология, сколько сама идея автоматического наведения камеры, которая получила валидацию от лидера потребительского рынка. Это говорит о том, что автоматическое наведение камеры является важной функцией для пользователей, которая может значительно упростить и улучшить их опыт использования электроники. Важный аргумент в пользу такой точки зрения, что функция включена по умолчанию на флагманских устройствах.

Профессиональные решения с наведением

Несмотря на концептуальное сходство, профессиональные устройства подходят к процессу наведения немного по-другому. Понятно, что видеобары в офисе не используют сложные и дорогие лидары, такая точность просто не нужна. Камеры с автоматическим наведением используют комбинацию из определения лиц и направления голоса. В видеозвонке на айпаде вряд ли будет участвовать больше трех человек, они просто не поместятся перед экраном, в переговорной же может быть одновременно до 20-и человек. И требования по наведению при таком числе участников гораздо жестче: из всех людей нам нужно показать именно того, кто говорит. Тех, кто присутствует, но не участвует, можно легко убрать из кадра видеозвонка.

Второе важное отличие профессиональных решений — возможность обзора на 360° для камер в центра стола или наличие 5..12 кратного зума для камер с углом обзора 90-120°. Такие характеристики определяются стандартными конфигурациями переговорных комнат, где длинный или круглый стол одной стороной упирается в презентационный монитор или проекционный экран.