Будущее становится реальностью

Истоки аналитики

Впервые об анализе видеоизображения заговорили в 1990 году, задолго до трагических событий 11 сентября 2001 года. «Это был удел различных научно-исследовательских институтов, финансируемых правительством, - заявляет Дитер Кондек (Dieter Kondek), президент и генеральный директор Agent Video Intelligence или Agent Vi. - «Компьютерное зрение», - так первоначально называли аналитику, - постепенно эволюционировало в исследовательскую деятельность по созданию искусственного интеллекта».

Первыми образцами аналитики на рынке стали детекторы движения, разработанные по заказу министерства обороны, которые требовали значительных аппаратных ресурсов, что делало их малоэффективными. Потребители и производители, в свою очередь, считали такую видеоаналитику сложной и ненадежной из-за большого количества ложных срабатываний. «Даже самое невинное движение, например полет птицы, могло привести к тревоге в системе, - отмечает Кондек, - Эти устаревшие системы CCTV не могли работать с более продвинутыми алгоритмами, которые существуют сегодня, например, для обнаружения оставленных предметов, факта вторжения в охраняемую зону, остановившейся машины и т.д.». Переломным моментом стали события 11 сентября, которые застали всех врасплох. Именно с этого момента стало ясно, как необходимо обществу наличие интеллектуальных видеосистем для контроля ситуации в местах массового скопления людей, в аэропортах, для ограничения доступа на охраняемые территории и т.д. На тот момент на рынке не было ни одного решения, способного справиться с задачей такого рода, когда требуется одновременная обработка информации от тысяч телекамер. Также большое количество угроз и террористических атак в школах США и по всему миру заставили производителей задуматься и начать работу в этом направлении. Благо, к этому моменту вектор развития технологий в отрасли безопасности начал смещаться в сторону цифровых систем, что дало возможность производителям направить усилия на создание интеллектуальных систем.

Интеллектуальные возможности систем сегодня

Сегодня возможность анализа видеоизображения стала неотъемлемой частью абсолютно любых систем и решений. Задачей аналитической системы является радикальное снижение ложных тревог, вызванных, например, природными и климатическими явлениями, изменением освещенности и т.д., при максимальном уровне интеллектуального распознавания движения человека, образа или события, определению человеческого лица, номера автомобиля и т.д. Например, Bosсh Security System использует анализ фона, способный адаптироваться к его изменениям, что позволяет избежать ложных тревог, например, от качающихся деревьев или движения облаков. В этом случае тревога наступает только при реально опасной ситуации, параметры которой задаются пользователем. Также применяются решения, способные измерять объекты с помощью трехмерной системы координат или путем калибровки изображения от камеры. Это достигается путем использования графического интерфейса пользователя, который позволяет наложить 3D-сетку на изображение и различать объекты, учитывая соотношение размеров предметов в перспективе и векторов их перемещения. Многие компании ведут разработки по анализу человеческого поведения, выделению нестандартных и опасных действий.

Однако эксперты считают, что производители и поставщики при общении с потребителем должны четко объяснять, чего стоит ждать от интеллектуальных возможностей систем и какие желания пользователей не могут быть удовлетворены. «Между тем, во что люди верят и ждут от интеллектуальных систем, и их реальными возможностями лежит огромная пропасть, - считает Андрес Сади (Andras Sudy), директор по маркетингу компании Intello. - Начитавшись и наслушавшись много различной информации об интеллектуальности систем, потребители предъявляют к ним необоснованно завышенные требования, выполнение которых, если и возможно, то только путем сложных настроек и конфигурирования систем».

Именно глубокое понимание потребностей клиента стало частью стратегии компании Intello по уменьшению количества ложных тревог. У компании есть решение по мониторингу транспортных потоков, включающее в себя несколько аналитических алгоритмов, таких как распознавание автомобильных номеров, определение направления и скорости движения объекта. Управление автомагистралями Венгрии провело тестовую эксплуатацию этого решения, после чего спросило о возможности определения системой тумана на дороге, что не было предусмотрено изначально.

«У нас не было готового решения этого вопроса, поэтому нам пришлось создавать систему определения и оповещения о тумане на дороге из того, что есть на сегодняшний день,- отмечает Сади. - Но если эта задача не может быть решена из-за физических ограничений камеры, то надо честно сказать об этом. Это лучшее решение проблемы, которое возможно».

Чего ждать?

Появление искусственного интеллекта в системах завтрашнего дня пока весьма проблематично, но, тем не менее, алгоритмы анализа видеоизборажения с каждым днем становятся все сложнее. «В будущем очевидна более точная идентификация или выделение объекта, - таково мнение Геди Тэлмона (Gadi Talmon), соучредителя компании Agent Vi. - Сейчас этой технологии нет ни у одного из производителей. В настоящий момент мы работаем над алгоритмами идентификации объекта, которые смогли бы различать, например, людей по одежде или отличительным знакам на ней. Мы постоянно создаем новые более устойчивые и надежные алгоритмы».

Некоторые эксперты предсказывают появление большого числа новых интеллектуальных алгоритмов, разработанных маленькими специализированными компаниями, нежели интегрированных решений, созданных совместными усилиями таких компаний, как VistaScape и Siemens Building Technologies или ActivEye и Honywell. «У больших компаний есть средства для смены курса разработок в зависимости от потребностей рынка, в то время как маленькие компании более узко специализированы, но разрабатывают именно то, что хочет заказчик. - говорит Сади. - В ближайшие пару лет на рынке безопасности будет очень интересная ситуация».

Рост отрасли безопасности провоцирует спрос на все более умные аналитические решения. И чем вероятнее станет возможность применения технологий вне рынка безопасности, тем интереснее будет наблюдать за сектором интеллектуального видеонаблюдения.

Обеспечивая будущее

Но уже сегодня потребитель задается вопросом: а что выбрать? DVR, гибридные DVR, NVR? Не забывая об основных функциях, таких как сжатие и хранение видеоинформации, стоит обратить больше внимания на видеоплатформы и системы с открытой, наращиваемой архитектурой на базе IP-технологий, которые представлены на рынке многими производителями.

Мир безопасности уверенно движется к IP-технологиям. Функции DVR стали более сложными и умными, благодаря интеграции с различными камерами и центральными серверами. Сегодняшние DVR способны захватывать видео с лучшим качеством, хранить больше информации на меньшем дисковом пространстве и имеют гибкие настройки записи. Более того, на рынке представлены как сетевые видеорекордеры (NVR), так и гибридные DVR. Эти устройства для работы по сети, в том числе и Интернет. NVR работают исключительно с сетевыми IP-камерами, гибридные DVR могут работать как с IP, так и аналоговыми камерами, имеют больше возможностей по удаленному контролю и наблюдению. NVR позволяют контролировать всю систему, вплоть до параметров настройки и управления каждой камерой, они специально созданы для записи и хранения больших массивов данных, что возможно только на базе платформы с открытой архитектурой. Какие системы: NVR или гибридные DVR будут лидировать на рынке в ближайшие 5 лет? Чего ожидать от рынка? Каких тенденций и технологий?

Гибридные системы

Английская компания IMS Research провела маркетинговое исследование рынка, которое показало, что переход от аналоговой техники к сетевым технологиям стал динамичнее. Рынок сетевых технологий видеонаблюдения, включая камеры, сетевые видеосерверы и устройства записи, увеличился на 42 процента в 2006 году. Ожидается, что рынок продолжит рост и составит 2,6 биллиона долларов США к 2010 году. Это свидетельствует о том, что сетевые продукты, такие как камеры, составят лишь одну треть от общего числа поставляемых в 2010 году камер. Но согласно тем же исследованиям, отрасль безопасности упорно сопротивляется переменам, и внедрение новых технологий будет не таким быстрым. Основной задачей поставщиков и производителей является объяснение рынку преимуществ сетевых технологий перед традиционным аналоговым CCTV. В чем же проблема противостояния? Многих IP-менеджеров (специалистов, системных администраторов) не устраивает большой поток данных, который генерируют устройства видеонаблюдения в сети. «Именно поэтому даже такие производители, как Bosсh всегда будут иметь в линейке продуктов старый добрый DVR, - отмечает директор по маркетингу подразделения цифровых систем компании Bosch Security Systems Жан-Барт Мул (Jan-Bart Mul). – Так как затраты на камеры составляют в любой системе большую часть, гибридные системы, работающие как с аналоговыми, так и сетевыми камерами, особенно гибридные DVR, будут востребованы. Гибридность – это необходимая функциональность».

Специалисты Vision Systems, ведущей австралийской компании по производству DVR, разделяют это мнение. Учитывая степень распространения и количество аналоговых камер, возможность совместной работы с обеими технологиями будет востребована еще несколько лет. По словам Тима Ферроу (Tim Farrow), главного конструктора Vision Systems, «пропускная способность сети будет главной головной болью, сдерживающим фактором для развития масштабируемых IP-решений».

Одновременно с адаптацией для работы по сети, компрессией, емкостью систем, игроки рынка пытаются найти способ более удобного, быстрого поиска записанной информации и ее анализа. К тому же, остро стоит вопрос информационной безопасности, ограничения доступа к видеозаписям и способов защиты и шифрования видеоданных.

Хранение данных

Большая емкость, надежность и скорость записи/чтения жестких дисков будут очень важны в будущем. Благодаря увеличению емкости и снижению стоимости жестких дисков, DVR занимают важную нишу на рынке безопасности. Основатель компании Dallmeier Electronic, одного из пионеров разработок DVR, Dieter Dallmeier поясняет, что несмотря на существенное увеличение объема памяти за последние 15 лет, емкость жестких дисков со 100 мегабайт в 1992 году увеличилась до 500 гигабайт в 2006-и, и постоянное совершенствование методов сжатия, проблема резервирования и хранения данных существует и сегодня. Сохранение дискового пространства является ключевой задачей. Выпускаются DVR с большим объемом дискового пространства. В настоящий момент обычные диски легко могут достигать размера от 600 гигабайт до 2-х терабайт. В больших IP-системах DVR надо подключать к многочисленным системам хранения данных. «Поддержка внешних сетевых массивов хранения данных, RAID и NAS (сетевой накопитель данных) дисков и дополнительных дисков с горячей заменой, – вот что будет иметь значение в будущем», - убежден Жан-Барт Мул.

Некоторые компании, такие как 3VR, предлагают решения, имеющие самотестирование и самоконтроль для предупреждения, например, случаев отключения камеры наблюдения, выхода из строя накопителя данных или отсутствия видеоданных. Это значительно снижает время и издержки на техническое обслуживание, риск потери данных.

Технологии сжатия данных

Развиваются и технологии сжатия изображения. H.264 – наиболее продвинутый кодек, позволяющий получать картинку высокого качества, при этом передавая видео в реальном времени с минимальной нагрузкой на сеть. В системах, использующих H.264, размер кадра вирируется от 1 до 5 килобайт. Рекордеры с двойным способом сжатия, таким как MPEG-4 и H264 или MJPEG и MPEG-4 также становятся популярными из-за своей гибкости в подключении к камерам и центральным серверам. «По мере развития каналов связи и размеров накопителей данных, - считает главный конструктор Vision Systems Тим Ферроу, - инновационные технологии сжатия видео в системах видеонаблюдения и безопасности будут уже не так важны. IP-устройства будут иметь встроенные накопители данных и аналитическое ядро, которые позволят лучше управлять информацией. Эти устройства смогут индексировать видео и передавать на центральный сервер только важные фрагменты, вместо того чтобы передавать и хранить всю информацию. Это позволит снизить требования к каналу связи и стоимость создания системы в целом». Недавно компания GEUTEBRÜCK выпустила новую версию программного обеспечения GscView, в которой реализована возможность управлять кодерами видеосигнала. Такая система не только значительно снижает объемы данных и загрузку канала, но и позволяет на обычном процессоре Core2Duo одновременно отображать до 100 камер живого видео 25 к/с в формате MPEG-4. Для этого требуется специальный механизм, так называемый регулятор скорости, постоянно контролирующий работу мониторов, чтобы быть уверенным, что видеоданные не передаются быстрее чем могут быть обработаны. Вторая задача - это динамический живой поток (DLS), который смотрит за тем, чтобы аппаратные кодеки всегда сжимали и передали видеокартинку требуемых размера и качества для текущего окна отображения.

Поиск данных

Несмотря на все преимущества сегодняшних DVR или NVR, у них есть одна общая проблема. Имея возможность хранить записанную информацию от большого количества камер, службы безопасности сталкиваются с большими объемами информации, которую очень сложно использовать. В случае происшествия, например воровства или попытки террористической атаки, нет сомнения, что вся информация будет гарантированно записана. Но проблема заключается во времени, которое требуется потратить на просмотр сотен и тысяч часов записей живого видео с простой камеры в поисках нужных данных. Многие компании работают над созданием нетрадиционных DVR с глубокими интеллектуальными системами поиска данных. Большая функциональность будет включать в себя и сложные системы анализа записанных данных, встроенных в DVR, для быстрого поиска подозрительных событий. Например, файлы с метаданными (текстовые строки, содержащие ключевые слова, описывающие отдельные сцены), которые пересылаются вместе с видеофрагментом на записывающее устройство, гораздо меньше по размеру и удобнее для быстрого поиска, в отличие от поиска кадра с движением непосредственно в видеофайле. Это позволяет уменьшить время поиска и доступа к интересующим сценам и событиям до нескольких секунд, так как используется специальный алгоритм, подобный тому, что используется на поисковых интернет-сайтах.

Но помимо анализа записанных событий важную роль играет и наблюдение за ситуацией в реальном масштабе времени. Традиционный способ видеомониторинга уже не может соответствовать растущему количеству камер и архитектуре современных систем. Видеооператор физически не сможет контролировать такое количество камер и адекватно воспринимать ситуацию, реагировать. Поэтому тенденцией рынка является переход к интеллектуальным системам анализа. Как уже говорилось выше, основной идеей для построения распределенных систем большой емкости является использование оконечных устройств, обрабатывающих видеоизображение от камеры и отправляющих оператору только подозрительные, требующие внимания события. Но, оказывается, и здесь есть свои «подводные камни», требующие современных решений и организационных мер.

IPoIP (Image Processing over IP Networks)
Видеообработка по IP-сетям

За последнее время было потрачено много усилий на разработку алгоритмов, позволяющих извлекать информацию, представляющую собой ценность для анализа, как из потокового, так и статичного изображения. В результате были созданы способы, позволяющие работать как с текущим, так и записанным изображением, причем эти алгоритмы могут работать как на программной, так и аппаратной платформах. Однако такие платформы одновременно могут обрабатывать данные лишь от небольшого количества камер (в большинстве случаев, по мнению первоисточника, не более одного-двух каналов). Существует два основных типа построения системы.

В первом случае устройство обработки видеоизображения находится в непосредственной близости от видеокамеры, выполняет первичную обработку данных, далее результат отправляется по сети на центральный сервер или на станцию мониторинга. Обычно в роли устройства обработки изображения выступает ПК для решения сложных задач, но в последнее время увеличивается доля автономных серверов на базе DSP (digital signal processor – цифровой сигнальный процессор) или даже ASIC (Application-Specific Integrated Circuit – проблемно-ориентированная интегральная микросхема) процессоров. Эти устройства выполняют задачи по анализу изображения и отправляют в сеть информацию при наличии значимого события (например, обнаружении движения). Одновременно рядом с камерой могут быть установлены устройства оцифровки видеоизображения для организации удаленного мониторинга, которые могут передавать видео разного качества и разрешения, адаптируясь под пропускную способность сети. Видеопоток, как правило, передается в форматах MJPEG, MPEG-4 или им подобных. По сути, это решение на базе IP-видеосерверов со встроенными детекторами движения, каналами датчиков и ключей. С одной стороны, такое решение эффективно, так как имеет низкую нагрузку на сеть и обеспечивает достаточную распределенность и гибкость. Но с другой стороны, имеет ряд недостатков:

как правило, для каждого видеоканала требуется свое устройство, что при большой системе приводит к существенному удорожанию проекта;
невозможно усовершенствовать процессор, только менять или использовать ПК для более сложных задач аналитики;
в случае уличной установки камер, которые требуют сложных аналитических задач, например, на автострадах для контроля за движением, невозможно использовать ПК ввиду его непригодности для работы «снаружи» в тяжелых климатических условиях, либо требуется использование дорогих решений для передачи видеоизображения на дальние расстояния;
решения на базе DSP-процессоров требуют больше усилий и затрат на разработку из-за ограниченных возможностей и средств разработки нижнего уровня.

В другом случае, в роли ядра видеообработки выступает центральный сервер. Все задачи по видеоаналитике со всех камер в системе возложены на один мощный вычислительный ресурс. С аппаратной точки зрения такое решение экономически более оправданно и пригодно для больших проектов. Но такое решение возможно только в том случае, если в камерах происходит довольно мало значимых событий, требующих незначительных ресурсов и позволяющих одному серверу работать с большим количеством камер. Но в таком решении узким местом является сеть, так как к ее пропускной способности предъявляются повышенные требования. Так как весь видеоанализ происходит на сервере, туда должно поступать оцифрованное видеоизображение высокого качества, то есть, несжатое. При работе такого решения в сети с небольшим количеством камер все будет хорошо, но в случае увеличения количества камер, оно становится непрактичным из-за высоких затрат на организацию сетевых коммуникаций. Такое решение больше применимо в случае, если не требуется обработка каждого кадра живого видео, а только некоторых редких кадров.
Осознав все ограничения обоих решений, компания Agent Vi поставила перед собой задачу создать решение, которое:

смогло бы одновременно работать как с несколькими, так и тысячами камер;
обеспечивало масштабируемость при невысоких затратах;
камеры можно было бы устанавливать в любой географической точке без ограничений, при условии, что в этом месте есть IP-сеть;
возможность просмотра любой камеры с места мониторинга;
изображение от каждой камеры можно обработать несколькими интеллектуальными алгоритмами. Данные анализа должны быть занесены в центральную базу данных и доступны для просмотра с места мониторинга;
возможность легко добавить новые алгоритмы или адаптировать к конкретным задачам существующие без значительных затрат на обновление системы;
возможность работать с событиями одной и нескольких камер; мультикамерные события объединяют информацию от нескольких датчиков, что позволяет определять события наивысшей важности;
на дикой местности (путепроводы, границы, автодороги), где нет развитой инфраструктуры, требования к электроснабжению и каналу связи, особенно беспроводному, наиболее важны. Для таких задач, где вопрос энергопотребления критичен, невозможно использовать ПК.

Архитектура IPoIP

Архитектура IPoIP была создана для удовлетворения вышеуказанным требованиям и решения следующих задач:

обеспечение экономически эффективного решения для приложения обработки видеоизображения от большого числа камер без ограничения вероятности детектирования и увеличения количества ложных тревог;
возможность применения любого алгоритма для любой камеры даже в случае их географического удаления и ограниченных условиях эксплуатации;
возможность применения большого числа алгоритмов одновременно для любой камеры без ограничения пользователя работой только с одним приложением.

Уникальность IPoIP заключается в распределенной архитектуре обработки изображения. Вместо выполнения видеоанализа только рядом с камерой (IP-видеосервер, ПК) или только на центральном сервере, новая архитектура предполагает одновременное использование обоих вариантов. Сам процесс разбит на две части и разделен между аппаратными устройствами оцифровки и центральным сервером. В этом случае IPoIP инкапсулирует преимущества обоих решений и не зависит от их недостатков.

Идея такого разделения заключается в том, что микропроцессор существует у каждой камеры внутри видеокодировщика для сжатия видео. Этот недорогой фиксированный процессор очень подходит для выполнения нескольких описанных выше задач, который позволяет отправлять небольшое количество важной информации центральному серверу для более детального анализа. Например, в случае определения автомобильного номера, видеоанализатор, находящийся рядом с камерой, находит изображение номера в кадре и передает по сети не весь кадр (а это около 1 Мб в исходном качестве), а только изображение номера на центральный сервер для анализа. В случае, если исходных данных недостаточно, центральный сервер может запросить дополнительную информация для анализа, например, цвет автомобиля или контур для классификации.
В этом случае система объединяет в себе как высокое качество исходного видео, так и вычислительную мощность и гибкость центрального процессора без затрат на дорогую сеть.

По материалам:
http://asmag/asm/common/article_detail.aspx?c=1&module=1&id=4128
журнал «A&S International», Июнь 2007, номер 102
статьи «Intelligent Video. Solutions Tackle Real-Life Hurdles», «Image Processing over IP Network (IPoIP)», «Powering the Next Generation of Actionable Intelligence Solutions»
http://boschsecurity
http://honeywell
http://camerasecuritynow
http://agentvi
http://video-surveillance-guide/