До сих пор большинство обсуждаемых в этой книге вопросов относилось к аналоговым видеосигналам. Большинство современных систем видеонаблюдения по-прежнему используют аналоговые телекамеры, хотя все большее число производителей предлагают сетевые телекамеры, которые предназначены для передачи видео по компьютерным сетям. Всего несколько лет назад к тем немногим компонентам систем видеонаблюдения, которые работали с цифровым видео, относились устройства видеопамяти, видеоквадраторы, видеомультиплексоры, внутренние схемы телекамер с цифровой обработкой видеосигналов (Digital Video Processing — DSP ). Но ситуация изменилась.

Сейчас мы с уверенностью можем сказать, что в большинстве современных систем видеонаблюдения, хотя они по-прежнему работают с аналоговыми телекамерами, используются цифровые видеорегистраторы для наблюдения и долгосрочного хранения записей. Качество телекамеры всегда остается отправной точкой, от которой мы отсчитываем качество системы видеонаблюдения, но теперь равным образом стали важны и качество записанного цифрового изображения, и качество обработки этого изображения.

В период между настоящим и первым изданиями этой книги (с 1996 года по 2005 год) произошли революционные сдвиги в таких сферах, как телевидение, мультимедийные приложения, фотография и видеонаблюдение. Основная часть новых разработок связана с цифровой технологией. Одним из локомотивов подлинного бума в индустрии видеонаблюдения стал переход к цифровой обработке, передаче и хранению видеоинформации. Этот «локомотив» набрал ход только недавно, что и послужило причиной выхода полностью нового издания этой книги, где мы подробно обсудим вопросы, связанные с цифровыми и сетевыми технологиями и сжатием изображения.

Всего лишь несколько лет назад стоимость производительной цифровой электроники, способной обрабатывать видео в режиме реального времени, была слишком высокой и экономически неоправданной. Но в настоящее время с постоянным увеличением производительности и скорости микросхем памяти, процессоров и жестких дисков происходит постоянное уменьшение их стоимости.

Таким образом, цифровая обработка видеосигналов оказалась не только возможной и более доступной, но фактически стала единственной альтернативой при обработке большого количества качественных видеосигналов.

Цифровое видео проникло в индустрию вещательного телевидения в начале 1990-х годов. Подобно любой новой технологии, на первых порах использовалось очень редко и стоило дорого. Сегодня мы говорим о цифровом видео как о новом стандарте, который пришел на смену аналоговому телевидению почти 50-летней давности. Существует два варианта: телевидение стандартной четкости (SDTV, Standard Definition), у которого соотношение сторон 4:3 и привычное качество, и телевидение высокой четкости (HDTV, High Definition) с соотношением сторон 16:9 и примерно в 5 раз большим количеством пикселов. Во многих странах мира уже ведется телевизионное вещание в цифровой форме, обычно в том и другом формате (SDTV и HDTV). Неудивительно, что большинство потребителей предпочитают стандарт HDTV, у которого выше разрешение и соотношение сторон, характерное для широкоформатного экрана кинотеатра, но так как в видеонаблюдении мы имеем дело со стандартным разрешением, то в этой мы рассмотрим все основные вопросы, связанные с цифровым видео стандартного разрешения с соотношением сторон 4:3.

Цифровые видеорегистраторы (DVR) и сетевые телекамеры стали причиной нового роста в индустрии видеонаблюдения, источником больших прибылей и новых идей решений в разработке интеллектуальных систем видеонаблюдения. Они сделали очень зыбкой и практически невидимой ту границу, которая отделяет компьютеры, сетевые и информационные технологии от видеонаблюдения.

Преимущества цифрового видеонаблюдения

По определению аналоговые сигналы могут иметь любое значение в заданном диапазоне. Примером такового аналогового сигнала может служить как аудиосигнал, так и видеосигнал. Как мы знаем, заданным диапазоном для аналогового видеосигнала является интервал от 0 вольт, что соответствует черному, до 0.7 вольт, что соответствует белому.

Как уже говорилось ранее, большинство телекамер, используемых сейчас в видеонаблюдении, формируют аналоговые сигналы. Однако основная проблема, с которой мы сталкиваемся при работе с аналоговыми сигналами, заключается в том, что в них возникает и накапливается шум, и, как читатели, вероятно, знают из собственного опыта, в реальных условиях от этого шума избавиться невозможно. Он накапливается на каждом этапе формирования, передачи и обработки видеосигнала.

Возникая еще в матрице и электронике телекамеры на начальном этапе формирования сигнала, шум увеличивается как при передаче (в кабеле), так и на завершающем этапе (в видеомониторах и устройствах записи и т. д.). Чем длиннее путь видеосигнала, тем больше шума мы получим в конце этого пути.

Именно в этом проявляется существенное отличие цифрового сигнала. Так, одним из наиболее принципиальных различий между аналоговым и цифровым сигналом, кроме непосредственно формы, является иммунитет к шумам. Цифровой сигнал в электронной форме также подвержен воздействию шума, как и аналоговый. Но цифровые сигналы могут иметь только два значения: нуль и единицу. Шум будет воздействовать на сигнал только в том случае, если его величина достигнет уровней, которые могут превзойти помехоустойчивость цифровых схем, определяющих равенство сигнала нулю или единице. Это означает, что цифровые сигналы допускают аккумуляцию шума до невообразимого уровня по сравнению с аналоговыми видеосигналами, поэтому мы говорим, что цифровые сигналы фактически имеют иммунитет к шумам. (Можно также отметить, что уровням «нуль» и «единица» в цифровых электронных устройствах соответствуют режимы отсечки или насыщения активных элементов, а в этих режимах усиление наводок невозможно. Прим. ред .)

В конечном итоге, это дает более протяженные расстояния для передачи, высокую помехозащищенность и отсутствие деградации сигнала, то есть более высокое качество изображения.

Другое важное преимущество цифрового видеосигнала — это возможность цифровой обработки и хранения информации. Под этим подразумевается улучшение изображения, его сжатие, различные коррекции и т. д. Крайне существенным является то, что копия и оригинал ничем не отличаются по качеству изображения. Сколько бы копий цифрового изображения мы ни делали (1,2 или 10), качество всегда будет оставаться таким же, как у оригинала. И последним (не по степени важности) преимуществом цифрового видео является возможность проверки подлинности копии. Эта функция часто называется нанесением «водяных знаков» (water-mark) и позволяет защитить информацию, записанную в цифровой форме от подделки, что крайне важно для индустрии видеонаблюдения.

Рис. 9.2. Представление цифрового видеосигнала

Цифровые видеорегистраторы (DVR)

В настоящее время в видеонаблюдении эпоха записи на видеокассеты практически завершилась. Пять лет назад при подготовке предыдущего издания книги, видеомагнитофоны еще встречались в большом количестве, а цифровые видеорегистраторы только начинали появляться. Сейчас они поменялись местами. Но какие реальные преимущества дают в видеонаблюдении цифровые видеорегистраторы по сравнению с видеомагнитофонами?

Во-первых, видеомагнитофоны с аналоговым методом хранения информации не позволяют быстро найти нужную запись от нужной телекамеры, исключение составляет относительно быстрый поиск по тревогам, который имеется во многих TL-видеомагнитофонах. Так как видеомагнитофоны хранят информацию в аналоговом виде, то ее дальнейшая обработка практически невозможна. Запись видеомагнитофона всегда имеет более низкое качество, чем у исходного видеосигнала.

Первоначально были попытки внедрить цифровую запись в видеонаблюдении на цифровых кассетах формата DAT. Несмотря на то, что информация записывалась в цифровом виде, доступ к ней по-прежнему осуществлялся последовательно, что не так эффективно, как при произвольном доступе к информации жесткого диска. Кроме того, жесткие диски имеют значительно более высокую скорость передачи данных и большую емкость, чем у других доступных устройств хранения. При этом можно записывать видео с качеством выше, чем S-VHS, используя соответствующие алгоритмы сжатия. Еще несколько лет назад существовала проблема длительности записи на жесткие диски, но это уже осталось в прошлом. Сейчас широко распространены жесткие диски объемом 300 Гбайт, а цифровые видеорегистраторы с объемом внутреннего дискового пространства 1200 Гбайт (1.2 Тбайт) перестали быть редкостью.

Хранение многих недель записи от нескольких телекамер перестало быть проблемой. Современные жесткие диски теперь имеют малое время доступа и при использовании хорошего алгоритма сжатия теперь на одном жестком диске можно хранить и воспроизводить в режиме реального времени (то есть с частотой обновления кадров «живого» видео) записи от нескольких телекамер одновременно.

Стоимость жестких дисков ежедневно снижается. Читателям, вероятно, интересно будет узнать, что когда шла работа над предыдущим изданием этой книги, появился первый жесткий диск формата 3.5 дюйма с емкостью 30 Гбайт. Теперь в 2005 году за ту же самую цену мы можем купить жесткий диск с десятикратной емкостью. В связи с возросшим значением жестких дисков для современной системы видеонаблюдения, эту главу мы завершим обсуждением их наиболее важных технических параметров.

Суммарное время записи, то есть сколько дней или неделей записи может храниться на жестком диске определенной емкости (например, 300 Гбайт) зависит от типа сжатия и качества исходного изображения. Также очень важным фактором будет вид записи: постоянная запись или запись по детектору движения. Запись по детектору движения стала очень популярной в видеонаблюдении, так как она позволяет увеличить время записи как минимум в 2–3 раза (это очень сильно будет зависеть от качества самого детектора движения). Конечно, можно увеличивать и емкость дискового пространства цифрового видеорегистратора, но при этом нужно не забывать и о повышении отказоустойчивости, что может быть уже изначальным требованием заказчика.

Когда мы имеем дело с таким количеством переменных, невозможно дать однозначный ответ. Но, поскольку я знаю, что одним из первых вопросов многих клиентов бывает вопрос о том, сколько дней записи можно будет хранить, то чтобы вам немного помочь, на нашем веб-сайте () я разместил две таблицы, позволяющие автоматически рассчитывать время записи.

Все сказанное выше приводит нас к различным размышлениям о том, что мы должны учитывать при выборе алгоритма сжатия, накопителей и их скорости передачи информации. Поэтому нам нужно понимать теорию обработки и сжатия цифрового видео. В следующей части главы мы постараемся объяснить основы.

Рис. 9.3. Цифровые видеорегистраторы

Стандарты и стандартизация

Существует несколько международных организаций, которые занимаются разработкой стандартов для цифрового видео. Более всего известен Международный телекоммуникационный союз ITU (International Telecommunication Union), который является агентством ООН, специализирующимся в сфере телекоммуникаций. Подразделение ITU-T является его постоянным органом. Оно занимается изучением технических и текущих вопросов, а также вопросов, связанных с тарификацией, и выпускает рекомендации, нацеленные на международную стандартизацию. Международная ассамблея стандартизации телекоммуникаций WTSA (World Telecommunication Standardization Assembly) собирается раз в четыре года и определяет темы для изучения рабочими группами ITU-T, которые, в свою очередь, готовят рекомендации по этим темам. Утверждение рекомендаций ITU-T подробно описано в Резолюции 1 WTSA. В некоторых сферах, которые попадают в поле зрения ITU-T, необходимые стандарты разрабатываются совместно с другими организациями, такими, как ISO и IEC.

Международная организация по стандартизации ISO (International Organization for Standardization) и Международная электротехническая комиссия IEC (International Electrotechnical Commission) являются основой специализированной системы международной стандартизации. Национальные институты, члены ISO и IEC, участвуют в разработке международных стандартов через технические комитеты ISO и IEC.

Эти технические комитеты создаются для работы над определенными техническими вопросами и имеют свою специализацию. Комитеты ISO и IEC сотрудничают в сфере взаимных интересов. Другие международные организации, правительственные и неправительственные организации, связанные с ISO и IEC, тоже принимают участие в разработке стандартов. В сфере информационных технологий ISO и IEC организовали совместный комитет ISO/IEC JTC1. Предварительные стандарты, разработанные техническим комитетом, передаются для голосования в национальные институты для голосования. Для утверждения стандарта в качестве международного необходимо одобрение не менее 75 % организаций, имеющих право голоса.

Некоторые рекомендации, такие, как новый стандарт Н.264, были подготовлены совместно группами ITU-T SG16 Q.6, которая известна как VCEG (Video Coding Experts Group), и ISO/IEC JTC1/SC29/WG11, которая также называется MPEG (Moving Picture Experts Group). Группа VCEG была сформирована в 1997 году для поддержки уже существовавших стандартов ITU-T кодирования видео и для разработки новых стандартов для применения в широкой сфере коммуникационных и некоммуникационных приложений.

Группа MPEG (экспертная группа по вопросам движущегося изображения) была образована в 1988 году с целью разработки стандартов кодирования аудио и видео для различных сфер применения, таких, как хранение, распространение и передача цифровой информации.

Следует отдельно оговорить и то, что хотя в видеонаблюдении мы используем видеосигнал и будем говорить о сжатии движущихся изображений, нашло применение и сжатие отдельных неподвижных изображении. Поэтому, чтобы подчеркнуть разницу между этими двумя видами сжатия, мы будем говорить о сжатии видеоизображения (подвижного) и сжатии изображения (неподвижного). (Однозначной терминологии в русском языке не существует. Можно говорить о сжатии изображения и сжатии видеопотока. Прим. ред .)

Алгоритмы сжатия видеоизображения используют три измерения: горизонтальное, вертикальное и временное. Поэтому такой вид сжатия часто называют еще временным и межкадровым. Типичным примером алгоритмов с межкадровым сжатием являются MPEG-1, MPEG-2, MPEG-4, H.263 и Н.264.

Алгоритмы сжатия изображения используют только два измерения: горизонтальное и вертикальное.

Типичными его представителями будут JPEG и Wavelet (JPEG-2000).

В видеонаблюдении нам очень часто приходится сталкиваться со сложной задачей выбора оптимального алгоритма сжатия для какой-либо конкретной задачи. Запомните, простого и однозначного решения этой задачи не существует. Очень часто многое зависит от того, насколько хорошо мы понимаем различия между различными алгоритмами сжатия, но еще важнее знать, для чего нужна система видеонаблюдения.

Если цифровая система видеонаблюдения должна обеспечивать безопасность кассира в банке или раздающего карты в казино, то необходимы высокие скорости записи и отображения. Очень часто будет предпочтительна скорость «живого» видео (25 кадров в секунду для PAL и 30 — для NTSC), хотя в некоторых случаях будет достаточно и 10 кадров в секунду. Скорость записи и отображения теоретически можно снизить еще больше, но это не будет практичным решением. В данном случае тестирование поможет вам выбрать оптимальное решение.

В качестве другого примера приведем типичную задачу записи повседневной активности людей. Например, люди входят и выходят из фойе здания. В данном случае высокая скорость записи только увеличит объем архива, что снизит общую эффективность системы видеонаблюдения, так как архивные записи еще кому-то впоследствии потребуется просмотреть и проанализировать. Повседневную человеческую деятельность достаточно записывать со скоростью 2 кадра в секунду (хотя можно и повысить скорость), при условии что качество изображения достаточно высоко, а уровень сжатия низок. Что мы увидим в записи и насколько высок будет уровень детализации, зависит от угла обзора объектива, но если на изображении можно разглядеть лицо человека при высокой скорости записи, то это можно будет сделать и при скорости записи 2 кадра в секунду.

Еще одной важной технологией записи, которую применяют в видеонаблюдении, является запись с мультиплексированием. В современном цифровом видеонаблюдении мы во многом копируем то, что было сделано во времена аналоговой записи с использованием видеомультиплексоров и видеомагнитофонов. В настоящее время типичный цифровой видеорегистратор, используемый в видеонаблюдении, на самом деле представляет собой устройство, в котором объединены функции видеомультиплексора и видеомагнитофона с цифровой записью. В таких устройствах удобнее применять сжатие изображения, а не сжатие видеоизображения, так как цифровой видеорегистратор будет сжимать телевизионные кадры или поля как отдельные изображения, от какой бы телекамеры ни пришло то или иное изображение. Некоторые возразят, что серьезным недостатком алгоритмов сжатия изображения, которые используются в цифровых видеорегистраторах с мультиплексированием, будет достаточно большой размер одного изображения (обычно при хорошем качестве одно сжатое телевизионное поле занимает примерно 30–60 килобайт). Но преимуществом таких алгоритмов сжатия изображения оказывается то, что каждое изображение будет независимым от других, то есть оно само по себе содержит достаточно информации, чтобы его можно реконструировать, не пользуясь предшествующими или последующими кадрами записи. Юридически в некоторых случаях такие алгоритмы сжатия изображения будут предпочтительнее по причине независимости отдельных кадров записи. Это, конечно, не означает, что сжатие видеоизображения не позволит использовать запись в суде, а только подчеркивает тот факт, что алгоритмы сжатия видеоизображения реконструируют нужный кадр на основе предшествующих или последующих кадров записи. При использовании алгоритмов сжатия изображения мы можем иметь значительно более низкую скорость записи, чем 25 кадров в секунду (29.97 кадров в секунду для NTSC), что позволяет экономить пространство жесткого диска. А в сочетании с записью по детектору движения, которая имеется в большинстве цифровых видеорегистраторов с записью с мультиплексированием, это превращает DVR в очень мощную замену традиционной комбинации видеомультиплексора и видеомагнитофона. Поэтому на один цифровой видеорегистратор сейчас можно записывать без перезаписи несколько телекамер со скоростью нескольких кадров в секунду в течение многих дней, недель и даже месяцев. Об этом можно было только мечтать еще 5-10 лет назад.

Когда мы хотим достичь максимально возможного качества с максимально возможной скоростью записи в цифровых видеорегистраторах, лучше всего подходит межкадровое сжатие, поскольку оно эксплуатирует межкадровую избыточность видеопотока. Впрочем, для достижения максимальной эффективности требуется продолжительный по времени видеосигнал от одной телекамеры. Другим достоинством алгоритмов сжатия видеоизображения является то, что поддержка записи звука в них включена изначально. Алгоритмы с межкадровым сжатием используют предсказание движения (не путать с детектированием движения), что делает движение более плавным при воспроизведении. Кстати, именно поэтому такие алгоритмы и не используются при записи с мультиплексированием.

Более того, если в цифровом видеорегистраторе есть несколько видеовходов и межкадровое сжатие, то скорее всего по каждому входу он записывает на жесткий диск независимые видеопотоки.

Еще одна важная особенность, напрямую связанная с межкадровым сжатием, заключается в появлении задержки (отставания), которая хорошо заметна в таких стандартах сжатия, как MPEG-1 и MPEG-2. Это непосредственно связано с принципами, реализованными в межкадровом сжатии, где избыточность видеосигнала сокращается при сравнении кодируемого кадра с предшествующим и последующим, что требует буферизации и вызывает задержку при кодировании и декодировании. Этот эффект более всего заметен в стандарте MPEG-2, где высокое качество изображения достигается при высокой скорости передачи данных (обычно более 4 Мбит/с), что вызывает задержку от половины до одной секунды. В вещательном телевидении или при просмотре фильма на DVD такая задержка видеосигнала не будет существенной, но она может стать серьезной проблемой в видеонаблюдении, когда нужно управлять поворотной камерой, сигнал которой кодируется для передачи по сети. Впрочем, снизив скорость передачи данных и уменьшив размер структуры GOP (group of pictures), можно добиться приемлемой задержки в 200 миллисекунд и даже меньше с незначительным ухудшением качества изображения.

Рис. 9.4. Один и тот же фотоснимок с различным разрешением: 50x50, 100x100 и 200x200 пикселов

Стандарты сжатия видеоизображения, которые используют низкую скорость передачи данных и предназначены для видеоконференций (то есть предусматривают двустороннюю передачу видеопотоков), такие, как Н.263 и MPEG-4 имеют значительно меньшую задержку, хотя качество изображения тоже снижается.

За последнее десятилетие технологии обработки и сжатия изображения эволюционировали очень быстро и значительно. Хотя в большинстве случаев MPEG-2 доминирует в индустрии вещательного телевидения и DVD, не исключено, что новые и более эффективные стандарты сжатия со временем его вытеснят. К момену написания этой книги самым новым и наиболее перспективным стандартом сжатия видеоизображеия считался Н.264 (на базе MPEG-4 v.10, также известный как кодек AVC, advanced video codec), a самым новым и перспективным стандартом сжатия изображения был JPEG-2000 (на базе Wavelet-сжатия). Впрочем, будущее покажет, так ли это на самом деле.

Теперь перечислим стандарты сжатия, которые используются или могут быть использованы в ближайшeм будущем в видеонаблюдении. Более подробно мы их рассмотрим далее в этой главе.

— JPEG и Motion-JPEG (сжатие изображения)

— JPEG-2000 /Wavelet и Motion JPEG-2000 (сжатие изображения)

— MPEG-1 (сжатие видеоизображения, используется скорость передачи данных 1–3 Мбит/с)

— MPEG-2 (сжатие видеоизображения, используется скорость передачи данных 1-30 Мбит/с)

— MPEG-4 (сжатие видеоизображения, используется еще меньшая скорость передачи данных 9.6 кбит/с-1.5 Мбит/с)

— MPEG-7 (новая концепция, имеющая функции интеллектуального поиска объектов)

— MPEG-21 (самая новая концепция, обещающая большую степень интеграции возможностей семейства MPEG)

— Н.261 (сжатие видеоизображения, один из первых и самых старых стандартов, предназначен для видеоконференций, использует скорости передачи, кратные 64 кбит/c, характерные для ISDN)

— Н.263 (улучшенный Н.261, использует еще меньшие скорости передачи данных)

— Н.264/AVC (новый и прогрессивный стандарт сжатия видеоизображения с широкой областью применения)

— Другие (собственные и гибридные реализации)

Рис. 9.5. Аналого-цифровое преобразование начинается с дискретизации и квантования аналогового видеосигнала

Существуют и другие, гибридные виды сжатия, которые сочетают особенности сжатия изображения и сжатия видеоизображения. Например, сжатие типа Motion Wavelet или Multi-Layer JPEG и другие собственные разработки компаний-производителей.

Преимущества аппаратной компрессии очевидны: скорость сжатия постоянна и не зависит от загруженности центрального процессора другими задачами (передача по сети, резервное копирование данных и т. д.).

Впрочем, общеизвестно, что программная компрессия позволяет легко и быстро модифицировать устройства записи и добавлять новые функции, так как она зависит только от программного кода, который можно легко обновить.

ITU-601 : Объединяя NTSC и PAL

Прежде чем перейти к обработке или хранению сигнала в цифровом формате, осуществляется его аналого-цифровое преобразование. Оно может производиться в сетевой телекамере или в цифровом видеорегистраторе. На этом этапе происходит дискретизация и квантование аналогового сигнала (преобразование в дискретную форму). Частота дискретизации и количество уровней квантования зависят от качества и быстродействия электроники и определяют разрешение (качество) оцифрованного изображения и частоту регенерации цифровой кадровой памяти. В данной связи необходимо понимать, что, несмотря на большой выбор вариантов дискретизации и квантования при аналого-цифровом преобразовании, был разработан телевизионный стандарт оцифровки и большая часть продукции, используемой в видеонаблюдении, соответствует ему.

Рекомендация ITU-R BT.601 определяет оцифровку аналогового видеосигнала, состоящего из яркостной компоненты Y красной цветоразностной компоненты и синей цветоразностной компоненты, с базовой частотой дискретизации 3.375 МГц, которая будет общей как для PAL, так и для NTSC. Яркостная компонента оцифровывается с четырехкратной базовой частотой дискретизации (то есть 3.375 х 4 = 13.5 МГц), а цветоразностные компоненты оцифровываются с двукратным увеличением базовой частоты дискретизации (то есть 6.75 МГц). Таким образом, этот формат оцифровки известен как 4:2:2. Существуют и другие форматы оцифровки, такие, как 4:1:1 и 4:4:4, но формат 4:2:2 является одним из наиболее распространенных в видеонаблюдении.

Если мы сейчас вспомним количество строк в кадре и количество кадров в секунду для стандарта, то, перемножив 625 строк в кадре на 25 кадров в секунду, получим 15625 строк в секунду. Теперь частоту дискретизации 13.5 МГц (то есть 13500000 раз в секунду) разделим на полученное значение, что даст нам 864 отсчета для каждой строки. Таково качество дискретизации видеосигнала PAL согласно рекомендациям ITU-601C частотой дискретизации 13.5 МГц. Поскольку длительность строки PAL составляет 64 мкс, то 864 отсчета, которые приходятся на строку, разбивают этот период времени на очень малые интервалы (см. рис. 9.6).

Рис. 9.6. Частота дискретизации, рекомендованная ITU-601

Следует отметить, что 864 отсчета в строке включают в себя и импульсы синхронизации.

Для стандарта NTSC с 525 строками и частотой обновления 59.94 Гц (именно 59.94, а не 60) мы получаем 525 х 29.97 Гц = 15734.25 строк в секунду. Разделив 13.5 МГц на 15734.25 Гц, получим 858 отсчетов на одну строку, которые опять будут включать в себя импульсы синхронизации.

Рис. 9.7. Дискретизация сигнала

Итак, подводя итоги, еще раз отметим, что, согласно рекомендации ITU-601, для дискретизации яркостного сигнала в стандарте PAL используется 864 отсчета на одну строку, а в стандарте NTSC — 858 отсчетов на строку. В обоих случаях используется частота 13.5 МГц.

Из изложенных выше фактов следует очень важный вывод: ITU-R BT.601 представляет собой первую международную рекомендацию, которая пытается объединить в рамках общей цифровой концепции дискретизации два несовместимых аналоговых композитных телевизионных стандарта (NTSC с 525/59.94 и PAL с 625/50). Основным достижением этой рекомендации стал выбор общей частоты дискретизации 13.5 МГц, которая одинакова для обоих стандартов.

Из 864 отсчетов для PAL и 858 отсчетов для NTSC в обоих случаях на активные строки без синхроимпульсов приходится по 720 отсчетов. Это максимальное горизонтальное разрешение видеосигнала, оцифрованного согласно рекомендации ITU-601. Термин «разрешение» здесь используется в более широком значении, чем в аналоговом телевидении, где разрешение выражено в ТВ-линиях, но об этом мы поговорим подробнее далее.

Некоторые из вас могут задать вопрос: «Почему именно 720 отсчетов, а не больше или меньше?» Это связано с тем, что 720 без остатка делится на 8 (то есть, 23), что очень удобно для большинства стандартов сжатия, использующих дискретное косинусное преобразование (JPEG, MPEG, серия стандартов Н), где изображение разбивается на блоки 8x8 пикселов.

Рис. 9.8. Количество пикселов в кадре, согласно рекомендации ITU-601

Очень часто приходится сталкиваться с такой ситуацией, что цифровое оборудование «отрезает» по 8 отсчетов слева и справа активной строки, в которой после этого остается 704 пиксела вместо 720. Это сделано для того, чтобы более устойчиво обрабатывать нестабильные сигналы от различных телекамер.

Вертикальная дискретизация, согласно рекомендации ITU-601, равна количеству активных строк, которых приходится 288 на одно телевизионное поле (или 576 для полного телевизионного кадра) в PAL и 240 на одно телевизионное поле (или 480 для полного телевизионного кадра) в NTSC.

Таким образом, оцифрованный согласно рекомендации ITU-601 телевизионный кадр имеет формат 720x576 пикселов для PAL и 720x480 пикселов для NTSC.

Это показывает, что рекомендация ITU-601 учитывает чересстрочную развертку, что позволяет во многих цифровых видеорегистраторах выбрать режим записи полями или кадрами.

Наблюдательный читатель, вероятно, уже заметил в приведенных выше числах некоторое несоответствие, которое иногда сбивает с толку, когда речь идет о цифровом видео. Эта неточность касается соотношения сторон в телевидении стандартной четкости и в изображениях, получаемых при оцифровке согласно рекомендации ITU-601. Как мы знаем, все видеомониторы в системах видеонаблюдения имеют соотношение сторон 4:3 = 1.33, но соотношение сторон по рекомендации ITU-601 для кадра PAL будет 720:576 =1.25, а для кадра NTSC 720:480 = 1.5. Это приводит к появлению т. н. «неквадратных» пикселов в обоих телевизионных стандартах. В стандарте PAL пикселы сжимаются по горизонтали, и поэтому для отображения на мониторе с соотношением сторон 4:3 кадр необходимо растянуть. В стандарте NTSC пикселы необходимо растягивать уже по вертикали перед выводом на монитор, так как они были сжаты по вертикали. Это растяжение пикселов выполняется на последнем этапе декодирования изображения перед его отображением. Это может показаться необязательным, но, тем не менее, именно растяжение пикселов позволяет сделать декодирующую электронику более универсальной и дешевой, так как она используется как для PAL, так и для NTSC.

Рис. 9.9. Пример испытательной таблицы, оцифрованной согласно рекомендации ITU-601. Обратите внимание на горизонтальное сжатие для PAL (слева), и как оно пропадает при аналоговом выводе (справа).

Разрешение изображения, оцифрованного согласно рекомендации ITU-601

Согласно теории Найквиста, непрерывный аналоговый сигнал может быть реконструирован без потери информации из отдельных частей, если частота дискретизации не менее чем в два раза выше самой высокочастотной составляющей спектра сигнала. Когда в сигнале появляются высокочастотные паразитные составляющие, то они приводят к наложению спектров (наподобие муара, эффект алиасинга, aliasing), поэтому они крайне нежелательны. Чтобы избавиться от паразитных высоких частот, сигнал нужно пропустить через фильтр низких частот, который отсечет все частоты, выше максимальной, которая равна половине частоты дискретизации. Идеального фильтра низких частот на практике не существует, поэтому отсекание частот будет происходить немного ниже, чем требуется теорией. Это имеет прямое отношение к количеству горизонтальных элементов (пикселов), которые сможет обрабатывать цифровая система.

В идеальных условиях, если не производится дополнительная фильтрация сигнала, то, имея частоту Найквиста 6.75 МГц (то есть частота дискретизации составит 13.5 МГц), 720 пикселов в активной строке будут эквивалентны горизонтальному разрешению 3/4x720=540 ТВ-линий, как это определено в аналоговом телевидении.

Впрочем, рекомендация ITU-601 определяет и отсекание частот до 5.75 МГц за счет работы дополнительного фильтра защиты от наложения спектров (anti-aliasing and reconstruction filter), что уменьшает горизонтальное разрешение аналогового яркостного сигнала до 449 ТВ-линий для PAL и 455 ТВ-линий для NTSC.

Дальнейшее уменьшение разрешения связано уже со сжатием изображения, поэтому мы можем сказать, что на практике ни один оцифрованный видеосигнал в видеонаблюдении не может иметь разрешение выше, чем примерно 450 ТВ-линий. Теперь становится очевидным, что выбор такого алгоритма сжатия, который дает минимальные потери качества, является предметом первостепенной важности. Но это требование противоречит необходимости очень длительной записи, которая достигается за счет повышения уровня сжатия. Различные стандарты сжатия мы тоже рассмотрим в этой главе, но сейчас необходимо подчеркнуть, что вышеприведенный предел горизонтального разрешения оцифрованного видеосигнала справедлив еще до того, как будет осуществлено сжатие изображения.

Глаз человека менее чувствителен к цветовому разрешению, поэтому в видеонаблюдении формат оцифровки 4:2:2 мы считаем как вполне приемлемый, где дискретизация цветоразностных сигналов осуществляется с частотой 6.75МГц (вдвое меньше, чем частота дискретизации яркостного сигнала). Это дает 432 пиксела для PAL и 429 пикселов для NTSC в одной строке (включая импульсы синхронизации). Таким образом, в одной оцифрованной активной строке умещается 360 цветоразностных красных отсчетов и 360 цветоразностных синих отсчетов для обоих телевизионных стандартов.

Рис. 9.10. Разница между полным кадром 720x576 пикселов (иллюстрация слева) и изображением формата CIF (360x288) будет достаточно велика, а иногда будет заключаться в том, что вы сможете или не сможете распознать автомобильный номер. В качестве примера сказанному внимательно посмотрите на фотографию (машина справа).

В идеальных условиях, когда частота Найквиста будет равна 3.375 МГц, 360 отсчетов в активной строке будут эквивалентны 3/4x360=270 ТВ-линиям. Рекомендация ITU-601 определяет и отсекание частот до 2.75 МГц за счет работы дополнительного фильтра защиты от наложения спектров, что уменьшает горизонтальное разрешение аналоговых цветоразностных сигналов до 215 ТВ-линий для PAL и 218 ТВ-линий для NTSC.

Все изложенное выше и в особенности данные об оцифровке яркостного сигнала позволяет нам прийти к очень важному заключению относительно разрешения оцифрованного видео. Сразу отметим, что наш вывод касается только рекомендации ITU-601, а, как уже было сказано выше, большинство цифрового оборудования, которое используется в видеонаблюдении, придерживается этой рекомендации.

При записи на цифровые видеорегистраторы, совместимые с рекомендацией ITU-601, мы не получим никакого преимущества от телекамер с разрешением выше 450 ТВ-линий.

Нечто похожее уже наблюдалось в истории видеонаблюдения, когда использовались телекамеры высокого разрешения (например, 460 ТВ-линий) для записи на видеомагнитофоны VHS, у которых разрешение ограничено было 240 ТВ-линиями из-за фильтра низких частот. Конечно, разница в случае с цифровыми видеорегистраторами не будет такой существенной, так как относительно недавно некоторые производители заявили о выпуске цветных телекамер с разрешением 520 ТВ-линий. На практике это для нас означает, что мы не увидим никакой разницы от телекамеры с 460 ТВ-линиями и 480 ТВ-линиями или даже 520 ТВ-линиями горизонтального разрешения при записи цветного изображения на цифровой видеорегистратор (даже самого лучшего качества), соответствующий рекомендации ITU-601. Следует уделить больше внимания выбору телекамеры с лучшим отношением сигнал/шум, меньшим смазыванием или лучшим динамическим диапазоном, чем ориентироваться на небольшие отличия в горизонтальной разрешающей способности, которые все равно никто не сможет увидеть. Но если система предназначена только для наблюдения с использованием высококачественных видеомониторов, у которых разрешение превышает 500 ТВ-линий, такая небольшая разница в разрешении может оказаться полезной. Впрочем, это потребует подключения раздельного видеосигнала Y/C вместо композитного видеосигнала, что очень редко используется в видеонаблюдении, иначе разница будет практически незаметной.

Конечно, никто не может предсказать, с чем мы столкнемся в будущем, но уже сейчас с уверенностью можно сказать, что рано или поздно в видеонаблюдении появятся телекамеры высокого разрешения и соответствующие им рекомендации по оцифровке. Однако, пока этого не произошло, нам необходимо помнить о всех ограничениях, с которыми нам приходится сталкиваться, и компромиссах, которые заложены в цифровых системах видеонаблюдения.

Все, что было изложено выше, справедливо для горизонтального разрешения, но теперь настало время поговорить о вертикальном разрешении. Для некоторых цифровых систем видеонаблюдения вертикальное разрешение будет не менее важно, чем горизонтальное, особенно в тех случаях, когда необходимо распознать лицо или номерной знак автомобиля на расстоянии.

Рис. 9.11. ITU- 601 рекомендует несколько форматов оцифровки, из которых в видеонаблюдении широко распространен формат 4:2:2.

Рис. 9.12. Если частота дискретизации слишком низка, то видеосигнал будет реконструирован неверно

Рис. 9.13. Слева: ТВ-поле; В центре: Эффект чересстрочной «гребенки»; Справа: Работа алгоритма деинтерлейсинга. Обратите внимание на зубчатые контуры автомобиля на иллюстрации слева, где была использована запись полями, и на качество тех же контуров на иллюстрациях в центре и справа, где использовалась запись кадрами.

В рекомендации ITU-601 выбрано 8-битное квантование, что дает нам 256 уровней квантования(28 = 256). Этот выбор очень практичен с инженерной точки зрения: ни одна электронно-лучевая трубка не в состоянии передать более 250 оттенков серого, поэтому не имеет смысла квантовать видеосигнал большим количеством уровней. Значение 256 выбрано потому, что оно является степенью двойки, а в мире цифровых устройств, как мы знаем, все представлено нулями и единицами (то есть, в двоичной системе счисления).

Имея дело с рекомендацией ITU-601, мы должны быть готовы к появлению новых подводных камней. Как было в случае с частотой дискретизации 13.5 МГц, которая учитывала весь видеосигнал, включая синхроимпульсы, ITU-601 рекомендует использовать 8-битный диапазон уровней квантования для представления всех вертикальных деталей видеосигнала. В данном случае мы можем расценивать время как горизонтальные детали, так как оно имеет дело со строками, которые разворачиваются на мониторе по горизонтали.

Таким образом, ITU-601 предлагает из 256 доступных уровней квантования 8-битного диапазона значения 0 и 255 использовать для синхронизации, а значения от 1 до 254 — для видео. Яркостный уровень черного задается значением 16 (двоичное значение 00010000), а уровню белого присваивается значение 235 (двоичное значение 11101011). Значение 128 зарезервировано для определения цветного или черно-белого видеосигнала.

Рис. 9.14. Сравнение полнокадрового формата с форматом CIF

Как уже было сказано выше, количество пикселов по вертикали в ТВ-кадре PAL будет 576, тогда как для NTSC это будет 480, что соответствует количеству активных строк в этих телевизионных стандартах. Необходимо напомнить читателям, что аналоговые телекамеры в видеонаблюдении генерируют видеосигнал с чересстрочной разверткой (50 полей в секунду или 29.97 полей в секунду). Кадр при чересстрочной развертке состоит из двух телевизионных полей, смещенных во времени относительно друг друга (на 1/50 секунды для PAL и 1/29.97 секунды для NTSC). Поэтому в оцифрованном видеофрагменте с движущимися объектами может проявляться эффект чересстрочной «гребенки» при записи полными кадрами. Это нормальный телевизионный эффект, возникающий как следствие чересстрочной развертки. Это даже не ошибка оцифровки, как иногда считают. При этом возникает ощущение, что движущиеся объекты размываются в направлении движения, и, чем быстрее движется объект, тем сильнее будет заметен этот эффект.

Существуют специальные алгоритмы обработки цифрового изображения, которые позволяют минимизировать или полностью исключить этот эффект. Это называется деинтерлейсингом (de-interlacing). Такая функция присутствует в различных графических редакторах, таких, как Photoshop или Photopaint, но ее имеют и некоторые цифровые видеорегистраторы.

Рис. 9.15. Полный кадр, записанный цифровым видеорегистратором с использованием Wavelet-сжатия

Рис. 9.16. Полный кадр, записанный цифровым видеорегистратором с использованием сжатия MPEG-2

При записи в полнокадровом режиме, в отличие от записи полями, вертикальное разрешение повышается в два раза, что делает края объектов более плавными и позволяет видеть больше деталей (см. примеры на иллюстрациях). Когда запись ведется кадрами, но телевизионные поля записываются и обрабатываются раздельно, то при отображении такого фрагмента на экран выводятся поочередно четные и нечетные поля, что вызывает ощущение «прыгающего» вверх и вниз изображения, так как четные и нечетные поля смещены относительно друг друга по вертикали на одну строку. На самом деле это вполне естественный эффект, обусловленный чересстрочной разверткой, а не ошибка при воспроизведении, как иногда считают. (Такой режим отображения производители зачастую пытаются выдать за собственную уникальную разработку. Будьте внимательны, на российском рынке он фигурирует под разными названиями (режим «казино», ускоренная запись, запись 50 к/с и т. д. Прим. ред .) , но никаких особых преимуществ не предоставляет и никакой дополнительной информации, помимо той, что содержалась в видеосигнале, тоже не дает. При желании его можно получить самостоятельно, имея в наличии программу для обработки и редактирования видео.) Отметим, что раздельная запись и обработка четных и нечетных телевизионных полей приводит к значительному увеличению размера архива.

Рис. 9.17. Разница между телевизионным полем (слева) и полным кадром (справа)

Возможно, читатели уже задаются вопросом, как можно нормально отображать оцифрованное видео, записанное полями (720x288 для PAL или 720x240 для NTSC), на экране или при экспорте изображения.

Ответ прост. Это достигается дублированием каждой строки. (Это не всегда так, потому что существует несколько алгоритмов интерполяции недостающих строк. Эти алгоритмы отличаются визуальным качеством и ресурсоемкостью. Впрочем, нужно помнить, что никакая интерполяция не сможет повысить реальную детализацию изображения и дать нам новую информацию. Прим. ред .) Такой способ приводит еще к одному заметному эффекту, который выражается в появлении зубчатых границ на изображении.

Глаз человека более чувствителен к разрешению по горизонтали, чем в вертикальном направлении, и, вероятно, поэтому большинство производителей цифровых видеорегистраторов предпочитают запись полями. Впрочем, в некоторых случаях вертикальное разрешение для нас оказывается важным, и тогда следует вести запись полными кадрами. А в некоторых цифровых видеорегистраторах возможна только запись полями, что ограничивает нас в выборе.

Рис. 9.18. Изображение, на котором зафиксирован реальный похититель, экспортированное в формате BMP , (слева) и детализация полного кадра (вверху) и формата CIF (внизу).

Вышеописанный эффект чересстрочной «гребенки» проявляется в основном при использовании сжатия изображения JPEG или Wavelet, то есть без межкадрового сжатия когда телевизионные поля обрабатываются как отдельные статичные изображения.

Однако, если применяется сжатие видеоизображения, то есть присутствует межкадровое сжатие, (например, семейство MPEG и Н.26х), то эффект чересстрочной «гребенки» частично компенсируется в процессе вычисления векторов предсказания движения и будет не так сильно заметен.

Все наши рассуждения до сих пор были применимы к так называемому полнокадровому разрешению. Но существуют стандарты сжатия изображения, которые используют в 4 раза меньшее количество пикселов (то есть 352x288 или 352x240 пикселов), чем содержится в полном кадре. Такой формат кадра обычно называется CIF (Общий формат обмена видеоданными, Common Interchange Format) и, как правило, используется стандартами сжатия MPEG-1 и Н.261. Это делается для того, чтобы уменьшить поток данных до приемлемого для видеоконференций уровня, который сопоставим по качеству изображения с VHS. Когда речь идет о разрешении систем видеонаблюдения, использующих сжатие MPEG-1, Н.261 с форматом кадра CIF, все вышеприведенные вычисления будут применимы и в этом случае, но их нужно будет разделить пополам. Таким образом, эквивалентным аналоговым разрешением для формата CIF будет примерно 220 ТВ-линий. Формат CIF содержит в четыре раза меньше пикселов, чем полный кадр в рекомендации ITU-601 (в два раза меньше пикселов по вертикали и по горизонтали). Для многих областей применения качества CIF будет вполне достаточно, а скорость обновления кадров при записи и передаче возрастает. Это будет особенно полезно при организации видеоконференций, для которых изначально и создавался этот формат. Разрешение формата CIF до сжатия сопоставимо с разрешением аналогового видео VHS (240 ТВ-линий). Это необходимо учитывать при проектировании систем видеонаблюдения, где требуется распознавание лица и автомобильных номеров. Иногда формат полного кадра ITU-601 называют 4CIF, подчеркивая, что количество пикселов здесь в четыре раза больше, чем в формате CIF. Также существует и формат QCIF (Quarter CIF), в котором содержится в четыре раза меньше пикселов, чем в формате CIF (то есть 176x144 пиксела).

Рис. 9.19. Сегодня на рынке присутствует огромное количество цифровых видеорегистраторов

Вполне очевидно, что мы стремимся получить максимально высокое качество изображения, но нужно понимать, что, независимо от наших действий, качество сжатого изображения никогда не будет выше, чем у несжатого. Количество пикселов, которое содержится в оцифрованном изображении от любой телекамеры с аналоговым видеосигналом, даже при записи полного кадра составит в лучшем случае всего около 415000 пикселов для PAL и 345000 для NTSC. Чтобы показать, много это или мало, достаточно в качестве примера вспомнить о современных цифровых фотоаппаратах (например, фотоаппарат, у которого заявлено 4000000 пикселов). Поэтому, когда заказчик спрашивает о причине пикселизации при увеличении кадра, экспортированного с цифрового видеорегистратора, ответ будет простым: таково количество пикселов в оцифрованном изображении. Телекамеры, используемые в видеонаблюдении, дают нам такие кадры, которые имеют значительно более низкое разрешение, чем кадры, полученные с помощью пленочного или цифрового фотоаппарата, а поэтому их не стоит и сравнивать.

Таким образом, когда вы собираетесь проектировать систему видеонаблюдения, от которой требуется возможность распознавания лиц и автомобильных номеров, то следует брать в расчет и количество пикселов в оцифрованном изображении. Об этом мы еще поговорим в конце этой главы, где будет дано несколько рекомендаций по проектированию таких систем видеонаблюдения.

Рис. 9.20. Аналого-цифровое преобразование сигнала и его передача в типичной цифровой системе видеонаблюдения

Необходимость сжатия

Для того чтобы показать, какой поток данных потребуется для передачи видео, оцифрованного согласно рекомендации ITU-601, мы проведем несколько простых вычислений. Умножим количество отсчетов в каждой строке (864 для PAL и 858 для NTSC) на количество строк телевизионного стандарта (625 и 525).

Результат мы умножим на количество кадров в секунду (25 и 30), и получим одинаковый поток данных при оцифровке каждого телевизионного стандарта, предполагая, что для представления яркостного сигнала используется 8 битов, и 8 битов для представления двух цветоразностных сигналов (4 бита для Сг и 4 бита для Сb).

Для PAL: 864 х 625 х 25 х (8+8) = 216 Мбит/с, из которых активный видеопоток составит 720 х 576 х 25 х 16 = 166 Мбит/с.

Для NTSC: 858 х525 х 29.97 х (8+8) = 216 Мбит/с, из которых аналогичным образом активный видеопоток составит 720 х 480 х 29.97 х 16 = 166 Мбит/с.

Этот поток данных указан для несжатого видео, оцифрованного согласно рекомендации ITU-601 с форматом оцифровки 4:2:2. Если используется формат оцифровки 4:4:4 или 10-битный диапазон уровней квантования, вместо 8-битного (что применяется в вещательном телевидении при обработке и редактировании видео), то видеопоток еще больше увеличивается. Для системы видеонаблюдения использование такого видеопотока будет непрактичным, так как пропускной способности обычных локальных сетей Fast Ethernet не хватит даже для одной телекамеры, не говоря о том, чтобы работать одновременно с несколькими, как это бывает обычно. Поэтому в первую очередь к оцифрованному видео обязательно нужно применить сжатие.

Цифровые системы видеонаблюдения без сжатия изображения были бы невозможны.

Существуют различные стандарты сжатия изображения в вещательном телевидении, для передачи видео в сети Интернет, для записи на DVD и т. д., но в индустрии видеонаблюдения используются ITV— генеральный спонсор 2-го издания книги «CCTV. Библия видеонаблюдения» практически все стандарты сжатия, за исключением немногих, что позволяет достичь лучшего компромисса между максимально высоким уровнем сжатия и максимально возможным качеством изображения.

Рис. 9.21. Типичное отображение нескольких телекамер на одном экране, что обычно доступно в режиме наблюдения и просмотра архива.

Это особенно важно, когда на один цифровой видеорегистратор мы записываем несколько телекамер (мультиплексированная запись нескольких телекамер, обычно 16, 18, 24 или 32 телекамеры). Существует большое количество стандартов сжатий и их разновидностей, которые предлагают различные преимущества.

Один кадр несжатого видео может занимать около 1.244 Мбайт для PAL (720x576x3 = 1.2 Мбайт), если мы предполагаем 3 цветовые компоненты и 8-битную оцифровку, а 8 бит равно сжатыми изображениями, размер которых менее 1 байт. В видеонаблюдении мы обычно имеем дело со 100 кбайт, а зачастую даже меньше 10 кбайт.

Рис. 9.22. Графическое представление эффективности алгоритмов сжатия по сравнению с несжатым изображением. Обратите внимание на большую эффективность сжатия MPEG-2 при том же качестве

Когда используется компрессия видеоизображения (вместо компрессии отдельных изображений), то обычно указывается не размер одного кадра, а видеопоток в кбит/с или Мбит/с. Таким образом, видеопоток хорошего качества при сжатии MPEG-2 составит порядка 4 Мбит/с. Поток видео среднего качества для передачи по сети Интернет при сжатии MPEG-4 составит примерно 256–512 кбит/с. Насколько сильно можно сжимать видео, зависит от того, сколькими деталями вы готовы для этого пожертвовать и какое сжатие вы используете. Впрочем, в любом случае без сжатия не обойтись.

Нужно также понимать, что возможна и дополнительная обработка оцифрованного видеосигнала до или после сжатия. В некоторых случаях цифровая обработка заключается в простом масштабировании кадров для размещения их в меньших по размеру окнах (как это происходит в видеоквадраторах), но существуют и более сложные алгоритмы. Например, алгоритмы повышения контраста могут проводить сравнение каждого пиксела с соседними и на основании сравнения изменять значения пиксела. Алгоритмы шумоподавления, детекторов движения и другие также относятся к сфере дополнительной обработки цифрового видеосигнала.

Когда видеосигнал оцифрован и сжат, то его можно сохранить (записать) и передать по локальной сети, по сети Интернет или по другим каналам связи значительно быстрее. Это только немногие преимущества цифрового видео, которые недоступны для аналогового видеосигнала.

Преимущества передачи цифрового видео по сети очевидны: локальные сети уже проложены во многих офисах, учебных заведениях, на фабриках и заводах. Если ответственный IT-персонал дает разрешение на использование местных локальных сетей для передачи видео, то цифровые системы видеонаблюдения можно очень легко и быстро интегрировать с существующими сетями. Кроме того, можно значительно увеличить дистанцию передачи видеосигнала, объединяя несколько соседних локальных сетей в единую структуру. Очевидно, что в эпоху массового развития сети Интернет локальные системы видеонаблюдения могут легко быть объединены в крупномасштабную систему, соединяющую ее локальные компоненты, даже разбросанные по разным континентам, так же легко, как если бы они были расположены через улицы друг от друга.

Рис. 9.23. Типичная сетевая телекамера. Обратите внимание, что у нее нет аналогового видеовыхода

Локальные сети и кабели, используемые в них, тоже имеют свои ограничения (их мы рассмотрим детально в главе, посвященной сетевым технологиям), и для увеличения расстояния передачи цифрового видеосигнала необходимо использовать такие сетевые устройства, как повторители (репитеры, network repeaters). Впрочем, их функции выполняют и сетевые коммутаторы и маршрутизаторы.

Многие современные цифровые системы видеонаблюдения могут использовать для передачи видеосигнала и сеть Интернет, и как только мы подключаем их к этой сети, то все ограничения на максимальную дистанцию передачи видеосигнала пропадают, так как провайдеры услуг доступа в Интернет сами заботятся о репитерах и усилении сигнала, которые необходимы, чтобы мы могли передавать информацию из одной точки в другую, независимо от расстояния, их разделяющего.

Сейчас уже доступны действительно цифровые телекамеры, которые обычно называются сетевыми телекамерами (IP-camera, LAN camera). Мы о них говорим как о действительно цифровых устройствах, и они заслуживают такого наименования, поскольку их можно подключить напрямую в существующие локальные сети и просматривать через веб-броузер, используя их IP-адрес, в отличие от цифровых телекамер, которые получили такое название за цифровую обработку сигнала и генерируют на выходе аналоговый видеосигнал. Сейчас в большинстве случаев сетевые телекамеры используются в небольших инсталляциях, для промышленного или специализированного видеонаблюдения в научных целях, а также для проведения видеоконференций в сети Интернет. При современном развитии технологии по качеству изображения и скорости обновления кадров сетевые телекамеры пока еще уступают аналоговым телекамерам. Впрочем, цифровая обработка и технологии сжатия изображения развиваются настолько быстро, что время, когда сетевые телекамеры сравняются с аналоговыми телекамерами, придет очень быстро.

Размеры видеопотоков хорошего качества от нескольких телекамер могут быть достаточно велики, несмотря на сжатие изображения, а это потребует применения лучших кабелей для повышения пропускной способности локальной сети. Но куда более важно то, что большая часть системных администраторов и IT-специалистов, отвечающих за поддержку сети, которую планируется использовать для передачи видеосигналов, сразу выскажут свои опасения относительно того, что ваша цифровая система видеонаблюдения может перегрузить имеющиеся локальные сети. Поэтому очень часто вы будете сталкиваться с требованием ограничения потоков данных от цифровой системы видеонаблюдения, или даже с необходимостью построения новой локальной сети, выделенной исключительно для передачи цифрового видео. Такая необходимость потребует от нас знания сетевых технологий, протоколов TCP/IP и всего остального, что нужно при переходе от аналогового телевидения к цифровому. Сетевые технологии мы рассмотрим в отдельной главе.

А сейчас мы остановимся на технологиях сжатия изображения в том виде, в каком они используются в видеонаблюдении.

Типы видеосжатия

В цифровых системах видеонаблюдения используются почти все доступные стандарты сжатия: JPEG, M-JPEG, Wavelet, H.263, MPEG-1, MPEG-2, JPEG-2000, MPEG-4, H.264 и т. д.

Существует большое количество разнообразных технологий сжатия. Как из них выбрать самый оптимальный для конкретного случая способ сжатия?

Безусловно, найти ответ на этот вопрос будет нелегко. Следует понимать теорию оцифровки изображения и ограничения телевизионных стандартов, на которые будут накладываться ограничения оцифровки видео и сжатия.

В общих чертах можно сказать, что существует два основных типа сжатия изображения/видео: сжатие без потерь и сжатие с потерями.

Сжатие без потерь позволяет добиться только очень низкого уровня сжатия (обычно в три-четыре раза по сравнению с несжатым оригиналом) и используется в основном в вещательном телевидении и при видеомонтаже. Поэтому в этой книге мы будем рассматривать различные стандарты сжатия с потерями.

Сжатие с потерями означает, что некоторые детали изображения или видеопотока будут потеряны и их невозможно будет восстановить никаким способом и никакой дополнительной обработкой. Хорошим стандартом сжатия следует считать не тот, который позволяет добиться очень высокого уровня компрессии, а такой стандарт, который позволяет достичь лучшего компромисса между качеством и размером видеопотока.

Рис. 9.24. Правильный выбор сжатия, телекамеры и объектива позволяет четко рассмотреть номер автомобиля

Одним из наиболее популярных стандартов сжатия сегодня считается JPEG, который чаще всего используется в цифровой фотографии. Мы все с ним знакомы, и читатели, вероятно, неоднократно сталкивались с тем фактом, что десятикратное сжатие JPEG практически не вносит заметных искажений в изображение. Таким образом, если вы пользуетесь цифровым фотоаппаратом с разрешением 4 мегапиксела, то размер одной фотографии без сжатия может достигать 12 Мбайт, что немало, когда нам нужно обрабатывать такой большой файл или хранить его на карте памяти объемом 32 Мбайт. Но если мы используем типичный уровень сжатия 1:10, то не заметим ощутимой разницы в качестве фотографии, зато с файлом будет удобнее работать и таких файлов больше поместится на карте памяти. В видеонаблюдении нам обычно требуется уровень сжатия значительно выше десятикратного. Не забывайте о том, что только один оцифрованный телевизионный кадр занимает около 1 Мбайт, а десятикратное сжатие уменьшит его всего до 100 кбайт.

Существуют цифровые видеорегистраторы и сетевые телекамеры, которые работают и с такими кадрами, но в большинстве случаев необходимость длительного хранения архива заставляет использовать более высокий уровень сжатия.

Нередко можно видеть, как производители заявляют о 100-кратном сжатии одного телевизионного поля.

Здравый смысл подсказывает нам, что потери будут очень значительными при столь высоких уровнях сжатия, а кроме того появятся артефакты сжатия, которые очень нежелательны. И нам снова придется искать компромисс между приемлемым качеством и небольшим размером видеопотока. Справедливости ради нужно сказать, что существуют очень интересные и остроумные решения (обычно собственные разработки отдельных производителей), которые позволяют заметно уменьшить размеры видеопотока за счет сокращения его избыточности (например, статичный фон записывается только один раз, а далее учитываются только разница между кадрами, которая создается не статичным фоном, а движущимися объектами).

Все это похоже на принципы работы семейств стандартов MPEG и Н.26х. Независимо от вашего выбора стандарта сжатия, источник видеосигнала, то есть сама телекамера должна иметь самое лучшее качество из доступного. А это означает, что необходимо выбирать качественную телекамеру и качественный объектив. И только тогда, когда нам удалось оптимизировать изначальный аналоговый видеосигнал для отображения всех нужных деталей и цветов, мы можем постараться получить оцифрованное видео почти такого же качества.

Рис. 9.25. Несжатое изображение (слева, 720x576 пикселов, примерно 1.2 Мбайт) и то же самое изображение, сжатое JPEG со 100-кратным уровнем сжатия (справа).

Вы не сможете увидеть в цифровой записи тех деталей, которые изначально позволяла увидеть телекамера. Это представляется слишком общим и банальным утверждением, но мне часто приходилось встречать специалистов индустрии безопасности, которые пытались разглядеть автомобильный номер на цифровой записи, тогда как телекамера уже изначально не позволила бы его увидеть. Существует очевидное и очень простое правило, цифровая запись никогда не окажется лучше, чем оригинальный сигнал телекамеры.

Имеет смысл вложить средства в покупку качественных телекамер и объективов. В качественной телекамере имеется ПЗС- или КМОП-матрица высокого разрешения, хорошее соотношение сигнал/шум, широкий динамический диапазон, низкая чувствительность и хороший объектив. Основываясь на практике, следует заметить, что при использовании аналоговых телекамер для цифровой записи их соотношение сигнал/шум имеет первостепенное значение для оцифрованного изображения. Разрешение тоже важно, но соотношение сигнал/шум будет, вероятно, даже важнее по той простой причине, что при слишком сильных шумах алгоритмы сжатия изображения имеют тенденцию их увеличивать, принимая их за мелкие детали. Поэтому если у телекамеры низкое соотношение сигнал/шум (то есть изображение содержит много шумов), то после сжатия изображение будет выглядеть значительно хуже, чем до него. Проще говоря, чем лучше соотношение сигнал/шум (от 50 дБ и выше), тем выше качество у оцифрованного видеосигнала.

Качество оцифрованного видеосигнала, если при этом использовалась рекомендация ITU-601, будет примерно таким же, как у исходного аналогового видеосигнала.

После того как качественный аналоговый видеосигнал будет оцифрован согласно рекомендации ITU-601, качество цифрового видеосигнала будет почти таким же, как у исходного аналогового видеосигнала (при условии, что мы оцифровываем полный кадр). Затем на стадии сжатия происходит дальнейшее снижение качества изображения. Поэтому сжатие является фактором, ограничивающим разрешение.

Здесь следует сделать важное замечание о том, что не следует смешивать такие понятия, как количество пикселов и потеря разрешения в результате сжатия. Когда мы используем полнокадровый ввод и последующее сжатие видео, количество пикселов остается постоянным, допустим 720x576 пикселов, но артефакты сжатия могут снизить разрешение. Поэтому мы и говорим, что сжатие изображения является дополнительным фактором, ограничивающим разрешение.

Дискретное косинусное преобразование как основа

Одним из наиболее частых преобразований двумерных изображений является дискретное косинусное преобразование (Discrete Cosine Transformation, DCT ). Оно лежит в основе почти всех стандартов сжатия, которые применяются в видеонаблюдении, за исключением Wavelet и JPEG-2000. Таким образом, все стандарты JPEG, MPEG и семейство Н.26х используют DCT-преобразование в той или иной форме. Поэтому мы скажем о нем несколько слов.

DCT-преобразование основано на преобразовании Фурье. Преобразование Фурье представляет собой очень хороший метод анализа сигналов в частотной области. Единственная проблема заключается в том, что оно всегда строится на предположении о периодичности и бесконечной протяженности сигналов во временной области. В действительности это не так, и поэтому в 60-е годы было предложено альтернативное преобразование Фурье, так называемое быстрое преобразование Фурье (БПФ). Дискретное косинусное преобразование базируется на БПФ.

Итак, как работает дискретное косинусное преобразование? Пространственная избыточность присутствует во всех видеофрагментах и в видеонаблюдении, и в вещательном телевидении, и в других сферах. Если на изображении (в телевизионном поле) имеется объект, то большинство его пикселов будут иметь достаточно сходные значения. В этом и заключается избыточность изображения, то есть можно уменьшить количество информации для каждого пиксела, дав среднее значение для целой области пикселов. Крупные объекты имеют низкие пространственные частоты, а мелкие объекты — высокие пространственные частоты. Цифровое видео способно передавать весь спектр пространственных частот, но после анализа остаются только те частоты, которые нужно передать, поэтому при сжатии важным шагом является анализ пространственных частот изображения.

На рис. 9.26 показано, как работает двумерное DCT-преобразование. Изображение разбивается на блоки 8x8 пикселов. DCT-преобразование конвертирует блок значений пикселов в набор коэффициентов косинусных функций с возрастающими частотами. Коэффициенты отражают присутствие тех или иных пространственных частот. На иллюстрации показаны блоки пикселов, которые получаются из каждого коэффициента. Верхний левый коэффициент представляет среднюю яркость блока, и, таким образом, является средним арифметическим значением всех пикселов, его также называют DC-коэффициентом. Справа налево коэффициенты представляют увеличивающуюся горизонтальную пространственную частоту. Сверху вниз коэффициенты представляют увеличивающуюся вертикальную пространственную частоту. Само по себе DCT-преобразование не производит никакого сжатия информации, то есть не устраняет избыточность. На самом деле полная информация о коэффициентах займет больше места, чем информация об исходных пикселах.

Рис. 9.26. Принципы дискретного косинусного преобразования

DCT-преобразование конвертирует значения пикселов в удобную для обнаружения избыточности форму. Поскольку не все пространственные частоты присутствуют одновременно, то в результате DCT-преобразования на выходе мы получим набор коэффициентов, где будут присутствовать значимые коэффициенты, но очень многие будут иметь значения, близкие к нулю или нуль. Если коэффициент равен нулю, то неважно, присутствует ли он или нет. Если же мы отбрасываем коэффициент, близкий к нулю, то это равносильно добавлению той же пространственной частоты к изображению, но противоположной фазы. Решение отбросить коэффициент основывается на том, насколько визуально заметен будет этот небольшой нежелательный сигнал, и определяется уровнем сжатия. Если коэффициент нельзя отбросить, то сжатие также возможно за счет уменьшения количества битов, используемых для его кодирования. Визуально это выглядит так, как будто в изображении появилось немного шума. Типичным нежелательным артефактом DCT-преобразования является блочность изображения при высоких уровнях сжатия. Это связано с тем, что DCT-преобразование проводится на блоках 8x8 пикселов.

Рис. 9.27. Зигзагообразное сканирование при обратном DCT -преобразовании

Читателям следует знать, что Wavelet-сжатие отличается от JPEG-сжатия тем, что Wavelet-сжатие обрабатывает все изображение, а не блоки 8x8, поэтому артефакты сжатия проявляются не в блочности изображения, а скорее как его затуманивание. Сжатия на основе DCT- и Wavelet-преобразований подразумевают потерю данных, поэтому они называются сжатием с потерями. Основная задача заключается в нахождении оптимального компромисса между высоким уровнем сжатия и качеством изображения без особо заметных потерь.

Рис. 9.28. Увеличенный в два раза фрагмент изображения при JPEG-сжатии в 100 раз

Рис. 9.29. Увеличенный в два раза фрагмент изображения при Wavelet-сжатии в 100 раз

Различные стандарты сжатия, используемые в системах видеонаблюдения

В системах видеонаблюдения используются различные стандарты сжатия изображения и видеоизображения. Возможно, здесь их больше, чем в любой другой индустрии. Например, в цифровой фотографии чаще всего используется сжатие JPEG, когда необходимо экономить пространство, доступное для хранения снимков. В вещательном телевидении доминирует стандарт MPEG-2, тогда как в компьютерной индустрии и в Интернете приобрел популярность MPEG-4.

В разнообразной продукции систем видеонаблюдения используются почти все стандарты сжатия. Для того чтобы правильно их понимать, необходимо разделить все стандарты на две основные категории, о чем мы уже говорили ранее: сжатие, которое применяется к отдельным изображениям, назовем сжатием изображения и сжатие, применяемое к видеопотоку, назовем сжатием видеоизображения. Стандарты, использующие сжатие изображения, работают с отдельными изображениями, тогда как стандарты, использующие сжатие видеоизображения, расценивают время как важную переменную при уменьшении избыточности видеопотока.

Рис. 9.30. Временная шкала, показывающая периоды разработки различных стандартов сжатия и совместную работу ITU- T и ISO/IEC

У каждой из этих двух категорий сжатия есть свои преимущества, что зачастую очень затрудняет выбор в пользу какой-либо из них. Обычно в цифровых видеорегистраторах, которые записывают на жесткие диски несколько телекамер в режиме мультиплексирования, применяется сжатие изображения. Некоторые производители используют два различных стандарта сжатия в одном устройстве. В этом случае для локальной записи используется один стандарт сжатия, а для передачи по сети с низкой пропускной способностью — другой стандарт сжатия видеоизображения, который будет более эффективен для этих целей. Поэтому необходимо знать и понимать все стандарты сжатия и каждый раз оценивать достоинства и недостатки всех стандартов по отношению к проектируемой системе наблюдения.

Некоторые специалисты подразделяют стандарты сжатия на группы по принципу того, какая организация (ITU-T или ISO) предложила тот или иной стандарт. Но существует и много самостоятельных разработок отдельных производителей, что не позволяет нам принять такое деление. Более того, при разработке новых стандартов рабочие группы ITU-T и ISO/ЕС работают совместно. В частности новый стандарт сжатия Н.264, работа над которым была начата ITU-T, велась затем совместно с группой ISO/IEC JTC1.

Следующие стандарты сжатия изображения являются наиболее распространенными в видеонаблюдении. Расположены в порядке появления.

— JPEG — Широкораспространенный стандарт сжатия, который существует уже более 15 лет. Использует DCT-преобразование. Используется многими программами, такими, как графические редакторы и веб-броузеры.

— M-JPEG — Это вариант сжатия JPEG и на самом деле не является стандартом. M-JPEG — сокращение от Motion JPEG, где каждое изображение является независимо сжатым телевизионным кадром или полем.

— Wavelet — Очень популярное сжатие в видеонаблюдении. Отличается большей эффективностью при сжатии деталей, так как не делит все изображение на блоки 8x8 пикселов.

— JPEG-2000 — Стандартизованный вариант Wavelet-сжатия. Доступны дополнительные модули JPEG-2000 для различных графических редакторов и веб-броузеров.

— Motion JPEG-2000 — Принцип действия примерно такой же, как у M-JPEG, но в качестве основы используется JPEG-2000. Так выглядит эволюция стандартов сжатия видеоизображения:

— Н.261 — Стандарт для низкой скорости передачи данных, принятый в 1984 ITU для аудиовизуальных сервисов.

— MPEG-1 — Стандарт ISO, созданный как модификация Н.261 для записи видео на компакт-диски при низкой скорости передачи данных (около 1.5 Мбит/с).

— MPEG-2 — Разработан для вещательного телевидения. Использует низкий уровень сжатия для передачи, записи и воспроизведения видео высокого качества. Сейчас используется в большинстве телестудий, на DVD-дисках, на кабельном телевидении, а также в кабельном телевидении и многими производителями цифровых видеорегистраторов.

— Н.263 — Создавался как адаптация MPEG-2 для достижения более высоких уровней сжатия при сохранении высокого качества изображения. Был принят как международный стандарт в 1996 году и пересмотрен в 1998 году. Стандарты Н.263+ и Н.263++ представляют собой усовершенствованные версии Н.263.

— MPEG-4 — Стандарт разрабатывался как объектно-ориентированное сжатие. Существует несколько версий. Сжимает видео и аудио с широким выбором скорости передачи данных. Пригоден для различных областей применения, которые используют низкоскоростные каналы связи, от мобильной телефонии и Интернета до телевидения.

— MPEG-7 — Новый стандарт, предназначенный для описания аудиовизуального содержимого.

— MPEG-21 — Новый стандарт, описывающий общую структуру взаимодействия всех объектов MPEG и пользователей.

— Н.264 — Самый новый стандарт сжатия, который базируется на Н.263 и MPEG-4 (AVC), который предлагает широкий выбор качества, включая более эффективное сжатие для форматов телевидения высокой четкости (заявлено о втрое большей эффективности по сравнению с MPEG-2).

Теперь проанализируем их по отдельности.

JPEG

JPEG расшифровывается как объединенная группа экспертов по машинной обработке фотоизображений (Joint Photographic Experts Group), а это, в свою очередь, является первоначальным названием комитета ISO, который подготовил данный стандарт для цифровой фотографии.

JPEG — это стандартизированный принцип сжатия изображений, который использует DCT-преобразование для уменьшения избыточности изображения. Он ориентирован только на неподвижные цифровые изображения, при этом разрешение изображения в стандарте не прописано. Такими стоп-кадрами в телевидении могут служить либо телевизионные поля, либо телевизионные кадры.

Хотя JPEG широко используется в цифровой фотографии и веб-приложениях, этот стандарт применяется и в видеонаблюдении, где сжатие применяется к оцифрованному видео (телевизионным кадрам и полям), которые обрабатываются как независимые изображения.

Впрочем, JPEG содержит и раздел рекомендаций для сжатия без потерь (с коэффициентом сжатия примерно 2:1), но нас больше интересует способ сжатия JPEG с потерями, когда можно получить коэффициенты сжатия, превышающие 10:1, без заметного ухудшения качества. Работа JPEG основывается на преобразовании блоков, состоящих из 8x8 элементов изображения, на основе дискретного косинусного преобразования (Discrete Cosine Transformation — DCT ).

Если изображение с высокой степенью сжатия увеличить, то четко проявляется его блочная структура. Можно достичь степени сжатия до 100 раз. JPEG известен как способ сжатия с потерями, означающий, что, если изображение подвергнется сжатию, то при декомпрессии нельзя получить изображение точно такого же качества, как оригинал. Тем не менее, коэффициенты сжатия, достигаемые с помощью сжатия JPEG, довольно высоки (превышают 10:1), и некоторая потеря качества изображения представляется несущественной для человеческого глаза. JPEG разработан с учетом известных ограничений человеческого глаза, таких, как невосприятие очень мелких деталей цветности, как и мелких деталей яркости в рассматриваемом изображении.

Рис. 9.31. Разбиение на блоки при сжатии JPEG

Для каждого отдельного компонента цвета изображение делится на блоки 8x8, из которых составляется все изображение. Над этими блоками выполняется дискретное косинусное преобразование. Обычно внутри блоков 8x8 значения пикселов изменяются мало. Поэтому энергия имеет низкую пространственную частоту. Преобразование, которое может быть использовано для представления энергии несколькими коэффициентами, является двумерным дискретным косинусным преобразованием блоков 8x8. Это преобразование, широко изучаемое с точки зрения применения его к сжатию изображений, явилось чрезвычайно эффективным для сильно коррелированных данных.

JPEG хранит полную цветовую информацию: 24 бита на пиксел (16 миллионов цветов); можно сравнить, например, с GIF (другая популярная среди пользователей ПК техника сжатия), который может хранить только 8 бит на пиксел (256 или меньшее количество цветов). Полутоновые изображения (в шкале серого) не могут быть сжаты с такими большими коэффициентами компрессии с помощью JPEG, поскольку человеческий глаз намного более чувствителен к изменениям яркости, чем к оттенкам цвета, и JPEG может сжимать данные о цвете в большей степени, чем данные о яркости.

Имеется довольно любопытное наблюдение, которое заключается в том, что JPEG-файл черно-белого изображения всего на 10–25 % меньше, чем полноцветный JPEG-файл визуально подобного качества.

Рис. 9.32. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие JPEG, размер файла 49 кбайт). Увеличенный фрагмент (справа).

Рис. 9.33. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие JPEG, размер файла 15 кбайт). Увеличенный фрагмент (справа).

Кроме того, следует отметить, что JPEG не подходит для штрихового рисунка или текста, поскольку дискретное косинусное преобразование непригодно для очень резких черно-белых переходов.

JPEG может быть использован для сжатия данных из различных цветовых пространств, таких, как RGB (видеосигнал основных цветов изображения), YCbCr (преобразованный видеосигнал) и CMYK (палитра, используемая в издательских системах), поскольку он обращается с цветами как с отдельными компонентами. Наилучшие результаты по сжатию достигаются, если компоненты цвета независимы (некоррелированны), как это имеет место в YCbCr, где большая часть информации сосредоточена в яркости, а меньшая — в цветности.

Поскольку файлы JPEG, записываемые в системе видеонаблюдения, независимы друг от друга, они легко могут быть воспроизведены в обратном направлении. При этом скорость воспроизведения может быть увеличена или уменьшена, а кроме того, они могут быть скопированы в виде отдельных файлов или группы файлов.

M-JPEG

В системах видеонаблюдения используется стандарт сжатия, производный от JPEG, который называют motion JPEG (M-JPEG). На самом деле M-JPEG не существует как отдельный стандарт, скорее он относится к быстрому потоку изображений JPEG, которые могут быть воспроизведены с достаточно высокой скоростью, создавая при этом иллюзию движения. Поскольку зависимости между отдельными последовательными кадрами не берутся в расчет, такой способ позволяет получить только относительно небольшой уровень сжатия по сравнению со стандартами, использующими сжатие видеоизображения, такими, как семейства Н.26х или MPEG, которые описаны далее. Впрочем, M-JPEG используется некоторыми производителями многоканальных цифровых видеорегистраторов.

M-JPEG никогда не был предметом международной стандартизации, a JPEG не определяет стандарт передачи, поэтому реализации M-JPEG у разных производителей несовместимы между собой. Для увеличения степени сжатия иногда еще используется и сжатие разницы между двумя соседними кадрами. Этот вариант тоже не является стандартным, поэтому для воспроизведения таких записей потребуется программное обеспечение того же производителя.

Wavelet (вейвлет)

Многие десятилетия ученые пытались найти для аппроксимации прерывистых сигналов более подходящие функции, чем синусы и косинусы, которые составляют основу анализа Фурье. По определению синусы и косинусы являются нелокальными функциями (они определены в бесконечной области). В этом заключена главная причина их плохой работы при аппроксимации резких переходов, таких, как отдельные детали изображения с высоким разрешением в конечном двумерном кадре. Кадры именно такого типа мы наиболее часто наблюдаем при записи в мультиплексированном режиме, они отличаются от непрерывного потока движущихся изображений в обычном телевидении. Вейвлет-анализ действует иначе и позволяет более эффективно обрабатывать мелкие детали изображения.

Авторами этой математической модели были Гроссман и Морле (A.Grossman и J.Morlet), которые и применили термин Wavelet (вейвлет) в середине 80-х годов в связи с анализом свойств сейсмических и акустических сигналов. В результате вейвлет-сжатие изначально применялось в таких сферах, как астрономия и геофизика. Вскоре, когда компания Analog Devices выпустила аппаратную реализацию вейвлет-сжатия (кодек ADV601), оказалось, что его (сжатие) можно превосходно использовать в видеонаблюдении.

Вейвлет-сжатие преобразует полное изображение, а не его секции 8x8, как это происходит в JPEG, и является более естественным, так как отслеживает формы объектов в изображении. Поэтому вейвлет-сжатие оказалось особенно привлекательным для систем видеонаблюдения.

Рис. 9.34. Один из остроумных способов применения вейвлет-сжатия методом зигзага

Рис. 9.35. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие Wavelet, размер файла 45 кбайт). Увеличенный фрагмент (справа)

Рис. 9.36. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие Wavelet, размер файла 15 кбайт). Увеличенный фрагмент (справа).

С помощью вейвлет-анализа мы можем использовать аппроксимационные функции, определенные на конечных областях. Вейвлет-функции — это функции, которые удовлетворяют определенным математическим требованиям и используются для представления данных или других функций в вейвлет-анализе. Главное отличие от БПФ-анализа (быстрого преобразования Фурье) заключается в том, что вейвлет-функции разлагают сигнал по разным частотам с различным разрешением, то есть на множество малых групп волн, отсюда и название — вейвлет, элементарные волны. Алгоритмы вейвлет-преобразования обрабатывают данные в различных масштабах и с разным разрешением. Вейвлет-анализ позволяет разглядеть и отдельные детали, и глобальное изображение, или, как выразились некоторые авторы вейвлет-анализа, «увидеть и лес, и отдельные деревья» в противоположность анализу Фурье, который позволяет «видеть только лес».

Вейвлет-анализ хорошо подходит для аппроксимации данных с резкими границами. Процедура вейвлет-анализа заключается в подборе функции-прототипа элементарной волны, называемой анализирующей или порождающей волной. Временной анализ выполняется в укороченной высокочастотной версии функции-прототипа, в то время как частотный анализ производится в ее расширенной низкочастотной версии. Поскольку оригинальный сигнал или функция могут быть представлены в виде разложения по вейвлет-функциям (с применением коэффициентов в линейной комбинации с вейвлет-функциями), то операции с данными могут выполняться посредством использования всего лишь соответствующих вейвлет-коэффициентов.

Одна интересная особенность аппаратной реализации вейвлет-сжатия позволяет выбрать «область интереса» или «зону повышенной детализации» («Area of Interest» или «Quality Box»). Эта область может быть сжата с лучшим качеством и соответственно более высокой детализацией интересующих нас объектов по сравнению с остальным изображением, а ее использование позволяет значительно уменьшить размер файла сжатого изображения.

Рис. 9.37. Современные аппаратные реализации вейвлет-компресии позволяют выделить «область интереса» или «зону повышенной детализации»

JPEG-2000

JPEG-2000 (ISO 15444) представляет собой стандартизированную в общих чертах версию вейвлет-сжатия, которая была разработана группой JPEG. Когда в 90-х годах появилась аппаратная реализация вейвлет-сжатия от Analog Devices еще не существовало общего стандарта. Эксперты из группы JPEG быстро оценили преимущества вейвлет-сжатия и приступили к работе над новым стандартом сжатия. Завершение работы над новым стандартом было намечено на 2000 год — отсюда и идет название JPEG-2000.

С появлением единого стандарта JPEG-2000 стало возможно широкое применение вейвлет-сжатия при полной совместимости между различными продуктами и программами разных производителей. Появилось большое количество дополнительных программных модулей и аппаратных реализаций, что позволяет переносить изображения, сжатые этим стандартом, между различными платформами. Сейчас можно найти в Интернете дополнительные модули для Adobe Photoshop и веб-броузеров, реализующие поддержку JPEG-2000. Некоторые графические редакторы, такие, как Corel Photo Paint и JASC Paint Shop Pro уже имеют встроенную поддержку JPEG-2000. Именно для этого и проводится стандартизация, что позволяет нам работать с одним стандартным форматом файла в самых разных программах. Многие производители уже выпустили свои аппаратные реализации стандарта JPEG-2000, и эти кодеки доступны для видеонаблюдения.

Кроме того, стандарт JPEG-2000 предусматривает использование встраиваемой информации об авторе или источнике изображения. Для нас это полезно тем, что таким образом можно устанавливать подлинность изображения в видеонаблюдении. Существуют и варианты JPEG-2000, один из которых применим к видеоизображению и называется Motion JPEG-2000.

Рис. 9.38. Новый кодек ADV202 от Analog Devices использует JPEG-2000 и имеет большие перспективы для применения в охранном телевидении и телевидении высокой четкости.

Motion JPEG-2000

Motion JPEG-2000 это новый стандарт сжатия. Хотя он пока еще не используется в видеонаблюдении, но он очень перспективен, поэтому мы его упоминаем здесь. Благодаря масштабируемости вейвлет-сжатия Motion JPEG-2000 позволяет из одного видеопотока быстро получать видеопотоки разного разрешения. Эта особенность удачно используется в тех случаях, когда видеопоток с высоким разрешением используется для записи, а для удаленного просмотра используется видеопоток меньшего разрешения. Поскольку Motion JPEG-2000 является стандартом сжатия изображения, то все сжатые кадры (поля) независимы, что упрощает произвольный доступ к ним. Кроме того, это упрощает точно датирование кадров, что важно для видеонаблюдения и использования кадров в качестве доказательства в суде. Сжатие изображения происходит в режиме реального времени без задержки, что также упрощает процедуру хранения и передачи по сети видеопотоков.

MPEG-1

MPEG-1 (ISO 11172) — один из первых стандартов сжатия, предложенный группой MPEG (Motion Pictures Experts Group — экспертная группа по вопросам движущегося изображения ISO) вскоре после появления Н.261. MPEG-1 принадлежит к категории стандартов сжатия видеоизображения. Он работает с непрерывным оцифрованным видеосигналом и включает два звуковых канала. Визуальное качество при типичных уровнях сжатия (как на дисках VCD, например) сопоставимо с качеством записи аналогового видеомагнитофона VHS. Для сжатия звука сейчас используется популярный формат МРЗ.

MPEG-1 работает с последовательностью изображений формата CIF (352x288 для PAL; 352x240 для NTSC). Цветовая информация представлена половиной этого разрешения (176x144 или 176x120). Для MPEG-1 типичный видеопоток будет от 1 Мбит/с до 3 Мбит/с. Во время появления стандарта MPEG-1 у большинства проигрывателей компакт-дисков скорость передачи данных достигала примерно 1.5 Мбит/с, а основным применением нового стандарта сжатия была запись видео на компакт-диски. На компакт-диске объемом 700 Мбайт можно хранить до 1 часа видео, по этой причине для записи фильмов в формате VCD требовалось обычно два диска.

Рис. 9.39. Крайне упрощенное представление того, каким образом из опорного кадра вычисляются промежуточные

MPEG сам по себе определяет не алгоритмы сжатия (хотя и основан на DCT-преобразовании), а сжатие именно видеопотока, то есть организацию цифровых данных для записи, воспроизведения и передачи. Алгоритмы сжатия выбираются уже разработчиками, и качество сжатия будет сильно зависеть от выбранных алгоритмов.

Основная идея, которая лежит в основе сжатия видеоизображения, заключается в предсказании движения от кадра к кадру во временном направлении, после чего используется DCT-преобразование для выявления избыточности в пространственных направлениях. DCT-преобразование осуществляется на блоках 8x8, а предсказание движения осуществляется в яркостном канале (Y) на блоках 16x16. Другими словами блок 16x16 пикселов в текущем кадре кодируется с учетом такого же блока в предыдущем и последующем кадре. Например, в режиме обратного предсказания движения кадры, которые идут позже по времени, обрабатываются раньше, чтобы установить межкадровую зависимость.

Далее коэффициенты DCT-преобразования (самих видеоданных или разницы блоков) подвергаются квантованию. Вероятно, многие коэффициенты будут нулями.

Квантование может изменяться для каждого макроблока (макроблока 16x16 для Y и соответственно 8x8 для U и для V).

Рис. 9.40. Взаимосвязь кадров в группе изображений с 9 кадрами

Ко всем полученным в результате данным, которые включают коэффициенты DCT-преобразования, векторы движения, параметры квантования и другую информацию.

Существует три типа кадров в стандарте MPEG-1 (тоже самое и в MPEG-2): l-кадры (intra frames, кадры с внутренним кодированием), Р-кадры (predicted frames, кадры с предсказанным кодированием) и В-кадры (bidirectional frames, кадры, при кодировании которых используется предсказание, сформированное на основе предшествующего и последующего кадра).

l-кадры в общих чертах представляют собой изображения, которые кодируются с использованием только той информации, которая содержится в них самих (то же самое происходит при сжатии JPEG). Здесь устраняется только пространственная избыточность, и l-кадры затем используются как опорные для Р- и В-кадров, для которых используется межкадровое кодирование, что позволяет устранить и пространственную, и временную избыточность. Р-кадры кодируются с опорой на ближайший I- или Р-кадр. Каждый макроблок в Р-кадре может содержать коэффициенты DCT-преобразования разницы между этим макроблоком и аналогичным блоком в опорном кадре, либо только коэффициенты DCT-преобразования, как в l-кадре, если разница получается слишком большой. В-кадры кодируются с опорой на два ближайших I- или Р-кадра, один из которых предшествует В-кадру, а другой следует за В-кадром. Их название происходит от английского bidirectional, то есть двунаправленные (к предшествующему и последующему кадру). Кстати, именно этим и обусловлена задержка кодирования, типичная для сжатия MPEG.

Набор I-, Р- и В-кадров в MPEG называется группой изображений ( Group of Pictures , GOP).

Если группа изображений состоит только из одного изображения, то это будет только опорный l-кадр, и такое кодирование будет выглядеть функциональным эквивалентом стандарта Motion-JPEG. В этом случае устраняется только пространственная избыточность, но не временная. Когда группа изображений насчитывает 12 или 15 кадров, достигается оптимальный компромисс между уровнем сжатия и не слишком большой задержкой кодирования.

Типичные повторяющиеся структуры группы изображений из 9 кадров выглядят так:

IBBBPBBBP IBBBPBBBP IBBBPBBBP…

В MPEG появляется новый побочный эффект задержки кодирования, связанный с предсказанием движения. Эта та цена, которую мы платим в MPEG за лучшее качество изображения при сравнительно небольших видеопотоках. Большинство устройств, поддерживающих сжатие MPEG, позволяют устанавливать размер видеопотока и структуру группы изображений, а при выборе оптимальной комбинации этих параметров задержку кодирования можно снизить до незаметного глазу уровня за счет увеличения видеопотока и уменьшения размера группы изображений. В целом, количество элементов в группе изображений и определяет задержку кодирования. Так, например, для группы изображений из 12 кадров задержка кодирования составит половину секунды (для PAL), что уже существенно. А если к этому добавляется задержка на передачу по сети, то становится понятным, откуда берется в MPEG время задержки кодирования больше секунды.

Задержка кодирования может остаться незамеченной в системах видеонаблюдения, где используются только неподвижные телекамеры, но когда мы управляем поворотными телекамерами, эта задержка становится серьезной проблемой. Вполне закономерным будет вопрос о том, какая задержка кодирования MPEG и передачи по сети может считаться приемлемой. На самом деле это определяется скоростью реакции человека. Например, считается, что при управлении автомобилем скорость реакции человека не более 200 мс. Если мы опираемся на эти данные, что 200 мс будут считаться вполне приемлемой на практике задержкой.

Еще один интересный побочный эффект от двухстороннего предсказания движения в макроблоках проявляется в виде уменьшения шума из-за усреднения.

На практике чаще всего MPEG-1 используется для хранения видео на компакт-дисках, но иногда этот стандарт находит применение в кабельном телевидении и в видеоконференциях. Впрочем, существуют и цифровые видеорегистраторы для видеонаблюдения, которые записывают видео в режиме реального времени и тоже используют MPEG-1. Их применяют в том случае, когда скорость записи важнее, чем высокое разрешение. Большинство качественных цифровых видеорегистраторов, использующих MPEG-2, обратно совместимы с MPEG-1 и могут записывать и воспроизводить видеопоток стандарта MPEG-1.

MPEG-2

MPEG-2 представляет собой не следующее поколение MPEG-1, а скорее другой стандарт, нацеленный на более высокое качество передачи и записи цифровых движущихся изображений и звука. Он был предложен группой MPEG в 1993 и получил, как и MPEG-1, престижную награду Emmy.

Стандарт MPEG-2 определяет форматы кодирования для уплотнения цифрового видео высокого качества, звука и других данных в подходящий для передачи или хранения формат.

Так, MPEG-2, подобно MPEG-1, не ограничивает свои возможности только видео, но также работает с аудиопотоками. Здесь опять следует подчеркнуть, что MPEG-2 является не схемой или техникой сжатия (как многие полагают), а скорее стандартизацией управления и обработки цифровых данных самым быстрым, оптимальным способом. Кодирование MPEG-2 может генерировать скорости передачи данных значительно выше 18 Мбит/с, хотя при применении MPEG-2 на практике в видеонаблюдении вы вряд ли заметите особую разницу между аналоговым видеосигналом и тем же видеопотоком размером 4 Мбит/с, сжатым MPEG-2.

Стандарт MPEG-2 разрабатывался для широкого круга применения, поэтому он позволяет использовать видеопотоки различного размера, качества и разрешения. В MPEG-2 определено 4 профиля и 4 уровня для обеспечения взаимодействия в разных сферах применения. В профиле указано цветовое разрешение и размер видеопотока. Уровни определяют минимальное и максимальное разрешение изображения, частоту дискретизации яркостного (Y) сигнала, количество видео- и аудиослоев, поддерживаемых в масштабируемых профилях и максимальную скорость передачи данных для профиля.

Представляя собой совместимое расширение, видеостандарт MPEG-2 основывается на MPEG-1, поддерживая видеоформаты чересстрочного разложения и некоторые другие дополнительные свойства.

Формат MPEG-2 используется в вещательном телевидении сервисными службами, такими, как DBS (Direct Broadcast Satellite — спутник прямого вещания), CATV (CAble Television — кабельное телевидение) и, что наиболее важно, HDTV (цифровое телевидение высокой четкости). Кроме того, формат DVD (который был стандартизирован в период между двумя изданиями этой книги) использует кодирование MPEG-2 для видео- и аудиозаписей высокого качества. Благодаря сжатию MPEG-2 однослойный и односторонний цифровой видеодиск DVD имеет достаточно емкости, чтобы хранить два часа и 13 минут видео высокого качества, объемного звука и субтитров.

MPEG-2, как и MPEG-1, основывается на группах изображений, которые состоят из I-, Р- и В-кадров. 1-кадр является опорным с внутрикадровым кодированием (intracoded), то есть он может быть декодирован без обращения к данным других кадров. Р-кадры для декодирования потребуют предшествующий l-кадр или Р-кадр, В-кадры потребуют уже предшествующий и последующий кадр (l-кадр или Р-кадр). Поэтому Р-кадры и В-кадры являются промежуточными кадрами с межкадровым кодированием (intercoded).

Работа алгоритмов предсказания движения основывается на векторах движения. Для простоты представим, что в l-кадре имеется круг на белом фоне. В следующем Р-кадре имеется такой же круг, но уже смещенный в другую позицию. Предсказание движения означает, что должен быть вычислен вектор движения этого объекта, который описывает, каким образом двигается наш круг со своей позиции на l-кадре в позицию на Р-кадре. Этот вектор движения является частью потока MPEG-2 и разделен на горизонтальную и вертикальную часть. Эти части могут быть как отрицательными, так и положительными. Положительное значение показывает, что движение происходит слева направо или соответственно сверху вниз.

Отрицательное значение показывает, что движение происходит справа налево или снизу вверх. Впрочем, такая модель подразумевает, что разница между кадрами может быть выражена как простое перемещение пикселов. В потоке MPEG имеется матрица ошибок предсказания, которая позволяет более точно восстанавливать движение.

Рис. 9.41. Векторы движения используются для предсказания смещения объектов между I- и Р-кадрами

Когда только начинался переход к цифровым методам записи в видеонаблюдении (а это было совсем недавно, всего 5–6 лет назад), лишь очень немногие разработчики цифровых видеорегистраторов использовали стандарт MPEG-2. Сейчас ситуация изменилась, и многие уже увидели преимущества качественной цифровой записи видео и другие достоинства MPEG-2, с успехом нашедшие применение в видеонаблюдении — например, обратное воспроизведение архива, замедленное воспроизведение архива в прямом и обратном направлении, высокоскоростное воспроизведение архива (скорость может быть увеличена вплоть до 1024-кратной) и даже детектирование движения.

Очевидно, что MPEG-2 не предназначен для работы в режиме мультиплексированной записи, так как зависимость в потоке между кадрами нарушается, и выигрыш от межкадрового сжатия нивелируется. Поэтому цифровые видеорегистраторы со сжатием MPEG-2 обычно записывают видеопотоки от одной телекамеры на жесткий диск, хотя существуют и модели, которые могут одновременно записывать и несколько (немультиплексированных) видеопотоков на один жесткий диск. Учитывая то, что видеопоток MPEG-2 хорошего качества может достигать, например, 4 Мбит/с, несложно подсчитать, что при современном развитии технологии жестких дисков, один цифровой видеорегистратор сможет записывать всего лишь несколько таких видеопотоков, особенно если мы хотим одновременно просматривать архив.

Хотя сжатие MPEG-2 может быть реализовано программно с помощью достаточно производительных процессоров, для видеонаблюдения всегда предпочтительнее выполнять сжатие аппаратно, что гарантирует кодирование (запись) всех кадров без потерь. Декодирование (воспроизведение) может осуществляться с помощью программных декодеров, которых не так уж и много, поскольку MPEG-2 — это стандарт. Windows Media Player, Apple QuickTime, Real Audio — вот примеры программного обеспечения, которое способно воспроизводить видео MPEG-2. Некоторые цифровые видеорегистраторы, использующие MPEG-2, имеют возможность записи компакт-дисков или DVD с видео MPEG-2, такие диски затем можно просмотреть на бытовом DVD-проигрывателе.

Многие производители цифровых видеорегистраторов высшего класса, помимо аппаратного сжатия и записи, позволяют декодировать сжатое видео и выводить его на отдельный аналоговый монитор и одновременно программно со смещением во времени декодировать запись для просмотра или для архивирования по сети. Возможность одновременного выполнения всех этих операций иногда называют триплексной функцией, но существуют и другие варианты: triplex, quad-plex или penta-plex. В последнем случае имеется в виду, что одновременно могут выполняться до 5 операций: запись, воспроизведение, архивирование на внешние носители, воспроизведение записи по сети и архивирование по сети. Если все эти процессы осуществляются с применением одного жесткого диска (как это обычно и происходит), то он должен иметь соответствующую скорость передачи данных. По этой причине многие производители цифровых видеорегистраторов предпочитают выпускать не многоканальные, а одноканальные устройства с записью MPEG-2.

Рис. 9.42. В стандарте MPEG-2 используется такая же структура с группами изображений, как и в MPEG-1

MPEG-2 пригоден для применения в различных областях индустрии безопасности, поскольку он позволяет получить лучшее качество изображения, но чаще всего этот стандарт находит применение там, где требуется запись быстрых движений, например, в казино и банках. Особенно внимательно следует подходить к использованию сжатия MPEG-2 в тех случаях, когда требуется работать с поворотными телекамерами по сети, так как приходится учитывать задержку кодирования и передачи видеосигнала, но, как уже говорилось ранее, эту задержку можно сократить до приемлемых 200 мс и менее, манипулируя размерами видеопотока и структурой группы изображений.

Справедливости ради нужно отметить, что из-за больших размеров видеопотока MPEG-2 непригоден для удаленного просмотра и передачи данных по низкоскоростным каналам связи. Многие производители в этом случае предлагают использовать дополнительный стандарт MPEG-4 (основным стандартом сжатия для записи остается MPEG-2), так как он более гибок и адаптирован для передачи по низкоскоростным каналам связи (128 кбит/с, 256 кбит/с и др.).

MPEG-4

MPEG-4 (ISO 14496) — это еще один стандарт групп MPEG, разработанный относительно недавно. Его практически еще не использовали, когда вышло первое издание этой книги. MPEG-4 представляет собой результат еще одного примера международного сотрудничества сотен исследователей и инженеров со всего мира. Работа над MPEG-4, который официально обозначается как ISO/IEC 14496, была окончательно завершена в октябре 1998 года, а международным стандартом MPEG-4 стал в 1999 году.

Стандарт MPEG-4 был разработан для того, чтобы предоставить пользователям новый уровень взаимодействия с видеоинформацией. Он обеспечивает технологии, позволяющие осуществлять доступ не к пикселам, а к объектам, просматривать их и манипулировать ими. Этот стандарт отличается большой устойчивостью к ошибкам и работой с несколькими диапазонами значений скорости передачи данных. Сфера применения стандарта варьируется от цифрового телевидения, мультимедийных данных в мобильных коммуникациях, игр и до видеонаблюдения.

Основное отличие MPEG-4 от предыдущих стандартов заключается в его объектно-ориентированной аудиовизуальной модели. В рамках этой модели в каждой сцене присутствуют объекты, которые имеют связи между собой во времени и пространстве, что дает ряд преимуществ. Стандарт MPEG-4 открывает пользователям новые возможности для создания, редактирования, доступа и потребления аудиовизуальной информации. В основе технологии MPEG-4 лежит объектно-ориентированный подход, где сцена моделируется как состоящая из объектов, как естественных, так и синтезированных, с которыми пользователь может взаимодействовать. Работа с объектами (особенно с синтезированными) и интерактивность лежат в основе MPEG-4, но, к сожалению, в видеонаблюдении это не нашло применения.

Компенсация движения основана на блоках с соответствующей модификацией для границ объектов.

Размер блоков может быть 16x16 или 8x8 с половинным разрешением в пикселах. MPEG-4 также обеспечивает режим компенсации движения с наложением. Кодирование текстур объектов основано на DCT-преобразовании в блоках 8x8 с соответствующей модификацией для границ объектов. Для повышения эффективности кодирования также возможно предсказание коэффициентов. Статичные текстуры могут быть закодированы с использованием вейвлет-преобразования. Устойчивость к ошибкам обеспечивается за счет маркеров ресинхронизации, декомпозицией данных и другими методами. Масштабируемость обеспечивается как для пространственного, так и временного улучшения разрешения. MPEG-4 обеспечивает масштабируемость на уровне объектов с тем ограничением, что форма объекта должна быть прямоугольной. Для нас в видеонаблюдении это, возможно, самое полезное свойство, так как с ним связано масштабирование потоков для передачи по низкоскоростным каналам связи.

Стандарт MPEG-4 был оптимизирован для передачи данных в трех диапазонах скоростей: менее 64 кбит/с, 64 — 384 кбит/с и 384 кбит/с — 4 Мбит/с.

MPEG-4 предлагает набор инструментов и технологий, которые пригодны для различных областей применения как в существующих приложениях, так и в тех, которые появятся в будущем. Низкие скорости передачи данных и устойчивость к ошибкам позволяют использовать MPEG-4 для надежной передачи по низкоскоростным радиоканалам, что удобно для мобильных видеофонов, коммуникаций в космосе и, конечно, в видеонаблюдении. Для высоких скоростей передачи данных в MPEG-4 предусмотрены инструменты, которые упрощают передачу и хранение видео высокого качества, пригодного для телевизионных студий и других задач, требовательных к качеству видео. В процессе развития стандарта возникло несколько версий MPEG-4, которые поддерживают больше скоростей передачи данных, чем MPEG-2.

Основным применением стандарта MPEG-4 вне индустрии безопасности является размещение интерактивного видео в сети Интернет. Сейчас очень популярно программное обеспечение, которое позволяет поместить «живое» видео MPEG-4 на страницах сайта.

MPEG-4 может работать с чересстрочной и прогрессивной разверткой, хотя последняя редко используется в видеонаблюдении. Поддерживается формат оцифровки 4:2:0. Это означает, что количество отсчетов при оцифровке цветоразностных сигналов СЬ и Сr составляет половину от количества отсчетов яркостного сигнала как по горизонтали, так и по вертикали. Для каждой компоненты допускается квантование от 4 до 12 бит.

Также как и в MPEG-2, в стандарте MPEG-4 имеется несколько различных профилей (Simple Profile, Core Profile и Main Profile). Профили Simple Profile и Core Profile работают с видео формата QCIF и CIF со скоростью передачи данных 64 кбит/с, 128 кбит/с, 384 кбит/с и 2 Мбит/с. Профиль Main Profile может работать с разрешением CIF (352x288), полнокадровым разрешением, рекомендованным ITU-R 601 (720x576), и высоким разрешением HDTV (1920x1080). Поддерживаются скорости передачи данных 2 Мбит/с, 15 Мбит/с и 38.4 Мбит/с.

MPEG-4 разрабатывался не как монолитный стандарт, а скорее как набор инструментов, которые вместе с профилями обеспечивают решение конкретных задач. Хотя MPEG-4 представляет собой достаточно обширный стандарт, он имеет такую структуру, которая позволяет получать доступ к разным инструментам по мере необходимости. Каждый разработчик может выбрать из обширного стандарта MPEG-4 только тот инструментарий, который ему требуется, что с большой долей вероятности будет представлять очень незначительную часть стандарта.

Цифровые видеорегистраторы, работающие с MPEG-4 становятся все более популярными в видеонаблюдении, хотя они и используют разные профили MPEG-4 и, таким образом, отличаются по качеству изображения между собой.

MPEG-4 не заменяет, как считают некоторые, стандарт MPEG-2, но предлагает большую гибкость в работе на низкоскоростных каналах связи и позволяет передавать практически «живое» видео при скорости передачи 256 кбит/с. Некоторые производители включают MPEG-4 в свои цифровые видеорегистраторы для удаленного просмотра и управления, тогда как для локальной записи используются другие алгоритмы сжатия.

Ведутся разработки и новых стандартов в ITU-T и ISO. Последняя версия MPEG-4 и новый стандарт Н.264 позволят повысить уровень сжатия до такой степени, что фильмы с высоким разрешением (HDTV) можно будет записывать на DVD-диски высокой емкости.

MPEG-7

Хотя MPEG-7 и MPEG-21 (описан далее) не используются в видеонаблюдении, здесь необходимо их упомянуть, так как они представляют собой дальнейшее развитие концепции сжатия изображения, а не просто очередную модификацию алгоритмов сжатия. MPEG-1 и MPEG-2 обеспечивают удобный способ представления аудиовизуальной информации, и этими алгоритмами сжатия пользуются в вещательном телевидении, в видеонаблюдении и при видеомонтаже. MPEG-4 распространен еще более широко в различных сферах благодаря таким своим возможностям, как расширенный диапазон скоростей передачи, масштабируемость, устойчивость к ошибкам, гибкая интеграция объектов разных типов в рамках одной сцены и мощные методы добавления интерактивности в содержимое.

MPEG-7 определяет взаимодействующую структуру для способов описания содержимого, помимо традиционных метаданных. Описательные элементы MPEG-7 варьируются от цветов, форм и звуков до структурной информации высокого уровня о содержимом. MPEG-7 также имеет уникальный инструментарий для структурирования информации о содержимом.

MPEG-7 будет дополнять MPEG-4, а не заменит его. MPEG-4 определяет способ представления информации, a MPEG-7 определяет способ описания. MPEG-7 и MPEG-4 создают очень мощную связку, особенно когда используются объекты MPEG-4. С помощью MPEG-7 теперь стало возможным обмениваться информацией мультимедийного содержания, что позволяет легко найти именно то, что требовалось. Этот набор инструментов может оказаться особенно полезным в видеонаблюдении, где очень часто приходится иметь дело с архивами продолжительностью в несколько недель, а то и месяцев, записанных на жестких дисках. MPEG-7 поможет найти конкретные объекты, например, человека в красной рубашке или синюю машину, угнанную на улице.

MPEG-7, несомненно, найдет в будущем широкое применение в вещательном телевидении, видеонаблюдении и будет использоваться поисковыми серверами для нахождения различной мультимедийной информации. Поиск мультимедийной информации значительно упростится особенно в тех случаях, когда мы имеем дело с огромными объемами информации, записанной на жестких дисках большого объем.

Хотя сейчас в видеонаблюдении используются цифровые видеорегистраторы с функцией интеллектуального поиска, которые позволяют находить объекты в определенных зонах активности (неактивности), такой поиск с использованием MPEG-7 станет более мощным и гибким, что значительно повысит эффективность видеонаблюдения. Впрочем, это уже вопрос будущего.

MPEG-21

MPEG-21 — это еще один новый стандарт, который не используется в видеонаблюдении, но для полноты нашего описания мы немного расскажем и о нем. Задачей MPEG-21 является создание «полной картины» того, как различные Цифровые Элементы выстраиваются в инфраструктуру для доставки и использования мультимедийного содержания. Мир MPEG-21 состоит из Пользователей (Users), которые взаимодействуют с Цифровыми Элементами (Digital Items). Цифровым элементом может быть все, что угодно: от простой части мультимедийного содержания (одно изображение или звуковая дорожка) до целой коллекции видеозаписей. В качестве Пользователя MPEG-21 может выступать любое лицо (от производителей и продавцов до потребителя). Интересно, что все Пользователи «равны» в MPEG-21, так как у них у всех есть свои права и интересы в отношении Цифровых Элементов, а эти права и интересы необходимо выражать. Информация о распространении сама по себе представляет ценность, и конечный пользователь хотел бы иметь контроль над ее использованием. Серьезной движущей силой стандарта MPEG-21 является то, что цифровая революция дает пользователю возможность играть новую роль в цепочке производства и распространения мультимедийной информации.

Н.320

Стандарт Н.320 представляет собой рекомендацию ITU-T. Он состоит из серии других стандартов, каждый из которых отвечает за тот или иной аспект коммуникационной системы, то есть на самом деле является семейством стандартов. Например, стандарт Н.261 описывает кодирование видеоизображения, а Н.221 отвечает за мультиплексирование видеоинформации, аудиоинформации, данных и сервисной информации.

Рекомендация Н.320 предназначена в первую очередь для систем видеоконференции и видеофонов и оптимизирована для передачи данных по сети ISDN. При скорости передачи 128 кбит/с (два В-канала ISDN) можно достичь неплохого качества изображения при очень хорошей скорости обновления кадров. Поскольку допустимая скорость передачи данных для этого стандарта лежит в диапазоне от 64 до 1920 кбит/с, то Н.320 можно использовать в коммуникационных сетях (локальных и глобальных) с различной пропускной способностью. Обратите внимание, что стандарт Н.320 был разработан для двустороннего общения между людьми и поэтому не имеет задержки в передаче данных, которая наблюдается в стандартах MPEG-1 и MPEG-2.

При двустороннем общении очень важно, чтобы отставание оставалось ниже 100–200 миллисекунд, иначе общение будет затруднено. Малое время задержки в передаче данных очень важно и в видеонаблюдении, особенно в тех случаях, когда необходимо удаленно управлять телекамерами. Поэтому некоторые производители цифровых видеорегистраторов используют при управлении телекамерами один из стандартов Н.320, тогда как в общем случае применяют другой стандарт сжатия. Н.320 также поддерживает возможность выбора приоритета качества изображения или скорости обновления.

Рекомендация Н.320 описывает не только кодирование изображения, но стандартизирует и другие компоненты коммуникационной системы. Большим преимуществом этого стандарта является высокая совместимость. Так, например, видеофон ISDN от одного производителя может обмениваться информацией системой видеоконференции ISDN от другого производителя или видеопередатчиком ISDN, если все они поддерживают стандарт Н.320.

Н.261

Н.261 является одним из самых старых стандартов сжатия и именно его некоторые производители цифровых видеорегистраторов воплотили в своей продукции в те времена, когда появились первые DVR.

Н.261 — это стандарт видеокомпрессии из семейства стандартов Н.320, которые разработаны для видеоконференций. На момент появления стандарта Н.261 (начало 1980-х) не было сети Интернет, а самым быстрым способом передачи цифровой информации были линии ISDN. Поэтому вышедший в то время стандарт был оптимизирован для сжатия видеоизображения таким образом, чтобы его можно было передавать в диапазоне скоростей ISDN от 64 кбит/с до 1.5 Мбит/с. Так же, как стандарты MPEG, Н.261 определяет форматы как для хранения, так и для передачи сжатого видео. Более того, поскольку скорость передачи данных по линиям ISDN увеличивается с интервалом 64 кбит/с, то стандарт Н.261 позволяет настраивать уровень сжатия ступенчато, то есть постепенно увеличивая требуемую пропускную способность по 64 кбит/с.

Н.261 обычно работает с изображением формата CIF (352x288 пикселов для PAL и 352x240 пикселов для NTSC), который появился вместе с Н.261. Четверть этого разрешения также используется под именем QCIF (176x144 пиксела). Хотя стандарт Н.261 и предусматривает более высокое разрешение 704x576 пикселов, большинство цифровых видеорегистраторов со сжатием Н.261 используют формат CIF, сравнимый по качеству с VHS, как это было в случае и с MPEG-1. Хотя на экране компьютера можно увеличить передаваемое изображение, разрешение от этого не возрастет, и будут отчетливо видны блоки и пикселы изображения.

Стандарт Н.261 нашел самое широкое применение в рамках семейства стандартов Н.261 для систем видеоконференции. Сжатие Н.261 не особенно эффективно для более качественного видео в видеонаблюдении, но было очень удобно для удаленного доступа по низкоскоростным каналам связи. Говоря об этом в прошедшем времени, я хочу подчеркнуть, что при работе на низкоскоростных каналах связи Н.261 значительно проигрывает MPEG-4.

Н.263

Н.263 появился в 1996 году и стал дальнейшим развитием стандарта Н.261. Н.263 был специально оптимизирован для передачи изображения по очень низкоскоростным линиям связи со скоростью ниже 64 кбит/с в рамках семейства стандартов Н.320, например, для передачи по модему и телефонным линиям. Н.263 является альтернативой стандарту Н.261. При передаче изображений в сети GSM (9600 бит/с) и аналоговым телефонным линиям использование стандарта Н.263 позволяет несколько улучшить качество изображения и скорость обновления. На более высокоскоростных линиях связи качество будет сопоставимо с Н.261. Поскольку в стандарте Н.263 применен более эффективный алгоритм сжатия, то он позволяет добиться более высокого качества, чем у Н.261, на линиях связи с различной пропускной способностью, в том числе и ISDN. Н.263 позволяет передавать изображение с очень низкой скоростью передачи данных, как у модемов, скорость которых была в пределах 15–20 кбит/с. Первоначально планировалось с введением нового стандарта Н.263 сделать возможными видеоконференции по обычным телефонным линиям. Хотя для этой цели мог подойти формат QCIF, для того чтобы гарантировать работу на низкоскоростных линиях, решено было добавить еще один формат, который называется Sub-QCIF (SQCIF). Но кроме этого, были добавлены форматы высокого разрешения, чтобы воспользоваться преимуществами новых коммуникационных технологий и высокоскоростных линий связи. SQCIF предусматривает очень низкое разрешение (128x96 пикселов). Два других новых формата высокого разрешения (704x576 и 1408x1152) являются дополнительными, так как оборудование Н.263 должно поддерживать в обязательном порядке только форматы SQCIF, QCIF и CIF.

Н.264

Н.264 — это один из самых многообещающих стандартов в череде новых разработок. Он разрабатывался совместно группой Video Coding Experts Group (VCEG) из ITU-T и группой MPEG из ISO. Это историческое объединение известно как JVT (Joint Video Team). Сам стандарт идентичен ISO MPEG-4 part 10, который также известен как стандарт AVC для улучшенного кодирования видео (Advanced Video Coding). В черновом варианте стандарт Н.264 был готов к маю 2003 года, и в нем были реализованы технологии и особенности, взятые из Н.263 и MPEG-4.

Рис. 9.43. Н.264 использует сложные алгоритмы предсказания в макроблоках

Н.264 — это название относится к серии Н.26х видеостандартов ITU-T, тогда как AVC относится к серии MPEG-стандартов ISO. Поэтому новый стандарт иногда называют H.264/AVC или AVC/H.264, чтобы подчеркнуть общность его корней. Название Н.261_тоже взято из истории ITU-T, но оно встречается нечасто, хотя изредка и используется.

Основной целью проекта Н.264 была разработка стандарта, который можно было бы быстро внедрить, используя низкие скорости передачи данных, что, в свою очередь, снизило бы требования, предъявляемые к декодирующему оборудованию и линиям связи. Н.264 содержит несколько новых технологий, которые позволяют сжимать видео более эффективно, чем это делали используемые ранее стандарты. Например, в Н.264 для компрессии без потерь синтаксических элементов видеопотока используется схема статистического кодирования потока САВАС (Context-Adaptive Binary Arithmetic Coding). Также в стандарте Н.264 используется адаптивный фильтр для уменьшения артефактов блочности (Adaptive Deblocking Filter), который применяется на стадии кодирования и декодирования видео, то есть фильтрация производится для каждого кадра еще до того, как он будет использован для кодирования или декодирования последующих кадров. Этот фильтр позволяет уменьшить присутствие блочных артефактов, характерных для алгоритмов сжатия, использующих дискретное косинусное преобразование. В предыдущих стандартах при оценке компенсации движения использовался только предшествовавший кадр, но Н.264 позволяет для этой цели использовать кадры, находящиеся сколь угодно далеко от обрабатываемого кадра. Для большинства сцен это дает достаточно скромное улучшение в качестве и небольшое уменьшение видеопотока, но в некоторых случаях, например, при быстрых периодических вспышках и мерцании это позволяет значительно уменьшить размер видеопотока. Эти идеи, а также и многие другие привели к тому, что Н.264 значительно более эффективен, чем MPEG-4 ASP. Н.264 обычно работает более эффективно, чем MPEG-2, при меньшем размере видеопотока. Различные тесты и сравнения показали, что стандарт Н.264, по крайней мере, в 2–3 раза более эффективен, по сравнению с MPEG-2 при том же качестве изображения.

Рис. 9.44. Уже начали появляться диски HD DVD емкостью 30 Гбайт

Кроме того, совместная группа JVT заканчивает работы над дополнениями к стандарту, которые получили название FRExt (Fidelity Range Extensions). Эти дополнения позволят стандарту увеличить точность кодирования за счет поддержки 10- и 12-битного кодирования и увеличения цветового разрешения с использованием форматов оцифровки, известных как YUV 4:2:2 и YUV 4:4:4.

Н.264 уже широко используется в сфере видеоконференций, он был предварительно принят как обязательный стандарт для будущих спецификаций DVD, которые также известны как HD-DVD и разрабатываются DVD Forum.

Как и для многих видеостандартов ISO, для Н.264 есть пример реализации, который находится в свободном доступе. Этот пример должен только показать возможности нового стандарта, но не предназначен для практического применения.

Один из лидеров в сфере компьютерной обработки изображений и мультимедийных приложений компания Apple Computer уже включила стандарт Н.264 в новую версию своей операционной системы Mac OS X. Другие разработчики вскоре последуют этому примеру.

Motion Wavelet

Существует немалое количество и других алгоритмов сжатия видеоизображения, которые являются собственными разработками компаний-производителей систем видеонаблюдения. По этой причине эти алгоритмы никак не стандартизированы, и такой работы даже не ведется. Кроме того, подробности реализации разработчики предпочитают не сообщать, так как это является коммерческой информацией. От детального рассмотрения таких алгоритмов на страницах книги мы воздержимся и в качестве примера приведем только один алгоритм сжатия видеоизображения Motion Wavelet, разработанный одной из российских компаний.

Motion Wavelet — алгоритм сжатия видеоизображения, то есть сжатие кадров основано на том, что они образуют видеопоследовательность. Motion Wavelet обрабатывает изменения, которые возникают в очередном кадре по сравнению с предыдущим либо с опорным кадром. Этим он отличается от алгоритмов сжатия изображения (JPEG и Wavelet), в которых применяется покадровое сжатие. Поэтому размер кадра в Motion Wavelet при сопоставимом качестве получается меньше в 5-10 раз. Разница в среднем размере кадра будет зависеть от фона, наличия перемещающихся объектов и от других факторов.

В отличие от многих алгоритмов сжатия видеоизображения (например, алгоритмы MPEG) Motion Wavelet работает не по принципу вычитания кадров и сжатия полученной разницы. Motion Wavelet при анализе последовательности кадров использует детектор движения, который определяет на следующем кадре, какие элементы изображения изменятся, и сжимает только их. Если начинается движение во всем кадре, то будут обрабатываться и сжиматься все кадры полностью, что будет аналогично покадровому сжатию Wavelet. Впрочем, для видеонаблюдения именно сжатие, связанное с движением отдельных фрагментов, играет основную роль.

Обычно в тех алгоритмах, у которых сжатие основано на обработке разности кадров, не допускается изъятие хотя бы одного кадра из видеопотока, иначе он «распадается».

Эта проблема есть в наиболее распространенных реализациях алгоритма MPEG — они не могут адаптироваться к пропускной способности канала (например, при передаче видеоизображения по сети или по модему) и требуют канал фиксированной ширины. При использовании покадровых алгоритмов JPEG и Wavelet сжимается каждый кадр, поэтому здесь такая проблема отсутствует. Motion Wavelet может адаптироваться к каналу, поскольку если из потока, сжатого с его помощью, выкидывать блоки, то кадр потом можно будет восстановить, потому что сжатие очередного кадра по Motion Wavelet не имеет жесткой привязки к предыдущему кадру.

В наиболее распространенных реализациях алгоритма MPEG фиксируется величина сжимаемого потока. Это означает, что чем больше изменений происходит от кадра к кадру, тем хуже качество сжатого видеоизображения. Если в кадре ничего не изменяется, то качество сжатого изображения — отличное, но если объект начал двигаться, качество сжатого видеоизображения падает. Для видеонаблюдения такую ситуацию нельзя считать удовлетворительной, потому что здесь очень важно наблюдение с хорошим качеством именно движущихся объектов. В Motion Wavelet при наличии в кадре какого-либо действия фиксируется качество: если в кадре начинается движение, то увеличивается величина сжатого потока, а качество остается стабильным.

Еще одна проблема, которая возникает при передаче видеоизображения по сети в форматах MPEG, заключается в том, что видеопоток, сжатый с одной скоростью (например, 25 к/с), без дополнительного перекодирования нельзя передавать меньшей скоростью из-за жесткой привязки в последовательности кадров друг к другу. В алгоритмах Wavelet и JPEG нет этой проблемы. Она была решена и в алгоритме Motion Wavelet, который также позволяет при передаче пропускать кадры.

Так как Motion Wavelet для сжатия кадров использует вейвлет-преобразование, то все преимущества этого сжатия сохранились. Благодаря масштабируемости вейвлет-сжатия Motion Wavelet также позволяет из одного видеопотока быстро получать видеопотоки разного разрешения, когда видеопоток с высоким разрешением используется, например, для записи, а для удаленного просмотра используется видеопоток меньшего разрешения. Кроме того, в алгоритмах, использующих дискретное косинусное преобразование, как, например, JPEG и MPEG, возникает эффект блочности, но для Motion Wavelet, как и для любого вейвлет-сжатия, этот эффект нехарактерен.

Пикселы и разрешение

Все алгоритмы компрессии, о которых мы говорили ранее, базируются на одном мельчайшем элементе. Это пиксел, «кирпичик», из которых строится любое цифровое изображение. Этот термин необходимо проанализировать подробнее, так как именно пиксел определяет четкость изображения и детализацию, которую мы увидим.

Рис. 9.45. Пикселы RGB на люминофоре цветного монитора или телевизора с электронно-лучевой трубкой

Пиксел (от англ. Pixel, Picture Element, иногда Pel, т. е. элемент изображения) — это мельчайшая часть электронного (цифрового) изображения. Пикселы — это атомы изображения. Крайне важно понимать, что такое пиксел для цифровой фотографии, но то же самое можно сказать и применительно к видеонаблюдению, особенно после появления цифровых видеорегистраторов. Многие из вас употребляют термин «пиксел» при печати брошюр и каталогов для своей компании, а также при обсуждении характеристик жидкокристаллических дисплеев, но при этом мы совсем необязательно говорим о тех же пикселах, которые применяются в цифровом видео.

Пикселы можно связать с разрешением изображения, но крайне важно понимать различия между пикселами разного рода, поскольку очень часто мы пытаемся распознать мельчай шие детали (например, лицо злоумышленника) на изображении, сжатом с высокой степенью компрессии.

В офсетной печати вместо пикселов говорят точки (dots), но сути дела это не меняет, поскольку эти элементы невозможно разделить на более мелкие и получить при этом дополнительную значащую информацию об изображении, частью которого они являются. Проще говоря, в пикселах содержится элементарная информация о мельчайших деталях изображения, то есть информация о цвете и яркости пиксела. Применительно к телевидению мы говорим в данном случае о цветности (chrominance) и яркости (luminance) элемента изображения. Поскольку при отображении всего разнообразия цветов и теней мы ограничены набором первичных цветов, пикселы состоят из более мелких деталей, которые отражают определенное значение своих первичных цветов. Поэтому пикселы на самом деле не являются мельчайшими элементами изображения, однако только группа всех первичных элементов образует «полный» пиксел.

Рис. 9.46. Расположение пикселов RGB на стандартном телевизионном экране (смещение на половину пиксела по вертикали связано с чересстрочной разверткой)

А одинаковы ли пикселы, которые используются в цифровой фотографии, телевидении и печати? Это очень важный вопрос, которому мы уделим особое внимание. Нет, это пикселы разного рода. И в разнице между ними кроется множество ошибок и неточностей, которые возникают во многих сферах, связанных с обработкой изображения, одной из которых и является видеонаблюдение.

Как известно, в цветном телевидении используют цвета красного, зеленого и синего люминофора, чтобы имитировать все остальные цвета. С помощью трех первичных цветов (RGB) мы можем представить практически любой (почти любой) цвет, воспринимаемый человеческим глазом. При соответствующей интенсивности яркости красного, зеленого и синего люминофора мы также можем отобразить любую яркость пиксела (от белого до черного), в том числе и телесные цвета. На самом деле смешивание цветов происходит уже у нас в глазах, когда мы смотрим на пикселы с нормальной зрительной дистанции, которая настолько велика по сравнению с размером пикселов, что мы воспринимаем три первичные точки как одну точку результирующего цвета, полученную в результате аддитивного смешения цветов красного, зеленого и синего люминофора в пикселе.

Рис. 9.47. Пример иного расположения элементов RGB, из которых состоит пикселы

В аналоговом телевидении, которым большинство из нас до сих пор пользуется, и, конечно же, в видеонаблюдении пикселы в качестве элементарных деталей присутствуют на обоих концах сложной цепи, в результате которой мы получаем изображение: на входе, т. е. в телекамере, и на выходе, т. е. на мониторе. В телекамерах применяются ПЗС-матрицы, у которых мельчайшие элементы — пикселы — состоят из красной, зеленой и синей компоненты. Эти цветовые компоненты пиксела реагируют на красную, зеленую и синюю часть спектра проецируемого изображения, генерируя электроны пропорционально количеству цвета этой цветовой компоненты пиксела проецируемого туда изображения. В трехматричных ПЗС-телекамерах свет разделяется на три цветовые группы светоделительной призмой, а затем каждая световая группа проецируется на соответствующую ПЗС-матрицу. Это означает, что для каждого первичного цвета имеется отдельная ПЗС-матрица. Трехматричные ПЗС-телекамеры дают качественный видеосигнал с прекрасной цветопередачей и высоким разрешением. К сожалению, трехматричные ПЗС-телекамеры редко используются в видеонаблюдении, так как они очень дороги и, как правило, более громоздки, чем их одноматричные аналоги, которые в основном и используются. В цветных одноматричных ПЗС-телекамерах каждый пиксел состоит из трех первичных цветовых элементов (RGB). Справедливости ради нужно отметить, что существуют ПЗС-матрицы, где в качестве первичных цветов используются не красный, зеленый и синий, а голубой, желтый и пурпурный (как основные цвета в печати). Но такие телекамеры очень редко применяются в видеонаблюдении, и поэтому мы не будем рассматривать их как значительный сегмент видеонаблюдения. В противном случае нам было бы необходимо знать, что голубой, желтый и пурпурный преобразуются в самой телекамере при помощи таблиц в красный, зеленый и синий, так как композитный видеосигнал на выходе все равно должен быть представлен значениями RGB. Как видно на схематичной иллюстрации матрицы ПЗС (одноматричной телекамеры) фильтрация цветов RGB происходит в форме мозаики, поэтому этот фильтр называется мозаичным. Следует отметить, что зеленых светочувствительных элементов в два раза больше, чем синих или красных. Это связано с тем, что большая часть яркостной информации лежит в пределах зеленого спектра и человеческий глаз наиболее чувствителен к зеленому цвету. Именно эти зеленые ячейки сильно влияют на разрешение телекамеры.

Рис. 9.48. Мозаичный фильтр на ПЗС-матрице

Логично было бы предположить, что разрешение в ТВ-линиях цветной одноматричной ПЗС-телекамеры рассчитывается путем деления количества горизонтальных (трехцветных) пикселов на 3/4 (соотношение сторон), на практике оно считается иначе. Учитывая чересстрочную развертку и мозаичное расположение, реальное разрешение цветной одноматричной ПЗС-телекамеры будет порядка 70–80 % от приведенных ранее расчетов. Таким образом, ПЗС-матрица размером 768x582 пиксела будет иметь разрешение приблизительно 768/4x3x0.8=460 ТВ-линий. А цветные трехматричные ПЗС-телекамеры имеют как минимум на 100 ТВ-линий больше только потому, что используются все трехцветные пикселы и отсутствует мозаичный фильтр.

В качестве необходимого отступления от темы мы напомним нашим читателям, что до изобретения ПЗС-телекамер (когда использовались телекамеры с передающими трубками) в связи с тем, что изображение считывается с мишени трубки в результате сканирования непрерывным электронным лучом, не существовало дискретных и конечных мельчайших элементов изображения (как в случае с ПЗС-матрицами).

Дискретные элементы изображения появились только с изобретением цветного телевидения, когда стали изготовлять телевизоры с электронно-лучевыми трубками, в которых использовалась цветоделительная решетка. Именно она разделяла световой поток на красные, зеленые и синие точки.

Когда речь идет о черно-белых телекамерах, мы говорим о разрешении, а не о пикселах, что напрямую связано с мельчайшим электронным лучом, который может сгенерировать телекамера и отобразить монохромный экран. Если вы помните, черно-белые мониторы имели довольно высокое разрешение только потому, что в них не использовались решетки, или сетки, и, соответственно, не было связанных с этим физических ограничений, которые появились позже с изобретением цветного телевидения. Все зависело только от того, насколько точно электронный луч воспроизводит детали, зафиксированные электронным лучом телекамеры. Возвращаясь снова к технологиям современного видеонаблюдения, подчеркнем, что необходимо четко понимать, что разрешение изображения в основном определяется источником, то есть разрешением ПЗС-телекамеры, что зависит от количества пикселов на ПЗС-матрице.

Нам не удастся отобразить на мониторе больше деталей (даже если сам монитор способен на это), чем зафиксировала ПЗС-матрица телекамеры. И, хотя всегда возможно точно определить количество пикселов на ПЗС-матрице, мы по-прежнему пользуемся ТВ-линиями при оценке качества деталей изображения, получаемого от телекамеры. Разрешение в ТВ-линиях измеряется с помощью тестовых таблиц, и в реальности вам вряд ли удастся идеально точно расположить таблицу перед телекамерой, поэтому ТВ-линии показывают несколько меньше деталей, чем получится в результате вышеприведенного попиксельного расчета. Когда видеосигнал отображается на экране монитора, самый маленький элемент изображения определяется либо пикселом ПЗС-телекамеры, либо пикселом монитора. Если у нас монитор с низким разрешением, например, маленький ЭЛТ-монитор с диагональю 23 см и с разрешением 330 ТВ-линий, а наша телекамера способна различать до 480 ТВ-линий, то мы увидим только то, на что способен монитор, то есть 330 ТВ-линий. А если у нас телевизионный монитор, который способен показывать около 700 ТВ-линий, то при той же самой телекамере мы увидим только 480 ТВ-линий.

Чтобы получить полное представление об измерении разрешения, необходимо сказать еще несколько слов о разрешающей способности объектива, которая измеряется в линиях на миллиметр. Есть оптические испытательные таблицы, которые измеряют эту функцию как разрешающую способность объектива в сравнении с контрастом. Это функция передачи модуляции (ФПМ). Тут все немного усложняется, так как ФПМ учитывает только черные линии на белом фоне (в отличие от учета черных и белых линий при измерении разрешения в ТВ-линиях, как мы это делаем в видеонаблюдении).

Рис. 9.49. Разрешение объектива, выраженное в парах линий на миллиметр

Разрешение в точках на дюйм (DPI)

Термин «точки на дюйм» (DPI) широко употребляется в настоящее время. Но под словом «точка» зачастую подразумеваются разные вещи, что и породило путаницу и неправильное толкование (нечто похожее происходит, когда в видеонаблюдении определяют разрешение в линиях и ТВ-линиях). В печати мы выражаем разрешение в точках на дюйм. С учетом того, что дюйм равен 2.54 мм, можно пересчитать в точки на миллиметр, но такие единицы измерения не будут стандартными. Поэтому, когда мы говорим о 300 точках на дюйм, на практике это означает, что на миллиметр приходится более 10 точек. Естественно, это очень маленький размер, и человеческий глаз не в состоянии различить две мельчайшие цветные точки, когда они расположены очень близко при печати с разрешением 300 точек на дюйм. Теоретически для сравнения возможно перевести телевизионное разрешение, которое используется в видеонаблюдении, в точки на дюйм.

Но есть одно большое «но»… В печати смешивание цветов реализуется совершенно иначе, чем при аддитивном смешивании, когда используются основные цвета RGB. В данном случае мы имеем дело с субтрактивным смешиванием, при котором в качестве основных используются голубой, пурпурный и желтый. Для дополнительных темных тонов добавляется черный, хотя теоретически цветов CMY достаточно для отображения всей палитры цветов. Все вы знаете, что такая печать называется CMYK. Таким образом, при печати цветных журналов и книг в основном используется 4 цвета красок. Для получения результирующего цвета в печати мельчайших элементов изображения все элементарные цветовые точки располагаются очень близко друг к другу (схожим образом происходит смешение на телевизионном экране). Основное отличие от телевидения заключается в том, что цветовые точки не располагаются в линию одна за другой (как это в настоящее время происходит на люминофоре большинства электронно-лучевых трубок и на экране жидкокристаллических мониторов). При печати четыре цветовые точки расположены под разными углами: 45 градусов для черного, 75 градусов для пурпурного, 90 градусов для желтого и 105 градусов для голубого. Для печати качественных журналов и брошюр в полиграфии требуется разрешение 300 точек на дюйм. Таким образом, когда мы читаем при нормальном расстоянии для чтения (обычно 50 см), человеческий глаз не различает цветные пикселы, и мы видим уже результат цветового смешения.

Рис. 9.50. К сожалению, по техническим причинам в черно-белом издании мы не сможем проиллюстрировать принципы цветной печати CMYK, но некоторое представление о структуре пикселов вы получите, взглянув на увеличенную область (нижний правый угол) иллюстрации.

Психофизиология восприятия мелких деталей

Многочисленные эксперименты и тесты показали, что человеческий глаз может различить самое большее 5–6 пар линий на миллиметр. Этот показатель подразумевает оптимальное расстояние между глазом и объектом 30 см, то есть, когда мы, например, читаем достаточно мелкий текст. Это дает минимальный угол примерно в 1/60 градуса. Таким образом, это значение 1/60 градуса считается пределом угловой разрешающей способности для нормального зрения. Мы можем использовать угловую разрешающую способность глаза для лучшего понимания того, как человек воспринимает мелкие детали, что позволит нам затем применить наши теоретические познания на практике, в частности, в видеонаблюдении.

При расчете расстояния между человеком и монитором существует простая рекомендация, которая предписывает умножать высоту экрана монитора на семь. Вообще, необходимо понимать, что расстояние до монитора — это крайне важный аспект психофизиологического восприятия деталей в изображении. Человеку, который смотрит в монитор, совершенно не нужно находиться слишком близко к экрану, но и очень далеко от экрана располагаться зрителю тоже не стоит. При стандарте аналогового телевидения PAL с его 576 активными строками, расстояние до экрана монитора для оптимального восприятия деталей изображения рассчитывается исходя из предельного для глаза человека значения 5–6 пар линий на миллиметр, проецируемых на расстояние, где находится экран монитора. Так, если мы используем правило семикратной высоты экрана и возьмем, например, обычный монитор с диагональю 15 дюймов (38 см), у которого высота экрана будет примерно 23 см, то рекомендуемое расстояние до экрана составит примерно 1.6 м. Максимальная разрешающая способность человеческого глаза на этом расстоянии уменьшится примерно в 5 раз по сравнению с тем, что указано на рисунке для дистанции 0.3 м (1.6/0.3=5.33). В то время как на расстоянии 0.3 м глаз человека различает 5–6 пар линий на миллиметр, для 1.6 м разрешающая способность глаза уменьшится уже до 1 пары линий на миллиметр (2 линии на миллиметр, 0.5 миллиметра на 1 линию), что примерно и получится у нас, если мы разделим 576 активных линий на высоту экрана 23 см (2.5 линии на миллиметр). Все эти расчеты подразумевают, конечно, что у нас высококачественный монитор с высоким разрешением. Если мы сильно приблизимся к такому монитору, то мы не увидим никакой дополнительной информации. Если же мы увеличим дистанцию между человеком и экраном монитора, то это тоже не даст никакого положительного эффекта. Когда мы приближаемся к монитору, то эффект будет таким же, как если бы мы заменили этот монитор на другой, но с большей диагональю. Если, допустим, вы замените цветной монитор с диагональю 21 дюйм на другой монитор с диагональю 23 дюйма при том же расстоянии 1.6 м, то качество изображения и мелкие детали будут визуально восприниматься зрителем хуже. Для оптимального восприятия деталей на мониторе с диагональю 21 дюйм расстояние будет уже 2.1 м.

Рис. 9.51. 1/60 градуса считается пределом угловой разрешающей способности человеческого глаза

Такая же логика прослеживается и те же самые вычисления будут справедливы и для компьютерных мониторов высокого разрешения с электронно-лучевой трубкой и размером зерна 0.21 мм. В этом случае оптимальным расстоянием до экрана дисплея будет около 0.6 м. Большинство жидкокристаллических дисплеев не могут похвастать столь малым размером зерна, которое в этом случае обычно составляет 0.28 мм. Поэтому на них удобнее смотреть с расстояния примерно 1 м.

Здесь указаны приблизительные расстояния между зрителем и экраном монитора, которые основываются на пределе угловой разрешающей способности человеческого глаза 1/60°.

При том же расстоянии до экрана визуально будет восприниматься как значительно более качественное изображение от обычного компьютерного дисплея с разрешением XGA (1024x768 пикселов), где реальная разрешающая способность дисплея будет 92 точки на дюйм (dpi). Это значение получается делением 1024 пикселов на ширину 14-дюймового LCD-дисплея ноутбука. Поэтому дисплей компьютера имеет большую площадь (в пикселах), но также и более высокую частоту обновления, чем мы используем в видеонаблюдении. Имейте в виду, что для нормального отображения таких высококачественных изображений на экране компьютер должен иметь хороший видеоадаптер с достаточным количеством видеопамяти, чтобы обрабатывать это количество пикселов (1024x768) с нужным количеством цветов для передачи реальной сцены (глубина цвета 24 бит, что позволяет отображать 16.7 миллионов цветов в цветовой схеме RGB). И еще одно важное замечание: такой дисплей не будет совместимым с видеостандартами PAL или NTSC, так как это компьютерный дисплей XGA. Для отображения вышеупомянутых стандартов потребуется преобразование, которое может быть более или менее успешным в зависимости от алгоритмов и технологии дисплея.

Рис. 9.52. Здесь указаны приблизительные расстояния между зрителем и экраном монитора, которые основываются на пределе угловой разрешающей способности человеческого глаза 1/60 градуса

На печати мы имеем даже более высокое разрешение на миллиметр, чем мы можем получить на любом мониторе. Именно поэтому нам часто кажется, что кадр, распечатанный на качественной фотобумаге с использованием принтера высокого разрешения, визуально выглядит значительно лучше, чем тот же кадр на обычном мониторе, используемом в видеонаблюдении. В основном это связано с тем, что когда мы смотрим на монитор, то располагаемся от него несколько дальше, чем при чтении этой книги.

Итак, давайте представим, что изображение от телекамеры высокого разрешения отображается на качественном видеомониторе, у которого в спецификациях указана горизонтальная разрешающая способность около 500 ТВ-линий. Если у данного монитора диагональ экрана, например, 38 см (15 дюймов) то это означает, что он способен отображать примерно 666 вертикальных линий по 30-сантиметровой ширине экрана (30 см = 11.8 дюйма). Если 666 линий мы поделим на 11.8 дюйма, то получим разрешение равное 56 точек на дюйм (56 dpi)!

Это практически самое высокое разрешение, которое мы можем получить при отображении аналогового видеосигнала, и оно определяется самим видеостандартом (PAL/NTSC).

Чтобы качественно распечатать телевизионный кадр, соответствующий стандарту ITU-601, на струйном принтере, нам также необходимо знать основы технологии струйной печати. Это нам позволит выбрать нужное качество печати на принтере. Как и следовало ожидать, размер кадра на печати и его разрешение мы легко сможем рассчитать, так как мы знаем разрешение нашего принтера. Пусть это будет 1440 точек на дюйм. Впрочем, следует предостеречь нашего читателя от желания принимать на веру все технические характеристики, указанные в инструкциях к подобным устройствам. Эти значения не всегда соответствуют действительности и нашим ожиданиям. Те точки на дюйм, которые указаны в технических характеристиках вашего принтера (например, 720 или 1440 dpi), обозначают мельчайшие точки, которые могут быть отпечатаны одним соплом (голубого, пурпурного, желтого или черного цвета) печатающей головки струйного принтера. Ситуацию еще более запутывает тот факт, что это не те же самые точки на дюйм, к которым мы привыкли, когда речь идет о полиграфической печати. «Натуральные» цвета струйной печати получаются в результате процесса псевдосмешения цветов (точечных растров) для создания плавных переходов на цветном изображении, что представляет собой распыление краски и смешивание полученных точек различных размеров, чтобы получить результирующий цвет. На самом деле цветные струйные принтеры представляют собой бинарные устройства, в которых синие, пурпурные, желтые и черные точки находятся в состоянии «включено» (печатать) или «выключено» (не печатать) без каких-либо промежуточных состояний. Такой подход концептуально отличается от подхода, использованного в электронно-лучевых трубках мониторов, где люминофор может светиться с различной яркостью.

«Бинарный» струйный принтер, работающий в цветовой системе CMYK, может печатать только 5 «чистых» цветов: голубой, пурпурный, черный и желтый, а также и белый. При этом белый цвет — это всего лишь фоновый цвет бумаги (предполагается, что она действительно белая), но он также используется при формировании цветов. Очевидно, что такая цветовая палитра не может использоваться для качественной цветной печати. Впрочем, то же самое касается новых струйных фотопринтеров, у которых используется два дополнительных цвета (светло-синий и светло-пурпурный) для более естественной передачи оттенков кожи человека. Поэтому здесь в дело вступают алгоритмы формирования полутонов (half toning), которые делят все разрешение принтера на ячейки полутонов и затем варьируют количество точек в этих ячейках, чтобы имитировать переменный размер точек. Аккуратно сочетая ячейки, которые содержат различные пропорции точек в цветовой системе CMYK, струйный полутоновый принтер способен обмануть человеческий глаз, заставив его увидеть палитру из миллионов цветов, вместо нескольких основных.

Есть одно очень простое правило, позволяющее нам вычислить нужные значения. Многие профессионалы цифровой обработки изображения, такие, как специалисты компании Adobe, предлагают делить разрешение, указанное в спецификациях струйного принтера на 4, чтобы получить реальное разрешение. На практике это означает, что струйный принтер с разрешением 720 точек на дюйм может передавать 180 цветных точек на дюйм. Для того чтобы получить самое высокое разрешение, нужно использовать соответствующую фотобумагу, которую рекомендует компания-производитель струйного принтера.

Здесь следует сделать еще одно важное замечание. Когда мы экспортируем оцифрованное сжатое изображение, чтобы использовать его в качестве доказательства (для правоохранительных органов, в суде), то необходимо иметь это изображение в исходном формате или хотя бы экспортировать его в растровый формат BMP, который не вносит дополнительных артефактов компрессии. Когда мы сравниваем различные алгоритмы компрессии, то наиболее объективно мы поступим, сравнивая изображения, распечатанные на фотобумаге с использованием одного и того же высококачественного струйного принтера. Также мы можем сравнивать их на экране, но они должны быть предварительно экспортированы в формат BMP.

Рис. 9.53. В настоящее время высококачественные цветные принтеры достаточно дешевы и должны присутствовать в любой системе видеонаблюдения

Распознавание лиц и автомобильных номеров

Одним из наиболее частых требований к системам видеонаблюдения является возможность узнать человека, определить нарушителя или, например, группу людей, совершающих противоправные действия.

Вторым по значимости требованием является возможность распознавать автомобильные номера.

Конечно, телекамеры и цифровые видеорегистраторы могут применяться не только в сфере видеонаблюдения, но поскольку это все же наиболее типичный случай применения, то мы остановимся подробнее на требованиях, которые предъявляются к проектированию и установке системы видеонаблюдения для обеспечения успешного распознавания лиц и автомобильных номеров.

Основная проблема, с которой мы здесь сталкиваемся, связана с очень ограниченным числом пикселов в телекамерах, применяемых в видеонаблюдении, и в самой рекомендации ITU-601. Как уже было упомянуто в начале главы, число это составляет примерно 400 000 пикселов, поэтому в большинстве случаев мы будем использовать одну и ту же хитрость, которая заключается в подборе правильного места и объектива для телекамеры, чтобы она смогла увидеть достаточно деталей для распознавания людей и автомобильных номеров. Обычно заказчики системы видеонаблюдения склонны полагать, что с помощью одной телекамеры можно охранять все, видеть все и распознавать все. Эту тему уже неоднократно обсуждали, но она попрежнему является камнем преткновения при подготовке разных проектов. Когда мы все работаем исходя из очень ограниченной сметы (а бюджет всегда будет очень важным соображением при проектировании), то прослеживается очевидная тенденция закладывать в проект минимально возможное количество телекамер. Тем не менее, когда что-то случилось и потребовалось кого-то опознать по записи, то в первую очередь виноватым может оказаться проектировщик системы видеонаблюдения, что с ее помощью невозможно распознать лицо человека или номер машины, даже если они попали в поле зрения телекамеры.

Вот простой совет: не идите на компромисс, а займитесь образованием ваших клиентов. Только так они смогут понять, зачем потребовались дополнительные телекамеры. Например, если нужно, установите две телекамеры для наблюдения за входом в фойе. Одна будет выполнять функцию обзорной, другая (с меньшим углом зрения) будет четко фиксировать лица всех входящих в фойе людей. Сначала это может показаться избыточным, но как только будет опознан и задержан первый злоумышленник, система видеонаблюдения докажет свое право на существование. Именно для этого и устанавливают системы видеонаблюдения.

Как подобрать объектив с нужным углом обзора для успешного распознавания, мы уже давно знаем из опыта проектирования аналоговых систем видеонаблюдения, и это не является чем-то фантастическим. Здесь же мы лишь подчеркнем тот факт, что при оцифровке видео будет иметь место некоторая потеря качества изображения, которую необходимо учитывать при проектировании системы.

На самом деле существуют различные национальные стандарты по видеонаблюдению, которые определяют, при каких условиях будет возможно распознавание лиц и автомобильных номеров. Для разных стран эти стандарты совершенно необязательно будут идентичны, поэтому мы воспользуемся австралийскими стандартами по видеонаблюдению, которые наиболее близки автору этой книги. Они должны дать вам достаточно информации для применения их рекомендаций на практике и, возможно, они также дадут вам пищу для дальнейших размышлений.

При записи оцифрованного изображения рекомендуется использовать полный кадр и самое высокое качество (т. е. 704x576 пикселов, что эквивалентно 720x576 пикселов из рекомендаций ITU). По возможности для повышения вертикального разрешения используйте при записи полные телевизионные кадры, а не телевизионные поля, хотя приведенные ниже рекомендации вполне применимы и при записи полями. Если в качестве объекта наблюдения мы берем человека, а установленная система видеонаблюдения имеет разрешение не менее 400 ТВ-линий (большинство из них будут иметь около 460 ТВ-линий), то рекомендованы следующие минимальные размеры объекта:

— Для идентификации человека (незнакомого) он должен занимать не менее 100 % высоты экрана. При этом предполагается, что лицо человека (голова) составляет примерно 15 % высоты человека. Если используется оцифрованное изображение, то голова должна занимать не менее 90 пикселов по высоте, прежде чем будет применен алгоритм сжатия изображения.

— Для распознавания человека (знакомого) человек должен занимать не менее 50 % высоты экрана. Если используется оцифрованное изображение, то высота человека должна составлять не менее 288 пикселов, прежде чем будет применен алгоритм сжатия изображения.

— Для обнаружения нарушителя человек должен занимать не менее 10 % высоты изображения. Если используется оцифрованное изображение, то высота человека должна составлять не менее 60 пикселов, прежде чем будет применен алгоритм сжатия изображения.

— Для наблюдения за толпой человек должен занимать не менее 5 % высоты изображения. Если используется оцифрованное изображение, то высота человека должна составлять не менее 30 пикселов, прежде чем будет применен алгоритм сжатия изображения.

— Для визуального распознавания автомобильных номеров нужно, чтобы высота символов номерной пластины была не менее 5 % высоты экрана. Если используется оцифрованное изображение, то высота символов должна составлять не менее 30 пикселов, прежде чем будет применен алгоритм сжатия изображения.

На испытательной таблице CCTV Labs имеются элементы, которые позволяют проверить соответствие вашей системы видеонаблюдения приведенным выше рекомендациям.

Рис. 9.54. Минимальные размеры объектов относительно вертикали экрана для идентификации и распознавания

Операционные системы и жесткие диски

Для того чтобы компьютер мог работать, ему требуется соответствующее аппаратное обеспечение и такое программное обеспечение, которое сможет «понимать» все устройства компьютера. При загрузке компьютера мы в первую очередь видим различные таблицы BIOS (Basic Input/Output System, базовая система ввода/вывода), в которых указаны его аппаратная конфигурация, жесткие диски, видеоадаптеры, клавиатура, мышь, последовательные и параллельные порты и т. д.

После того как BIOS определит аппаратную конфигурацию компьютера, он обращается к специальной секции жесткого диска, которая называется загрузочной областью, где ищет операционную систему.

Операционная система (ОС) — это программное обеспечение, которое обычно находится на жестком диске, и, после того как оно загружено в память компьютера, предоставляет пользователю графический интерфейс и позволяет взаимодействовать всем компонентам компьютера, загружая для них драйверы.

Также ОС позволяет вводить и исполнять команды в том виде, как они определены пользователем или программой. Само название «операционная система» говорит о ее предназначении, в ее среде работают все приложения и специализированные программы, такие, как процессоры таблиц, графические и текстовые редакторы.

Многие цифровые видеорегистраторы, используемые в видеонаблюдении построены на базе компьютера и используют одну из нескольких популярных ОС, а функция видеозаписи в них реализована за счет специализированной программы и плат видеоввода. В цифровых видеорегистраторах на базе ПК чаще всего используются такие ОС, как Windows и Linux. Существуют и другие ОС, как, например, Unix, Solaris и Mac OSX, но они не нашли применения в видеонаблюдении, поэтому в рамках книги они не рассматриваются.

Некоторые цифровые видеорегистраторы загружают ОС не с жесткого диска, а из микросхемы памяти (обычно, флэш-память или энергонезависимая память EPROM). Иногда вы увидите, что производители цифровых видеорегистраторов будут писать в технических характеристиках, что в их устройствах используется такие ОС, как Real Time Operating System (RTOS) или встраиваемые ОС (Embedded OS). Цифровые видеорегистраторы со встраиваемыми ОС несколько проще в эксплуатации. Встраиваемые ОС меньше по размеру и быстрее загружаются. Если в цифровом видеорегистраторе используется обычная ОС, то в случае сбоя жесткого диска ее придется устанавливать заново. Этого не придется делать в случае со встраиваемыми ОС, так как небольшой размер позволяет хранить их в микросхеме энергонезависимой памяти, что повышает общую надежность. Впрочем, у таких цифровых видеорегистраторов есть одно серьезное ограничение, встраиваемые ОС сложнее обновлять, и они не столь гибкие, как ОС, загружаемые с жесткого диска.

В индустрии безопасности требования, предъявляемые к стабильности ОС, всегда были очень высоки. Требования же к долгосрочному и бесперебойному функционированию оборудования в видеонаблюдении иногда еще выше, чем требования, предъявляемые к веб-серверу с большим количеством посетителей, и всегда выше, чем требования, предъявляемые к офисному или домашнему компьютеру.

Веб-сервер еще можно отключить на несколько минут или даже часов для технического обслуживания, но в видеонаблюдении цифровой видеорегистратор должен работать непрерывно в течение многих месяцев, а возможно, и лет. А это очень непростая задача. Интенсивность записи и считывания информации с жесткого диска у цифрового видеорегистратора значительно выше, чем, например, у веб-сервера, так как потоки видеоинформации значительно больше, чем потоки информации с веб-страниц или электронной почты. Не все операционные системы и даже не все компьютерные комплектующие пригодны для длительного бесперебойного функционирования. Одной из причин, по которой большинство веб-серверов в Интернете работают под управлением Linux, является долгосрочная стабильность этой ОС. Конечно, нельзя сказать, что популярные и широко распространенные ОС семейства Windows совершенно непригодны для нашей цели, но читатель должен знать, что, по статистике, идентичные конфигурации компьютеров на базе процессоров Intel (а таких процессоров большинство на рынке ПК), работают быстрее под управлением Linux, нежели чем под управлением Windows.

Linux — еще сравнительно молодая операционная система, созданная финским студентом по имени Линус Торвальд. Эта ОС была разработана на основе Unix, одной из старейших и надежнейших ОС, которая, к сожалению, под лицензией. Своим успехом и столь быстрым развитием Linux обязан концепции открытого кода, то есть исходный код операционной системы бесплатно доступен каждому в рамках Стандартной Общественной Лицензии GNU. Когда появилась первая версия Linux и стала доступной всем бесплатно, единственное требование автора этой ОС заключалось в том, что каждое усовершенствование системы или новый драйвер, разработанные другими людьми, должны быть доступны каждому.

Тысячи разработчиков программного обеспечения, студентов и энтузиастов единодушно приняли идею открытого кода ОС. Именно поэтому Linux со временем становится все более популярным и все время совершенствуется, а, кроме того, для этой ОС выходит все больше разнообразных приложений, и постоянно расширяется список поддерживаемого оборудования. Стабильность Linux — это всего лишь черта, унаследованная от концепции Unix, но и она постоянно повышается с выходом новых версий ядра и файловых систем. Существует большое количество вариантов Linux, которые называются дистрибутивами, но используют одно и тоже ядро (kernel, которое и является настоящим ядром операционной системы).

Однако, каждый дистрибутив имеет различный набор из дополнений, программ, инструментов и графических оболочек, которые поставляются бесплатно.

Когда Linux используется в цифровом видеорегистраторе, то это выгодно не только с позиций сиюминутной коммерческой выгоды, но и с позиции долгосрочных вложений, так как и в будущем вам не потребуется платить какие-либо лицензионные отчисления за ОС. Если в цифровом видеорегистраторе выйдет из строя системный жесткий диск (а это может произойти с любым жестким диском независимо от используемой ОС), то установка новой версии Linux не потребует от вас никаких платежей и многократного ввода серийных номеров с регистрации в Интернете, как это бывает в случае с Windows.

Некоторые производители цифровых видеорегистраторов используют версии Windows, которые были доработаны и адаптированы с учетом их специфических требований. Эти версии будут значительно стабильнее и надежнее стандартной версии Windows от Microsoft.

Существует мнение, что встраиваемые ОС еще более надежны и стабильны, так как они хранятся в энергонезависимой памяти и им не страшны сбои жесткого диска.

В случае сбоя жесткого диска или электропитания цифровой видеорегистратор со встраиваемой ОС быстро перезагрузится и продолжит запись. ОС переустанавливать не нужно даже в том случае, если жесткий диск полностью выйдет из строя, а потребуется только его заменить. Для некоторых это будет оптимальным решением. Впрочем, у него существует и ряд ограничений: в таких цифровых видеорегистраторах сложно обновлять ОС и драйверы, а потому возникают сложности с подключением новых устройств. Кроме того, здесь будет отсутствовать ряд не основных, но полезных функций. Обычно цифровые видеорегистраторы с полностью установленной ОС (Windows или Linux) имеют значительно больше различных функций и программ, так как они не ограничены размером флэш-памяти. Встраиваемые ОС из-за размеров флэш-памяти имеют ограниченную функциональность.

Рис. 9.55. В настоящее время можно насчитать не менее пары сотен моделей цифровых видеорегистраторов, которые используются в системах видеонаблюдения

Современные ПК с полным набором программ потребуют от 2 до 5 гигабайт жесткого диска. Здесь учитывается не только размер установленной ОС, но и все необходимые приложения, такие, как процессоры таблиц, текстовые и графические редакторы, веб-броузеры и другое необходимое для работы ПО. Кроме того, значительный объем будет занимать информация, созданная пользователем, а ее объем будет во многом зависеть от того, работаете ли вы только с текстовыми файлами или с текстом и изображениями или даже с видео.

Цифровые видеорегистраторы, используемые в видеонаблюдении, являются своего рода исключением из этого правила, так как они будут использовать максимально доступный объем жесткого диска.

Сейчас уже доступны жесткие диски емкостью 300 Гбайт, что позволяет нарастить суммарный объем внутренних жестких дисков для одного цифрового видеорегистратора свыше 1 Тбайт, используя 4 таких диска.

Некоторые крупномасштабные системы могут включать в себя даже внешние SCSI или RAID-массивы. Типичный цифровой видеорегистратор, который мы применяем в видеонаблюдении, будет работать постоянно, днем и ночью, 24 часа в сутки, 7 дней в неделю, без выключения и перезагрузки (в идеальном случае). Сами цифровые видеорегистраторы бесспорно являются симбиозом программного обеспечения и жестких дисков. Если одно или другое даст сбой, то мы получим нефункционирующий цифровой видеорегистратор и потерю важных записей.

Рис. 9.56. Одно из самых важных электромеханических устройств цифрового видеорегистратора

Необходимость более полного понимания технологии жестких дисков и их ограничений сейчас особенно остро чувствуется в видеонаблюдении. Даже самая стабильная ОС будет зависеть от надежности аппаратного обеспечения. Если оно выйдет из строя, то ОС тоже не будет функционировать, даже если с технической точки зрения сбой произошел не по вине ОС. В любом компьютере самыми уязвимыми с точки зрения надежности являются движущиеся детали, а именно охлаждающие вентиляторы и вращающиеся жесткие диски. Эти компоненты компьютера чаще всего выходят из строя по причине износа и стирания, а также от повышенной температуры, пыли, влажности, ударов и тряски. Некоторые из этих проблем успешно решаются только некоторыми производителями цифровых видеорегистраторов. К сожалению, приходится констатировать тот факт, что к моменту написания этой книги большинство производителей цифровых видеорегистраторов даже не рассматривают этих проблем. И только очень немногие производители, движимые конкуренцией на рынке, готовы затратить больше усилий и средств, используя более качественное аппаратное обеспечение и закладывая на стадиях разработки и производства способы и средства его защиты. В большинстве же случаев все будет зависеть от поставщиков и инсталляторов и от того, как они сумеют объяснить заказчикам важность создания, поддержания постоянных комфортных условий для функционирования оборудования, которое должно находиться в чистых и хорошо кондиционируемых помещениях.

Жесткие диски — это самая важная часть цифрового видеорегистратора, которая имеет движущиеся части (вращающиеся диски). В первую очередь жесткие диски важны потому, что на них хранится записанная информация, поэтому в этой главе мы уделим им особое внимание.

Анализ всех особенностей различных ОС, которые в настоящее время используются в цифровых видеорегистраторах, далеко выходит за рамки нашей книги, но мы остановимся на файловых системах, которые используются в различных ОС для хранения информации (в том числе файлов с видеоизображением) на жестких дисках.

Жесткие диски

Жесткие диски являются очень важной частью любого современного компьютерного устройства, к числу которых относятся и цифровые видеорегистраторы, используемые в видеонаблюдении. Следовательно, необходимо понимать принципы их работы, основные технические характеристики и знать об ограничениях, накладываемых технологией. Жесткий диск или накопитель на жестких магнитных дисках (это полное название) предназначен для долговременного хранения информации. В отличие от оперативной памяти (ОЗУ, RAM), которая теряет всю информацию после выключения питания компьютера, жесткий диск хранит информацию постоянно, что позволяет сохранять на нем программы, файлы и другую нужную информацию. Кроме того, жесткие диски имеют значительно больший объем, чем оперативная память. Сейчас на одном жестком диске уже может храниться около 400 Гбайт информации.

Жесткий диск состоит из 4 основных элементов: пластинки, шпиндель, считывающие/записывающие головки и интегрированная электроника. Пластинки представляют собой твердые диски из металла или пластика, обе стороны которого покрыты тонким слоем оксида железа или другого намагничиваемого материала. Эти пластинки надеты на центральную ось или шпиндель, который вращает все пластинки с одинаковой скоростью. Считывающие/записывающие головки закреплены на специальных держателях по обе стороны каждого диска и могут перемещаться от центра до края пластинки. Это движение в сочетании с высокой скоростью вращения пластинок, позволяет головкам получить доступ ко всем областям пластинок. Интегрированная электроника позволяет переводить команды, поступающие от компьютера, и позиционировать головки в соответствующие области пластинок, осуществляя процесс считывания и записи нужной информации.

Компьютеры записывают данные на жесткие диски в виде последовательности двоичных битов. Каждый записанный на жестком диске бит закодирован ориентацией частиц оксидного слоя пластинки. При записи данных компьютер посылает серию битов на жесткий диск. Когда диск принимает эту последовательность, то он использует записывающую головку, чтобы намагнитить соответствующие области оксидного слоя пластинки и таким образом осуществляет запись. Биты не обязательно хранятся в той последовательности, в какой они были отправлены на жесткий диск. Например, данные одного файла могут быть записаны в разных областях и на разных пластинках жесткого диска, а когда компьютер требует информацию, записанную на жестком диске, головки жесткого диска будут спозиционированы на все нужные участки пластинки. В процессе считывания информации головки жесткого диска определяют ориентацию элементов оксидного слоя на пластинке, затем эта информация декодируется и пересылается компьютеру. Считывающие/записывающие головки жесткого диска могут получить доступ к любому участку пластинок в любое время, что позволяет считывать и записывать данные произвольно, а не последовательно, как в случае с магнитной лентой. Поскольку жесткие диски характеризуются произвольным доступом, они могут считать или записать информацию в течение нескольких миллисекунд.

Рис. 9.57. Основные механические детали жесткого диска

Для того чтобы операционная система компьютера «знала», где искать нужную информацию на жестком диске, он разбивается на отдельные области, что позволяет компьютеру легко и быстро найти нужные последовательности битов.

Такой способ разметки жесткого диска называется форматированием. Форматирование подготавливает жесткий диск к записи файлов таким образом, что нужная информация может быть быстро считана, когда это потребуется.

Прежде чем можно будет использовать новый жесткий диск, его необходимо отформатировать. Форматирование — это метод организации записанной на диск информации, зависящий от операционной системы.

Существует два вида форматирования жестких дисков: низкоуровневое и высокоуровневое. Низкоуровневое форматирование осуществляется прежде, чем высокоуровневое.

Рис. 9.58. Два основных формата жестких дисков: жесткие диски 3.5" используются в настольных компьютерах, а жесткие диски 2.5" применяются в ноутбуках

Форматирование осуществляется разметкой поверхности на секторы, кластеры (группа секторов) и дорожки в соответствии с используемой операционной системой. Дорожки представляют собой окружности, отмеченные на каждой стороне пластинки (такие же дорожки можно видеть на виниловой пластинке или компакт-диске). Дорожки отличаются номерами. Их нумерация начинается с нулевой дорожки, расположенной ближе других к внешнему краю пластинки. Дорожки разделяются на меньшие участки — секторы, используемые для хранения фиксированных объемов данных. Секторы обычно форматируются таким образом, что содержат 512 байтов данных (1 байт состоит из 8 бит). Цилиндр состоит из набора дорожек, которые находятся на одном и том же расстоянии от шпинделя на всех сторонах магнитных пластинок. Например, третья дорожка на каждой стороне у каждой магнитной пластинки находится на одном и том же расстоянии от шпинделя. Если представить, что эти дорожки вертикально соединены, то мы получим форму цилиндра. Программное и аппаратное обеспечение компьютера очень часто работает, используя цилиндры. Когда данные организованы на жестком диске цилиндрами, к ним можно быстро получить доступ без многократного позиционирования головок жесткого диска. Поскольку позиционирование головок производится достаточно медленно по сравнению со скоростью вращения магнитных пластинок и переключением между головками, запись цилиндрами значительно сокращает время доступа к информации на жестком диске.

Рис. 9.59. Цилиндры формируются из дорожек на обеих сторонах магнитных пластинок

После того как жесткий диск был отформатирован на низком уровне, магнитные свойства покрытия пластинки с течением времени постепенно ухудшаются. Со временем головкам жесткого диска становится все труднее считывать и записывать информацию в секторы магнитной пластинки. Секторы, которые стали непригодны для хранения данных, называют дефектными (bad sectors). К счастью, качество современных жестких дисков таково, что дефектные секторы на них встречаются относительно редко. Более того, современные компьютеры умеют определять, когда сектор испортился и отмечать его как дефектный. После этого сектор больше не будет использоваться для хранения данных, а вместо него будет выбран другой сектор из резервной области.

После того как жесткий диск был отформатирован на низком уровне, требуется произвести высокоуровневое форматирование, которое помещает на диск файловую систему, что позволяет операционной системе, такой, как Windows или Linux, использовать доступное пространство для хранения файлов.

Различные операционные системы используют разные файловые системы, поэтому высокоуровневое форматирование определяется используемой операционной системой.

Рис. 9.60. Разбивка жесткого диска на разделы (партиции)

Если мы форматируем весь жесткий диск только под одну файловую систему, то это автоматически ограничивает количество и типы операционных систем, которые могут быть установлены на него. Но если мы разбиваем диск на несколько разделов (партиций), то каждый из разделов может быть отформатирован под разные файловые системы, что позволит установить на один жесткий диск несколько разных операционных систем. Кроме того, разбивка жесткого диска на разделы позволяет использовать дисковое пространство более эффективно.

Для того чтобы считывать или записывать данные, головка жесткого диска должна быть позиционирована над нужной дорожкой вращающейся магнитной пластинки. Те значения времени поиска (seek time), которые указывают производители жестких дисков, обычно учитывает еще и время, нужное для того, чтобы магнитная головка перестала вибрировать после перемещения (время стабилизации, settling time).

Затем учитывается время, которое потребуется, чтобы нужный сектор оказался под магнитной головкой (задержка вращения, rotational latency). Современные диски используют позиционирование с ускорением, это означает что, получив команду сменить дорожку, магнитная головка начинает ускоряться до тех пор, пока она не пройдет половину пути до искомой дорожки, затем до подхода к нужной дорожке происходит замедление. Поэтому среднее время поиска всего лишь в несколько раз больше минимального времени поиска. Максимальное время поиска обычно примерно в два раза больше среднего времени поиска, поскольку головка достигает максимальной скорости перемещения, прежде чем дойдет до средней дорожки. Минимальное время поиска дорожки — это время, которое тратится на перемещение головки на соседнюю дорожку. При чтении больших блоков информации, как, например, при считывании архивных записей нашим цифровым видеорегистратором, именно этот параметр будет определять производительность жесткого диска. Среднее время доступа более важно при произвольном считывании небольших объемов информации (например, при перемещении по дереву директорий).

Время доступа складывается из времени переключения между головками, времени поиска нужной дорожки, задержки вращения и времени считывания сектора. Большее количество головок сокращает время, уходящее на механическое позиционирование на новую дорожку. При повышении скорости вращения увеличивается максимальная скорость передачи данных и сокращается задержка вращения, которая представляет собой дополнительное время ожидания появления нужного сектора под магнитной головкой. Приведенная таблица показывает различия между жесткими дисками с разной скоростью вращения и максимальную скорость передачи данных (на этом мы остановимся чуть позже), которая является самым важным параметром, отвечающим за то, какой максимальный объем информации мы можем записать на жесткий диск за единицу времени.

(Задержка вращения в данном случае рассчитывалась следующим образом. Например, для 7200 об/мин скорость вращения (7200) делится на 60 секунд = 120 об/сек и берется обратное значение, но это будет максимальная задержка вращения… Когда же говорят об этом параметре, то очень часто подразумевается среднее значение. Так как время ожидания случайного сектора будет иметь равномерное распределение, то средняя задержка вращения будет равна половине максимальной. Прим. ред .)

* Высокая скорость вращения требует дополнительного охлаждения жесткого диска

Для каждого жесткого диска определена скорость вращения, которая выражается в оборотах в минуту (revolutions per minute, rpm, об/мин). Этот параметр, кстати, дает очень хорошее представление о производительности жесткого диска. Жесткие диски для настольных ПК обычно имеют 5400 об/мин или 7200 об/мин. При этом жесткие диски с 7200 об/мин работают на 10 % быстрее дисков с 5400 об/мин, но они и дороже на 10–30 %. Старшие серии моделей жестких дисков, которые имеют 10,000 об/мин или 15,000 об/мин, позволяют добиться лишь незначительного прироста в производительности, а их стоимость будет отличаться значительно и в большую сторону, так как в большинстве случаев они имеют SCSI-интерфейс и функции для повышения надежности. Кроме того, высокая скорость вращения шпинделя жесткого диска требует большего энергопотребления, что приводит к большему нагреву жестких дисков. Охлаждение очень важно для всех жестких дисков, но особенно важно оно именно для дисков с высокой скоростью вращения. Таким образом, для обычного цифрового видеорегистратора жесткие диски со скоростью вращения 5400 или 7200 об/мин будут вполне приемлемы и окажутся удачным компромиссом между достаточной скоростью и разумной стоимостью.

Если два жестких диска имеют одинаковую скорость вращения шпинделя, то предпочтительнее окажется тот из них, у которого время поиска меньше. Разница во времени поиска, которая варьируется от 3.9 миллисекунды для сверхбыстрых жестких дисков со SCSI-интерфейсом до 12 миллисекунд у более медленных дисков с IDE-интерфейсом, может быть заметна при работе с большими базами данных, когда головки жесткого диска «бегают» по всем дорожкам, но это также будет заметно при поиске архивных записей в цифровом видеорегистраторе по событиям или по времени записи.

Рис. 9.61. Расположение загрузочных областей

Кэш-память ( cache )  — это еще один параметр, который характеризует жесткий диск. Он обозначает объем внутренней памяти жесткого диска. Предназначенная для того чтобы сократить количество обращений к жесткому диску, кэш-память содержит комбинацию часто запрашиваемой и недавно запрошенной с диска информации. Большой объем кэш-памяти в целом позволяет повысить производительность жесткого диска, когда к нему одновременно обращаются несколько пользователей. Хотя незначительная разница в объеме кэш-памяти не имеет большого значения для производительности, малый объем кэш-памяти говорит о том, что мы столкнулись со старым и медленным жестким диском. Операционные системы стараются повысить общую производительность, сокращая избыточную активность жесткого диска. Для этого наиболее часто используемые данные помещаются в оперативную память, что сильно сокращает количество обращений к жесткому диску. Запись новых данных тоже может производиться с задержкой, в более удобное для этого время. Существуют и другие способы сокращения обращений к жесткому диску. Например, при буферизации дорожки жесткого диска, при задержке вращения считываются все сектора этой дорожки в ожидании появления нужного сектора под магнитной головкой, так как с большой долей вероятности они потребуются сразу после чтения нужного сектора. В современных жестких дисках буферизацией дорожек занимается кэш-память встроенного контроллера диска.

Современные жесткие диски имеют кэшпамять объемом от 2 до 4 Мбайт для буферизации дорожек, что убирает задержку вращения. Некоторые жесткие диски высокого класса имеют 8 или даже 16 Мбайт кэш-памяти. Впрочем, скорость вращения по-прежнему ограничивает максимальную скорость передачи данных.

Рис. 9.62. Жесткие диски большого объема обычно имеют несколько головок и пластинок

Несмотря на «умную» электронику, которая позволяет повысить производительность жестких дисков, в первую очередь она определяется именно механическими характеристиками накопителя. По этой причине факторы, влияющие на производительность механических частей жесткого диска, также будут влиять на его надежность и срок службы. Высокая температура, пыль, влажность, сотрясения, вибрации могут послужить причиной поломки жесткого диска. Наиболее частыми причинами сбоев жесткого диска, с которыми мы сталкиваемся на практике в видеонаблюдении, являются перегревы и пыль.

Не будет преувеличением, если мы скажем, что жесткие диски в некоторых цифровых видеорегистраторах эксплуатируются более интенсивно, чем жесткие диски во многих интернет-серверах. К сожалению, культуре обращения с оборудованием у пользователей цифровых видеорегистраторов далеко до пользователей, устанавливающих корпоративные серверы и интернет-серверы. С цифровыми видеорегистраторами очень часто обращаются так, словно стремятся от них поскорее избавиться, устанавливая их в помещениях с минимальной вентиляцией, где много пыли и высокая влажность. При проектировании систем видеонаблюдения мы всегда должны настаивать, чтобы с жесткими дисками обращались, как если бы они были установлены в корпоративном сервере.

Рис. 9.63. Один из немногих производителей, который заботится о жестких дисках в цифровых видеорегистратораях. Для этого устанавливаются воздушные фильтры и датчики мониторинга вентиляторов, внешней и внутренней температуры

В современной конкурентной гонке производители цифровых видеорегистраторов стараются достичь более высоких скоростей записи и более высокого уровня компрессии при том же качестве, что и у их конкурентов. Но только очень немногие уделяют должное внимание условиям эксплуатации своей продукции и улучшают их за счет установки фильтров воздуха, температурных датчиков и датчиков скорости вращения внутренних вентиляторов. Все это вместе с использованием стабильной операционной системы увеличивает срок службы цифровых видеорегистраторов. Кроме того, будет очень мало пользы от самой высокой скорости записи и самого лучшего и быстрого алгоритма сжатия, если полученные кадры мы не можем записать на рабочий жесткий диск.

Существует несколько разных стандартов интерфейсов, которые позволяют вести обмен данными между компьютером и жесткими дисками. Сейчас применяются такие интерфейсы, как ATA, SCSI, RAID и SATA. Их мы подробнее рассмотрим далее в книге. Каждый интерфейс имеет свои преимущества и недостатки, но производительность в первую очередь зависит от самого жесткого диска, а не от его интерфейса. Внутренняя скорость передачи данных (sustained transfer rate или internal transfer rate) жесткого диска определяет и то, сколько телекамер и с какой скоростью мы сможем записывать на наш цифровой видеорегистратор. Внутренняя скорость передачи данных, которая в современных жестких дисках варьируется в пределах 14–60 Мбайт/с, показывает то, с какой скоростью можно считывать данные в кэш-память с внешней (то есть самой дальней от шпинделя) дорожки жесткого диска. В целом, она определяет общую скорость передачи данных в тех случаях, когда кэш-память не используется или не влияет на быстродействие (например, при считывании очень больших файлов, таких, как архивные записи цифрового видеорегистратора). Внутренняя скорость передачи данных очень сильно зависит от скорости вращения шпинделя, и, разумеется, она всегда будет ниже внешней скорости передачи данных (external data transfer rate или burst data transfer rate), которая показывает, с какой скоростью происходит обмен данными между кэш-памятью жесткого диска и оперативной памятью компьютера. Внутренняя скорость передачи данных является важным параметром для жестких дисков цифрового видеорегистратора, и от него зависит скорость записи и воспроизведения. Впрочем, производительность цифрового видеорегистратора зависит от многих других параметров, таких, как операционная система, центральный процессор, скорость сжатия изображений, размер видеопотоков и т. д., но если жесткий диск не справляется с потоками информации, то и скорость записи цифрового видеорегистратора тоже окажется значительно ниже теоретического максимума.

А теперь рассмотрим эту проблему в практической плоскости на конкретном примере. Предположим, что мы достаточно «консервативны» в выборе оборудования и у нас имеется не очень быстрый жесткий диск, внутренняя скорость передачи данных которого составляет только 14 Мбайт/с. Если нам привычнее считать в мегабитах в секунду, то данное значение нужно умножить на 8, что даст нам скорость передачи данных 112 Мбит/с. Теперь давайте предположим, что мы ведем запись на цифровой видеорегистратор с алгоритмом компрессии JPEG, а размер изображения приемлемого качества составляет, допустим, 40 килобайт.

Если, кроме записи, мы больше ничего не делаем на цифровом видеорегистраторе (т. е. не просматриваем архив), то максимальная (теоретическая скорость записи) такого устройства рассчитывается делением скорости 14 Мбайт/с на размер одного кадра (40 килобайт), что даст нам примерно 350 кадров в секунду. Если к цифровому видеорегистратору подключено 16 телекамер, то теоретическая скорость записи одной телекамеры будет 350/16=21 кадр в секунду. Это будет теоретическим максимумом только в том случае, если цифровой видеорегистратор не выполняет никакой другой работы, кроме записи. На практике цифровой видеорегистратор «тратит время» и на временную коррекцию, то есть синхронизирует несинхронизированные телекамеры. Это уменьшает скорость записи еще примерно в два раза до 10 кадров в секунду для одной телекамеры. Если мы захотим воспроизвести архивную запись или провести архивацию, то это тоже уменьшит скорость записи не менее чем на 50 %, что с выбранным жестким диском нам позволит получить максимум 5 кадров в секунду для одной телекамеры. Кроме того, нужно учитывать различные служебные обращения операционной системы к жесткому диску. При этом наши рассуждения будут справедливы только тогда, когда в цифровом видеорегистраторе применяется аппаратная компрессия, которая освобождает центральный процессор от сжатия изображений. Вы часто будете встречать утверждения, что в цифровом видеорегистраторе применяется очередной алгоритм программного сжатия, «имеющий лучшие характеристики среди всех известных». На практике это означает, что теоретический максимум скорости записи будет ограничен еще и производительностью центрального процессора и в нашем случае снизится еще более, упав до 1–2 кадров в секунду. И есть еще один важный, но практически незаметный фактор, который необходимо учитывать в нашем примере. Это фрагментация файлов, которая увеличивается тем больше, чем дольше мы ведем запись. Фрагментация файлов может значительно снизить скорость записи, хотя и не влияет на внутреннюю скорость передачи данных жесткого диска. Впрочем, в численном выражении ее выразить затруднительно, так как эта фрагментация будет зависеть от типа файловой системы, операционной системы, особенностей ПО и хранения данных в цифровом видеорегистраторе. При высоком уровне фрагментации файлов жесткий диск будет затрачивать много времени для поиска фрагментов файла на разных дорожках.

Как это следует из приведенного выше примера, на скорость записи цифрового видеорегистратора влияет очень много факторов и процессов. Жесткие диски оказываются начальным и конечным звеном в цепочке этих процессов.

Различные файловые системы

Для записи информации на жесткие диски и сменные носители каждая операционная система использует какую-нибудь файловую систему, чтобы при необходимости эту информацию можно было найти и считать. Эта фундаментальная и важная концепция определяет гибкость, емкость и безопасность различных систем, поэтому в данном разделе мы перечислим основные файловые системы, используемые в настоящее время.

Все файловые системы состоят из структур, необходимых для хранения и управления информацией.

Файловая система выполняет три основные функции: она следит за свободным дисковым пространством и пространством, выделенным для хранения файлов; она поддерживает структуру директорий и файловых имен; и она хранит ссылки на физическое расположение файлов на жестком диске.

Различные операционные системы используют различные файловые системы. Некоторые операционные системы, такие, как Windows, могут работать только со своими файловыми системами. Другие ОС (Linux и Mac OS X) умеют работать не только со своими, но и с другими файловыми системами.

Приведем список часто встречающихся файловых систем:

— Ext — (Extended file system), файловая система, предназначенная для операционных систем Linux

— Ext2 — (Extended file system 2), файловая система, предназначенная для операционных систем Linux

— Ext3 — (Extended file system 3), файловая система, предназначенная для операционных систем Linux (Ех12+протоколирование)

— FAT — (File allocation table 32), 12- и 16-разрядная файловая система, которая используется в DOS и Windows

— FAT32 — (File allocation table 32), 32-разрядная файловая система, которая используется в Windows

— HFS — (Hierarchical File System), файловая система, применявшаяся в старых версиях Mac OS

— HFS+ — (Hierarchical File System+), файловая система, применяющаяся в новых версиях Mac OS

— HPFS — (High Performance File system), файловая система, применявшаяся в IBM OS/2

— ISO 9660 — используется на дисках CD и DVD-ROM (Rock Ridge и Joliet — это ее расширения)

— JFS — (IBM Journaling File system), файловая система, применяемая в Linux, OS/2 и AIX, которая использует журналирование

— NTFS — файловая система, применяющаяся в операционных системах семейства NT (Windows NT, 2000 и ХР)

— ReiserFS — файловая система для Linux и Unix, которая использует журналирование О UDF — пакетно-ориентированная файловая система для записываемых и перезаписываемых носителей, таких, как CD-RW и DVD-R

— UFS — файловая система Unix и Mac OS X

Рис. 9.64. Типичные цифровые видеорегистраторы, применяемые в настоящее время в видеонаблюдении, имеют 16 видеовходов, но существуют модели с 18, 24 или 32 видеовходами

FAT (File Allocation Table)

Предложенная компанией Microsoft в1983 году файловая система FAT была разработана для операционной системы MS-DOS и использовалась в несерверных версиях Microsoft Windows вплоть до Windows ME (включительно). Даже при размере кластера 512 байт эта файловая система позволяла адресовать до 32 Мбайт дискового пространства, чего вполне хватало для жестких дисков объемом 10 и 20 Мбайт, которые были стандартом во времена персональных компьютеров XT. Но время шло, и были выпущены диски размером свыше 32 Мбайт, поэтому пришлось использовать кластеры с большим размером. Так использование кластеров размером 8192 байт (8 килобайт) позволило файловой системе адресовать пространство размером 512 Мбайт. Впрочем, такие большие размеры кластеров привели к проблеме внутренней фрагментации, когда большое количество маленьких файлов очень неэффективно использовали дисковое пространство. Так в этом случае 1 файл размером один байт занимал весь кластер размером 8192 байт, что означало потерю 8191 байта дискового пространства, а когда таких файлов было несколько тысяч, то дисковое пространство просто уменьшалось в размерах в несколько раз.

Файловая система FAT считается относительно простой и поэтому она очень часто используется для форматирования дискет. Кроме того, она поддерживается практически всеми операционными системами для персональных компьютеров, поэтому ее часто используют в том случае, когда на компьютере установлено несколько разных операционных систем. Также файловая система FAT используется для сменных носителей, таких, как флэш-память и т. п.

В системе FAT используется корневая директория, которая имеет ограничение на количество записей и должна находиться в строго определенном месте на диске или в разделе диска.

Хотя файловая система FAT является одной из старейших, ее будут использовать еще довольно долго, так как она идеально подходит для сменных носителей небольшого объема, таких, как дискеты. Помимо компьютеров, она с успехом используется на сменных носителях других устройств (память для цифровых фотоаппаратов и другой бытовой электроники).

FAT32 (File Allocation Table 32)

В 1997 году компания Microsoft разработала новую файловую систему FAT32, которая была дальнейшим развитием концепции FAT, так как в рамках самой FAT возможность увеличения размеров кластеров была уже физически исчерпана. Для FAT самым большим допустимым размером кластера было 32 килобайта, что позволяло адресовать 2 гигабайта дискового пространства. Компания Microsoft решила применить 32-битную файловую систему, в которой сейчас фактически используются 28 бит для адресации кластеров.

Теоретически, это должно давать 268,435,438 доступных кластеров (2 в степени 28), что позволяет поддерживать жесткие диски объемом во много терабайт, но на практике ограничение утилиты ScanDisk (программа от Microsoft, которая используется для проверки жестких дисков), не позволяет использовать более 4,177,920 кластеров, что не позволяет использовать диски размером свыше 124.55 гигабайт.

Таким образом, FAT32 представляет собой 32-битную версию предыдущей 16-битной файловой системы FAT В результате FAT32 поддерживает значительно большие жесткие диски или разделы жестких дисков (до 2 терабайт). Эта файловая система уже может использоваться в Windows 95 (Service Pack 2) и в Windows 98/2000/ХР. Предыдущие версии DOS и Windows не смогут распознать FAT32, и поэтому они не смогут произвести загрузку или использовать файлы с диска или раздела жесткого диска, которые отформатированы с использованием файловой системы FAT32. Среди других характерных отличий от FAT можно назвать меньший размер кластеров, дублирование загрузочной записи, а корневая директория в FAT32 может быть любого размера и располагаться где угодно на жестком диске или его разделе.

NTFS (New Technology File System)

NTFS (New Technology File System) является стандартной файловой системой для Microsoft Windows NT и последовавших за ней Windows 2000, Windows XP и Windows Server 2003. NTFS во многом копирует концепцию HPFS, файловой системы, которая была создана Microsoft и IBM для замены устаревшей файловой системы FAT, унаследованной от MS-DOS. В файловой системе HPFS было реализовано несколько усовершенствований для повышения производительности и более рационального использования дискового пространства: поддержка метаданных (metadata) и использование дополнительных структур данных (advanced data structures). Все это есть и в NTFS, но кроме этого имеется журналирование и списки управления доступом к файлам.

В файловой системе NTFS есть все, что имеет хоть какое-то отношение к файлам (имя, дата создания, права доступа и даже тип информации). Все это записывается как метаданные. Для хранения данных файловой системы используются двоичные деревья. Несмотря на сложность реализации, такой подход позволяет получить более быстрый доступ к данным и уменьшает фрагментацию. Журнал используется для того, чтобы гарантировать целостность самой файловой системы, но не каждого отдельного файла.

Операционные системы, которые используют NTFS, имеют повышенную надежность, что было очень важным требованием, учитывая нестабильность первых версий Windows NT.

Поскольку детали реализации закрыты, независимые разработчики столкнулись с рядом проблем при попытке создания инструментов для работы с NTFS. В настоящее время ядро операционной системы Linux включает в себя модуль, которые позволяет считывать данные из разделов NTFS. Впрочем, общая сложность файловой системы и ограниченность ресурсов очень долго не позволяли реализовать поддержку записи в разделы NTFS.

На жестких дисках небольшого объема не рекомендуется использовать файловую систему NTFS, так как она использует значительные объемы дискового пространства для хранения своих структур. Центральная структура этой файловой системы называется главной файловой таблицей (master file table, MFT). NTFS хранит несколько копий критически важных частей главной файловой таблицы, чтобы предотвратить повреждение файловой системы и потерю данных. Так же, как FAT и FAT32, NTFS использует кластеры для хранения данных файла. Впрочем, размер кластера не зависит от размера жесткого диска или раздела жесткого диска. Можно использовать и маленькие кластеры размером по 512 байт независимо от того, какого размера раздел жесткого диска. Такие кластеры можно использовать с разделом объемом как 6 Гбайт, так и 60 Гбайт. Использование маленьких кластеров не только повышает эффективность использования дискового пространства, но и уменьшает фрагментацию, (то есть распределение одного файла по нескольким кластерам, которые не являются соседними, что значительно увеличивает время считывания файла).

За счет использования небольших размеров кластера NTFS обеспечивает хорошую производительность и экономное расходование дискового пространства даже на жестких дисках очень большого объема. И, наконец, файловая система NTFS поддерживает функцию горячего исправления (hot fixing), которая позволяет автоматически определять дефектные секторы жесткого диска и помечать их, чтобы они более не использовались файловой системой.

Ext2

Ext2 (extended file system 2) была на протяжении нескольких лет стандартной файловой системой для операционной системы Linux и до сих пор остается популярной. Изначально она была разработана Реми Кард на основе концепции расширенной файловой системы. Ее быстродействие достаточно высоко для того, чтобы ее использовали в качестве эталона для сравнения. Основным недостатком этой файловой системы было отсутствие журналирования. Ext2 поддерживает жесткие диски или разделы жестких дисков объемом до 4 терабайт. Ее усовершенствованная версия Ext3 имеет функцию журналирования и совместима с Ext2.

Ext3

Ext3 (extended file system 3) — это файловая система с журналированием, которая становится все более популярной среди пользователей операционной системы Linux. Хотя по масштабируемости и производительности она уступает своим конкурентам, таким, как ReiserFS и XFS, у нее есть одно существенное преимущество, которое заключается в том, что пользователи могут сразу перейти на нее с другой популярной файловой системы Ext2 без необходимости копирования данных, хранящихся на жестком диске.

В новой файловой системе добавлена функция журналирования, без которой Ext3 представляет собой полный аналог Ext2. Кроме того, раздел с Ext3 может быть подключен и использоваться, как если бы он был с файловой системой Ext2, что автоматически означает, что для работы с новой файловой системой Ext3 у вас в распоряжении окажется большой выбор проверенных утилит, чем не могут похвастаться ее прямые конкуренты.

ReiserFS

ReiserFS представляет собой компьютерную файловую систему, которую разработала и реализовала группа из Namesys под руководством Ганса Райзера. В настоящее время эта файловая система поддерживается Linux. Возможно, ReiserFS будет поддерживаться и в других операционных системах.

Появившись в ядре Linux с версии 2.4.1, ReiserFS была самой первой файловой системой с функцией журналирования, которую включили в стандартную поставку ядра. По сравнению с Ext2, другой файловой системой, которая включалась прежде в стандартную поставку ядра, ReiserFS обладала несомненным преимуществом, так как она использовала журнал транзакций для документирования всех изменений структуры файловой системы. Функция журналирования позволяет файловой системе быстро вернуться в стабильное состояние после непредвиденной перезагрузки в связи со сбоем электропитания или операционной системы. Эта функция позволяет значительно снизить вероятность повреждения файловой системы (а также необходимость продолжительных по времени проверок файловой системы). ReiserFS позволяет очень эффективно работать с директориями, содержащими большое количество небольших по размеру файлов. К сожалению, пользователям файловой системы Ext2, переходящим на ReiserFS, потребуется полностью переформатировать свои жесткие диски, что является значительным неудобством по сравнению с ее основным конкурентом Ext3. Впрочем, ряд очевидных преимуществ позволил ReiserFS стать файловой системой по умолчанию для многих дистрибутивов Linux.

HFSuHFS+

HFS Plus или HFS+ была разработана компанией Apple Computer для замены Hierarchical File System (HFS), файловой системы, используемой на компьютерах Macintosh. Кроме того, она используется как один из форматов файловой системы для жестких дисков МРЗ-плееров iPod. Файловая система HFS Plus появилась 19 января 1998 года с выходом операционной системы Mac OS 8.1. Иногда эту файловую систему называют Mac OS Extended. HFS Plus является улучшенной версией файловой системы HFS, поддерживает большие файлы (длина 64 бит вместо 32 бит) и использует Unicode (вместо MacRoman) для имен элементов (файлов и папок). HFS Plus использует полностью 32-битную таблицу размещения файлов, вместо 16-битной, используемой в HFS (это было серьезным ограничением, так как диск мог содержать не более 65,536 секторов, что сперва само по себе было не страшно, но после того как жесткие диски перешагнули рубеж 1 Гбайт, пришлось увеличивать размеры секторов до такой степени, что потери на фрагментацию стали неприемлемыми). Также, как и HFS, HFS+ использует двоичные деревья для хранения большинства метаданных тома. 11 ноября 2002 года с появлением версии Mac OS 10.2.2 Apple добавила и функцию журналирования для повышения надежности хранения данных. Все это было доступно изначально и в Mac OS X Server, но в несерверной версии — только через командную строку.

Впрочем, к 2003 году с появлением версии Mac OS X 10.3 все тома HFS Plus на всех компьютерах Macintosh имели функцию журналирования, которая была включена по умолчанию.

XFS

— это мощная файловая система с функцией журналирования. XFS была разработана компанией SGI (Silicon Graphics Inc.) для своей операционной системы Их (одна из реализаций Unix). В мае 2000 года SGI выпустила XFS в рамках лицензии открытого кода. Эта файловая система поставляется с версиями 2.5.хх и 2.6.хх ядра Linux, но она была доступна для версий ядра 2.4.хх только в виде патча вплоть до выхода версии ядра 2.4.25, когда она стала достаточно стабильной.

UFS

UFS (UNIX file system) используется многими операционными системами Unix. Она произошла от файловой системы Berkeley Fast File System (FFS), которая в свою очередь является производной от файловой системы FS, которая использовалась в первых версиях Unix, разработанных в Bell Labs.

Почти все BSD-производные операционные системы UNIX, включая FreeBSD, NetBSD, OpenBSD, NeXTStep и Solaris используют вариации UFS. В Mac OS X ее также можно использовать как альтернативу HFS. В Linux реализована частичная поддержка UFS support, а сама файловая система Ext2, входящая в ядро Linux, произошла от UFS.

Mac OS X — это самая последняя версия операционной системы Mac OS для компьютеров Macintosh. Разработанная компанией Apple Computer, эта операционная система имеет стабильность операционной среды Unix и традиционный популярный графический интерфейс Macintosh. Впервые Mac OS X была выпущена в 2001.

АТА, SCSI, RAID и SATA

Тип соединения (интерфейс) между жестким диском и системой (системная плата и центральный процессор компьютера) определяется одним из нескольких стандартов. EIDE (Enhanced Integrated Drive Electronics) является одним из самых популярных интерфейсов. Его также называют АТА (Advanced Technology Attachment).

Еще один распространенный стандарт SCSI (Small Computer System Interface) в настоящее время стал утрачивать популярность. Причина, по которой SCSI все реже используется в видеонаблюдении, заключается в том, что жесткие диски АТА при меньшей стоимости уже практически сравнялись по скорости и надежности с жесткими дисками SCSI.

Жесткие диски АТА доминируют в компьютерной индустрии, и то же самое можно сказать о жестких дисках АТА, которые используются в видеонаблюдении в цифровых видеорегистраторах.

Большинство современных компьютеров позволяют подключить до 4 жестких дисков с интерфейсом EIDE без какого-либо дополнительного аппаратного обеспечения, так как контроллер EIDE обычно уже встроен в системную плату.

Хотя SCSI-контроллеры тоже могут быть встроены в системную плату, это не так часто встречается (особенно в последнее время, когда скорость жестких дисков АТА стала сопоставима со SCSI). Поэтому во многих цифровых видеорегистраторах (на базе платформы Intel), может быть установлено до 4 внутренних жестких дисков (если, конечно, для них найдется достаточно места внутри корпуса).

Современные накопители EIDE обычно соответствуют спецификациям АТА/100 или АТА/133. Число 100 означает, что максимальная скорость интерфейса составляет 100 Мбайт/с, и то же самое показывает число 133 в спецификации АТА/133, для которой 133 Мбайт/с будет внешней скоростью передачи данных.

Следует отметить, что внутренняя скорость передачи данных будет примерно в два раза меньше.

Обычно диски SCSI, которые требуют отдельный контроллер и стоят недешево, устанавливают только в серверы или в компьютеры, хранящие очень большой объем информации. Интерфейс SCSI устроен таким образом, что к нему можно подключать более 4 жестких дисков (обычно поддерживается до 16 устройств, одно из которых это сам контроллер). Это еще одна причина, из-за которой диски SCSI используют, когда требуются большие объемы дискового пространства, хотя это получается дорого.

Есть несколько поколений стандарта SCSI. У последних поколений скорость передачи данных, разумеется, выше, чем у первых.

Сейчас распространены последние спецификации Ultra160 и Ultra 320, которые поддерживают очень высокие внешние скорости передачи данных (160 Мбайт/с и 320 Мбайт/с соответственно).

В последнее время в связи с ростом требований, предъявляемых к размеру дискового пространства и надежности хранения данных, в видеонаблюдении получили широкое распространение устройства, называемые RAID-массивами.

Аббревиатура RAID расшифровывается как избыточный массив недорогих (независимых) дисков (Redundant Arrays of Inexpensive (Independent) Disks), и уже само название очень хорошо описывает его концепцию. RAID объединяет в массив несколько небольших по размеру жестких дисков (обычно АТА) для повышения производительности или надежности. Если один из дисков выходит из строя, то данные не будут потеряны, и вышедший из строя диск обычно можно заменить в процессе работы. Для организации RAID-массива, как правило, требуется отдельный контроллер (как в случае с дисками SCSI), а сам массив представляется в операционной системе не как набор дисков, а как отдельный логический диск.

Имеется два важных соображения при выборе жестких дисков для RAID-массива: размер диска и скорость вращения. Современные контроллеры работают в основном с жесткими дисками UltraATA/100 или даже UltraATA/133, поэтому они будут достаточно быстры. Высокая скорость вращения дисков позволяет достичь высокой скорости передачи данных и снизить время доступа, но это всегда сопровождается повышением температуры, а также уровня вибрации и шума. В принципе для RAID-массива подойдут любые жесткие диски.

Рис. 9.65. Стандарт параллельной передачи данных ATA (EIDE)

Рис. 9.66. RAID-массив с избыточным резервированием, использующий жесткие диски АТА, с возможностью горячей замены

Сейчас для построения RAID-массивов используются 6 типов архитектуры, каждый из которых имеет свои достоинства и недостатки в функциональности и производительности. Кроме 6 типов архитектуры RAID с избыточностью (то есть повышенной надежностью), сейчас очень часто архитектуру массива дисков без функции избыточности называют RAID-0. Далее мы рассмотрим все 7 типов архитектуры RAID.

— RAID-0 ( striping , массив с чередованием)

Это самая быстрая и эффективная архитектура массива, но она не предлагает отказоустойчивости, то есть функция избыточности не реализована. Таким образом, с технической точки зрения RAID-0 не соответствует принципам RAID, поэтому RAID-0 не дает никаких преимуществ в надежности хранения данных. В рамках данной архитектуры все данные равномерно распределяются между всеми дисками массива, которые называются набором томов с чередованием (stripe set). Основное преимущество RAID-0 заключается в скорости, так как скорость передачи данных увеличивается пропорционально количеству жестких дисков массива. Впрочем, если хотя бы один диск выйдет из строя, то данные всего массива будут утеряны.

— RAID-1 ( mirroring , зеркалирование)

RAID-1 — это полная противоположность архитектуре RAID-0. Основная задача здесь не повышение скорости, а обеспечение надежности хранения данных. При записи или считывании данных все диски массива используются одновременно. Таким образом, данные записываются одновременно на два и более диска, что эквивалентно созданию идеальной резервной копии, поскольку информация резервной копии не будет устаревать. RAID-1 будет лучшим выбором при создании максимально отказоустойчивой системы.

— RAID-2 ( striping , массив с чередованием и коррекцией ошибок)

Принципы архитектуры RAID-2 те же самые, что и у RAID-0: данные распределяются по всем дискам массива, но не на уровне блоков, а на уровне битов, что необходимо для того, чтобы при обмене данными использовать код коррекции ошибок (ЕСС). Для этого потребуются дополнительные жесткие диски. Для обеспечения полной надежности хранения данных необходимо отводить 10 дисков для данных и 4 диска ЕСС для коррекции ошибок. Следующий уровень уже потребует 7 дисков для коррекции ошибок при 32 дисках для хранения данных. Это объясняет, почему RAID-2 никогда не пользовался особой популярностью.

— RAID-3 ( data striping + dedicated parity , массив с чередованием и четностью)

В архитектуре RAID-3 применяется более разумная коррекция ошибок. Данные байт за байтом распределяются по жестким дискам массива, а отдельный жесткий диск используется для хранения избыточных данных четности. Большинство контрольных дисков, используемых в архитектуре RAID-2 используются для определения положения сбойного элемента, так как многие RAID-контроллеры могут самостоятельно определить, где произошел сбой, то количество избыточных дисков можно сократить. В RAID-3 используется только один избыточный диск, это становится как достоинством, так и недостатком данной архитектуры, поскольку при каждом обращении к массиву необходимо обращаться и к этому избыточному диску. Таким образом, преимущество в скорости от распределения данных по нескольким жестким дискам частично нивелируется. Для массива RAID-3 потребуется не менее трех дисков и достаточно сложный контроллер. Все вышесказанное объясняет, почему RAID-3 так же, как и подобные ему RAID-4 и RAID-5, никогда не пользовался массовой популярностью. RAID-3 часто используется в тех случаях, когда требуется считывать и записывать очень большие последовательности данных в однопользовательской среде.

RAID-3 не позволяет одновременно выполнять множественные операции ввода и вывода.

— RAID-4 ( data striping + dedicated parity , массив с чередованием и четностью)

RAID-4 очень похож по своим принципам на RAID-3, но распределение данных по дискам происходит на уровне блоков, а не байтов. Теоретически это должно было значительно повысить производительность, но на практике этого не происходит, так как избыточный диск по-прежнему остается слабым звеном. Таким образом, RAID-4 не дает особых преимуществ и не позволяет одновременно выполнять несколько операций записи.

— RAID-5 ( distributed data + distributed parity , массив с чередованием дисков и чередованием четности)

RAID-5 обычно считается лучшим компромиссом между производительностью и надежностью хранения данных. Не только данные, но и контрольная информация распределяется по всем дискам. В результате RAID-5 совсем немногим уступает RAID-3 по производительности.

Впрочем, уровень отказоустойчивости не слишком высок, так как без потери данных только 1 диск массива может выйти из строя. Требуется не менее 3 дисков для организации такого массива.

RAID-5 лучше всего подходит для многозадачной и многопользовательской среды, так как скорость записи в таком массиве достаточно высока.

— RAID-6 ( distributed data + distributed parity , массив с чередованием дисков и чередованием четности)

RAID-6 очень похож на RAID-5 во всем, кроме того, что хранится двойной объем контрольной информации, необходимой для восстановления массива в случае сбоев диска. Хотя такой подход несколько снижает производительность, он позволяет без потери данных пережить сбой даже двух жестких дисков. Но за все нужно платить. Результатом такого подхода стало то, что RAID-6 требует не менее 5 дисков для организации массива, а скорость записи еще больше снизилась из-за удвоения избыточной информации.

RAID-массивы в видеонаблюдении приобретают все большую популярность, так как они позволяют увеличить время записи и повысить надежность хранения информации.

Чаще всего используется RAID-5, хотя некоторые производители предлагают и RAID-1 с зеркалированием.

Самый новый интерфейс обмена данными между системной платой и жестким диском получил название Serial ATA(SATA).

Этот стандарт последовательной передачи данных является дальнейшим развитием привычного стандарта АТА, предусматривающего параллельную передачу данных, и имеет три основных преимущества по сравнению со своим предшественником: скорость, удобство подключений и возможность горячей замены.

Первая версия Serial ATA имела скорость передачи данных 150 Мбайт/с, но в этот стандарт изначально заложена возможность ее увеличения. Так ожидается, что вторая версия позволит увеличить скорость передачи данных до 300 Мбайт/с, а 600 Мбайт/с мы получим уже к 2007 году. Впрочем, скорость передачи данных 150 Мбайт/с всего лишь на 17 Мбайт/с выше, чем у самого быстрого интерфейса АТА/133 с параллельной передачей данных. Самая большая проблема параллельной передачи данных заключается в том, что при увеличении скорости передачи очень трудно поддерживать синхронизацию нескольких параллельных линий. Новый последовательный интерфейс использует самые новые стандарты передачи сигналов. Впрочем, необходимость в столь высокоскоростных интерфейсах до сих пор является предметом дискуссии, так как самым слабым звеном по-прежнему остается жесткий диск с его низкой скоростью внутренней передачи данных, что связано с механической составляющей жесткого диска.

На практике, самым большим преимуществом оказалась замена неудобных IDE-кабелей на более гибкие кабели, которые имеют только 7 проводников и разъемы шириной 8 миллиметров с каждой стороны. Максимальная длина кабеля может составлять 1 метр, что в сравнении с короткими IDE-кабелями (45 сантиметров в длину) с 40 или 80 проводниками будет большим подарком для инсталляторов. Кроме того, улучшается вентиляция системного блока, что нельзя недооценивать.

Рис. 9.67. Разъемы жесткого диска Serial АТА

Рис. 9.68. Кабели Serial АТА

Концепция использования на одном шлейфе нескольких устройств (master-slave) тоже осталась в прошлом, что не может не радовать, так как теперь можно забыть о многочисленных комбинациях перемычек на жестком диске. Теперь на одном кабеле может находиться только одно устройство. Все разъемы должны быть выполнены таким образом, чтобы их нельзя было подключить неправильно, а эта проблема существовала при подключении жестких дисков АТА.

Настоящие жесткие диски SATA также имеют другой разъем электропитания, который невозможно спутать с чем-либо еще. В нем имеется 15 контактов с различным напряжением (3.3, 5 и 12 В). Во время перехода от параллельного к последовательному интерфейсу АТА планируется использовать различные адаптеры для подключения одного интерфейса к другому, что, впрочем, будет сказываться на быстродействии. В начале 2003 года проводились тесты, которые показали, что потери в быстродействии составляют от 30 до 50 %. В настоящее время многие производители жестких дисков уже выпускают накопители с полноценным интерфейсом Serial.

Среднее время наработки на отказ (MTBF)

Большинство производителей жестких дисков приводят для своей продукции такое значение, как среднее время наработки на отказ (MTBF, Mean Time Between Failure). Обычно оно варьируется от 300,000 до 1,000,000 часов. С точки зрения обычного человека это немало (примерно 30-100 лет). Впрочем, эти значения относятся больше к миру теории, чем гарантируют практическое применение. Развитие технологий не позволяет эффективно использовать жесткие диски на протяжении более чем двух лет: они раньше устаревают. Впрочем, статистика и математические расчеты позволяют получить важные данные о качестве жестких дисков и предполагаемом времени бесперебойной работы.

Практика показывает, что жесткие диски выходят из строя значительно раньше, чем истечет среднее время наработки на отказ. Это связано во многом с неадекватными условиями эксплуатации (удары, вибрации, сотрясения, перегрев вследствие недостаточного охлаждения, пыль), о чем мы уже говорили, но это всегда имеет смысл повторить.

Среднее время наработки на отказ основывается на простом экспоненциальном распределении вероятности сбоя, при этом вероятность сбоя равна (47)

где е = 2.71, t — время, для которого вычисляется вероятность сбоя, а М — средняя наработка на отказ.

Так, например, при 500,000 часов наработки на отказ жесткого диска имеется 1 % вероятности того, что он выйдет из строя в течение 7 месяцев, 5 % — в течение 3 лет, 10 % — в течение 6 лет, и 50 % — в течение 40 лет.