Софт-Архив

H 264 Или Mpeg4 img-1

H 264 Или Mpeg4

Рейтинг: 4.1/5.0 (1834 проголосовавших)

Описание

3D-видео AVCHD 2

3D-видео AVCHD 2.0 (MPEG4-MVC H.264/AVC): что это такое

Всё, что следует знать о стерео 3D-видео AVCHD 3D, о стандарте MPEG4-MVC H.264/AVC, о сходстве и различиях MVC для Blu-ray 3D и для 3D-камкордеров

Актуальность статьи, посвящённой новому 3D-стандарту видео MVC H.264/AVC, назрела уже давно, как минимум, с апреля-мая 2011, когда в магазинах начали появляться первые 3D-видеокамеры с поддержкой этого формата. Однако задержка с публикацией, возникшая по разным причинам, как теперь выяснилось, оказалась только к лучшему, ибо только совсем недавно, в июле 2011, разработчики наконец-то объявили о появлении нового поколения формата стандарта AVCHD Version 2.0, спецификации которого, среди прочего, пополнились описанием поддержки 3D-видео MVC и “обычного” Full HD видео с прогрессивной развёрткой – 1080@60p/50p.

В то же время, MVC H.264/AVC нельзя назвать новым, только что появившимся 3D-форматом, поскольку именно этот способ кодирования применяется уже несколько лет при производстве видеозаписей на оптических дисках стандарта Blu-ray 3D, правда, несколько в другом виде.

Итак, на сегодняшний день мы имеем на руках следующие факты:

  • Кодирование/декодирование 3D-видео в новой версии MPEG-4 называется MVC и по-прежнему базируется на H.264/AVC
  • Формат MVC применяется как при работе со стереоскопическим видео на дисках Blu-ray 3D, так и при работе с 3D-видео камерами стандарта AVCHD
  • Несмотря на одинаковое в обоих случаях название кодека – MVC, файлы на выходе получаются разные: стереопара .M2TS/.SIFF на дисках Blu-ray 3D и почему-то один единственный файл .MTS для 3D-видео AVCHD
  • Формальное ограничение качества Full HD (1920 х 1080) записей прогрессивной развёрткой 24p или чересстрочной развёрткой 50i/60i, действовавшее для AVCHD версий 1.x и, почти никем, впрочем, не соблюдавшееся, окончательно снято в версии AVCHD 2.0. Наконец-то развёртка 1080@60p/50p для AVCHD стандартизирована, хотя, увы, пока не для 3D-видеокамер

В этой статье мы разберёмся, что же на самом деле скрывается внутри формата MVC, в чём именно заключается разница между MVC для Blu-ray 3D и MVC для 3D-AVCHD, а заодно выясним, чем редактировать и чем смотреть 3D-видео, снятое 3D-камкордерами AVCHD.

Для полной ясности, уточним ещё раз: сегодня мы исследуем исключительно 3D-формат видео MVC в версии для камер AVCHD. Работе с дисками Blu-ray 3D будет посвящена отдельная статья, в сегодняшнем материале они упоминаются лишь для сравнения.

Прежде чем докопаться до сути 3D-формата MVC, давайте определимся, что представляет собой обычный AVC.

H .264/MPEG -4 AVC (Advanced Video Coding) – это стандарт кодека сжатия видеоданных, базирующийся на блочно-ориентированных алгоритмах восстановления визуальной информации о движущихся объектах. Стандарт был разработан объединённой командой (Joint Video Team, JVT) представителей группы экспертов VCEG (ITU-T Video Coding Experts Group) и группы экспертов MPEG (ISO/IEC Moving Picture Experts Group), и поэтому в официальном развёрнутом написании имеет два равноценных названия: ITU -T H .264 и ISO /IEC 14496-10 MPEG -4 Part 10, AVC (ISO/IEC MPEG-4 Advanced Video Coding).

Первоначально кодек H.264/AVC разрабатывался преимущественно для сжатия, записи и распространения видео высокой чёткости (High Definition, HD). Впрочем, внутренняя структура файлов H.264/MPEG-4, основанная на формировании пакетов сетевого уровня абстракции NAL (Network Abstraction Layer) с одинаковым целочисленным числом байтов декодированного видео (VCL, Video Coding Layer), одинаково удобна как для пакетной обработки и записи на носители, так и для потоковой передачи с помощью транспортных протоколов вроде Real Time Transport Protocol. Так что со временем стандарт стал популярен повсеместно, в том числе, для сжатия видео с мизерным разрешением и битрейтом для просмотра на экранах всяких телефонов и гаджетов.

Стандарт H.264 послужил в первую очередь популяризации HD видео: именно этот кодек используется при телевещании в стандартах DVB и SBTVD, в работе оборудования для видеоконференций, спутникового и кабельного вещания, применяется в интернете (YouTube, Vimeo, iTunes) и популярных интернет-плеерах Adobe Flash и Microsoft Silverlight.

Кроме того, кодек H.264/AVC наиболее популярен для сжатия видео на дисках Blu-ray. Точнее говоря, возможно, вам и встретится оптический носитель Blu-ray Disc (или мёртвый ныне HD DVD), записанный с применением альтернативного кодека VC-1, но уж точно вы не найдёте ни одного современного плеера Blu-ray, который не смог бы воспроизвести запись H.264/AVC.

Итак, в окончательном официальном виде спецификации стандарта H.264/AVC были приняты в мае 2003 года. После этого начали появляться различные практические варианты его применения, ибо кодек – это только полдела, для каждого прикладного случая – онлайнового, эфирного вещания, записи на носители и т.д. должен соблюдаться ряд дополнительных требований по структурированию, защите контента и т.п.

Такова, вкратце, предыстория появления пять лет назад, в июле 2006 года, нового стандарта под названием AVCHD, разработанного совместными усилиями компаний Sony и Panasonic (в ту бытность ещё Matsushita Electric Industrial).

Первоначально бренд AVCHD применялся в качестве названия формата для нового поколения цифровых видеокамер с поддержкой качества записи уровня High Definition (HD) на разные типы носителей – флешки, встроенную память, даже 8-см диски DVD, с применением эффективного кодека H.264/AVC. Затем право на логотип AVCHD получили не только камкордеры, но также соответствующие плееры, архиваторы и программное обеспечение.

В изначальной редакции стандарта AVCHD Version 1.0 подразумевалась поддержка лишь двух основных форматов записи видео: Full HD 1080i – с передачей 1080 эффективных строк сканирования (линий) чересстрочным методом, и HD 720p – 720 эффективных строк сканирования (линий) прогрессивным методом.

Пояснение для постигающих азы терминологии. Чересстрочный метод (interlacing – 50i/60i), появившийся ещё во времена первых стандартов передачи телесигнала и доживший до наших дней, подразумевает, что при каждом обновлении кадра производится передача лишь половины строк (полукадров), чётных или нечётных. Таким образом, при частоте кадровой развёртки (синхронизации) 50 Гц, полукадры с чётными строками, чередуемые полукадрами с нечётными строками, успевают смениться на экране 25 раз. Во времена аналогового телевещания такой способ временной дискретизации сигнала позволял вдвое уменьшить ширину канала передачи, сегодня же, в эпоху цифровой техники, более уместно говорить об использовании меньшего потока данных (битрейта) для уплотнения сигнала с большим количеством строк.

Прогрессивный способ (progressive – 24p/50p/60p) подразумевает передачу всех строк картинки в каждом кадре, то есть, при частоте синхронизации 50 Гц каждую секунду генерируется 50 полноценных кадров с полным набором строк. Безусловно, такой способ позволяет записывать, хранить и передавать сигнал с более качественной картинкой, однако для этого потребуется обеспечить более мощный канал для бесперебойной передачи большего потока данных, более мощную электронику для обработки данных, и, конечно, больше места для хранения таких записей.

Рискуя навлечь на себя гнев “продвинутых пользователей” за излишние подробности рассказа, всё же рискну добавить ещё одну деталь для начинающих.

Не ищите на дисках, флешках и жёстких дисках файлов с разрешением .AVC (и, кстати. MVC). Важно понимать, что AVC – это только кодек, а контейнер, в котором “лежит” закодированное этим кодеком видео, может быть каким угодно – AVI, MP4, MKV, TS, MTS, M2TS. Для видеокамер стандарта AVCHD стандартными считаются разрешения файлов .MTS и .M2TS.

Однако продолжим. Несколько позже, в январе 2009 года, разработчики AVCHD приняли решение ввести ещё одно дополнительное определение стандарта и новый логотип AVCHD Lite. Так стали обозначать версию, применяющуюся в видеокамерах и фотокамерах с поддержкой видеосъёмки с максимальным качеством HD 720p.

Вот теперь, разобравшись с сутью “двухмерного” стандарта кодирования H.264/AVC и его реализацией для 2D-видеокамер AVCHD, мы можем перейти к определению стереоскопической версии – MVC.

Технология многоканального кодирования Multiview Video Coding (MVC ) является дальнейшим развитием стандарта H.264/MPEG-4 AVC, и предназначена для сжатия и декодирования нескольких (более одного) потоков видеоданных. Требования к видео MVC H.264/AVC определяются стандартом ISO/IEC 14496-10/ITU-T H.264 и описаны в дополнении H (Annex H) к рекомендациям ITU по кодеку H.264/AVC. Технология многоканального видео MVC базируется на сжатии и декодировании второго дополнительного канала видео относительно базового канала видео, с применением алгоритма предсказания, того же кодека H.264/AVC и нового стерео-профиля MPEG-4: Multiview High в общем случае (для многоканального – два и более каналов, видео в целом), или Stereo High уровня 4.1 (Stereo High@L4.1) в случае стерео 3D-видео.

Теперь – чуть медленнее и подробнее. В процессе создания 3D-видео формата MPEG4-MVC, один из каналов (например, для левого глаза), считается базовым каналом и кодируется, как и прежде, кодеком H.264/AVC. Второй канал 3D-видео (для правого глаза) кодируется точно так же, кодеком H.264/AVC, но уже относительно базового канала. с привязкой к пакетам кадров базового канала. В результате на выходе имеем два потока видео: один канал – привычный полноценный AVC, второй – этакий ” MVC-довесок”, в котором хранится информация второго видеопотока, закодированная относительно базового потока. Довесок, кстати говоря, достаточно компактный, его объём в среднем меньше 50% основного канала.

Таким образом, 3D-видео, сжатое с помощью кодека MVC H.264/AVC, обладает сразу двумя волшебными свойствами. Во-первых, объединяет в себе сразу две версии видео – стерео 3D и обычную 2D, обратно совместимую со старым оборудованием. Во-вторых, комбинированный 2D/3D-видеосигнал имеет объём не более 150% по сравнению с обычной 2D-версией, и для единовременной передачи обоих (2D и 3D) версий видео потребуется всего лишь в полтора раза более широкий канал.

Для сравнения: 3D-видео, фактически, чисто “механическими способами “затолканное” в контейнер 3D-AVI (камеры Fuji Real 3D W3), занимает на флешке именно двойной объём против обычного 2D-AVI. Кроме того, представьте себе вещание двух раздельных 2D/3D сигналов. В результате это может потребовать, как минимум, двух каналов, с увеличением полосы до 2,5-3 раз.

Теперь представим работу плеера Blu-ray с 3D-видео в формате MPEG4-MVC. Если плеер современный, с поддержкой Blu-ray 3D, он распознает флаг 3D-режима в профиле Stereo High@L4.1 и скажет “Алё, вижу 3D-контент, как будем воспроизводить, в 2D или в 3D?”. Если же плеер старый и рассчитан на работу только с обычными дисками Blu-ray, он попросту проигнорирует наличие 3D-контента MVC и будет воспроизводить только базовый канал H.264/AVC.

Наконец-то мы добрались до самого главного. Начало продаж первых цифровых 3D-камкордеров Sony HDR-TD10E. способных записывать 3D-видео в формате MVC, несколько опередило появление собственно стандарта AVCHD Version 2.0, описывающего и нормирующего формат MVC для 3D-видеокамер. Сегодня это уже неважно, поскольку в наличие есть и формат, и камеры. С программным обеспечением, правда, не всё пока гладко, но вопрос также постепенно решается.

Итак, в начале июля 2011 года организация промоутеров формата AVCHD объявила о начале лицензирования новой версии стандарта – AVCHD Version 2.0. В новой версии формат AVCHD 2.0 пополнился спецификациями поддержки 3D-видео MPEG4-MVC H.264/AVC, а также поддержкой прогрессивных Full HD развёрток 1080/60p,50p. Кроме того, список доступных логотипов стандарта пополнился тремя новыми  – AVCHD 3D, AVCHD Progressive и AVCHD 3D/Progressive.

Рассмотрим изменения, произошедшие со стандартом AVCHD, более пристально. Прежде всего, дебютировавший формат AVCHD 3D: впервые появилась поддержка записи стерео 3D-видео с помощью сжатия Multiview Video Coding (MVC), определяемого выше упомянутым стандартом ISO/IEC 14496-10/ITU-T H.264, однако прогрессивная Full HD развёртка для него, к сожалению, пока доступна только в “кинотеатральном” варианте 24p. Зато чересстрочная Full HD развёртка для 3D-картинки поддерживается в обоих актуальных вариантах, а именно 59.94i и 50i.

Обратите также внимание на максимально допустимый системный битрейт записи: он вырос с 24 Мбит/с в первой версии стандарта всего лишь до 28 Мбит/с в AVCHD 2.0. Отчасти именно этим можно объяснить поддержку чересстрочных развёрток PAL/NTSC для записи 3D-видео. Для сравнения: на пике поток данных для фильмов Blu-ray достигает 40 Мбит/с, для MVC-фильмов Blu-ray 3D  – до 60 Мбит/с. Ясен перец, идти с битрейтом 28 Мбит/с на прогрессивную Full HD развёртку 50p/60p – всё равно что с ёжиком против танка.

Спасибо хоть, что теперь прогрессивные развёртки 59,94p и 50p официально поддерживаются для Full HD видеокамер AVCHD. Ради справедливости стоит отметить, что AVCHD-камкордеры Panasonic уже давно и не в первом поколении поддерживают эти развёртки. Теперь они с полным на то основанием обзаведутся новым логотипом AVCHD Progressive. Зато имеющиеся в продаже любительские камеры Sony HDR-TD10 или ожидаемые осенью профессиональные модели Sony HXR-NX3D1E могут рассчитывать не только на маркировку AVCHD 3D, но также на полноценный логотип AVCHD 3D/Progressive.

Современные камеры Panasonic с поддержкой стерео 3D за счёт специального 3D-объектива, такие как HDC-SD900 или HDC-SDT750, на логотип AVCHD 3D пока претендовать не могут, поскольку пишут 3D-видео в виде Side-by-Side, без MVC: хотя и в формате 1080@50p/60p, но на каждый глаз приходится по половинке экрана (2 х 960х1080 = 1920х1080).

Что касается “лёгкой” версии стандарта – AVCHD Lite, отныне с таким логотипом будут лицензироваться любые H.264/AVC продукты – видеокамеры, фотокамеры с поддержкой видеозаписи, поддерживающие стандарт AVCHD  с разрешением не более 720 строк, хотя и с любыми актуальными на сегодня прогрессивными и чересстрочными вариантами развёрток – 24, 50 или 60 кадров в секунду. Иными словами, 3D-видеокамеры с кодеком MVC носить маркировку AVCHD Lite никогда не будут.

В завершение нашего сегодняшнего рассказа осталось поведать о ключевых отличиях применения кодека MPEG4-MVC H.264/AVC в двух, актуальных на сегодня видах прикладной его реализации – для хранения стерео 3D-видео на дисках Blu-ray 3D, и для записи стерео 3D-видео видеокамерами стандарта AVCHD 3D.

Напомним: результатом сжатия стерео 3D-видео по алгоритму MPEG4-MVC H.264/AVC являются два видеопотока: один базовый, точь в точь классическое 2D-видео H.264/AVC, второй – дополнительный канал, в котором с помощью кодека MVC, говоря попросту, закодированы только отличия кадров этого канала относительно кадров базового потока.

В любом случае, на выходе имеем два чётко связанных друг с другом видеопотока. И вот на этом сходство Blu-ray 3D и AVCHD 3D заканчивается. В случае записи на оптический диск в хорошо знакомой всем папочке с контентом /STREAM, помимо файлов базового канала со стандартным разрешением .M2TS появляется ещё одна вложенная папочка SSIF, где хранятся MVC-файлы канала для правого глаза с тем самым разрешением .SSIF. Разумеется, видеофайлам .M2TS соответствуют парные MVC-файлы .SSIF с аналогичным индексом, и, конечно же, отсутствие у файла .M2TS MVC-пары означает, что этот контент не стереоскопический, обычный.

Специфика файловой системы UDF дисков Blu-ray 3D заключается в возможности использования одних и тех же байтов для воспроизведения контента двух видеопотоков. Так что не пугайтесь, если увидите в свойствах папки BDMV/STREAM суммарный объём данных порядка 70-90 Гбайт при максимальной ёмкости диска 50 Гбайт: ваша Windows не сошла с ума, всё нормально, так и было задумано.

В отличие от дисков Blu-ray 3D, стереоскопическое 3D-видео, записанное видеокамерами AVCHD 3D, выглядит как… обычный AVC-файл. Да, именно так: оба потока стерео 3D-видео AVCHD 3D пишутся в единый контейнер с привычным расширением .M2TS.

Плюс такого подхода в том, что, будучи поставленным на воспроизведение любым программным плеером с поддержкой AVC-файлов, но без поддержки MVC, например, MS Media Player Classic Home Cinema, этот файл будет воспроизведён как обычный AVC-файл. То есть, налицо полная обратная совместимость с 2D-оборудованием, что, собственно говоря, и было задумано при разработке стандарта.

Минус такого подхода (если это вообще минус) в том, что без специальных средств стерео 3D-видео AVCHD 3D никак не отличить от обычного однопотокового 2D-видео. Несомненно, со временем Windows научится считывать флаг профиля Stereo High и как-нибудь обозначит отличие AVC-файлов .M2TS от стереоскопических MVC-контейнеров .M2TS. Пока что для этих целей можно воспользоваться информацией поставляемой в комплекте с камерой Sony-TD10E утилиты PMB (Picture Motion Browser). Она сразу же обозначает стерео файлы MVC пиктограммой 3D HD.

Чуть больше о структуре и свойствах стереоскопических 3D-видео AVCHD 3D можно узнать с помощью видеоредактора Sony Vegas Pro 10 – одного из немногих, кто уже сегодня в полной мере поддерживает импорт, обработку и рендеринг MVC-файлов AVCHD 3D.

На этом сегодня остановимся. Всё, что хотелось сказать в статье с соответствующим заголовком – “3D-видео AVCHD 2.0 (MPEG4-MVC H.264/AVC): что это такое”, сегодня уже сказано.

В следующей части под названием “3D-видео AVCHD 2.0 (MPEG4-MVC H.264/AVC): как с ним бороться” мы расскажем о способах создания, импорта, редактирования, рендеринга и воспроизведения 3D-видео в формате MPEG4-MVC.

Мы очень надеемся, что продвинутые в техническом плане читатели простят нас за слишком поверхностное изложение принципа работы алгоритмов MPEG. В то же время мы будем рады любой критике, а также любым предложениям по второй части материала.

Другие статьи, обзоры программ, новости

Форматы сжатия видеосигнала: сравнение кодеков MJPEG и

Системы контроля и управления доступом (СКУД) Форматы сжатия видеосигнала: сравнение кодеков MJPEG и H.264

Текст: admin | 15 сентября 2011

Рассмотрим внедрение новейших технологий в области видеонаблюдения на примере форматов сжатия видео в видеорегистраторах и сетевых камерах. Много ранее для видеонаблюдения применялся алгоритм отраслевого стандарта JPEG. Это формат для цифровой фотосъемки, где каждое изображение сжимается индивидуально (внутрикадровое сжатие) и обеспечивает хорошее качество каждого изображения. Для формата сжатия MJPEG не требуется высокой производительности процессора, поэтому он с успехом использовался для видеонаблюдения. В кодеке MPEG-4 сжатие осуществляется не только индивидуально для каждого кадра, но и для серии кадров (межкадровое сжатие), т.к. большие объемы данных в серии кадров часто остаются неизменными. Однако это хорошо при несущественных переменах в кадре, проще говоря, если движение практически отсутствует. Но для объектов с интенсивностью событий, большим потоком людей и автомобилей, важно получить качественное изображение в моменты именно движения. Эта необходимость привела к разработке нового прогрессивного формата H.264 (или MPEG-4 Часть 10). H.264 позволяет формировать высококачественный видеосигнал со значительно меньшим цифровым потоком, чем MPEG-4, но при этом требования к производительности процессора весьма высоки. Но формат H.264 позволяет уменьшить размер файла с цифровым видео более, чем на 80 % по сравнению с форматом M-JPEG.4 при равных показателях качества.

График представляет собой пример сравнения цифровых потоков изображений, передаваемых камерами в кодеках JPEG. MPEG -4 и H .264. По вертикали - «Пиковое значение сигнал-шум» (PSNR), определяющее «качество» сжатых видеоизображений, а по горизонтали — цифровой поток. Естественно, важное значения для передачи данных имеют установки качества и размеров изображения. В примере представлены следующие параметры: скорость - 10 кадров в секунду, разрешение 176 x 144 (4 CIF ), длительность съумки 10 секунд (100 кадров). График выявляет, что сжатие JPEG использует цифровой поток 260 кбит/с, в то время как для MPEG-4 достаточно скорости передачи данных 85 кбит/с, а при использовании H.264 скорость снижается до 50 кбит/с. С точки зрения развития техники сжатия во времени, MPEG-4 требует примерно треть полосы частот по сравнению с используемой JPEG, а для H.264 необходима всего пятая часть полосы.

Вывод: на сегодняшний день модели с поддержкой формата H.264 — это лучшее предложение в мировой охранной индустрии .

по материалам представленным компанией.

Информация о MPEG-4 (включая AVC

Информация о MPEG-4 (включая AVC/H.264) Информация о MPEG-4 (включая AVC/H.264) Серия: Технические видеостандарты

Если Вы хотите обсудить содержание этого документа с автором, Вы сможете сделать это на форуме Doom9 в разделах «Новые форматы» – Кодеки и Контейнеры .

Пожелания, предложения, замечания, возражения и возмущения по поводу перевода посылайте по адресу: pogo-stick@nm.ru .

Если Вы хотите разместить эти документы на каком-либо из сайтов, обратитесь за разрешением к автору. Связаться с ним можно, послав личное сообщение в форуме Doom9 . Мои условия: не изменять содержание, включая это небольшое сообщение, копировать документ целиком, дать ссылку на расположение перевода: pogo-stick.nm.ru и послать оповещение по адресу: pogo-stick@nm.ru.

MPEG-4 — это международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году, и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO — Международной организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-4 в основном используется для вещания (потоковое видео), записи фильмов на компакт-диски, видеотелефонии (видеотелефон) и широковещания, в которых активно используется сжатие цифровых видео и звука.

MPEG-4 всё ещё находится на стадии разработки и делится на несколько частей. Ключевыми частями стандарта MPEG-4 являются часть 2 (MPEG-4 part 2, включая Advanced Simple Profile, используемый такими кодеками как DivX, Xvid, Nero Digital и 3ivx, а также Quicktime 6) и часть 10 (MPEG-4 part 10/MPEG-4 AVC/H.264 или Advanced Video Coding, используемый такими кодеками как x264, Nero Digital AVC, Quicktime 7, а также используемый в форматах DVD следующего поколения, таких как HD DVD и Blu-Ray Disc).

Перспективы MPEG-4 (справочный материал)

Эволюция формата MPEG продолжается с завидным постоянством. Каждый новый кодек был лучше предыдущего и, благодаря дешевому лицензированию и чёткой стандартизации, завоевал массы.

После появления MPEG-1 (1991 год) и MPEG-2 (1995 год) пришло время (1999 год) более прогрессивному кодеку MPEG-4 (ASP), основной задачей которого было максимальное уменьшение битрейта при сохранении качества предшественника. Нельзя со 100% уверенностью сказать, что это удалось, но попытка была близка к успеху. Формат обеспечивал 6-кратное сжатие, сохраняя при этом высокое качество изображения.

Но не только группа MPEG (Motion Picture Experts Group) от ISO разрабатывала стандарты видео сжатия. Параллельно с ней работала группа VCEG (Video Coding Expert Group) от ITU-T (International Telecommunication Union), дочерней организации ООН. В результате объединения их усилий была организована группа JVT (Join Video Team). Результатом работы которой, в декабре 2003 года, был утверждён стандарт ISO/IEC MPEG-4 Part 10 или ITU-T H.264. Общее название этих, абсолютно идентичных стандартов, - AVC (Advanced Video Coding), было предложено MPEG. Как дополнение к нему, был также утвержден аудио стандарт AAC (Advanced Audio Coding).

В целом, стандарт MPEG-4 делится на несколько частей, но основные из них следующие:

  • ISO 14496-1 (Системный), Анимация / Интерактивность (DVD-меню)
  • ISO 14496-2 (Видео), Advanced Simple Profile (ASP), которого придерживаются XviD, DivX
  • ISO 14496-3 (Аудио), Advanced Audio Coding (AAC)
  • ISO 14496-10 (Видео), Advanced Video Coding (AVC), он же H.264
  • ISO 14496-14 (Контейнер / упаковка), MP4 формат контейнера (используется расширение .mp4)
  • ISO 14496-17 (Субтитры), MPEG-4 Синхронизированный текстовый формат субтитров (.ttxt)

AVC/H.264 определяет 4 профиля, которые, в свою очередь, делятся на уровни.

Профили определяют набор механизмов кодирования или алгоритмов, которые можно использовать для создания соответствующего потока данных, тогда как уровни накладывают ограничения на использования некоторых ключевых параметров этого потока.

Все декодеры, соответствующие некоему профилю, должны поддерживать все возможности этого профиля. В свою очередь, кодекам необязательно использовать какие-то особенные поддерживаемые функции профиля, но они должны предоставить соответствующий поток данных, т.е. поток, который будет декодироваться соответствующий декодером.

Базовый профиль (Base profile ) – поддерживает все возможности AVC/H.264 кроме следующих наборов.

Набор 1: B-Frames, Weighted Prediction, CABAC, кодирование полей и адаптивное переключение между кадровым кодированием и кодированием полей.

Набор 2: SP/SI-Кадры и кадровое дробление данных.

Основной профиль (Main profile ) – поддерживает первый набор возможностей, которые не поддерживаются Базовым профилем, но не поддерживает FMO, ASO и избыточность изображения, которые поддерживают первым.

Расширенный профиль (Extended Profile ) – поддерживает все возможности Базового профиля, а также Набор 1 и Набор 2, за исключением CABAC.

Высший профиль (High Profile ) – поддерживает все возможности Основного профиля, плюс 8x8 intra prediction, различные матрицы квантования, кодирование без потерь, больше YUV форматов (4:4:4, 4:2:2…)

Стандарт MPEG-4 Part 10 (AVC/H.264) использует наилучший на сегодняшний день метод сжатия аудиоданных - AAC (Advanced Audio Coding).

Кодек MPEG-4 AVC претендент для использования на HD-DVD (High Definition DVD) дисков, а также для Blu-Ray дисков. Со стороны конкурентов выступают Microsoft со своим VC-1 и MPEG-2 в HD варианте.

Для эффективного хранения и использования всех возможностей стандарта MPEG-4 был утвержден новый формат контейнера, который позволяет хранить разные мультимедийные потоки в одном файле.

MP4 - это глобальное расширение файла для официального формата контейнера, описанного в MPEG-4 стандарте. Так же существуют расширения: m4a, m4p, m4e, mp4v, m4v и др.

Контейнер поддерживает потоковую передачу и все виды мультимедийного контента, в т.ч. несколько аудио-, видео-потоков, субтитры, картинки, видео/аудио с разной частотой кадров/битрейтом. Также предусмотрена возможность хранить 2D и 3D анимационную графику, интерактивность, ДВД-подобные меню.

Что такое MPEG-4 стандарт?

MPEG-4 (ISO 14496) – это широкий открытый стандарт разработанный Moving Picture Experts Group (MPEG), рабочей группой Интернациональной Организацией Стандартизации (International Organization for Standardization – ISO), которая также разработала общеизвестные MPEG-1 (MP3, VCD) и MPEG-2 (DVD, SVCD) стандарты, упорядочивающие разного рода форматы аудио-видео сжатия и многое другое.

В сущности MPEG-4 предназначался не для стандартизации одного потенциального продукта (например, чего-то сравнимого с DVD), а для того чтобы охватить большое количество под-стандартов, из которых поставщики продуктов могли бы выбрать то, что им нужно для своей продукции.

MPEG-4 стандарт, как уже упоминалось, разделён на множество разных под-стандартов, из которых наибольший интерес представляют следующие:
  • ISO 14496-1 (Системы). формат контейнера MP4, анимация/интерактивность (например, DVD меню)
  • ISO 14496-2 (Видео #1). Продвинутый Простой Профайл (Advanced Simple Profile – ASP), которому соответствуют XviD, DivX5, 3ivx.
  • ISO 14496-3 (Аудио). Продвинутое Кодирование Аудио (Advanced Audio Coding – AAC)
  • ISO 14496-10 (Видео #2). Продвинутое Кодирование Видео (Advanced Video Coding – AVC), так же известное как H.264

Каковы возможные преимущества открытого стандарта, такого как MPEG-4, по сравнению с закрытыми форматами, такими как Windows Media Micro$oft-а?

Преимущество в том, что открытый стандарт открыт для всех, желающих создать продукт. Поэтому, уже сейчас существует множество разных продуктов совместимых с MPEG-4 стандартом и, соответственно, совместимых друг с другом.

Кроме возможной совместимости и широкого выбора продуктов, открытый стандарт приводит к конкуренции, которая сулит потребителям более высокое качество продуктов, менее высокие цены и большую сосредоточенность производителей на нуждах потребителей.

И, возможно, самым важным аргументом в пользу открытого стандарта является то, что он делает возможным развитие программных продуктов с открытыми исходными текстами. XviD – ярчайший пример.

ISO 14496-1 (Системы) - MP4

Как уже было упомянуто MPEG-4 стандарт определяет собственный формат контейнера (другие форматы контейнеров не охватываются этим стандартом: AVI, OGM, Matroska и т.д.), который предусматривает не только хранение аудио и видео, а ещё и анимированного/интерактивного содержимого (так же известного как BIFS).

Анимация/интерактивность.

Не вдаваясь в технические детали, стандарт MPEG-4 системы определяет широкий ряд мощных инструментов, которые делают возможными различные виды анимации (не только схожие с flash анимацией, но и подобные тем, что были использованы в фильмах «Toy Story» и «Finding Nemo») или интерактивность (например, DVD меню и интерактивные потоковые меню). Всё это может быть сделано в 2D и 3D. Образцы того, что могут предложить MPEG-4 системы, могут быть найдены здесь . Для воспроизведения системных файлов вам понадобиться системный декодер/проигрыватель. Самые популярные для 2D систем: GPAC 's Osmo4 (скачать ) и EnvivioTV (скачать ). Для 3D систем посмотрите здесь .

Совместимость.

MP4 контейнер – очень важная часть MPEG-4 стандарта, так как нельзя достичь 100% совместимости между разными MPEG-4 аудио-видео реализациями без стандартного контейнера. В противоположность этому, для MPEG-4 видео всё ещё самым популярным форматом является AVI. AVI контейнер – это основная причина существующей не совместимости в MPEG-4 (например, в аппаратных проигрывателях).

Дальнейшее изучение.

Если Вы хотите прочитать больше о MP4 контейнере обратите внимание на MP4 FAQ в форуме Новые А/В контейнеры сайта Doom9 . Некоторая документация по MP4 доступна здесь и здесь . Смотрите так же FAQ о MPEG-4 системах от Motion Picture Experts Group (MPEG) . Если Вы заинтересованы в описании интерактивного содержимого взгляните на этот документ от GPAC проекта. Спецификацию MPEG-4 систем можно скачать здесь . Спецификацию ISO базового формата медиа файла (14996-12), на котором основан MP4, можно найти здесь .

ISO 14496-2 (Видео) - Продвинутый Простой Профайл (ASP)

MPEG-4 стандарт определяет широкий ряд инструментов для кодирования. В настоящее время наиболее распространены те, что входят в ISO 14496-2. Эту часть стандарта часто называют MPEG-4 "Часть 2", но далее она будет называться – MPEG-4 ASP.

MPEG-4 Часть 2.

Как уже упоминалось, MPEG-4 стандарт может быть использован для достижения разных целей. И, конечно, различные задачи требуют различных инструментов для кодирования. Например, если Вы хотите создавать потоковое видео с очень низким битрейтом вам потребуются инструменты отличные от тех, что Вы будете использовать при кодировании DVD материала со средним или высоким битрейтом. Чтобы обеспечить эти потребности MPEG-4 стандарт определяет множество различных профайлов и уровней (Profiles and Levels). Каждый профайл/уровень – это уровень совместимости, обеспечивающий слаженную работу продуктов соответствующих ему. Даже если продукты изготовлены разными производителями. Эти уровни стандартизуют не только инструменты, которые могут быть использованы при кодировании, но и задают видео параметры: ограничение битрейта, размер изображения, частота смены кадров и т. д. Обзор MPEG-4 профайов может быть найден здесь .

Продвинутый Простой Профайл (ASP).

При кодировании DVD материала наиболее полезным оказывается Продвинутый Простой Профайл @ Уровень 5 (ASP@L5). Он допускает размер изображения до 720x576, частоту смены кадров до 30fps и предлагает такие инструменты как B-Frames (B-VOPS), Quarter Pixel Motion Search Precision (QPEL), Global Motion Compensation (GMC) и MPEG/Custom Quantization, в противоположность к Простому Профайлу (Simple Profile), который допускает только 352x288 и 15fps.

Самые важные инструменты доступные в Продвинутом Простом Профайле (не могут использоваться в Простом Профайле):

B-Frames/B-VOPS/Bi-directional encoding:

B-кадры/двунаправленное кодирование

В отличие от I-кадров/ключевых кадров, которые содержат всё изображение и не зависят от других кадров, и P-кадров, которые содержат только изменённые части изображения из предыдущего I- или P-кадра, B-кадры используют информацию, содержащуюся в предыдущем или следующем I- или P-кадре. Поэтому B-кадры могут быть сжаты гораздо сильнее, чем другие типы кадров. Это должно значительно улучшить качество и повысить сжимаемость.

Quarter Pixel Motion Search Precision (QPEL):

Четверть-пиксельная точность определения движения

В основном большинство MPEG-4 кодеков по умолчанию обнаруживают движение между двумя кадрами с точностью в половину пикселя (HalfPel). Теперь же с QuarterPel передвижения объектов на четверть пикселя могут быть обнаружены, эффективно удваивая точность! Практически, это означает, что Вы получите более чёткое изображение, используя QPEL.

Кодек, MPEG-4 и MJPEG

Кодек H.264, MPEG-4 и MJPEG

Одним из ключевых решений в проектировании современных систем видеонаблюдения, а также в их использовании является выбор кодеков для сжатия видеосигнала. Именно этот программный элемент сегодня в большей степени определяет цену на оборудование систем видеонаблюдения (в основном видеорегистраторы, видеосерверы, платы видеозахвата и IP камеры ). Чтобы понять причину этому, необходимо хотя бы в общих чертах понимать, особенности работы кодеков H.264, MPEG-4 и MJPEG, а также вытекающие из этого преимущества и недостатки их использования.

MJPEG (Motion JPEG)

Данный кодек использует покадровую компрессию. Что это означает? Грубо говоря, данный принцип сжатия аналогичен тому, если бы вы собственноручно брали каждый кадр видео и сжимали его в формате JPEG с помощью, например, Microsoft Paint или Photoshop. Главным преимуществом данного кодека считается простота алгоритма сжатия, что не требует высокопроизводительного процессора. А вот недостатки этого продукта и стали причиной того, что применение его стремительно падает в системах видеонаблюдения. Итак, это в первую очередь – высокие требования к размерам дискового пространства для хранения информации. Кроме того, при реализации возможности удаленного доступа к видео данным посредством Интернет использование кодека MJPEG характеризуется не рациональным использованием пропускного канала связи, так как при сжатии отдельных кадров не учитываются изменения в последовательности кадров, что приводит к отправке лишней (одинаковой) информации. Таким образом, кодек MJPEG остается актуален для бюджетных вариантов систем видеонаблюдения, так как не предъявляет высоких требований к техническим характеристикам компьютеризированной части, однако для многофункциональных систем мониторинга и камер с большим разрешением его использование является не рациональным.

Кодек MPEG-4, как и H.264, в отличие от MJPEG сжимает не отдельные кадры, а последовательность изображений. Главным их отличием является то, что они не отправляют лишней информации. Они не отправляют как MJPEG часто целое изображение, а отправляют только обновления, то есть то, что изменилось в «основном» кадре. Такой алгоритм сжатия получил название внешнекадровой компрессии. За счет его использования кодеки MPEG-4 и H.264 позволяют добиться значительной экономии дискового пространства и снижения нагрузки на полосу пропускания. Причем, кодек H.264 использует самые сложные алгоритмы сжатия видео изображений, но и экономия вышеописанных параметров у него значительно выше. По сравнению с MJPEG при идентичных показателях качества изображения кодек H.264 способен уменьшить размер видео файла более чем на 80 процентов. По сравнению с кодеком MPEG-4 при сжатии файлов H.264 выигрывает около 50%. Не смотря на то, что оборудование, поддерживающее кодек H.264 стоит дороже из-за повышенных требований к вычислительной части системы видеонаблюдения, сегодня он используется все чаще. Многие специалисты утверждают, что через несколько лет он практически вытеснит с рынка MPEG-4 и MJPEG, открывая возможность использования.

Стандарт сжатия видеоизображения

Стандарт сжатия видеоизображения H.264

9 июля 2012 г. в 23:14

Как ожидается, новейший стандарт сжатия видеоизображения H.264 (известный также под названием MPEG-4 Part 10/AVC, последние буквы которого означают «передовое кодирование видеосигналов»)станет в ближайшие годы самым востребованным видеостандартом.

H.264 – это открытый лицензированный стандарт с поддержкой самых эффективных на сегодняний день технологий сжатия видеоизображения. Кодер H.264 без ущерба для качества изображения может снижать размер файла цифрового видео более чем на 80% по сравнению с форматом Motion JPEG и на 50% - по сравнению со стандартом MPEG-4 Part 2. Что означает гораздо меньшие требования к полосе пропускания для передачи и объему памяти для хранения видеофайла. Или же, с другой стороны, возможность получения гораздо лучшего качества видеоизображения при той же скорости передачи данных. Прошедший коллективное утверждение со стороны организаций по стандартизации в области телекоммуникационных и информационных технологий, H.264, как ожидается, получит более широкоераспространение по сравнению с предшествующими стандартами.

H.264 уже появился в таких новых электронных устройствах, как мобильные телефоны и цифровые видеоплееры, и сразу завоевал признание со стороны конечных пользователей. Провайдеры различных услуг, такие как онлайн-хранилища видеоматериалов и телекоммуникационные компании также начали использование H.264.

В отрасли охранного видеонаблюдения H.264, по всей вероятности, быстрее всего найдет свое применение в таких областях, которые требуют использования высокой частоты кадров и высокого

разрешения, например, для охранного наблюдения за автомагистралями, аэропортами и казино, где нормой является использование частоты 30/25 (NTSC/PAL) кадров в секунду. Наибольшая экономия будет достигнута за счет снижения требований к ширине полосы пропускания и объему свободногопространства для хранения данных.

Кроме того, ожидается, что H.264 ускорит переход на мегапиксельные камеры, поскольку высокоэффективная технология сжатия может снизить огромные размеры файлов и скорость их

передачи без ущерба для качества изображения. Есть, впрочем, и сопутствующие требования. Хотя H.264 предлагает экономию расходов на ширину пропускного канала сети и объемы свободного

пространства для хранения данных, этот стандарт требует наличия сетевых камер и станций наблюдения с более высокими техническими характеристиками.

Разработка стандарта H.264

H.264 является результатом совместного проекта группы экспертов по кодированию видео ITU-T и группы экспертов по вопросам кинотехники ISO/IEC (MPEG). ITU-T проводит координацию телекоммуникационных стандартов от имени Международного телекоммуникационного союза. ISO расшифровывается как Международная организация по стандартизации, а IEC – Международная электротехническая комиссия, которая осуществляет надзор за всеми электротехническими, электронными и сопутствующими им технологиями. Название H.264 используется со стороны ITU-T, в то время как ISO/IEC дали стандарту название MPEG-4 Part 10/AVC, поскольку он представляет собой новый элемент в их пакете MPEG-4. В пакет MPEG-4, к примеру, входит и MPEG-4 Part 2 – стандарт, применяемый в видеокодерах и сетевых камерах на базе IP-систем.

H.264, разработанный для исправления некоторых недостатков в предыдущих стандартах сжатия видеоизображений, достигает своих целей благодаря:

  • улучшениям, позволяющим снизить скорость передачи данных в среднем на 50%, и предлагающими такое качество неподвижного видеоизображения, которое сравнимо с любым другим
  • видеостандартом
  • устойчивости к ошибкам, которая позволяет воспроизводить изображение несмотря на ошибки при передаче данных по различным сетям
  • низкому уровню задержки и получению лучшего качества при более высоком уровне задержки
  • простой структуре синтаксиса, которая упрощает внедрение стандарта
  • декодированию на основе точного совпадения, при котором определяется точное количество числовых расчетов, производимых кодером и декодером, что позволяет избежать появления накапливающихся ошибок
  • H.264 также обладает гибкостью, которая позволяет применять его для решения различных задач с самыми разными требованиями к скорости передачи данных. К примеру, в области развлекательного видео (телетрансляции, DVD, спутниковое и кабельное телевидение) H.264 способен обеспечить скорость от 1 до 10 мегабит в секунду с высоким уровнем задержки, в то время как для телекоммуникационных услуг H.264 может предложить скорость передачи данных менее 1 мегабита в секунду с низким уровнем задержки.

    Как происходит сжатие видеоизображения

    Сжатие видеоизображения – это сокращение и удаление избыточных видеоданных с целью оптимизации хранения и передачи файлов цифрового видео.

    В ходе этого процесса исходный видеосигнал обрабатывается с помощью алгоритма для создания сжатого файла, готового к передаче и хранению. Для воспроизведения сжатого файла применяется

    инверсный алгоритм, который фактически дает то же самое видеоизображение, что и оригинальный источник видеосигнала. Время, требуемое для сжатия, отправки, распаковки и отображения файла, называется задержкой. При одинаковой вычислительной мощности – чем более сложен алгоритм сжатия, тем выше задержка.

    Совместная работа пары алгоритмов называется видеокодеком (кодер/декодер). Видеокодеки, применяющие разные стандарты, как правило, несовместимы друг с другом, поэтому видеоданные,

    сжатые с использованием одного стандарта, нельзя распаковать с применением другого стандарта. К примеру, декодер MPEG-4 Part 2 не будет работать с кодером H.264. Причиной тому является тот факт, что один алгоритм не может корректно декодировать результат, полученный с помощью работы другого алгоритма, однако есть возможность оснастить множеством разных алгоритмов программное или аппаратное обеспечение, чтобы оно могло производить сжатие разных форматов.

    В различных стандартах сжатия видеоизображения применяются различные методы сокращения размера данных, и, таким образом, результаты отличаются по скорости передачи данных, качеству и

    уровню задержки.

    Результаты сжатия могут различаться и у кодеров, использующих один и тот же стандарт, поскольку разработчик кодера волен выбирать, какие именно наборы средств, определенных стандартом, в нем задействовать. До тех пор пока результат на выходе кодера соответствует формату и декодеру стандарта, возможны различные методы его реализации. Это выгодно, поскольку различные методы реализации имеют разные цели и разный бюджет. Профессиональные программные кодеры для работы с оптическими носителями не в режиме реального времени должны иметь возможность обеспечивать лучшее кодированное видеоизображение по сравнению с аппаратными кодерами для проведения видеоконференций в режиме реального времени, встроенными в портативные устройства.

    Таким образом, определенный стандарт не может гарантировать определенную скорость передачи данных или ее качество. Более того, функционирование одного стандарта нельзя корректно сравнивать с другими стандартами или даже с различными методами реализации этого же стандарта без предварительного определения конкретного метода реализации.

    Декодер же, в отличие от кодера, должен реализовывать в себе все необходимые элементы стандарта с тем, чтобы декодировать соответствующий поток битов. Поэтому стандарт четко указывает, как именно алгоритм распаковки должен восстанавливать каждый бит сжатого видеоизображения.

    Приведенный ниже график сравнивает скорость передачи данных при одинаковом уровне качества изображения следующих видеостандартов: Motion JPEG, MPEG-4 Part 2 (без компенсации движения), MPEG-4 Part 2 (с компенсацией движения) и H.264 (базовый профиль).

    Рис.1 Для выбранной последовательности видеокадров кодер H.264 генерирует до 50% меньше бит в секунду по сравнению с кодером MPEG-4 с компенсацией движения. Кодер H.264, по меньшей мере, в три раза эффективнее, чем кодер MPEG-4 без компенсации движения, и по меньшей мере в шесть раз эффективнее, чем Motion JPEG.

    Профили и уровни H.264

    Объединенная группа, участвующая в определении стандарта H.264, сосредоточила свое основное внимание на создании простого и ясного решения, сводящего к минимуму количество опций и параметров. Важнейшим аспектом данного стандарта, как и в случае с другими видеостандартами, является предоставление различных возможностей в рамках профилей (наборов алгоритмических параметров) и уровней (классов функционирования) для оптимальной поддержки популярных продуктов и распространенных форматов.

    В H.264 заложено семь профилей, каждый из которых рассчитан на конкретную область применения. Каждый профиль определяет, какой именно набор параметров может использовать кодер, и ограничивает сложность реализации декодера.

    Сетевые камеры и видеокодеры, скорее всего, будут использовать так называемый базовый профиль, рассчитанный преимущественно на применение в областях с ограниченными вычислительными мощностями. Базовый профиль наиболее подходит для применения в современных кодерах режима реального времени, встроенных в сетевое видеооборудование. Этот профиль также обеспечивает

    низкий уровень задержки, что является важным требованием для охранного видеонаблюдения, и также имеет особую важность для управления в режиме реального времени функциями панорамирования, наклона и масштабирования сетевых PTZ-камер.

    H.264 имеет 11 уровней или степеней ограничения требований к функциональности, пропускному каналу и памяти. Каждый уровень определяет скорость передачи данных и скорость кодирования в макроблоках в секунду для разрешений в диапазоне от QCIF до HDTV и выше. Чем выше разрешение, тем выше требуемый уровень.

    Использование кадров

    В зависимости от профиля H.264, кодером могу использоваться различные типы кадров, а именно I-кадры, P-кадры и B-кадры. I-кадр (или вводный кадр) – это изолированный кадр, который может декодироваться независимым образом без привязки к любым другим изображениям. Первое изображение в видеопоследовательности всегда является I-кадром. I-кадры необходимы в качестве начальных точек для новых просмотров или точек повторной синхронизации в случае нарушения переданного потока битов. I-кадры можно использовать для реализации функций перемотки вперед, назад и иных функций произвольного доступа. Кодер автоматически вставляет I-кадры через равные промежутки времени или по требованию в случае, когда ожидается присоединение новых клиентов к просмотру потока. Недостатком I-кадров является чрезмерное количество составляющих их бит, но, с другой стороны, они и не создают большого количества искажений.

    P-кадр, который расшифровывается как промежуточный кадр предсказуемого характера, содержит ссылки для своего кодирования на части предшествующих I-кадров и/или P-кадров. P-кадры, как правило, требуют меньшее количество бит, чем I-кадры, но имеют недостаток в том плане, что они очень уязвимы по отношению к ошибкам передачи из-за своей сложной зависимости от предшествующих ссылочных P- и I-кадров.

    B-кадр (или промежуточный кадр двунаправленного предсказания) – это кадр, содержащий в себе ссылки и на предыдущий, и на последующий ссылочные кадры.

    Рис.2 Типовая последовательность I-, B- и P-кадров. P-кадр может ссылаться только на предшествующий I- или P-кадр, в то время как B-кадр может ссылаться как на предшествующий, и на последующий I- или P-кадры.

    Когда видеодекодер восстанавливает видеоизображение посредством покадрового декодирования потока бит, процесс декодирования всегда должен начинаться с I-кадра. При использовании P-кадров и B-кадров они должны декодироваться вместе с ссылочными кадрами.

    В базовом профиле H.264 используются только I- и P-кадры. Этот профиль идеально подходит для сетевых камер и видеокодеров из-за своего низкого уровня задержки, достигаемого за счет отсутствия B-кадров.

    Основные методы сокращения данных

    Для сокращения количества видеоданных, как в рамках кадра с изображением, так и в рамках последовательности видеокадров, можно использовать самые разнообразные методы.

    В рамках кадра изображения сокращение данных можно произвести простым удалением избыточной информации, что окажет свое влияние на разрешение изображения.

    В рамках последовательности кадров сокращение видеоданных можно произвести с помощью таких методов, как кодирование по отличиям, которое используется в большинстве стандартов сжатия видеоизображения, в том числе и H.264. При кодировании по отличиям кадр сравнивается с ссылочным кадром (т.е. предыдущим I- или P-кадром) и кодируются только изменившиеся по отношению к ссылочному кадру пиксели. Таким образом сокращается количество пиксельных значений для кодирования и отправки.

    Рис.3 В формате Motion JPEG три изображения в показанной выше последовательности кодируются и отправляются какотдельные уникальные изображения (I-кадры) без какой-либо зависимости друг от друга.

    Рис.4 При кодировании по отличиям (применяемом в большинстве стандартов сжатия видеоизображения, в том числе и в H.264) полностью кодируется только первое изображение (I-кадр). В двух оследующих изображениях (P-кадрах) ставятся ссылки на первое изображение в отношении статичных элементов (в данном случае в отношении дома) и кодируются только движущиеся элементы (в данном случае бегущий человек) с использованием вектора движения, что, таким образом, снижает объем информации для отправки и хранения.

    Объем кодирования можно дополнительно снизить, если обнаружение и кодирование по отличиям базируется на блоках пикселей (макроблоках), а не на отдельных пикселях - следовательно, сравниваются более крупные участки и кодируются только блоки со значительными отличиями.Снижаются также и затраты, сопутствующие указанию меняющегося места действия.

    Впрочем, одирование по отличиям существенно не снизит объем данных, если видеоряд содержит много движущихся объектов. И здесь можно использовать такие технологии, как поблочная компенсация движения. Поблочная компенсация движения учитывает то, что многое из того, что создает новый кадр в видеопоследовательности, можно найти на предыдущих кадрах, но, возможно, в другом есте действия. Данная техника разделяет кадр на ряды макроблоков. Новый кадр (например, P-кадр) можно составить или «предсказать» поблочно посредством поиска совпадающего блока в ссылочном кадре. При обнаружении совпадения кодер просто кодирует положение найденного совпадающего блока в ссылочном кадре. Кодирование так называемого вектора движения требует меньше бит, чем кодирование фактического содержания всего блока.

    Рис.4 Иллюстрация поблочной компенсации движения.

    Эффективность H.264

    H.264 выводит технологию сжатия видеоизображения на новый уровень.

    Стандарт H.264 вводит новую передовую схему внутреннего предсказания при кодировании I-кадров. Данная схема может значительно сократить размер (в битах) I-кадра при сохранении высокого качества при помощи успешного предсказания маленьких блоков пикселей в рамках макроблока внутри кадра. Это происходит посредством попытки найти совпадающие пиксели среди ранее закодированных пикселей, которые ограничивают новый пиксельный блок 4x4 для внутреннего кодирования. Путем повторного использования уже закодированных пиксельных значений можно значительно сократить размер данных в битах. Новое внутреннее предсказание – это ключевой элемент технологии H.264, уже доказавший свою высокую эффективность. Для сравнения: даже если в потоке H.264 использовать только I-кадры, размер получившегося файла будет гораздо меньшим, чем для потока Motion JPEG, в котором используются только I-кадры.

    Рис.6 Иллюстрации того, как можно использовать некоторые режимы внутреннего предсказания при кодировании пикселей 4x4 в рамках одного из 16 блоков, образующих макроблок. Каждый из 16 блоков внутри макроблока может кодироваться с помощью разных режимов.

    Рис.7 Помещенные выше изображения иллюстрируют эффективность схемы внутреннего предсказания H.264, при которой внутренне предсказанное изображение отправляется «бесплатно». Для создания изображения на выходе необходимо закодировать только содержимое остаточного изображения и режимы внутреннего предсказания.

    В H.264 также улучшена поблочная компенсация движения, применяемая при кодировании P- и B-кадров. Кодер H.264 может выбирать для поиска совпадающих блоков (вплоть до субпиксельной

    точности) некоторых или многих участков внутри одного или внутри нескольких ссылочных кадров. Для улучшения поиска совпадений можно также настраивать размер и форму блоков. На участках, где внутри ссылочного кадра нельзя найти никаких совпадающих блоков, используются внутренне закодированные макроблоки. Высокая степень гибкости поблочной компенсации движения в H.264 эффективна в местах видеонаблюдения за большим количеством людей, где следует сохранять требуемое для этой области применения качество изображения. Компенсация движения является наиболее востребованным аспектом видеокодера, а различные способы и уровни, при которых возможна ее реализация посредством кодера H.264, помогают повысить эффективность сжатия видеоизображения.

    Со стандартом H.264 типичные блочные объекты, заметные на видеоизображениях с высокой степенью сжатия по стандартам Motion JPEG и MPEG (в отличие от H.264), можно уменьшить благодаря встроенному деблокирующему фильтру. Этот фильтр автоматически сглаживает края блоков, создавая почти идеальное развернутое видеоизображение.

    Рис.8 Блочные объекты на изображении с высокой степенью сжатия слева уменьшились при применении деблокирующего фильтра, как это видно на изображении справа.

    Заключение

    H.264 представляет собой огромный шаг вперед в технологии сжатия видеоизображения. Этот стандарт предлагает различные технологии, позволяющие добиться лучшей эффективности сжатия благодаря применению более точных схем внутреннего предсказания, а также большей устойчивости к ошибкам. Он открывает новые возможности для создания передовых видеокодеров, способных значительно повысить качества изображения, увеличить частоту кадров и разрешение при сохранении той же скорости передачи данных (по сравнению с предшествующими стандартами) или же, напротив, обеспечить видеоизображение того же качества при меньшей скорости передачи данных.

    H.264 представляет собой первый образец совместной работы Международного телекоммуникационного союза, Международной организации по стандартизации и Международной электротехнической комиссии по типовым международным стандартам сжатия видеоизображения. Из-за своей гибкости H.264 нашел применение в таких разнообразных областях, как DVD высокой четкости (например, Bluray), видеотрансляция, в том числе трансляция телевидения высокой четкости, онлайн-хранилища видеоматериалов (например, YouTube), мобильная телефонная связь третьего поколения, в таких программах, как QuickTime, Flash и в операционной системе MacOS X на компьютерах Apple, а также в игровых видеоприставках, например, PlayStation 3. Благодаря поддержке во многих отраслях промышленности и разработки программных приложений, рассчитанных на удовлетворение потребительских и профессиональных потребностей, H.264, как ожидается, заменит другие, используемые на сегодняшний день, стандарты и методы сжатия.

    С более широким распространением формата H.264 в сетевых камерах, видеокодерах и программном обеспечении для управления видеонаблюдением, разработчикам и интеграторам систем требуется уверенность в том, что выбранные ими продукты и поставщики поддерживают этот новый открытый стандарт. На данный момент сетевое видеооборудование, поддерживающее как H.264, так и Motion JPEG – это идеальный выбор, обеспечивающий наивысшую степень универсальности и интеграции.

    (812) 339-01-10 wisol_office Наш офис