H 264 или mpeg4 что лучше

Конечно же, противопоставлять MPEG-4 и H.264 некорректно, так как Н.264 и MPEG-4 (часть 10) – это одно и то же. Однако так оказалось удобнее написать основную часть материала статьи, понимая под MPEG-4 только MPEG-4 (часть 2).

Структура MPEG-4 и немного истории
Алгоритмы кодирования видео играют важную роль в современном мире. Они применяются для цифрового пред-ставления, сжатия, хранения, передачи и обработки видео-информации в самых различных системах. Большинство из этих алгоритмов последнего времени связано с деятельно-стью двух организаций: MPEG (Motion Picture Experts Group), работающей под эгидой Международной организа-ции по стандартизации (ИСО), и VCEG (Video Coding Ex-perts Group), работающей в составе Международного союза по электросвязи (МСЭ). Первая группа выпускает стандар-ты MPEGxx (-1, -2, -4, -7, -21), вторая – создает рекоменда-ции МСЭ Нхх (.261, .263, .263+, .263++, .264). В настоящей статье речь пойдет о последних разработках этих групп в области кодирования видео – стандарте MPEG-4 (часть 2) и рекомендации Н.264. Последняя рекомендация одновре-менно является стандартом MPEG-4 (часть 10), а также ISO/IEC 14496-10. Такое объединение двух стандартов ста-ло возможным в результате совместной работы групп MPEG и VCEG в рамках проекта Joint Video Team.
В таблице 1 показана предыстория создания этих стан-дартов.
Таблица 1 – Рекомендации МСЭ и стандарты MPEG

Надо отметить, что ядро стандарта MPEG-4 (ч. 2) было основано на рекомендации H.263.
Итак, самый последний стандарт в области кодирова-ния видео можно называть MPEG-4 (часть 10), либо ISO/IEC 14496-10, либо Н.264/AVC. Аббревиатура AVC здесь означает Advanced Video Coding.
Приведем содержание остальных частей стандарта MPEG-4:
Ч. 1 – Описание системы: сцены, объединения аудио, видео и служебной информации, синхронизации, управле-ния буфером, управления правами на интеллектуальную собственность.
Ч. 3 – Кодирование аудио.
Ч. 4 – Конформное тестирование: условия, процедуры, битовые потоки.
Ч. 5 – Общедоступное программное обеспечение, эта-лонно реализующее требования стандарта.
Ч. 6 – Протоколы распространения мультимедиа ин-формации.
Ч. 7 – оптимизированное программное обеспечение ко-дирования видео (технический отчет, а не стандарт).
Ч. 8 – Специфицирует механизмы передачи потока MPEG-4 через IP-сети .
Ч. 9 – Описание реализации MPEG-4 на языке VHDL (технический отчет, а не стандарт).
Ч. 11 – Механизм описания сцены.
Ч. 12 – Формат мультимедийного файла ИСО.
Ч. 13 – Дополнения в отношении управлениями права-ми на интеллектуальную собственность.
Ч. 14 – Формат файла MPEG-4 (ч. 2).
Ч. 15 – Формат файла MPEG-4 (ч. 10).
Ч. 16 – Дополнения по кодированию анимации.
При дальнейшем изложении с целью уменьшения пу-таницы мы будем называть стандарт MPEG-4 (ч. 2) стандар-том MPEG-4, а стандарт MPEG-4 (ч.10) – стандартом Н.264.

Как прагматизм победил романтизм
Посмотрев таблицу 1, мы увидим, что популярный и сегодня стандарт кодирования видео MPEG-2 (например, он применяется в DVD) был разработан еще в 1996 г. Зачем же было разрабатывать стандарт MPEG-4? О, для этого были великие причины…
Во-первых, зачем ограничивать себя кодированием ка-ких-то там прямоугольных изображений? Даешь изображе-ние произвольной формы! А вдруг нам понадобится коди-ровать не только естественные, но и синтетические изобра-жения, а также гибриды первых и вторых? Ведь виртуаль-ная реальность уже не за горами! А как нам не позаботиться об астрономах и других потребителях, коим 8 бит на ком-поненту цвета ничто? Да и вообще, что это за отсталая идея – относиться к видео как к последовательности прямо-угольных статических изображений? Даешь объектный подход! Будем кодировать взаимодействующие объекты, трехмерные поверхности. Суперпупер аппарат (вейвлеты) не подходит для кодирования видео? Что ж, применим их для кодирования неподвижных изображений. Ну и пусть, что MPEG-4 для видео: вейвлеты ведь.
Наверное, так примерно рассуждали энтузиасты – соз-датели MPEG-4 и разработали действительно революцион-ный стандарт. Правда, вот технические подробности деко-дирования увеличились с 17 страниц у Н.261 до 539 страниц у MPEG-4, притом что изложение здесь далеко не столь подробное. А ведь принципы кодирования видео не меня-ются на протяжении многих лет, только лишь уточняются и уточняются. Правда, профилей разработчика оказалось аж 19 (по сути, надо разрабатывать 19 алгоритмов декодирова-ния).
Но главная относительная неудача стандарта оказалась в том, что его творцы не учитывали потребности рынка. Не так уж много приложений, где требуется кодирование объ-ектов произвольной формы, высокой разрядности цвета, не-стандартной его дискретизации и прочей экзотики. Зато пользователи любят делать цифровые видеоклипы, пересы-лать их по сети, пользоваться услугами цифрового телеви-дения и сервисами видео-по-запросу. Конечно, и для этих приложений MPEG-4 был эффективнее своего предшест-венника, но тут добавились еще проблемы с лицензионной чистотой решений.
В общем, через два года после принятия MPEG-4 мпе-говцы объединились с VCEG и создали новый стандарт – Н.264. Во главу угла данного стандарта поставлена лицен-зионная чистота решений и максимальная эффективность за счет отказа от всякой вышеупомянутой экзотики.

Основные характеристики Н.264
Предполагаемые области применения стандарта Н.264 следующие:
– вещание (кабель, кабельный модем, спутник, DSL, TB);
– хранение на различных носителях (DVD, магнитные диски);
– видеоконференцсвязь (ISDN, Ethernet, LAN, DSL, ра-диосети, мобильные сети, модемы);
– сервисы типа видео по запросу;
– сервисы MMS (DSL, ISDN).
Под эффективностью алгоритма в стандарте Н.264 по-нимается высокая степень сжатия видео при допустимом качестве и робастность битового потока к ошибкам/потерям передачи. Аскетизм Н.264 в отличие MPEG-4 проявляется в том, что здесь предусмотрено всего три профиля:
Baseline – для видеоконференцсвязи;
Extended – для потоковой передачи видео по сети;
Main – для хранения и вещания видео.
Надо отметить, что профиль Extended полностью по-крывает профиль Baseline, тогда как профиль Main находит-ся несколько в стороне.
В стандарте Н.264 реализованы такие основные новые технические решения, как:
1) Для улучшения предсказания:
– компенсация движения на основе малых блоков адап-тивно настраиваемого размера;
– точность компенсации движения до ¼ отсчета;
– компенсация движения на основе одного или более опорных кадров;
– независимость порядка отображения кадров от по-рядка следования опорных кадров;
– возможность использования любого кадра в качестве опорного;
– предсказание с использованием весовых множителей;
– непосредственное пространственное предсказание на основе внутрикадрового кодирования;
– циклическая фильтрация для ликвидации эффекта блочности.
2) Другие решения, повышающие эффективность ко-дирования:
– преобразование блоков малых размеров (4 х 4);
– иерархическое блочное преобразование;
– целочисленные быстрые алгоритмы преобразования; – арифметическое кодирование;
– контекстно-адаптивное энтропийное кодирование.
3) Для повышения помехоустойчивости и гибкости пе-редачи по различным средам:
– новая структура множества параметров;
– синтаксическая структура NAL, позволяющая абстра-гировать сетевые служебные данные от служебных данных кодирования;
– гибко настраиваемый размер слайса;
– произвольный порядок следования слайсов;
– введение в поток повторяющихся слайсов;
– упорядочение данных;
– переключение потоков на основе использования SI/SP синхронизации.
Как и в предшествующих стандартах кодирования ви-део, в Н.264 определены три вещи:
1) синтаксис битового потока представления видео;
2) семантика этого потока;
2) метод декодирования для реконструкции видео.
То есть в стандарте определены лишь выходные после-довательности, но не принципы построения кодера видео-сигнала. Это позволяет производителям соревноваться в создании наилучшего кодера.
Схема кодирования видео в соответствии со стандар-том Н.264, в общем, повторяет схемы кодирования предше-ствующих стандартов. Разницей является разве что наличие на последнем этапе обработки с целью удаления блочности. Алгоритм кодирования (он явно не описан в стандарте) со-стоит из четырех основных компонентов:
– компенсация движения и вычитания текущего кадра из опорного;
– дискретное косинусное преобразование (ДКП) разно-стного кадра;
– квантование коэффициентов преобразования;
– энтропийное кодирование квантованных коэффици-ентов.
Рассмотрим эти компоненты подробнее.

Читайте также:  Exception unwrapping private key java security

Компенсация движения
Высокая эффективность Н.264 обусловлена улучше-ниями каждого из компонентов. От эффективной компенса-ции движения зависит энергия разностного кадра. Чем точ-нее скомпенсировано это движение, тем меньше энергии, а значит, выше будет коэффициент сжатия. Можно было бы вычислять вектора движения для каждого пиксела, но это сложно, поэтому их вычисляют для прямоугольных блоков. Выгода здесь в том, что изображение также прямоугольно, можно в дальнейшем применить преобразование, например, ДКП. Минусы очевидны: границы объектов обычно не ле-жат на прямоугольнике, движение также, как правило, не бывает горизонтальным или вертикальным. Тем не менее в настоящее время это единственный метод.
С увеличением размера блока увеличивается вычисли-тельная эффективность и уменьшается объем бит, отводи-мый на кодирование векторов движения. Однако одновре-менно ухудшается точность компенсации, а, следовательно, и увеличивается энергия разностного изображения. Таким образом, налицо необходимость оптимизации, и в Н.264 реализован адаптивный выбор размера блока от 4 х 4 до 16 х 16 пиксела, а точность указания вектора доведена до ¼ пиксела (за счет предварительной интерполяции). Если уж кадры совсем не похожи друг на друга, то компенсация движения не используется, а применяется внутрикадровое кодирование.

Преобразование разностного кадра и квантова-ние
Как известно, для преобразования изображения в спек-тральную область могут использоваться различные ортого-нальные преобразования. Целью преобразования является перераспределение энергии изображения: большая ее часть оказывается сосредоточенной в малом числе коэффициен-тов. Наиболее эффективным преобразованием в этом смыс-ле из числа быстрых считается вейвлет-преобразование. Именно его применяют в MPEG-4 для кодирования непод-вижных изображений. Однако вейвлет-преобразование тре-бует больше памяти (надо запомнить весь кадр) и плохо стыкуется с блочной компенсацией движения, поэтому для кодирования видео не применяется.
В MPEG-4 так же, как и в MPEG-2 (а также и в JPEG), применяется ДКП с основным размером блока 8 х 8. В Н.264 используется целочисленное ортогональное преобра-зование над блоками размером 4 х 4, которое аппроксими-рует ДКП. В результате ядро преобразования использует только сложение, вычитание и сдвиги. При последующем масштабировании необходимо для каждого пиксела одно умножение на коэффициент, но эта операция может быть отнесена к дальнейшему квантованию. Вся арифметика вы-числений 16-разрядная, т. е. может быть выполнена на де-шевом микроконтроллере.
Целью квантования является приведение множества значений коэффициентов к небольшому количеству различ-ных значений. Обычно это достигается за счет деления с округлением результата. Однако коэффициенты квантова-ния в Н.264 выбраны так, чтобы избежать вычислительно-сложных делений (вместо этого выполняется умножение с накоплением и сдвиг вправо).
После осуществления квантования коэффициенты пе-реупорядочиваются. В MPEG-4 это либо зигзагообразное сканирование для блоков 8 х 8, либо использование струк-туры нульдерева для вейвлет-коэффициентов. В Н.264 вы-полняется зигзагообразное сканирование для блоков 4 х 4.

Энтропийное кодирование и формирование потока бит
Цель энтропийного кодирования заключается в обозна-чении более коротким кодом более часто встречающуюся последовательность символов (бит). В MPEG-4 для этого выполняется вначале кодирование длин серий (RLE), а за-тем применяется кодирование с переменной скоростью по заранее вычисленным таблицам Хаффмана. Надо отметить, что кодер Хаффмана чувствителен к ошибкам в канале пе-редачи. Кроме того, необходимо, чтобы кодер/декодер рас-полагали одинаковыми таблицами.
В Н.264 в зависимости от профиля применяются либо экспоненциальные коды Голомба, либо контекстно-зависимый арифметический кодер. Преимуществом ариф-метического кодера является более высокая степень сжатия, так как символ может кодироваться дробным числом бит, тогда как кодер Хаффмана может кодировать только целым числом бит.
В качестве транспорта может быть использован MPEG-2, часть 1 которого определяет порядок объединения видео, звука и служебных данных в единый поток. Другим реше-нием является использование протокола реального времени (RTP). NAL-структура потока H.264 как нельзя лучше под-ходит для пакетной передачи в соответствии с этим прото-колом. Еще один вариант – использовать стандарт MPEG-4 часть 6.

Что же лучше?
С момента появления Н.264 проводились многочислен-ные сравнения этого стандарта и MPEG-4. Результаты, как правило, показывали выигрыш в 1–3 дБ стандарта Н.264 в широком диапазоне скоростей кодирования. Визуально ви-део в стандарте Н.264 также выглядит лучше (во многом благодаря использованию деблочного фильтра). Вот типич-ный результат:

Справедливости ради отметим, что для высокотекстурированных изображений большой разницы не наблюдается. Сравнение различных кодеков Н.264 меж-ду собой вы можете посмотреть на сайте [1]. Во многих тес-тах разница по эффективности кодирования между отдель-ными видеокодеками H.264 достигает двух и более раз.
Так что, будь то MPEG-4 или Н.264 – основная эффек-тивность кодеков основана на нюансах реализации. А этих тонкостей столько, что вы не почерпнете их даже из 700-страничной книги [2], с которой я все равно рекомендую вам ознакомиться.

Литература http://compression.ru/video/codec_comparison/ L.Hanzo, P.Cherriman, J.Streit. Video compression and communications. Second Edition. Wiley, 2007. 704 p.

Внимание! Копирование материалов, размещенных на данном сайте допускается только со ссылкой на ресурс http://www.tzmagazine.ru

Рады сообщить нашим читателям, что теперь нашем сайте работает модуль обратной связи. Нам важна ваша оценка наших публикаций! Также вы можете задавать свои вопросы.Наши авторы обязательно ответят на них.
Ждем ваших оценок, вопросов и комментариев!
Комментарии: Добавить комментарий или задать вопрос

Средняя оценка этой статьи: 2.6 (голосов: 10)
Ваша оценка:

Основная задача настоящего тестирования – сравнить результаты работы нового поколения MPEG4-кодеков (называемых MPEG-4 AVC или H.264) при записи домашнего видео простыми пользователями. Такие пользователи, как правило, используют простые известные программы для того, чтобы считывать DVD или оцифровывать сигнал с тюнера и редко изменяют настройки кодеков. Мы прекрасно понимаем, что писать кодеки так, чтобы они хорошо работали в разных ситуациях без специальной настройки (автоматически подстраиваясь под тип видео) сложнее, но тем больше чести авторам, если их кодеки хорошо справляются с такой задачей. DivX Pro 5 использовался для сравнения, как один из лучших кодеков предыдущего поколения, стандарта MPEG-4 ASP. Подробнее о разновидностях MPEG-4 можно прочитать здесь.

Использованные кодеки

dicas 0.10 AVC MoonLight 0.1.2546 MoonLight

Main Concept H.264

Main Concept 1.04.02.00 MainConcept Fraunhofer IIS от 25.11.2004 Fraunhofer

Ateme MPEG-4 AVC / H.264

Ateme 1.0.3.2 Ateme

Videosoft H.264 codec main

Videosoft 2.1.0.2 VSS_main DivXNetworks 5.1.1 DivX 5.1.1

Учитывая специфику H.264 (очень большое время работы при включении "по максимуму" всех опций и возможностей), мы в дальнейшем введем два набора настроек, получаемых от производителей кодеков (и только от них). Первый набор – "tuned" – настройки, дающие максимальное качество, но долгую работу и "fast" – настройки, обеспечивающие быструю работу, но с меньшим качеством. Причем и время, и качество будут измеряться в обоих случаях. Это позволит кодекам продемонстрировать, на что они способны по качеству и даст возможность более корректно сравнивать скорость, чем в варианте сравнения настроек по умолчанию. Часть 1: Методика тестирования

Читайте также:  Игры стрелялки на 32 битную систему

Метрика PSNR

Описание метрики

В рамках данного тестирования критерием качества сжатия служит метрика PSNR (peak signal to noise ratio/пиковое отношение сигнала к шуму, измеряется в дБ). Использование именно этой метрики обусловлено ее популярностью. Ее используют в большинстве научных статей и сравнений в качестве меры потерь качества. Как и все существующие метрики, она не идеальна и имеет свои достоинства и недостатки. Для понимания приведенных ниже цифр, необходимо знать лишь то, что значение метрики тем больше, чем больше разница между сравниваемыми изображениями.

Примечание: PSNR – это наиболее общепринятая метрика для оценки различий между двумя последовательностями. Несомненно, у неё есть множество недостатков. Можно придумать огромное количество последовательностей, на которых эта метрика не совсем адекватно себя ведёт. Например, два кадра, яркость одного из которых подняли на одну единицу (из, скажем, 255). Или два кадра, отличающихся одним пикселем – на первом пиксель белый, а на втором – чёрный. В обоих примерах вы с трудом сможете уловить различия в кадрах на глаз, но с точки зрения PSNR кадры будут значительно отличаться! Однако, несмотря на все недостатки, именно метрикой PSNR до сих пор пользуется большинство разработчиков кодеков для анализа своих результатов. Эта метрика понимается и признаётся всеми профессионалами в области кодирования видео. Именно по этой причине мы выбрали PSNR в качестве основной метрики.

Смысл графиков PSNR/Frame size

На графике изображена зависимость показателя метрики от среднего размера кадра. Каждая ветвь соответствует определенному кодеку. Ветви построены на опорных точках, каждая из которых соответствует конкретному битрейту. Хорошо видно, что на каждой ветви находится по десять точек (каждая последовательность сжимается на 10 настройках битрейта). Бывает, что кодек не удерживает битрейт и с разными настройками битрейта сжимает одинаково. В таких случаях, очевидно, на ветви кодека расположено менее десяти опорных точек. Для сравнения кодеков на этих графиках следует обращать внимание на то, как высоко расположены ветви кодеков. Чем выше находится ветвь – тем выше в среднем качество последовательности, сжатой данным кодеком. На вышеприведенном в качестве примера рисунке видно, что на высоком битрейте Videosoft сжал последовательность с меньшими потерями качества по сравнению с другими кодеками.

Методика тестирования

Последовательность действий

В тестировании участвует девять фильмов (см. ниже). Каждый фильм сжимается десять раз с разными битрейтами (кбит/с): 100, 225, 340, 460, 700, 938, 1140, 1340, 1840, 2340. Таким образом, для каждого кодека генерируется 50 фильмов. Затем для каждого фильма вычисляется метрика PSNR. Причем указанная метрика вычисляется для каждого кадра. Далее для построения графика используются соответствующие числа, в зависимости от типа графика.

Задачи и правила тестирования

Основной задачей ставилась сравнительная оценка качества кодеков при их непрофессиональном использовании для сжатия фильмов. Соответственно оценка проводилась на последовательностях, обработанных простым распространенным фильтром деинтерлейсинга, а параметры кодека брались по умолчанию. Правила тестирования:

  • Подсчет PSNR производился с помощью программы luv_avi.
  • Размер кадра считался как частное размера фильма и количества кадров.
  • Значение ординаты на графиках Delta вычисляется как разница PSNR для этих кодеков и кодека DivX.
  • При тестировании кодеков, которые накладывают свой логотип на сжатый фильм, логотип заменялся на черный прямоугольник и на исходный несжатый фильм накладывался такой же прямоугольник. Далее производилось сравнение
  • Для кодеков, являющихся VfW (Video for Windows), сжатие проводилось при помощи программы VirtualDub 1.5.4.
  • Для кодеков, работающих по интерфейсу DirectShow, сжатие проводилось при помощи программы GraphEdit (build 011008).
  • Для кодеков, которые устанавливались как отдельные приложения для сжатия, сжатие проводилось при помощи этого приложения.
  • Для кодеков, которые сжимали фильм не в формат avi, а в свой внутренний формат, для получения avi использовалась программа GraphEdit (build 011008) и декодер, поставляемый с кодеком.
  • Кодек MainConcept вставлял лишние кадры в декодированную последовательность. Для покадрового сравнения приходилось удалять эти кадры вручную при помощи программы VirtualDub. При этом файл считался пригодным для сравнения, если в исправленном фильме последний кадр визуально совпадал с последним кадром в исходным фильме.
  • Самый распространённый вопрос по поводу этого тестирования – «А с какими настройками тестировались кодеки?». В полном тексте документа, в разных местах мы ответили на него 8 раз – с настройками по умолчанию! Это означает следующее. Мы брали чистую операционную систему и инсталлировали на неё кодек. Настройки, которые он выставил при этом, мы считали настройками по умолчанию. В процессе тестирования мы меняли только один параметр – битрейт. Таким образом, чтобы посмотреть все параметры, вам надо всего лишь заново проинсталлировать интересующий вас кодек.

    Последовательности

    bankomatdi

    376 704 x 352 (RGB)

    battle

    1599 704 x 288 (RGB)

    bbc3di

    374 704 x 576 (RGB)

    foreman

    300 352 x 288 (RGB)

    susidi

    374 704 x 576 (RGB)

    На разных последовательностях кодеки показывают разные результаты. Например, эффективно сжать последовательность из одинаковых кадров намного легче, чем последовательность, состоящую из существенно различающихся картинок. Есть и другие характеристики последовательностей – размер кадров, зашумлённость, длина последовательности, тип движения камеры и т.д. Для нашего тестирования мы выбрали стандартные последовательности. Многими из них пользуются производители кодеков для тестирования своих продуктов. Конечно, эти последовательности не покрывают всего множества фильмов – тут нет ни мультфильмов, ни видео с тюнера. В дальнейшем мы планируем расширить число последовательностей.Часть 2: Графики по PSNR для всех кодеков

    Графики Y-PSNR – Frame Size

    На этих графиках хорошо видна динамика зависимости качества сжатого фильма от его размера. Координатами опорных точек диаграммы являются средние по фильму значения метрики и размера кадра. Таким образом, каждая ветвь имеет по десять точек, соответствующих разным битрейтам.

    Delta Y-PSNR – это графики относительного PSNR. В качестве референсного кодека выбран DivX 5.1.1. Для каждого замера на графике конкретного кодека бралась разница этого замера и значения PSNR для референсного кодека с тем же битрейтом. При отсутствии значения, PSNR референсного кодека получался линейной интерполяцией.

    Выводы

    • На низких битрейтах DivX сильно уступает кодекам VSS_main, Fraunhofer, Ateme.
    • На средних и высоких битрейтах кодек от Ateme опережает все остальные кодеки.

    В полной версии сравнения представлены другие типы графиков для различных последовательностей и видеокодеков: V-PSNR, U-PSNR , Y-difference и bitrate-handling.

    Часть 3: Покадровое сравнение видеокодеков

    На этих графиках хорошо видно, как изменяется качество сжатия отдельных кадров кодеками. По оси X отложены номера соответствующих кадров, а по оси Y – PSNR кодеков при сравнении с оригиналом.

    Sequence bankomatdi. Bitrate 100 kb/sec

    Sequence bankomatdi. Bitrate 2340 kb/sec

    В сжатых последовательностях разные кадры имеют различное качество, зависящее от многих параметров, как самой последовательности, так и настроек кодека. Например, на качество кадра влияет такой параметр, как тип этого кадра – сжатый независимо, с учётом одного предыдущего или нескольких кадров (I, P и B кадры). Для разных кодеков один и тот же кадр последовательности может иметь различное качество. Например, если мы найдём кадр, который первый кодек закодировал независимо, а второй – с использованием предыдущего, то, скорее всего, кадр первого кодека будет смотреться лучше. Таким образом, для любых двух кодеков в последовательности можно найти кадры, на которых один из кодеков смотрится лучше другого. Для визуального сравнения мы выбирали кадры, на которых разница между кодеками максимальна. Сравнение проводилось между кодеками от компании Ateme и компании DivXNetworks, Inc.

    • Битрейт 700 Кбит/с.
    • Последовательности для сравнения: bbc3di и foreman.
    Читайте также:  Как вернуть статус в одноклассниках

    Последовательность bbc3di, кадр 280

    Последовательность foreman, кадр 282

    Выводы

    • При одинаковом значении метрики PSNR кодеки стандарта H.264 показывают заметно лучшее визуальное качество.
    • Большинство кодеков явно оптимизированы для достижения максимальной скорости кодирования на сегодняшних конфигурациях и не используют всех возможностей, предоставляемых форматом H.264.

    При сравнении кодеков всегда хочется узнать, кто же в итоге лучший. Часто при ответе на подобные вопросы возникают заключения вроде «H.264 лучше DivX на 45%!». Однако кодеки можно сравнивать по многим параметрам – качеству сжатых последовательностей, способности держать заданный битрейт, быстродействию, удобству использованию, размеру инсталлятора, красоте логотипа и т.д. Причём для разных задач отдельные параметры могут быть неодинаково важны. Например, если вы хотите сжимать телевизионный сигнал, для вас важна скорость работы кодека, если записывать сжатые фильмы на CD – то немаловажна точность соблюдения битрейта, а если решили сделать архив оцифрованного видео – то, скорее всего, определяющим фактором является качество сжатых последовательностей.

    Как было сказано выше, данный текст является сильно сокращенным и откомментированным вариантом сравнения видеокодеков, предназначенного в первую очередь для профессиональных пользователей и производителей кодеков. Полный вариант этого тестирования имеет объем 70 pdf-страниц, содержит сравнения всех указанных в начале статьи видеокодеков, множество графиков и рисунков, не приведенных в данной статье.

    Мы выражаем благодарность компаниям Moonlight Cordless LTD, Fraunhofer Institute for Integrated Circuits IIS и Ateme за любезно предоставленные для данного тестирования кодеки, недоступные публично.

    Стандарты сжатия для видеосигнала появились еще со времен появления IP интернет-протокола и используются в различных сферах: от видеоконференций в интернете и широкополосных сетях связи до цифрово­го ТВ, видеонаблюдения и мобильных IР-сетей.

    На данный момент распространенным и популярным форматом кодирования цифрового видео является H.264, но всё больше внимания производители и потребители обращают на стандарт сжатия H.265 или HEVC (High Efficiency Video Coding – высокоэффективное видео кодирование). Давайте разберемся в их преимуществах и недостатках.

    В чем преимущество H.265?

    Формат сжатия H.265 использует только половину битрейта формата Н.264, а значит, можно больше передать информации по одинаковому пропускному каналу и сократить затраты на аппаратное «железо».

    Но, несмотря на это явное преимущество, формат H.265 еще далёк от массового внедрения. Можно ли что-то сделать пока с форматом Н.264? Ведь с учетом роста современных технологий и популярности видео контента растут и требования к пропускной способности канала и объемам сохраняемых данных.

    Популярный сейчас кодек H.264 тоже не стоит на месте и его битрейт оптимизируют тремя способами: предиктивным кодированием, подавлением шума, и "долгосрочным" управлением битрейтом (predictive encoding, noise suppression, and “long-term” bitrate control). В результате удалось сократить занимаемую память видео до 75%, а значит, кодек H.264 еще долго будет конкурировать с новым кодеком Н.265

    Сложности H.265

    Так как кодек Н.264 дорабатывается и уже давно используется, то производители не спешат вкладывать денежные средства в модернизацию оборудования. А по результатам тестирования кодека Н.265 различными командами, выводы оказались неоднозначными. В реальном сравнении кодеки не сильно отличались по размеру видеопотока. А вот проблемы с воспроизведением нового кодека были у многих плееров. Разница в качестве видео была заметна только на минимальных настройках (200 кбит/сек). Картинка Н.265 оказалась более детализированной, что может быть полезным в видеонаблюдении для распознавания номеров автомобиля на въезде.

    Дополнительной сложностью внедрения кодека Н.265 является более высокая стоимость патента, а значит, стоимость конечного продукта увеличится и для потребителя, не все на это готовы. Современное видеооборудование и так постоянно развивается, улучшается качество видеосигнала и растет стоимость компонентов.

    Усовершенствованный кодек H.264

    Еще одной причиной отложить Н.265 стало внедрение популярными производителями оптимизированных технологий кодирования H.264, который использует несколько современных технологий.

    Оптимизированные технологии H.264 используют прогнозирующее кодирование, чтобы уменьшить битрейт, затраченный на неизменное фоновое изображение

    Предиктивное кодирование

    В упрощенном варианте это кодирование объясняет картинка. Статичный фон отделяется от подвижных объектов и упрощается, битрейт значительно снижается, оптимизированное кодирование сокращает объем видеопотока.

    Технология H.264+

    Компании Hikvision разработала современный стандрарт сжатия H.264+. Видеокамера определяет подвижные участки кадра и кодирует их с повышенным содержанием битрейта, на статичные участки выделяется битрейта меньше. Далее, применяется стандартный кодек H.264/AVC, с помощью которого можно просматривать и хранить видео на совместимых устройствах. Единственное, H.264+ не может автоматически добавлять или убавлять ключевые кадры.

    Рис.6.1. Сравнение картинки при минимальном качестве сжатия

    Рис.7.1. Сравнение картинки при максимальном качестве сжатия

    Подавление шума

    Кодирование H.264 позволяет эффективно подавлять различные шумы, возникающие при записи и передачи сигнала. Это может быть нежелательный электрический сигнал, размытые пиксели, вызванные колебаниями света, температуры, или другими посторонними помехами. Путём интеллектуального кодирования объектов переднего плана изображение преобразуется в более четкое с точной цветопередачей.

    Так лучше ли кодирование Н.264 чем Н.265?

    С учетом вышеизложенного сделаем выводы: кодирование Н.264 предлагает не меньше, чем предлагает стандарт Н.265. Помимо всего, Н.264 совместим со всеми существующими системами, более распространен и меньше стоит.

    Стандарт H.265 дает преимущество до 50% в сжатии видео потока, как следствие – вы сэкономите на размере жесткого диска или выиграете в сроке жизни накопителя. Формат сжатия H.265 оправдывает себя только при условии, что камера ведет запись статичных объектов (к примеру ночью, когда нет движения). Если камера снимает оживленный поток людей, который полностью охватывает весь кадр камеры, то существенного эффекта в сжатии вы не получите.

    Эволюция форматов видеосжатия обычно исчисляется десятилетиями: в 90-х появился формат MPEG2, в 2000-х запущен Н.264, а в 2013 г. выпущен Н.265. Форматы кодирования следуют за технологическим прогрессом и индустрией видеозаписи/воспроизведения. Так, с MPEG2 появились DVD, с Н.264 – HD-технология, а с кодированием Н.265 наступила эра передовых цифровых технологий и мобильного интернета. Конечно, в ближайшие годы передовые компании и программисты доработают формат кодирования Н.265 и тогда его преимущества станут намного значительнее, что совершит очередной технический переворот сферы видеонаблюдения.

    для оценки объекта, приедем в удобное для Вас время

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Adblock detector