MPEG - ЗА И ПРОТИВ |
В популярной форме автор знакомит с принципами работы, достоинствами, недостатками и перспективами применения технологии сжатия MPEG. |
В 1988 году под покровительством международной организации по стандартам (ISO) была создана так называемая ╚Группа экспертов по движущимся изображениям╩ (Motion Pictures Experts Group, MPEG). Ее основной задачей стала разработка стандартов сжатия видео- и аудиоинформации. Заседания этой группы происходят четыре раза в год и длятся в среднем около недели. На них обсуждаются вопросы спецификаций потоков сжатых данных, а также аппаратура и программное обеспечение, необходимое для их декодирования. Принятые группой стандарты MPEG-1 и MPEG-2 получили чрезвычайно широкое распространение и стали основными способами преобразования изображения и звука в потоки сжатых цифровых данных. Стандарты MPEG особенно популярны в области сжатия видео, и используются во множестве приложений - от мультимедиа-компакт дисков для персональных компьютеров до интерактивного телевидения и спутниковых каналов связи. В этой статье я хочу дать краткое описание технологии цифрового сжатия видеоинформации, а также рассмотреть различные стандарты MPEG, включая их конкретные реализации и потенциальные возможности.
Цифровое сжатие сигнала
заключается в удалении избыточной информации, из
потока видеоданных после преобразовании
аналогового телевизионного изображения в
последовательность единиц и нулей. В результате
общий объем данных, которые можно передать по
коаксиальному кабелю, транслировать через
спутник или записать на компакт-диск,
существенно увеличивается. При воспроизведении
сжатый сигнал декодируется при помощи
специального устройства или программы.
Использование цифрового сжатого видео
позволяет уменьшить стоимость его передачи,
улучшить качество изображения, защитить данные
от несанкционированного доступа.
Цифровое сжатие позволяет передать через этот же спутник не один канал, а четыре, то есть стоимость трансляции одного канала уменьшается на 75%. |
Приведу несколько примеров.
Во-первых, применение цифрового сжатия позволяет
передать по одному кабелю примерно в
четыре-десять раз больше данных, чем в случае
аналогового сигнала. Во-вторых, аренда спутника
для трансляции одного телевизионного канала
стоит в США около 6 миллионов долларов в год.
Цифровое сжатие позволяет передать через этот же
спутник не один канал, а четыре, то есть стоимость
трансляции одного канала уменьшается на 75%.
В-третьих, аналоговый сигнал, передающийся на
большое расстояние, искажается и подвергается
воздействию различных помех (╚снег╩,
дополнительные изображения и т.п.). Цифровое
видео свободно от этого недостатка и ╚поступает
к потребителю точно таким же, каким оно было при
передаче - четким, ярким и неискаженным╩ /2/.
В настоящее время существует
несколько технологий сжатия изображений - MPEG, Indeo,
Cinepak, JPEG, H.261 и другие. Каждая из них используется в
определенных приложениях и обладает своими
собственными достоинствами и недостатками. Все
они отличаются качеством результирующего
изображения и плавностью потока кадров. Основной
принцип сжатия изображений заключается в
разделении каждого кадра на отдельные блоки с
последующим удалением избыточной информации.
Этот процесс называется внутрикадровым анализом
(intraframe analysis). Избыточная информация удаляется на
основании сравнения соседних кадров друг с
другом. Такая техника называется ╚компрессией с
потерями╩ - чем сильнее сжимаются данные, тем
больше информации утрачивается. Основная задача
качественного цифрового сжатия состоит в
поддержании оптимального баланса между объемом
результирующих данных и качеством изображения.
Технология MPEG разработана таким образом, чтобы в
первую очередь удалялись те элементы
изображения, которые незаметны при его
просмотре. Для этого используется как
внутрикадровый анализ, так и сравнение отдельных
кадров между собой. Рассмотрим этот процесс
более подробно.
Системы кодирования и декодирования (так называемые кодеки - codec) можно разделить на симметричные и асимметричные [Кодеки.]. У симметричных на кодирование и декодирование данных уходит примерно одинаковое количество времени. Такие кодеки используются главным образом при записи ╚живого╩ видео - например, при проведении видеоконференций.
Алгоритмы MPEG позволяют даже при удалении 99.5% потока видеоданных изображение может быть восстановлено с чрезвычайно высокой степенью достоверности. В результате технология MPEG позволяет достичь очень большой степени сжатия - до 180:1. |
В асимметричных кодеках процесс кодирования сигнала занимает больше времени, чем процесс восстановления, но позволяет добиться значительно большего коэффициента сжатия данных. Типичным приложением асимметричного сжатия является подготовка данных к записи на компакт-диск. Удалив избыточные данные, кодек статистически анализирует расположение отдельных пикселов внутри изображения. Полученные при этом данные сжимаются при помощи того или иного алгоритма. В технологии MPEG, например, для этого используется дискретное косинусное преобразование (DCT). Каждый кадр изображения разделяется на отдельные элементы (обычно размером восемь на восемь пикселов), которые обрабатываются в индивидуальном порядке. Косинусное преобразование превращает интенсивности пикселов в их частотный эквивалент - последовательности цифровых значений, соответствующие отдельным деталям изображения. Сжатие заключается в том, что после определенного предела данные просто игнорируются. При этом мелкие детали изображения утрачиваются, но в целом его качество остается приемлемым. Алгоритмы MPEG позволяют даже при удалении 99.5% потока видеоданных изображение может быть восстановлено с чрезвычайно высокой степенью достоверности. В результате технология MPEG позволяет достичь очень большой степени сжатия - до 180:1.
Как мы уже говорили, методы цифрового сжатия изображений делятся на несколько типов, каждому из которых соответствует определенный стандарт. В настоящее время стандарт MPEG является одним из наиболее распространенных и включает в себя две разновидности - MPEG-1 и MPEG-2. Каждая из них предназначена для определенного класса задач.
Стандарт MPEG-1 появился еще в 1991
году. При его разработке группа MPEG ставила перед
собой задачу создать алгоритм, который позволил
бы сжимать видеосигнал настолько, чтобы его
можно было передавать по низкоскоростным линиям
связи и записывать на стандартные компакт-диски.
Специалисты группы ориентировались на скорость
передачи данных менее 1.5 Мбит/с и на особенности
односкоростных дисководов CD-ROM. При этом
необходимо было достичь такого уровня качества,
который позволил бы сохранять и воспроизводить
полноэкранное видео с приемлемой частотой
кадров. Качество видеоизображений в системе MPEG-1
далеко от широковещательного, однако вполне
подходит для записи на компакт-диск и для
воспроизведения на компьютерном мониторе.
Стандарт MPEG-1 ориентирован на
разрешение, известное под названием SIF (Source Input
Format, формат источника сигнала) - 352х240 пикселов при
30 кадрах в секунду. Это лишь четверть
стандартного широковещательного телевизионного
разрешения, известного под названием CCIR 601 (720х480
пикселов). (Приведеные цифры относятся к
стандарту NTSC. Система MPEG совместима также с
европейским стандартом видеосигнала PAL.) Сигнал в
формате SIF можно воспроизводить с разрешением CCIR,
однако при этом необходимо интерполировать
дополнительные пикселы. Естественно, что детали,
утраченные при первоначальном кодировании, при
этом восстановить невозможно и качество
изображения существенно отличается от
оригинала. /4/ Стандарт MPEG-1 состоит из трех частей
- видео, аудио и системной. Системная часть
стандарта объединяет потоки видео- и
аудиоданных, синхронизируя их по времени.
Качество сигнала после декомпрессии
определяется тремя параметрами - количеством
цветов, количеством пикселов на кадр
(разрешением) и частотой кадров. Каждый из этих
параметров может быть улучшен за счет ухудшения
остальных, и все они могут быть ухудшены ради
увеличения степени сжатия данных. Хуже всего то,
что скорость передачи данных, обеспечиваемая
стандартными дисководами CD-ROM, не позволяет
получить изображения, сравнимого по качеству с
телевизионным радиовещательным стандартом.
Однако потенциальные возможности сжатия
изображений были по достоинству оценены
различными широковещательными сетями (например,
кабельным телевидением), и поэтому появилась
необходимость в новом стандарте, который
соответствовал бы требованиям массового
вещания. В конечном итоге это привело к созданию
группой MPEG стандарта MPEG-2.
Хочу сразу отметить, что этот стандарт разрабатывался не как замена, а как дополнение стандарта MPEG-1. Новый алгоритм сжатия изначально ориентировался на работу с разрешением CCIR 601 (704х480 пикселов в формате NTSC, 704х576 пикселов в формате PAL) и, как следствие, - на использование более высоких скоростей передачи информации. Разрабатывая новый стандарт, группа MPEG стремилась добиться более высокого качества изображения и поддержки различных форматов видеоданых. Алгоритм MPEG-2 ориентирован на скорость передачи данных в 6 Мбит/сек. Достижимая с его использованием степень сжатия позволяет разместить в одном аналоговом канале от шести до десяти цифровых. Как и его предшественник, этот стандарт состоит из трех ╚слоев╩ - видео, аудио и системного. Качество декодированного сигнала MPEG-2 значительно выше, чем в стандарте MPEG-1, однако это вовсе не означает, что стандарт MPEG-1 стал абсолютно бесполезным. Обе системы сжатия ╚являются независимыми технологиями, ориентированными на нужды различных потребителей и на разную скорость передачи данных╩ /6/. Формат MPEG-1 предназначен для низкоскоростных систем (например, для дисководов CD-ROM) и, вообще говоря, при невысоких скоростях передачи данных обеспечивает более высокое качество изображения, чем MPEG-2. Во многих случаях система MPEG-1 оказывается даже более эффективной, чем MPEG-2, за счет того, что при вполне приемлемом качестве позволяет разместить в одном аналоговом канале большее количество цифровых. Кроме того, ╚стандарт MPEG-1 является элементом стандарта MPEG-2, и любой декодер MPEG-2 может быть использован для декодирования изображений, сжатых по алгоритму MPEG-1╩ /7/. Это позволяет разработчикам систем хранения и передачи изображений выбирать тот стандарт, который наиболее точно соответствует их нуждам и требованиям.
Параллельно с разработкой стандарта MPEG-2 группа MPEG занималась также работой по созданию стандарта MPEG-3. Он ориентирован на использование в системах телевидения высокой четкости (HDTV, High Definition Television) с разрешением 1920х1080 при 30 кадрах в секунду. Необходимая скорость передачи данных составляет при этом от 20 до 40 Мбит/сек. Однако, в ходе ряда исследований было установлено, что в системах телевидения высокой четкости можно использовать уже созданные стандарты MPEG-2 и MPEG-1. После небольшой ╚доводки╩, связанной с поиском оптимального соотношения между качеством изображения и скоростью передачи данных, в качестве стандарта для систем телевидения высокой четкости был принят алгоритм MPEG-2. /8/ Стандарт MPEG-3 в настоящее время не применяется.
В сентябре 1993 года в Брюсселе
началась работа над новой инициативой группы MPEG -
стандартом MPEG-4. При этом ставилась задача
достичь приемлемого качества изображения при
как можно меньшей скорости передачи информации.
Для этого потребовалось разработать ряд
принципиально новых алгоритмов сжатия. Новый
стандарт ориентирован на разрешение 174х144
пиксела при 10 кадрах в секунду и позволит
передавать данные со скоростью от 4800 до 64,000
бит/сек. Этот стандарт откроет великолепные
возможности для создания целого ряда
чрезвычайно интересных приложений -
интерактивной мобильной мультимедиа-связи,
видеотелефонов, электронных газет,
мультимедиа-почты, игр и многих других. /9/ В
настоящее время этот стандарт все еще находится
на этапе разработки. Предполагается, что он будет
официально принят в ноябре 1998 года.
Говоря о различных стандартах MPEG, чрезвычайно
важно помнить о том, что эти стандарты описывают
главным образом декодеры, точнее - поток данных,
необходимый для того, чтобы MPEG-совместимое
устройство могло преобразовать его в
изображение. Качество сигнала определяется
устройством кодирования, а выбор подходящего
декодера предоставляется на усмотрение
пользователя.
Несмотря на чрезвычайно
высокие темпы развития, эта технология все еще не
вышла из ╚младенческого╩ возраста. Это, однако,
не мешает ее активному применению в системах
передачи аудио- и видеоинформации. Стандарт MPEG
стал наиболее распространенным за счет того, что
он является единственным промышленным
стандартом, который ╚позволяет воспроизводить
качественный аудио- и видеосигнал при скорости
передачи данных, обеспечиваемой стандартными
дисководами CD-ROM (150 Кб/сек) и линиями T-1 (1.544
Мб/сек)╩ /10/.
Помимо высокого технического уровня,
существует еще три причины, которые обусловили
широкое распространение этого стандарта.
Во-первых, это огромные средства, вложенные
крупнейшими электронными корпорациями в
развитие технологии видео компакт-дисков.
Предполагается, что эта технология постепенно
полностью вытеснит современные аналоговые
средства записи и воспроизведения
видеоизображений. Типичное устройство для
воспроизведения видеодисков ╚поддерживает
воспроизведение файлов в формате MPEG-1 и стоит
всего лишь на сто долларов дороже стандартного
плэйера для аудиодисков╩ /11/.
Во-вторых, система MPEG используется в
большинстве современных систем цифрового
телевидения - в частности, в огромной спутниковой
системе Hughes/RCA и в ряде систем ╚видео по запросу╩,
разработанных фирмой Bell /12/.
В-третьих, стандарт MPEG является
основным в компьютерной промышленности - на него
ориентируется все большее количество приложений
и уже сегодня существует более 50 моделей
аппаратных декодеров MPEG для различных моделей
компьютеров. Ни одна из систем сжатия данных не
применяется в широковещательной промышленности
так широко, как MPEG.
Несмотря на все ограничения стандарта
MPEG-1, кабельные и широковещательные компании
используют его не менее широко, чем MPEG-2. При этом
область его применения не ограничивается только
тестовыми приложениями, для оценки и проверки
возможностей цифрового сжатия изображений.
Многие кабельные компании экспериментируют с
передачей данных в формате MPEG-1, предполагая
использовать этот стандарт для трансляции
различных коммерческих программ, качество
которых может быть несколько ниже, чем качество
видеофильмов, спортивных передач и других важных
телепрограмм /14/.
В начале 1995 года фирма KRON, являющаяся
филиалом компании NBC, начала применять
компрессию в формате MPEG-1 при трансляции передач
в районе города Сан-Франциско. Использующаяся
при этом технология позволяет производить
сжатие телепрограмм ╚на лету╩, то есть
непосредственно во время их трансляции. Сжатый
сигнал одновременно передается на несколько
╚приемников╩, которые выполняют его
декомпрессию и затем транслируют на небольшое
расстояние традиционными методами (15). При этом
отпадает необходимость в качественных
широкополосных каналах связи (сигнал в формате
MPEG можно передавать даже по обыкновенной
телефонной линии), и кроме того появляется
возможность сохранения сигнала для его
последующей ретрансляции.
Однако наиболее перспективным в
области цифрового телевидения представляется
все-таки стандарт MPEG-2. Его возможности позволяют
не только расширить пропускную способность уже
существующих и разрабатывающихся каналов связи,
но и открывают широкое поле для внедрения
принципиально новых систем и услуг - в частности,
долгожданной 500-канальной системы кабельного
телевидения. Применение цифрового сжатия
изображений экономит миллионы долларов,
расходующихся на оплату
спутников-ретрансляторов, так как полосы
пропускания одного несжатого канала вполне
достаточно для передачи десяти сжатых цифровых
каналов. Технология MPEG-2 используется не только
вещательными корпорациями, но и телефонными
компаниями, которые занимаются предоставлением
интерактивных услуг. В частности, фирма Bell Atlantic
разработала на основе этой технологии систему
цифровой трансляции изображений и ряд
коммерческих интерактивных видеосистем.
Аналогичные системы разрабатываются компаниями
US West, NYNEX, Ameritech и Pacific Bell, а также несколькими
фирмами, работающими в области кабельного
телевидения.
С точки зрения цифрового телевидения и распространения стандарта MPEG этот год был чрезвычайно важным. В широковещательной промышленности начался постепенный переход на цифровые системы, затронувший не только крупные трансляционные компании, но и небольшие кабельные сети и фирмы. При этом можно было наблюдать тесное сотрудничество между отдельными фирмами, зачастую представляющими совершенно различные области потребительского рынка. Начавшееся совмещение широковещательных, компьютерных и телекоммуникационных технологий направлено на обеспечение быстрой и эффективной доставки конечному пользователю различных видео- и аудиопрограмм. При этом наряду с объединением усилий различных фирм наблюдается и всплеск конкуренции между различными секторами рынка. До недавнего времени основными потенциальными пользователями технологии MPEG были компании кабельного телевидения. Сегодня к ним присоединились также широковещательные компании, а также местные телефонные фирмы, которые активно внедряют различные интерактивные видеосистемы. Широковещательная промышленность двигается в сторону цифровой технологии, и стандарты MPEG являются на этом пути ее постоянными спутниками.