Уровни I, II и III стандарта МРЕG




Международная организация по стандартизации (International Organization for Standartization — ІSО) и экспертная группа по вопросам движущегося изображения (Motion Picture Experts Group — МРЕG) разработали стандарт аудиосжатия для сигна­ла, синхронизированного с сжатым видеосигналом, известный как МРЕG. В этой схеме объединены свойства MUSICAM (Masking pattern adaptive Universal Subband Integrated Coding And Multiplexing — универсальные интегральные средства кодирова­ния и уплотнения по поддиапазонам с маскировкой и адаптацией к кодограмме) и АSРЕС (Adaptive Spectral Perceptual Entropy Coding — адаптивное спектрально-восприимчивое кодирование энтропии). В схеме использованы три уровня (коды) увеличивающейся сложности и улучшающейся субъективной производительности, входные частоты дискретизации равны 32, 44,1 и 48 кГц, а биты на выход подаются со скоростью от 32 до 192 Кбит/с (монофонический канал) или со скоростью от 64 до 384 Кбит/с (стереофонический канал). Стандарт поддерживает режим работы единст­венного канала, стереорежим, двойственный режим работы канала (для двуязычных аудиопрограмм) и дополнительный совместный стереорежим. В последнем режиме два кодера для левого и правого каналов могут поддерживать друг друга, используя общие статистики с целью снижения скорости передачи бит аудиосигнала, даже большего, чем это возможно при монофонической передаче [26].

Кодер действует в соответствии с моделью реального времени порога спектральной восприимчивости человека. Этот порог представляет собой зависящую от частоты границу или порог, который отмечает уровни звукового давления, ниже которых человеческое ухо не может воспринимать сигналы. Эта кривая, названная порогом остроты слуха, ге­нерируется во время слухового теста. Порог остроты обычно присутствует на уровнях амплитуды как функция спектрального положения и во многом подобен кривой спектра мощности. Этот порог представляет собой изменяющуюся во времени функцию кратко­временной спектральной плотности мощности и имеет локальные максимумы в соот­ветствии с тонами высокого уровня и тонообразными сигналами (называемыми тоналами). Повышение порога вследствие наличия сильных тоналов, приводит к локальной маскировке спектральных компонентов ниже нового порогового уровня. Спектральные компоненты сигнала, лежащие ниже порога слышимости, объявляются несущественны­ми и не кодируются в процессе сжатия. Сигналы, превышающие зависящий от частоты порог, кодируются с достаточной точностью, позволяющей удерживать ошибку аппрок­симации ниже уровня остроты. Этот процесс завершается делением спектра множеством узкополосных фильтров и присвоением достаточного числа бит для описания каждого выхода фильтра относительно его амплитуды, которая расположена выше порога. Таким образом, сигналу, в определенной полосе составляющему 30 дБ выше порога, будет при квантовании выделено 5 бит. В этом случае шум квантования падает ниже порога, так как отношение шум/сигнал квантования сократилось на 6 дБ на бит. Типичный график порога остроты представлен на рис. 13.38.

 

 

f(кГц)

Рис. 15.38. Порог остроты и маскировки


Кодер работает следующим образом. Стандартный 16-битовый аудиосигнал РСМ усе­кается и преобразуется в компоненты спектральной подполосы с помощью группы мно­гофазных фильтров, состоящей из 32 равномерно расположенных полосовых фильтров. Блок фильтра создается с помехами соседнего канала, превосходящими 96 дБ, — уровень, требуемый для подавления искажения восприимчивости, вызванного шумом квантования. Фильтрованные выходные сигналы выбираются с частотой Найквиста для каждой полосы пропускания диапазона частот. В декодере этот процесс обращается. Частота дискретиза­ции каждого многополосного фильтра увеличивается до частоты исходного сигнала источ­ника с помощью интерполирования сигналов подполосы, образованных на выходах поло­сы пропускания блока синтетических фильтров. На рис. 13.39 представлена блочная диаграмма аудиокодера и декодера уровней I и II стандарта.МРЕG.

На уровне III стандарта МРЕG/ІSО (МРЗ) достигается разрешение более высокой час­тоты, которое весьма точно соответствует критической разрешающей способности челове­ка. Это усовершенствованное деление достигается посредством дальнейшей обработки 32 подполосных сигналов с помощью перекрывающегося или усеченного 6-точечного или 18-точечного модифицированного дискретного косинус-преобразования (modified discrete cosine transform — МDСТ).

 

План лабораторных занятий



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-15 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: