Форматы передачи цифрового аудио

Цифровые форматы

В этой статье мы попробуем разобраться в том обилии цифровых протоколов и спецификаций, которые относятся к цифровому аудио.

Сразу следует оговориться: термин «цифровой формат» охватывает на самом деле различные типы форматов. Прежде всего, существуют форматы хранения цифровых аудиоданных. Они описываются в таких значениях, как частота дискретизации и разрядность, но также применяется спецификация, которая определяет действительное разрешение сигнала в процессе передачи данных и хранения. Кроме того, существуют различные форматы записи и передачи данных, каждый из которых несет закодированный аудиосигнал. При работе в «цифровом мире» приходится иметь дело не только с различными типами разъемов и протоколов передачи данных, но также и с различными методами записи, форматами носителя (ленты, диски и т.д.) и компьютерными архитектурами.

Форматы записи и форматы цифровых данных.

Здесь мы будем говорить о тех носителях, на которых сохраняются чистые аудиоданные (например, их можно хранить на ленте или в виде файла на жестком диске). Некоторые записывающие устройства и форматы файлов совместимы друг с другом. Это значит, что одно устройство может читать файлы, которые созданы на другом устройстве, без необходимости предварительно конвертировать эти данные. Однако такая совместимость встречается не во всех случаях, и тогда приходится выполнять конвертирование.

Конечно, можно передать цифровые аудиоданные из одного устройства в другое, т.е. переписать из одного в другое при помощи соответствующего цифрового интерфейса. Однако это далеко не всегда удобно. В этом случае будут переданы только чистые аудиоданные, но не будет произведено конвертирование компьютерного файла в тот тип, который является совестимым для того устройства, на котором мы собираемся продолжать работу. Это значит, что данные редактирования, микширования, воспроизведения, а также названия файлов и другая важная информация будут утеряны. При прямой переписи данных понадобиться также записывать паузы, имеющие на индивидуальных треках в исходном материале, и, следовательно, HD- рекордер будет неэффективно использовать свободное место на жестком диске.

Alesis ADAT

ADAT -магнитофоны позволяют записывают 8 аудиотреков на кассету S-VHS. Кассета проигрывается в 3 раза быстрее, чем обычная видеокассета, тем самым можно записать 40 минут аудио на 120-минутную кассету S-VHS. Все 8 треков записываются параллельно. Кассету сперва требуется отформатировать, т.е. записать на нее специальный таймкод, который обеспечивает точность синхронизации нескольких ADAТ- рекордеров, поддерживает функции автолокатора (автоматического поиска заданной точки) и редактирования, и отображает информацию, относящуюся к этой ленте. Вначеле идет 15-секундный заголовок, затем на ленту записывается 2 минуты информации, описывающей данные: это инструкция, которая относится к использованию устройства удаленного доступа BRC (Big Remote Control) Alesis ADAT. В эту информацию входит SMPTE off-set,, точки вставки (punch in и punch out}, время начала и т.д.

Исходно формат ADAT поддерживал разрядность 16 бит. Номинальная частота дискретизации равна 48 кГц. На новейших устройствах ее можно изменять в пределах от 40,4 до 50,8 кГц при помощи функции Varispeed ( эта функция используется для изменения скорости ленты, в связи с чем изменяется также высота тона, а следовательно, изменяется частота дискретизации). Более поздние модели (XT и др.) позволяют непосредственно работать с частотой дискретизации 44,1 кГц.

Формат ADAT II поддерживает запись с разрядностью 20 бит и тем самым обеспечивает более широкий динамический диапазон, но, к сожалению, ленты, записанные в новом формате, не обязательно совместимы с 16-битными ADAT -магнитофонами. Чтобы проигрывать эти ленты на старых ADAT -магнитофонах, потребуется загрузить их при помощи ADAT -интерфейса (и использовать при этом алгоритм дизеринга, чтобы конвертировать 20-битныисиг сигнал в 16-битный).

Tascam DA-38/88/98

В цифровых рекордерах фирмы Tascam также выполняется запись восьми треков на видеокассету, но при этом используется формат Hi-8 (кассета меньшего размера с большей плотностью данных). На 120-минутную кассету можно записать 108 минут аудиоматериала. Аудио можно записывать параллельно, т.е. на все треки одновременно. Как и в случае ADAT, ленту предварительно нужно отформатировать на рекордере. Это позволяет синхронизировать несколько рекордеров между собой. Если необходимо использовать синхронизацию по таймкоду, то понадобится рекордер, оборудованной картой Sync (DA-88/98, Sony РСМ 800). Такая карта позволяет загружать таймкод SMPTE или EBU на кассету. Таймкод записывается в отдельную служебную область на кассете, которая не используется для аудиоданных. Таким образом, если вам необходимо использовать таймкод, вам не приходиться жертвовать одной из аудиодорожек.

Благодаря преимуществам этого таймкода можно синхронизировать рекордер с другими устройствами (например, с видеорекордером). Аудиоданные записываются с разрядностью 16 бит и частотой дискретизации 44,1 или 48 кГц. Varispeed также входит в число функции устройства.

Рассмотрим теперь компьютерные форматы сохранения аудиоданных.

Wave

формат Wave был разработан фирмами Microsoft и IBM и является стандартом для Windows PC. Файлы Wave имеют расширение *'.wav.BcQ современные аудиопрограммы, которые работают на PC, читают и записывают этот формат. Программы, работающие на других платформах (например, Macintosh}, также работают с форматом Wave (либо напрямую, либо при помощи конвертирования).

Спецификация Wave определяет, что число каналов и частоту дискретизации можно задать в конкретном файле. Эти значения не заданы по умолчанию. Можно сохранять монофонические и многокальные файлы в формате Wave. Однако в большинстве случае вы будете работать с моно или стереофайлами. Многоканальные записи обычно распределяются по нескольким файлам, поскольку в ином случае нельзя было бы отредактировать аудиоданные независимо друг от друга.

Файл формата Wave также может содержать специальные данные (например, точки «кольца»), которые нужны для определенных задач и поддерживаются соответствующими программами. Чтобы уменьшить размер файла, предусмотрено несколько стандартов сжатия данных — например, ADPCM (Adaptive Differential Pulse Code Modulation), который является наиболее распространенным из алгоритмов сжатия.

AIFF

Формат AIFF (Audio Interchange File Format) был разработан фирмой Apple для обмена данными между различными приложениями. Возможность создавать и проигрывать файлы AIFF исходно была фиксированной функцией операционной системы Macintosh. В настоящее время многие приложения, работающие на платформе Windows, умеют работать с форматом AIFF. На Macintosh в имени файла не всегда показано расширение (*. aif), поскольку структура файла Macintosh позволяет записывать информацию о формате в специальный блок данных. На PC аудиофайлы в формате AIFF обязательно имеют соответствующее расширение.

AIFF является очень гибким форматом. Внутри файла можно задать число каналов, разрядность и частоты дискретизации. Кроме того, дополнительную информацию можно записать в секторы файла, которая относится к программе, в том числе маркеры, информацию о высоте тона и точки «кольца». Файлы AIFF бывают монофоническими или стереофоническими. Многоканальный формат не поддерживается большинством приложений.

AIFF -файлы также можно компрессировать для уменьшения объема. В этом случае придется иметь дело с потерей качества. Компрессированные файлы называются AIFF -C («С» обозначает «компрессированный»).

AIFF, а также Sound Designer II, являются стандартными форматами аудиофайлов на Macintosh и применяются для записи цифрового звука на жесткий диск, редактирования и т.д. Большинство приложений, работающих на Macintosh, обрабатывают оба формата одинаково. В большинстве случае их можно применять в одной программе одновременно (в случае, если они имеют одинаковую частоту дискретизации). Если вы собираетесь обмениваться данными между Macintosh и PC, имейте в виду, что формат AIFF более предпочтителен, так как читается всеми современными аудиоприложениями. Кроме того, многие приложения, работающие на Macintosh, теперь предлагают функцию экспорта в формате Wave, что облегчает обмен данными с PC.

Sound Designer II

Формат Sound Designer II (SD II) был разработан компанией Digidesign. Его предшественник Sound Designer I был предназначен исключительно для монофонических файлов и оптимизирован для требований программного обеспечения Digidesign. Он поддерживал 16-битную разрядность без компрессии данных и частоту дискретизации 44,1 кГц.

Sound Designer II стал следующим этапом развития формата Sound Designer. Он позволяет задавать частоту дискретизации и разрядность. Файлы в формате SD II имеют расширение SD2, которое не обязательно показано в имени файла. Эта информация на Macintosh сохраняется в отдельных блок данных.

Обычно аудиоданные в формате SD II записываются в виде моно или стереофайла. Стереоверсия теперь читается в программе Pro Tools фирмы Digigesign, начиная с версии 5; до этого с Pro Tools были совместимы только монофонические файлы SD II. Помимо чистых данных, формат SD II может содержать дополнительную информацию, например, какой сектор аудиофайла задан в качестве региона. На Macintosh регионы читаются большинством аудиоприложений.

Формат MPEG

Аудиофайлы MPEG имеют расширение *.тр, которое заканчивается цифрой, обозначающей так называемый «слой». Этот формат был разработан двумя комитетами по стандартам — ISO (International Organization for Standardization) и IEC (International Electro-Technical Commission). Они заложили основу для этого формата и передали дальнейшую ее, разработку в MPEG (Moving Pictures Experts Group). Группе MPEG было поручено разработать стандарты кодирования для видео и аудиоданных. Различные стандарты MPEG применяются в различных приложениях.

MPEG-1 был ратифицирован в ноябре 1992 года. Он был разработан преимущественно для целей сжатия аудио и видеофайлов до такого объема, который мог бы уместиться на CD-Rom. В то время стал интенсивно развиваться Интернет, и такой способ уменьшения объема данных стал представлять большой интерес для разработчиков и пользователей веб-приложений. Стандарт MPEG-1 обеспечивает сжатие данных для видео и аудио и применяет сложный алгоритм под названием Perceptual Coding, который работает на основе психоакустики.

MPEG-2 является продолжением стандарта MPEG-1 и применяется для передачи телевизионных и HDTV -сигналов (High-Definition Television). Что немаловажно, при высокой степени сжатия поддерживается достаточно хороший уровень качества: качество видео значительно лучше, чем в результате кодирования MPEG-1. Стандарт также определяет применение 5. 1 Surround Sound для аудио. MPEG-2 является форматом для сжатия видеоданных в целях записи на DVD -диск. В Европе аудиоданные кодируются в соответствии со стандартом видео MPEG-2. В США для аудио применяется цифровой многоканальный стандарт DolbyAC-3. Стандарта MPEG-3 на самом деле не существует. Изначально его планировали для приложений HDTV, с использованием MPEG-2 в качестве основы, но разработчикиобнаружили, что при некоторых модификациях, MPEG-2 способен достичь таких же результатов, как и MPEG-3. Поэтому дальнейшие разработки MPEG-3 были прекращены.

В настоящее время начал широко распространяться стандарт MPEG-4, который, помимо улучшенного качества видео и аудио, поддерживает также интерактивную работу с данными.

Стандарты MPEG-1 и MPEG-2 определяют различные слои для кодирования аудиоданных. Чем выше порядок слоя, тем более высокие требования предъявляются к процессам кодирования и декодирования, и тем более интенсивно происходит сжатие данных.

Layer I является более «честным» по отношению к исходному сигналу, но требует более высокой скорости передачи данных — около 384 Кбайт/с для стерео (для CD требуется 1,41 Мбайт/с). Он разработан преимущественно для записи исходного материала. Layer II имеет более сложный процесс кодирования сигнала, а в остальных аспектах похож на Layer I. Специальный стереорежим (Layer IIA) служит для дополнительного уменьшения скорости передачи данных. Для монофонического канала применяется скорость от 96 до 128 Кбайт/ с. Стереорежим более эффективен на скоростях от 128 до 192 Кбайт/с. Layer III отличается от всех предыдущих слоев. Он основывается на совершенно другой концепции. При скорости 64 Кбайт/с для моноканала он позволяет получить наиболее высокий уровень сжатия данных, при этом из всех трех слоев он обеспечивает наименее «честное» воспроизведение звука. Тем не менее, на очень низких скоростях Layer III создает меньше искажений, чем два других слоя на эквивалентных скоростях. Именно поэтому Layer III является идеальным для сжатия аудиоматериала, предназначенного для распространения в Интернет. Благодаря его появлению моментально появились радиостанции, вещающие в формате тр3. Имеется большое количество алгоритмов кодирования и декодирования для PC и Macintosh, которые выпускаются в бесплатном и условно бесплатном виде. Что очень важно, при компрессии данных в MPEG можно улучшать процесс кодирования, и при этом для воспроизведения такого файла не потребуется новый декодер. В случае с MPEG разница в качестве звука является в основном результатом работы программы кодирования, в меньшей степени она зависит от факторов, которые определяются декодерами.

Аудиоспецификация MPEG-2, как правило, идентична аудиоспецификации MPEG-1, хотя допускается применение других процессов кодирования. Основное различие между двумя спецификациями в смысле аудио заключается в поддержке формата 5. 1 Surround (левый, центр, правый, левый Surround, правый Surround и субвуфер). Уменьшение данных Layer II используется именно до этого предела. Оно является идентичным стереформату IIА, в котором все 6 каналов компрессируются одновременно. Это обеспечивает общую скорость передачи данных 384 Кбайт/с.

Сжатие аудиосигналов в формате 5. 1 являются обратно совместимым со стандартом. MPEG-1 (в том смысле, что данный декодер MPEG-1 может, по меньшей мере, декодировать стереоинформацию, т.е. левый и правый каналы сигнала Surround).

Другие форматы

Те форматы, которые мы рассмотрели выше, являются наиболее важными для записи на жесткий диск, но помимо них существует достаточно широкое количество других форматов, используемых для цифровой записи. Некоторые из них являются специфичными для компьютера, другие — для приложений. Все они были разработаны в те времена, когда компьютеры постепенно превращались из огромных машин, занимающих несколько комнат, в настольное устройство. Приведем несколько примеров форматов аудио, которые работали на тех компьютерах: Amiga IFF, Sun/NeXt. (мю)/aw (формат, который до сих пор применяется в Интернет-приложениях), Ircam. sf, Psion sound (.wve) и т.д.

Форматы передачи цифрового аудио

В отличие от форматов файлов, эти форматы представляют собой стандарты, которые определяют правила для передачи данных между цифровыми аудиосистемами в реальном времени. По какой причине появились эти форматы? Прежде всего необходимо было описать определенные требования (например, числ^оканалов, которое должно передаваться одновременно), но, кроме того, имелся чисто коммерческий фактор. Несмотря на то, что производители оборудования исторически пытались найти самое простое решение (т.е. такое, которое им легче всего было бы воплотить в жизнь), тем не менее производитель А не весьма охотно использует формат производителя В, в особенности, если они работают в одной и той же области. В чем разница между аналоговыми и цифровыми цепями? Аналоговая цепь несет аудиосигнал в виде электрического напряжения. Это напряжение усиливается и воспроизводится через динамик, тогда сигнал становится слышимым.

Для аналоговых цепей существуют определенные электрические нормы (номинальные уровни и т.д.). В соответствии с ними выпускаются симметричные и несимметричные кабели, а также разъемы. В случае с аналоговыми цепями, если данный разъем не соответствует данному кабелю, всегда можно взять паяльник, припаять к кабелю другой разъем, и проблема решена. В случае с цифровыми цепями это не работает. Дело в том, что цифровые цепи имеют другую электрическую спецификацию и разъемы. Но это еще не все. Следует помнить, что цифровой сигнал на самом деле несет не аудиосигнал, а только его цифровое представление. Качество аудио не может быть утеряно непосредственно из-за электрических проблем (наводки и т.п.), однако плохие разъемы могут привести к потере данных в цифровом сигнале и возникновению слышимых щелчков или провалов в звуке.

Собственно передача данных выполняется в соответствии с правилами, которые описаны в данном протоколе программы передачи данных. Цифровые устройства, скоммутиро-ванные между собой, должны быть способны понимать этот протокол. Даже если у вас имеется переходник для данного кабеля, это еще не все: вам потребуется конвертер форматов, который переводит формат передачи данных одного устройства в другой, который может понять второе устройство.

AES/EBU

Формат AES/EBU был разработан организациями, носящими то же название (Audio Engineering Society/European Broadcasting Union), и является независимым от производителя. Это профессиональный формат, ставший широко распространенным стандартом.

В формате AES/EBU два канала аудио передаются по кабелю, длина которого может составлять до 100 метров, и при этом не требуются дополнительные компоненты. Стандартные разъемы для симметричных кабелей выполняются на разъемах XLR. Частота дискретизации свободно назначается, но обычно применяются значения 32, 44,1 и 48 кГц.

Формат AES/EBU поддерживает разрядность до 24 бит. Информация о синхронизации Wordclock передается вместе с сигналом, поэтому подключенное устройство может работать синхронно с мастер-устройством (т.е. тем устройством, из которого выводится Word-clock). Если понадобится передавать более двух каналов, придется использовать несколько кабелей.

S/PDIF

Формат S/PDIF был разработан совместно фирмами Sony и Philips, и это отражено в его названии (Sony/Philips Digital Interface). Он имеет много общего с форматом AES/EBU, но в нем применяются «потребительские» разъемы RCA вместо профессиональных XLR, а также несимметричные кабели. Сигнал в формате S/PDIF также можно передавать по оптическому кабелю Toslink.

В некоторых случаях вам может повезти, и вам удастся подсоединить кабель S/PDIF к адаптеру и далее напрямую к входу или выходу AES/EBU. Иногда это может работать, но далеко не всегда. В протоколах данных S/PDIF и AES/EBU существует различие, которое исключает полную совместимость между ними.

Формат S/PDIF также передает данные по двум каналам через один кабель, длина которого не может превышать 10 метров. Спецификация для передачи данных в основном такая же, как в случае с форматом AES/EBU, хотя определенная информация о статусе сигнала отличается. Например, этот формат включает данные для защиты от копирования SCMS (Serial Copy Management System), которая предназначена для того, чтобы исключить цифровое копирование (с одного DAT -магнитофона на другой и т.д.).

SDIF-2

SDIF-2 (Sony Digital Interface Format) был разработан специалистами Sony и использовался в основном для выпускаемых этой фирмой CD-рекордеров, предназначенных для мастеринга (модели 1610 и 1630). Он нередко называется также форматом 1610, но его уже достаточно трудно встретить в наши дни.

В SDIF -2для передачи данных применяются три кабеля BNC: по одному для каждого стерео канала и третий — для синхронизации Wordclock. Теоретически этот формат поддерживает любую частоту дискретизации, хотя, как правило, используются стандартные величины 32, 44,1 и 48 кГц. Разрядность может быть до 20 бит.

ADAT Lightpipe [ADI]

Alesis Digital Interface, также известный как ADAT Interface, был разработан фирмой Alesis в качестве формата многоканальной передачи данных по «цифре» для ADAT -рекордеров. Он очень широко распространен и используется в устройствах, выпускаемых не только фирмой Alesis: в том числе его можно встретить на микшерных пультах, аудиокартах и синтезаторах. Можно сказать, что сейчас формат ADAT является наиболее распространенным многоканальным форматом.

ADAT Lightpipe передает 8 каналов по одному оптическому кабелю Toslink (такой же кабель применяется для оптической передачи S/PDIF сигналов). Номинальная частота дискретизации равна 48 кГц (поскольку она является рабочей частотой для ADAT -магнитофонов), другие варианты тоже возможны. Максимальная разрядность составляет 24 бит, хотя не каждое аппаратное устройство поддерживает такую длину слова, некоторые работают только с 20-битными сигналами. Синхронизация Wordclock посылается вместе с аудиоданными.

TDIF

Формат TDIF (Tascam Digital InterFace) является ответом фирмы Tascam на ADAT -интерфейс фирмы Atesis. Он тоже был разработан специально для собственного продукта Tascam — MDM -рекордера DA-88. В настоящее время он также используется в цифровых картах, микшерных пультах, но все же он распространен не столь широко, как ADAT -интерфейс. Сигнал TDIF передает 8 каналов в обе стороны по одному кабелю. Это означает, что одного соединения при помощи кабеля между DA-88 и микшерным пультом достаточно для двустороннего обмена данными, и это очень удобно. Используются разъемы DB-25 (этот разъем чаще встречается в компьютерном мире, а не в аппаратных цифровых рекордерах). В противоположность оптической цепи ADAT -интерфейса, в TDIF применяется электрическая цепь. Сигнал Wordclock посылается отдельно по кабелю BNC, если требуется, чтобы отправляющее устройство (обычно это DA-88 или DA-98) служило в качестве «wordclock master». «Младший брат» этих устройств — DA-38 — не оборудован выходом wordclock и поэтому служит только в качестве устройства «slave».

FireWire

В последнее время все большую популярность приобретает стандарт FireWire (другое называние — IEEE 1394). Сперва появились цифровые видеокамеры, которые могли «общаться» с компьютером по протоколу FireWire. Фирма Apple выпустила первые компьютеры Power PC, оборудованные портами FireWire. несколько лет назад.

Этот стандарт первоначально был разработан фирмой Apple и поддерживал скорость передачи данных 400 Мбит в секунду (примерно 50 Мбайт/с). Кабель имеет 6 проводов, четыре из которых используются для собственно передачи данных (2 пары по 2 провода), остальные служат для подачи питания на подключенные устройства. Официально длина кабеля не может превышать 4,5 метра, однако неофициально можно использовать более длинный кабель (при этом понижается эффективность использования пропускной способности 400 Мбит/с).

Недавно фирма Apple выпустила новые компьютеры G4, которые оборудованы портами FireWire с пропускной способностью 800 Мбит/с. FireWire быстро стал популярным форматом. Это очень быстрый последовательный интерфейс, который превысил показатели SCSI, который ранее считался «королем скорости». FireWire позволяет, подключать различные устройства — рекордеры, компьютеры, жесткие диски, видеокамеры — при помощи одного и того же стандартного кабеля.

Фирма Yamaha разработала спецификацию для использования FireWire совместно, с электронными музыкальными инструментами. Спецификация носит название “mLan” и обеспечивает передачу по интерфейсу FireWire до 100 аудиоканалов с качеством CD, а также несколько сотен MIDI -каналов.

Форматы передачи цифрового аудио

Поиск по сайту