Спецификация формата данных MIDI

MIDI-данные представляют собой сообщения, или события (events), каждое из которых является командой для музыкального инструмента. Стандарт предусматривает 16 независимых и равноправных логических каналов, внутри каждого из которых действуют свои режимы работы; изначально это было предназначено для одно-тембровых инструментов, способных в каждый момент времени воспроизводить звук только одного тембра - каждому инструменту присваивался свой номер канала, что давало возможность многотембрового исполнения. С появлением многотембровых (multi-timbral) инструментов они стали поддерживать несколько каналов (современные инструменты поддерживают все 16 каналов и могут иметь более одного MIDI-интерфейса), поэтому сейчас каждому каналу обычно назначается свой тембр, называемый по традиции инструментом, хотя возможна комбинация нескольких тембров в одном канале. Канал 10 по традиции используется для ударных инструментов - различные ноты в нем соответствуют различным ударным звукам фиксированной высоты; остальные каналы используются для мелодических инструментов, когда различные ноты, как обычно, соответствуют различной высоте тона одного и того же инструмента.

Поскольку MIDI-сообщения представляют собой поток данных в реальном времени, их кодировка разработана для облегчения синхронизации в случае потери соединения. Для этого первый байт каждого сообщения, называемый также байтом состояния (status byte), содержит "1" в старшем разряде, а все остальные байты содержат в нем "0" и называются байтами данных (data bytes). Если после получения всех байтов данных последнего сообщения на вход приемника поступает байт, не содержащий "1" в старшем разряде - это трактуется как повторение информационной части сообщения (подразумевается такой же первый байт). Такой метод передачи носит название "Running Status" и широко используется для уменьшения объема передаваемых данных - например, передается один байт команды "Controller Change" с нужным номером канала, а затем - серия байтов данных с номерами и значениями контроллеров для этого канала.

MIDI- сообщения делятся на канальные - относящиеся к конкретному каналу (8n nn vv - Note Off (выключение ноты), 9n nn vv - Note On (включение ноты) и т.д.), и системные - относящиеся к системе в целом (F0 - System Exclusive (SysEx, системное исключительное сообщение) F1 – резерв и т.д.)

На основе MIDI позднее был разработан стандарт GM (General MIDI - единый MIDI – 127 возможных инструментов с фиксированными порядковыми номерами), ставящий условия обязательной совместимости инструментов и интерпретации номеров программ и контроллеров, а затем и другие стандарты (GS, XG), расширяющие GM. Однако общность инструментов внутри каждого стандарта подразумевает только основные звуковые характеристики. "Одинаковые" тембры на различных инструментах почти всегда имеют различную окраску, динамику, яркость, громкость по умолчанию и другие особенности, а "синтетические" тембры могут совершенно отличаться друг от друга. Кроме этого, у разных инструментов различается зависимость характера звука от силы удара по клавише, динамика работы MIDI-контроллеров, положения контроллеров по умолчанию и прочие "тонкие" параметры. Поэтому MIDI-партитура, подготовленная для конкретного инструмента, на других инструментах (даже внутри стандарта) часто звучит совершенно по-другому, и это необходимо учитывать при переносе партитур с между инструментами различных моделей.

Инструменты, поддерживающие стандарты GM и GS, почти всегда имеют дополнительные средства управления синтезом и обработкой звука, расширяющие рамки стандарта. При этом используемые способы управления, как правило, сохраняются внутри одной линии инструментов и внутри инструментов одного производителя.

Интерфейc MIDI позволяет задейcтвовать ресурсы процеccора и памяти компьютера для применения в облаcти музыки. Интерактивные cвойcтва мыши и диcплея предоcтавляют неограниченные возможноcти по оранжировке музыкальных произведений. Например, с помощью устройства задания последовательности ПО (секвенсера) можно запиcать музыкальный отрывок, проигранный на инcтрументах c MIDI-интерфейcом, а затем в графичеcком виде отобразить звуковую и управляющую информацию. В поcледующем эту информацию можно как угодно изменять даже во время воcпроизведения музыки.

Завоевывает популярность концепция совместного применения MIDI и методов дискретизации, получившая название Harddisk Recording. В одной и той же пользовательcкой оболочке можно одновременно запиcывать, обрабатывать и воcпроизводить оцифрованные звуковые cигналы и данные формата MIDI. В процессе обработки можно поочередно обращатьcя к различным типам данных, по cвоему уcмотрению их комбинировать и без вcяких ограничений вcтавлять в музыкальный отрывок. При этом оригинал остается в целости и cохранности, так как в него вcтавляютcя только метки (так называемые Cue Points), которые показывают начало и окончание требуемых изменений. Наиболее удобно применять этот метод в кино для cинхронизации музыки и изображения. Очень интенcивно иccледуютcя возможноcти повышения уровня выразительноcти электронной музыки. В арcенале иcполнителей на традиционных инcтрументах имеютcя разнообразные cредcтва экспрессии (вибрато, флажолет и т. п.), которые невозможно реализовать на клавиатуре cинтезатора.

Применения MIDI

Основное применение MIDI - хранение и передача музыкальной информации. Это может быть управление электронными музыкальными инструментами в реальном времени, запись MIDI-потока, формируемого при игре исполнителя, на носитель данных с последующим редактированием и воспроизведением (так называемый MIDI-секвенсор), синхронизация различной аппаратуры (синтезаторы, ритм-машины, магнитофоны, блоки обработки звука, световая аппаратура, дымогенераторы и т.п.).

Устройства, предназначенные только для создания звука по MIDI-командам, не имеющие собственных исполнительских органов, называются тонгенераторами. Многие тон-генераторы имеют панель управления и индикации для установки основных режимов работы и наблюдения за ними, однако создание звука идет под управлением поступающих MIDI-команд.

Устройства, предназначенные только для формирования MIDI-сообщений, не содержащие средств синтеза звука, называются MIDI-контроллерами. Это может быть клавиатура, педаль, рукоятка с несколькими степенями свободы, ударная установка с датчиками способа и силы удара, а также - струнный или духовой инструмент с датчиками и анализаторами способов воздействия и приемов игры. Тонгенератор с достаточными возможностями по управлению может весьма точно воспроизвести оттенки звучания инструмента по сформированному контроллером MIDI-потоку.

Для хранения MIDI-партитур на носителях данных разработаны форматы SMF (Standard MIDI File - стандартный MIDI-файл) трех типов:

0 - непосредственно MIDI-поток в том виде, в каком он передается по интерфейсу.

1 - совокупность параллельных "дорожек", каждая из которых обыч- но представляет собой отдельную партию произведения, исполняемую на одном MIDI-канале.

2 - совокупность нескольких произведений, каждое из которых состоит из нескольких дорожек.

В основном применяется формат 1, позволяющий хранить одно произведение в файле.

Кроме MIDI-событий, файл содержит также "фиктивные события" (Meta Events), используемые только для оформления файла и не передаваемые по интерфейсу - информация о метрике и темпе, описание произведения, названия партий, слова песни и т.п.

Что касается устройств MIDI-ввода, то характерным их представителем является MIDI-клавиатура. Это клавиатура, похожая на синтезаторную (4-6) октав, содержащая схему пpеобpазования воздействий в MIDI-сообщения и адаптеp с выходом MIDI Out.

MIDI-клавиатура не способна звучать самостоятельно, она использует в качестве синтезатора звуковую карту компьютера. Иногда на MIDI-клавиатуре размещены некоторые дополнительные переключатели, например, глиссандо или вибрато. Большинство MIDI-клавиатур производится фирмой Fatar (под своей маркой их продает даже фирма Roland). Клавиатура, правило, работает от электрической сети или от батареек. Однако в некоторых моделях, например MIDI Composer от фирмы QuickShot, предосмотренно питаниеот звуковой платы через разъем джойстика/MIDI. Многие сегодняшние клавиатуры – динамические, т.е. громкость производимого звука зависит от силы удара по клавише. Интересным аксессуаром является педаль, которая иногда входит в комплект поставки клавиатуры. Это аналог правой педали рояля, увеличивающей продолжительность звучания и придающей ему выразительность и дополнительные оттенки. Для подключения клавиатуры или синтезатора к звуковой карте компьютера необходим специальный кабель. С одного конца он оснащен круглым пятиштырьковым разъемом (DIN – connector), а сдругой чаще всего подключается к гнезду MPU/401 (совмещенному с разъемом для джойстика) или к специальному адаптеру.

Преобразователи MIDI позволяют иcпользовать и обычные инcтрументы, например cакcофон, гитару или аккордеон, в качеcтве уcтройcтв управления электронными генераторами звука. Таким образом, параметры cинтеза звука могут напрямую задаватьcя типичными приемами игры на конкретном инcтрументе. Поэтому, кроме MIDI-клавиатуры используютя совершенно разнообразные инcтрументы и приемы игры. Так, лазерная арфа позволяет c помощью лазерной оптики транcформировать движения пальцев в данные формата MIDI. С помощью cпециального мундштука, получившего название Breath Controller, музыкант, играющий на духовом инcтрументе, cилой выдыхаемой струи воздуха может воздейcтвовать на определенные MIDI-параметры. Сущеcтвует уcтройcтво, транcформирующее в команды управления жеcты. Оно закрепляетcя на внешней cтороне киcти, реагирует на ее движения и может управлять вcей аппаратурой на cцене.

Подробнее, на примере MIDI-гитары - явлении настолько новом и малоизученном, что все его возможности до сих пор еще неизвестны. Возникновение первых подобных гитар можно отнести к далеким 70-м годам, когда собственно MIDI еще и не существовало, как и цифровых инструментов. Первые гитарные синтезаторы были чисто аналоговыми устройствами, и цены их были баснословными. Тут следует сделать небольшое отступление от темы, и объяснить разницу между гитарными синтезаторами и гитарными процессорами. Процессорами принято обычно называть устройства обработки звука, которые определенным образом воздействуют и видоизменяют входной сигнал и не имеют собственного источника звуковых колебаний. Под синтезаторами подразумеваются устройства, имеющие внутри источник звука, который управляется внешним контроллером. Таким образом, MIDI-гитара строго говоря гитарой не является, так как колебания ее струн используются только для управления звуками синтезатора. Скорее это некий гитарообразный контроллер, имеющий вид обычной гитары.

Современная MIDI-гитара представляет собой обычную гитару, на которой установлен специальный полифонический звукосниматель, то есть звукосниматель, передающий отдельный сигнал с каждой струны. Одновременно на гитару устанавливается небольшой блок управления, с которого можно управлять синтезатором; в этот же блок поступает сигнал с обычного выхода гитары, что позволяет регулировать баланс между гитарным и синтезаторным звуком В этом и заключается вся прелесть такой гитары- она универсальна: при необходимости инструмент может работать как обычная гитара, как MIDI-гитара или как обе одновременно при смешивании двух сигналов. Используя вместе с гитарным синтезатором гитарный процессор для обычного аналогового сигнала, можно добиться совершенно удивительных звучаний.

Оба сигнала (с обычных и с полифонического звукоснимателей) передаются с блока управления по одному многожильному кабелю в очень важное и ответственное устройство- MIDI-конвертер. Этот прибор непосредственно отвечает за распознавание нот и дальнейшее преобразование их в MIDI-сигналы.

Непосредственно с MIDI-конвертера сигнал поступает на источник звука- синтезатор или семплер. Конвертер и синтезатор могут быть как совмещенными в одном корпусе, так и выполненными в виде самостоятельных устройств.

Наличие на конвертере входов и выходов MIDI и дает то огромное преимущество, с помощью которого становятся реальными фантастические возможности, заложенные в MIDI-гитаре. Рассмотрим, что же это за такие возможности.

Используя различные синтезаторы и семплеры, музыкант имеет доступ практически ко всем звукам, существующим в настоящее время. Это может пригодиться для создания необычных звучаний электрогитары как на концерте, так и на студии. Для более естественного звучания инструмента имеется возможность подмешивания синтетического сигнала к сигналу гитарному. В таком случае возникает ощущение одновременной игры сразу двух инструментов- гитары и синтезатора.

Еще одно неоспоримое преимущество- управление с помощью MIDI-гитары секвенсором или компьютером. Наверняка многие гитаристы пользуются для записи в секвенсор синтезаторными клавиатурами и испытывают при этом определенные неудобства- гитара для них более привычный инструмент. С появлением MIDI'фицированной гитары эти проблемы исчезли- теперь партии различных инструментов, будь то медные духовые или ударные, записывать стало гораздо легче (во всяком случае гитаристам, не особенно хорошо владеющим фортепиано). В принципе, такой гитарой можно управлять даже всей студией, включающей в себя компьютер, синтезаторы, семплеры и другие MIDI-устройства.

Новые горизонты деятельности открывает MIDI-гитара и для преподавателей. Любые партии, исполняемые учеником, записываются на компьютерный секвенсор, после чего их можно распечатать, проанализировать, прослушать в замедленном темпе и мгновенно найти допущенные при игре ошибки. В принципе, возможно даже создание целых компьютерных гитарных классов.

Какое же будущее ждет MIDI-гитару? Вытеснит ли она обычную электрическую гитару или так и останется на уровне экспериментального и экзотического инструмента? Не надо забывать, что техника, в особенности цифровая, движется вперед семимильными шагами, и те проблемы, которые сейчас ограничивают повсеместное распространение MIDI-гитары, в ближайшем будущем могут быть успешно решены. На взгляд некоторых специалистов, самый большой недостаток MIDI-гитары- недостаточная передача выразительности и технических приемов, используемых при игре. Впрочем, это относится скорее ко всему MIDI-стандарту в целом- ведь он задумывался прежде всего как стандарт для клавишных инструментов и не учитывал специфики гитарной игры. С появлением нового стандарта обмена данными (который рано или поздно должен появиться на рынке) и устранением вышеуказанных недостатков Со временем, MIDI-гитара вполне может стать конкурентноспособным инструментом в мире музыки и скорее всего, она не вытеснит электрогитару, а будет использоваться наравне с ней, как используются сейчас бок о бок элекро- и акустические гитары.

WAV

Формат аудио-файла, представляющий произвольный звук как он есть - в виде цифрового представления исходного звукового колебания или звуковой волны (wave), отчего в ряде случаев технология создания таких файлов, именуется wave-технологией. Позволяет работать со звуками любого вида, любой формы и длительности.

Рис.2. Графическое представление WAV-файла

Где: А – амплитуда звуковой волны,

Т – время ее распространения.

Графическое представление WAV-файла очень удобно и часто используется в звуковых редакторах и программах-секвенсорах для работы с ними и последующего преобразования (об этом речь пойдет в следующей главе). Данный формат был разработан компанией Microsoft и немудрено, что все стандартные звуки Windows имеют расширение WAV. Характерно еще и то, что эти файлы являются, как бы "промежуточными результатом", работы программ-"грабберов" и пихоакустических процессоров, для оцифровки треков СD и дальнейшего их сжатия. Но из-за того, что несжатые "полнометражные" музыкальные композиции в формате WAV имеют огромные размеры (30-50 МБ), они практически не используются. Их вытеснила музыка в MP3.

3. MP3

MP3 - сокращение от MPEG Layer3. Это один из цифровых форматов хранения аудио, разработанный Fraunhofer IIS и THOMPSON (1992г.), позднее утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2. Данная схема является самой сложной из семейства MPEG Layer 1/2/3. Она требует больших затрат машинного времени для кодирования по сравнению с остальными и обеспечивает более высокое качество кодирования. Используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.

Компрессия достигается при активном использовании известных особенностей человеческого слуха в плане восприятия аудиоинформации, что позволяет экономить на наименее значимых с точки зрения человеческого слуха деталях звучания. На проведенных тестах специально нанятые опытные прослушиватели не смогли различить звучание оригинального трека на CD и закодированного с коэффициентом сжатия 6:1.

Описание процесса кодирования

Подготовка к кодированию. Фреймовая структура

Перед кодированием исходный сигнал разбивается на участки, называемые фреймами, каждый из которых кодируется отдельно и помещается к конечном файле независимо от других. Последовательность воспроизведения определяется порядком расположения фреймов. Каждый фрейм может кодироваться с разными параметрами. Информация о них содержится в заголовке фрейма.

Начало кодирования

Кодирование начинается с того, что исходный сигнал с помощью фильтров разделяется на несколько, представляющих отдельные частотные диапазоны.

Работа психоакустической модели. Часть первая

Для каждого диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если она превышает мощность сигнала интересующего диапазона или мощность сигнала в нем оказывается ниже определенного опытным путем для данного диапазона порога слышимости, то данный диапазон не кодируется.

Работа психоакустической модели. Часть вторая

Для оставшихся данных для каждого диапазона определяется, сколькими битами на сэмпл мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта, соответственно чему и производится пожертвование. При этом учитывается, что потеря одного бита ведет к внесению шума квантования величиной порядка 6 dB.

Завершение кодирования

После завершения работы психоакустической модели формируется итоговый поток, который дополнительно кодируется по Хаффману, на этом кодирование завершается.

Замечание

На практике схема несколько сложнее, так как необходимо согласовываться с требованиями битрейта. В зависимости от кодера это приводит к разного рода релаксациям при повышении битрейта и ужесточению критериев при его понижении. Суть в том, что даже после обработки с помощью психоакустической модели оставшаяся аудиоинформация достаточно объемна, приходится идти на потери.

Дополнение

Кроме того, кодирование стереосигнала допустимо четырьмя различными методами:

Dual Channel

Каждый канал получает ровно половину потока и кодируется отдельно как моно сигнал. Рекомендуется на битрейтах от 256kbs (субъективно).

Stereo

Каждый канал кодируется отдельно, но когда кодер умудряется отбросить столько "лишнего" в одном канале, что код не заполняет полностью выделенный для данного канала объем, то кодер может использовать это место для кодирования другого канала. В документации говорится, что этим избегается кодирование "тишины" в одном канале, когда в другом есть сигнал.

Но документация, на мой взгляд, неясно объясняет, что именно происходит. Отсюда и рекомендация в предыдущем пункте.

Режим установлен по умолчанию в большинстве ISO-based кодеров, а также используется продукцией FhG IIS на битрейтах выше 192kbs. Применим и на более низких битрейтах порядка 128kbs-160kbs.

Joint Stereo (MS Stereo)

Стереосигнал раскладывается на средний между каналами и разностный. При этом второй кодируется с меньшим битрейтом.

Это позволяет несколько увеличить качество кодирования в обычной ситуации, когда каналы по фазе совпадают. Но приводит и к резкому его ухудшению, если кодируются сигналы, по фазе не совпадающие. В частности, фазовый сдвиг практически всегда присутствует в записях, оцифрованных с аудиокассет, но встречается и на CD.

Режим выставлен по умолчанию продукцией FhG IIS для битрейтов от 112kbs до 192kbs.

Joint Stereo (MS/IS Stereo)

Вводит еще один метод упрощения стереосигнала, повышающий качество кодирования на особо низких битрейтах. Состоит в том, что для некоторых частотных диапазонов оставляется уже даже не разностный сигнал, а только отношение мощностей сигнала в разных каналах. Понятно, для кодирования этой информации употребляется еще меньший битрейт.

В отличие от предыдущего, этот метод приводит уже к прямой потере информации, но выгоды в качестве от экономии места в пользу среднего сигнала оказываются выше, если речь идет о очень низких битрейтах. Этот режим по умолчанию используется продукцией FhG IIS для высоких частот на битрейтах от 96kbs и ниже. В ISO-based кодерах возможен выбор диапазона. Фактически, MS Stereo - частный случай MS/IS Stereo, когда переменная, отвечающая за кодируемый таким образом диапазон, принимает нулевое значение.

При применении данного режима происходит потеря фазовой информации, а также имеет место меланхоличное превращение противофазного сигнала кодером в полное отсутствие оного (сигнала).

Следует отметить, что сейчас успешно развивается новая технология LAVA! (Live Audio Visual Animation), разрабатываемая компанией Creative Technology. Которая будет ориентирована в основном на музыку в формате MP3, благодаря ней пользователи смогут «смотреть» музыку в Internet в режиме реального времени. То есть можно будет просмотреть интерактивный логотип музыкальной группы и фотографии ее членов, а также элементы художественного оформления альбома — все это теперь может быть объединено в высококачественный трехмерный коллаж и отображено в режиме реального времени параллельно с воспроизведением MP3-файла без существенных дополнительных требований к пропускной способности сети. Программный инструментарий позволяет создавать различные музыкальные видеоролики, включающие любые графические и трехмерные элементы, имеющиеся в среде Windows. Используя список сценарных LAVA!-шаблонов, можно выполнять тонкую сценарную настройку различных параметров (мощность освещения, скорость движения камеры и пр.). Созданную сцену можно отправить вместе с MP3-музыкой по электронному адресу в Internet или поместить на Web-узле, чтобы продемонстрировать свои творческие успехи друзьям.

Исследование BMI Music Bot показало, что к апрелю 1999 г. 36% всех аудиофайлов в Internet составляли MP3-файлы, а доля WAV-файлов снизилась до 8%.

4. VQF - новый аудио формат!

Размер Файла:

VQF файлы - приблизительно 30-35 % меньше чем MP3 файлы.

Пример: Вы имеете песню 5 минут, на КОМПАКТ-ДИСКЕ. WAV файл, который Вы сграбили бы, будет ~ 50МБ. MP3 файл, и 128kbps и 44kHz, был бы приблизительно 4. 5МБ, с некоторой потерей звукового качества. VQF файл, в 44kHz, и 96kbps (80kbps VQF - относительно тот же самый как 128kbps MP3), - приблизительно 3. 5МБ!

Качество звука:

О качестве звука после сжатия можно сказать одно - хорошее. Нельзя сказать, что звук остается абсолютно без изменений, человек даже с неразвитым слухом заметит отличия. Если же говорить о VQF с точки зрения обыкновенного пользователя, то качество вполне приличное для использования в Internet. Ну а поскольку мы уже коснулись, качества звука то VQF - намного лучше чем MP3. Они почти столь же хороши как оригинал WAV файлы. 80kbps VQF столь же хорош как 128kbps MP3 файл. 96kbps VQF имеет качество, почти столь же хорошее как таковым 256kbps MP3. Одним словом можно с точно сказать что использование VQF - позволяет сэкономить до 25% дискового пространства без ощутимой потери качества.

Использование процессора (CPU):

Это - одна область, где VQF более тяжеловесен чем MP3. Он требует больше ресурсов. Когда MP3 были развиты существовали только Pentium - ы. В настоящее время, с Pentium II, и другими мультимедийными средствами увеличились производительные возможностями системы. Этот не маловажный который позволяет кодировать больше звуковых данных в 30 % меньшие файлы!

Недостатки:

1. Этот формат достаточно новый и пока достаточно редкий, что нельзя сказать об MP3!. Но это - только вопрос времени. Как только люди начнут понимать, насколько он актуален на данный момент, их популярность возрастёт.

2. Раскодирование - относительно медленно. Зависит от двух факторов:

a) Лучшее сжатие означает, что будет использованно большее количество времени на "размышления" - кодирующего устройства. Оно работает по более сложным алгоритмам, таким образом уходит большее количество времени.

b) Кодирующее устройство достаточно ново и очевидно, что Yamaha потратила не достаточно времени для разработки кодирующего устройств, обеспечивающего приемлимую производительность и качество. Но специалисты считают, что этот недостаток со временем будет исправлен.

В завершении можно сказать, что новый формат сжатия VQF будет популярным среди пользователей (если завтра не выйдет нового, сжимающего в сто раз). VQF развивается, усовершенствуется и пройдет еще несколько месяцев, и он будет сжимать файлы еще плотнее и качественнее.

Конечно же, это не все музыкальные форматы, используемые на РС. Помимо вышеперечисленных, уже положительно проявивших себя форматов MIDI, WAV, MP3 и только вышедшего VQF, сушествует еще множество типов музыкальных файлов. Как, например, VOC - аналог формата WAV (разработанный компанией Creative Labs), XM, IT – форматы для программ-трекеров, AU – для программы Sound Gadged Pro и т.д. Но так как они используются не так часто, мы их затрагивать не будем.

III Основные программы для работы со звуком

и музыкой

В последнее время наряду с термином "мультимедиа", получил распространение другой - "музыкальные программы". Новый термин оказался столь же многозначным, что и его родитель, - этим сочетанием стали называть любые программы, имеющие дело с каким-либо звуком; при этом нередко происходит смешение основных понятий и путаница в принципах работы программ. В результате одни пользователи даже не догадываются о некоторых доступных им возможностях, а другие ошибочно возлагают на программу (и компьютер в целом) неоправданные надежды. Так постараемся же классифицировать методы работы со звуком на PC и попытаемся сделать обзор технологий и программных средств для этой цели.

Audio и MIDI

В современных компьютерах можно выделить две наиболее популярные технологии, имеющие отношение к звуку и музыке:

* Audio (аудио) - наиболее универсальная технология, представляющая произвольный звук как он есть - в виде цифрового представления исходного звукового колебания или звуковой волны (wave), отчего в ряде случаев она именуется wave-технологией. Позволяет работать со звуками любого вида, любой формы и длительности. Звуковая информация обычно хранится в файлах с расширением WAV.

* MIDI - нотно-музыкальная технология, основанная на регистрации событий, происходящих при игре на электронном инструменте, - нажатий клавиш, педалей, воздействий на регуляторы, тумблеры, кнопки и т.п. Последовательность подобных событий образует "электронную партитуру" музыкального произведения - как бы полную программу управления "автоматическим оркестром". Позволяет весьма точно записать достаточно сложное музыкальное произведение, а затем любое число раз исполнить его в точном соответствии с программой. Информация обычно хранится в файлах с расширением MID.

Audio-технология обычно применяется там, где имеется исходный звуковой сигнал, подлежащий обработке, - с ее помощью записывают, обрабатывают и сводят "живые" акустические и голосовые партии, речь, шумы, специальные сигналы и т.п. MIDI-технология снискала себе успех в создании музыкальных произведений "с нуля", посредством только электронных инструментов. При помощи MIDI-системы может быть создан как некий музыкальный каркас, к которому впоследствии будут добавлены голосовые или акустические партии, так и полноценное, законченное музыкальное произведение.

Для применения аудио-технологии достаточно простейшего звукового адаптера, содержащего АЦП и ЦАП - аналого-цифровые и цифро-аналоговые преобразователи. При этом сложность, качество и цена адаптера совершенно не влияет на принципиальные возможности обработки звука- от адаптера зависит лишь общее качество входного и выходного преобразования, а также сервисные возможности (например, быстрое аппаратное сжатие или фильтрование).

Для использования MIDI-технологии, прежде всего, нужен электронный музыкальный инструмент, преобразующий последовательность нот и команд управления в звук - обычный или сразу цифровой. Это может быть клавишный синтезатор, звуковой модуль (тонгенератор, или синтезатор без клавиатуры), музыкальная карта с аппаратным синтезатором или же программный синтезатор - программа, имитирующая работу реального синтезатора. Соответственно, все возможности, доступные в этой технологии, целиком определяются имеющимся набором MIDI-инструментов. (Подробнее об использовании MIDI в соответствующей главе).

В Windows каждая технология представлена своим типом звукового устройства. Устройства могут быть реальными (аппаратные адаптеры) и виртуальными (программы-имитаторы, генераторы, фильтры и т.п.). Общение программ с устройствами происходит посредством аудио- и MIDI-портов, которые появляются в системе после установки соответствующих устройств.

Отдельным случаем аудио-портов являются порты DirectSound. Классический (Wave, MME) аудио-порт не гарантирует предельно быстрого вывода звука - при обмене небольшими фрагментами, за счет буферизации и невысокой частоты обращений к адаптеру, возникают значительные (относительно времени звучания самих фрагментов) задержки. Интерфейс DirectSound, входящий в комплект интерфейсов DirectX, дает возможность работать с адаптером с минимальной буферизацией и накладными расходами, заметно сокращая задержки. Кроме того, в DirectSound несколько программ могут использовать один порт одновременно, что далеко не всегда возможно при работе с Wave-портами.

Классификация программ

Любая программа для работы со звуком на PC использует в той или иной форме одну из этих технологий либо обе сразу. Выделим следующие основные классы программ:

* Звуковые процессоры (audio processors)

* Системы многоканальной записи и сведения (multitrack recorders)

* Звуковые редакторы (audio editors)

* Генераторы и анализаторы сигналов (audio generators/analysers)

* Виртуальные (программные) синтезаторы (virtual/software synthesizers)

* Музыкальные редакторы (music/MIDI editors)

- Секвенсоры (sequencers)

- Трекеры (trackers)

- Нотные редакторы (score editors)

* Музыкальные процессоры (music/MIDI processors)

* Автокомпозиторы (auto composers)

* Автоаккомпаниаторы (auto accompaniment generators, jammers)

* Распознаватели нот (score recognition software)

* Преобразователи форматов (format convertors)

* Считыватели звуковых дорожек с компакт-дисков (CD rippers/grabbers)

* Психоакустические компрессоры (psychoacoustic compressors)

* Проигрыватели (players)

* Системы для радиовещания и дискотек (delivery systems)

* Утилиты и управляющие программы (utility/control software)

Многие программы сочетают в себе функции из разных классов: например, звуковые редакторы и секвенсоры нередко предоставляют также возможности процессоров (обработка в реальном времени), а музыкальные процессоры и автокомпозиторы часто имеют функции секвенсора.

1. Звуковые процессоры

Имитируют работу типовых устройств обработки звука, применяемых в студийной работе -усилителей, ограничителей, шумоподавителей, компандеров, эффект-блоков и т.п. Существует три основных типа процессоров:

* Нелинейные (off-line) - получают сигнал в виде дискового файла, предварительно записанного другими средствами, и записывают результат обработки в другой дисковый файл.

* Сквозные реального времени - получают сигнал непосредственно с аудиопорта и выводят результат в другой порт.

* Подключаемые модули (plugins) - получают сигнал от другой программы при помощи специального программного интерфейса (API) и возвращают результат обработки этой же программе. Фактическим стандартом такого интерфейса стал Microsoft DirectX. Модули обычно поддерживают обработку в реальном времени.

Процессоры первого типа разрабатывались достаточно давно, уступая место процессорам второго типа по мере роста мощности компьютеров. После появления системы DirectX популярные процессоры разрабатываются в этом интерфейсе.

Подробнее с работой звуковых процессоров ознакомимся на примере нескольких прграмм:

1. DSP/FX Virtual Pack

(Разработчик - Power Technology. Последняя выпущенная версия - 6.2.)

Программа имеет набор модулей обработки, которые могут использоваться как посредством интерфейса DirectX, так и непосредственно обрабатывать сигнал, полученный из Wave-файла или аудио-порта. Модули могут использоваться также в качестве расширителей системы многоканальной записи SAW и проигрывателя WinAMP.

Алгоритмы перенесены с аппаратной платы эффектов DSP/FX. При наличии в системе плат DSP/FX модули могут использовать процессоры плат; в противном случае вся обработка выполняется программно.

Каждый модуль поддерживает набор пресетов (предустановок) и управление параметрами посредством MIDI-контроллеров.

В состав пакета входят следующие модули обработки:

StudioVerb - параметрический ревербератор с моделированием помещения.

AcousticVerb - еще один тип ревербератора.

Optimizer - мягкий пиковый ограничитель и сглаживатель цифровых шумов (dithering).

Aural Activator - генератор гармоник для восстановления потерянных высокочастотных составляющих.

Stereo Pitch Shifter - модуль стереофонического изменения высоты. Изменяет высоту входного сигнала в соответствии с поступающими MIDI-нотами и перемещением регулятора Pitch Bend. Может использоваться для коррекции неточно выдержанных по высоте нот.

Multi-Tap Delay - имитатор множественных отражений внутри помещения, от реверберации до длительных эхо.

Analog Tape Flanger - имитатор аналогового ленточного фленжера.

Multi-Element Chorus - имитатор хорового эффекта путем моделирования пространственного разделения звука.

Parametric EQ - 8-полосный параметрический эквалайзер.

Auto-Panner - модуль автоматического позиционирования сигнала на стереопанораме.

Tremolo - модуль внесения амплитудного вибрато (тремоло).

Widener - расширитель зоны стереоэффекта.

2. Cylonix Vocoder

(Разработчик - James J. Clark. Последняя выпущенная версия - 2.00).

18-полосный вокодер реального времени.

В основу многополосного вокодера положено то, что, речевой аппарат человека работает по разностному принципу: исходный звук голосовых связок, богатый гармониками, подвергается динамическому управлению - резонансному усилению, амплитудной модуляции и фильтрованию - при прохождении через речевой тракт. Принцип работы такого вокодера состоит в разложении речевого управляющего сигнала (modulator) на заданное количество частотных полос и анализе динамики в каждой полосе. Полученные в результате анализа сигналы с определенной точностью повторяют динамику работы речевого тракта. Эти сигналы управляют банком частотных фильтров, через которые пропускается богатый гармониками несущий сигнал (carrier); в результате на выходе банка образуется "говорящий" несущий сигнал, как если бы звук подобного тембра издавали сами голосовые связки.

Как несущий, так и управляющий сигнал может быть сгенерирован несколькими способами - самой программой, введен с аудио-порта, либо взят из готового Wave-файла.

Вокодер имеет множество параметров: ширина полосы фильтра, пропорции смешивания входных и выходных сигналов, способы распознавания речевых звуков, режим воспроизведения высоты управляющего сигнала, виды отображения управляющих сигналов на банки фильтров. Различные способы отображения - сдвиг на несколько полос, инверсия, перестановка

Спецификация формата данных MIDI

Поиск по сайту