Кодирование звуковой информации




Информация взята с сайта биржи Автор24: https://spravochnick.ru/informatika/kodirovanie_informacii/kodirovanie_zvukovoy_informacii/.

Звук представляет собой непрерывный сигнал, а именно звуковую волну с меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рис 1. Амплитуда колебаний звуковых волн Рис 2. Дискретизация звука

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от 20 Гц до 20 кГц, данный диапазон называют звуковым

Так, тихий комариный писк - это звук с высокой частотой, но с небольшой амплитудой. Звук сирены, угрозы наоборот имеет большую амплитуду, но низкую частоту

Так, простая речь (например, диктофонная запись) нормально воспринимается человеком, если частота дискретизации при кодировании была не ниже 8000 Гц (8 КГц) Музыкальные же произведения -44,1 КГц (44100 Гц).

В процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки. Количество их называется частотой дискретизации

Частота дискретизации количество временных участков, на которые разбивается звуковая волна

На каждом участке измеряется амплитуда, т.е. уровень громкости.

Количество бит, которое отводится для кодирования одного уровня называется глубиной кодирования.

Представим, например, что для кодирования каждого уровня громкости компьютер использует 8 битов. Как известно, 8-битная ячейка может принимать одно из 256 значений. Но вдруг разнообразие интенсивности участков, полученных при дискретизации какого-то звука, оказалось более широким (например, 512 вариантов). В таком случае, компьютер "округлит" интенсивность участков до ближайших доступных значений чтобы "уложиться" в 256 вариантов и качество записи получится низким.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации

Схему работы компьютера со звуком в общих чертах можно описать так.

Микрофон превращает колебания воздуха в аналогичные по характеристикам электрические колебания.

Звуковая карта компьютера "умеет" преобразовывать электрические колебания в двоичный код, который записывается на запоминающем устройстве. При воспроизведении такой записи происходит обратный процесс (декодирование) - двоичный код преобразуется в электрические колебания, которые поступают в аудиосистему или наушники.

Динамики акустической системы или наушников имеют противоположное микрофону действие. Они превращают электрические колебания в колебания воздуха.

В современных звуковых картах обеспечивается 16−, 32− или 64−битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным, то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.
Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла

Оценим информационный объём моноаудиофайла (V),

это можно сделать, используя формулу: V=N⋅f⋅k,

где N — общая длительность звучания, выражаемая в секундах,

f — частота дискретизации (Гц),

k — глубина кодирования (бит).
Пример. Длительность звучания файла равна 1 минуте и имеем среднее качество звука, при котором частота дискретизации 24 кГц, а глубина кодирования 16 бит,

V= N*f*K = 60сек*24000гц*16бит=23040000бит=2880000байт=2812,5 Кбайт=2,75 Мбайт

Для стереозвукового файла, все это надо умножить на 2



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-01-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: