Кодирование текстовой информации
Текстовая информация представляет собой набор символов некоторого языка.
Язык – знаковая система представления информации. Множество символов языка образуют алфавит.
Языки бывают естественными и формальными. Естественные языки сложились в процессе общения людей, другими словами, естественные языки – это языки национальных культур. Формальные языки возникли из необходимости введения специальных символов в различных областях науки. Например, язык музыки представляет собой ноты и нотный стан, язык математики – это цифры, арифметические действия, специальные знаки %, / и т.д., язык дорожных правил – это знаки, разметка, сигналы регулировщика и светофора и т.п.
Алфавит компьютерного языка состоит из 256 символов, причем под каждый символ отводится 8 ячеек памяти, другими словами, информационный вес каждого символа равен 8 бит=1 байт. Эти 256 символов включают заглавные и прописные буквы двух алфавитов, математические символы, специальные символы. Все символы упорядочены, каждому символу соответствует некоторое число от 0 до 255.
Таблица ASCII содержит коды первых 128 символов (0-127). (см.приложение)
Остальные позиции заняты символами кириллицы (русскими буквами) и символами псевдографики. Существует несколько таблиц кодировки кириллицы – КОИ 8, Windows 1251-1252 и др. Их отличие в том, что буквам сопоставляются различные коды.
Кодирование графической информации.
Растровое представление графической информации
2.1. Сообщение обучающегося по данной теме
2.2. При этом представлении изображение разбивается на мельчайшие элементы – пиксели.
Пиксель – минимальный участок изображения, которому можно независимым образом задать цвет.
Палитра – множество цветов, используемых в изображении (весь набор красок).
Все множество пикселей образуют растр.
Растр – это прямоугольная сетка пикселей на экране.
Стандартные размеры растра 800 600, 1024
768 и др. Это значит, что по горизонтали на экране монитора умещается 1024 (М) пикселя, а по вертикали 768 (N) пикселей. Тогда общее количество пикселей может быть посчитано как K=MN.
Разрешающей способностью изображения называется отношение числа пикселей на единичный участок изображения. Единица измерения разрешающей способности – dpi (пикселей на дюйм).
Использую известную формулу 2i=N, где N – мощность алфавита (число цветов в палитре), можно посчитать, сколько бит информации содержит каждый символ (в нашем случае пиксель). Общий объем изображения можно вычислить по формуле V=KI, где K=mn.
Пример 1. Палитра состоит из 65536 цветов (N). Изображение состоит из 64 32 пикселя. Какой объем изображения в Кбайтах?
Решение: В палитре 65536 цветов. Значит, 2i=65536, откуда i=16 бит. Это значит, что каждый пиксель изображения «весит» 16 бит.
Если известно, что изображение имеет размер 64*32 пикселя, то можно узнать размер (объем) изображения:
V=Ki=64 32
16=26
25
24=26+5+4=215 бит = 215/213=215-13=22=4 Кбайт
Пример 2. Известно, что объем изображения, записанного в 256-цветной палитре (N), равен 0,5 Кб (V). Каким количеством бит кодируется каждый пиксель (i)? Из скольки пикселей состоит изображение? Какой объем будет у изображения размером 128*64 пикселя (K)?
Решение: Палитра состоит из 256 цветов (N). Значит, под каждый пиксель отводится 2i=256, т.е. i=8 бит.
Объем изображения равен 0,5 Кбайт = 0,5 213 бит. V=KI, значит,
K=V/I=0.5 213/8=0.5
213/23=2-1+13-3=29=512 пикселей. Изображение состоит из 512 пикселей.
Объем изображения размером 128 64 пикселя равен V=Ki=mni=128
64
8=27
26
23=27+6+3=216 бит = 216-3-10 =23 Кбайт = 8Кбайт.
3. Кодирование звуковой информации
3.1. Сообщение обучающегося по данной теме
3.2. С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. С помощью специальных программных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса.
Звуковой сигнал - это непрерывная волна с изменяющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть дистретизирован, т.е. превращен в последовательность электрических импульсов (двоичных нулей и единиц).
При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок — отсчетов.
Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний. Для определения количества бит, необходимых для кодирования, решим показательное уравнение:
Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.
Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц. При частоте 8 Кгц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 Кгц - качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.
Можно оценить информационный объем моном аудио файла длительностью звучания 1 секунду при среднем качестве звука (16 бит, 24 Кгц). Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду:
16 бит 24000 = 384000 бит = 48000 байт или 47 Кбайт