Измерение количества информации.

Р А Г Р А

Задача. В сообщении встречаются 25 разных символов. Выберите минимальную длину кодовых слов, при которой все они могут получить разные коды.

1 бит – 2 варианта - < 25.

2 бита – 4 варианта - < 25

3 бита – 8 вариантов - < 25

4 бита – 16 вариантов - < 25

5 битов: 32 варианта – верный ответ!

(п) Выбор длины кодовых слов L определяется условием M^L ³ M ₀, где M ₀ — мощность алфавита исходного сообщения и M — мощность нового алфавита.

(у) Соответственно, в этой задаче выбор кодовых слов определяется условием 2 ^L ³ 25.

3. Неравномерные коды.

Недостаток равномерных кодов в том, что закодированные сообщения получаются слишком длинными. В связи с этимвозникла идея: почему бы не присвоить часто встречающиеся символам более короткие коды?

Эту идея воплотилась в коде Морзе (азбуке Морзе), которую придумал американский художник и изобретатель Самюэль Морзе. В этом коде все буквы и цифры кодируются в виде различных последовательностей точек и тире.

Попробуем сократить длину сообщения, используя кодовые слова разной длины, например так.

А	Г	Р

Закодируем с помощью этой кодовой таблицы слово ГАГАРА – получится 1 0 1 0 10 0. Такой код называется неравномерным.

(п) Неравномерный код — это код, в котором кодовые слова имеют разную длину.

(у) Попробуем декодировать сообщение 010010. (?) Как выделить в этом сообщении кодовые слова? Ответ: это сообщение можно декодировать как АРАР, АГААР, АPАГА, АГААГА. Вывод: сообщения, закодированные с помощью неравномерного кода, не всегда можно декодировать однозначно.

Измерение количества информации.

(у) Вы уже знаете, что человек воспринимает информацию как текст, картинки, звук, видео. В компьютере информация кодируется и хранится как данные (код) – цепочка нулей и единиц (двоичный код). Количество информации в битах определяется длиной сообщения в двоичном коде. Например, в сообщении 10101100 8 битов, т. к. в нём 8 двоичных цифр.

На практике используются следующие единицы измерения информации:

1 байт = 8 бит

1 Кбайт (килобайт) = 1024 байта

1 Мбайт (мегабайт) = 1024 Кбайт

1 Гбайт (гигабайт) = 1024 Мбайт

1 Тбайт (терабайт) = 1024 Гбайт

Если считать через степени числа 2, то:

1 байт = 2³ битов

1 Кбайт (килобайт) = 2¹⁰ байта = 2¹⁰ × 2³бит = 2¹³ бит

1 Мбайт (мегабайт) = 2¹⁰ Кбайт = 2¹⁰ × 2¹³бит = 2²³ бит

Чтобы 2 Кб перевести в байты, нужно 2 умножить на количество байтов в 1Кб, т. е. 2 умножить на 1024 байта, получится 2048 байт.

Чтобы перевести это число в биты, нужно 2048 умножить на количество битов в 1Кб, т. е. 2048 умножить на 8 бит, получится 16 384 бита.

Если считать через степени числа 2, то чтобы 2 Кб перевести в байты нужно 2 умножить на 2¹⁰ байт, получаем 2¹¹ байт

Чтобы перевести это число в биты, = 2¹¹ ´ 2³ бит, получаем 2¹⁴ бит.

«Лесенка» на экране (слайд 12)показывает действия, которые нужно выполнить для перевода количества информации из одних единиц в другие.

Так, например, чтобы 1 Кб перевести в биты, нам нужно будет двигаться по верхней стрелке вниз от ступеньки «1 Кбайт» к ступеньке «1 Бит». Как вы уже знаете, 1 байт = 8 бит, 1 Кбайт = 1024 байта. Поэтому, при движении по верхней стрелке вниз число будет увеличиваться. Таким образом, чтобы перевести 1 Кб в биты, нам нужно будет умножить число на 1024, а затем – ещё на 8.

Чтобы перевести число бит в байты, нам нужно будет по нижней стрелке вверх от ступеньки «1 Бит» к ступеньке «1 КБайт». Поэтому, при движении по нижней стрелке вверх, число будет уменьшаться.Таким образом, чтобы перевести число бит в байты, нам нужно будет поделить число на 8, а затем – ещё на 1024.

Эта лесенка напоминает пъедестал, на каждой следующей ступеньке которого меньше людей, чем на предыдущей.

Задача. Алфавит русского языка содержит 33 символа. Определите наименьшую длину кодовых слов при кодировании сообщений на русском языке с помощью равномерного двоичного кода.

Решение: Итак, мощность исходного алфавита – 33 символа (M=33). Наименьшая длина кодовых слов (обозначим её как i) пока нам неизвестна (i =?). Поскольку мы имеем дело с равномерным двоичным кодом, длину кодовых слов можно выразить в битах (i бит), поэтому i бит – это 2 ⁱ разных кодовых слов. (т. е. дина кодовых слов определяется условием M £ 2 ⁱ. 2⁵ < 33, значит 5 бит на символ не хватает; но 33 £ 2⁶, значит 6 бит на символ хватает! Поэтому ответ: i = 6бит.

(?) Что если в этом коде ещё и различать Если заглавные и строчные буквы? Ответ: тогда мощность исходного алфавита – уже не 33, а 66 символов, поэтому число i нужно умножить ещё на 2 (возвести в 7 степень), поэтому ответ: i = 7бит.

Задание: Решить онлайн-тест по теме «Дискретное кодирование», который находится по адресу:

https://kpolyakov.spb.ru/school/test8a/4.htm

Сразу после решения теста нужно сфотографировать результат на телефон или сделать скриншот (клавишей PrintScreen или PrtScr) и прислать мне в личном сообщении или на почту: zilberman-82@mail.ru.

КОММЕНТАРИЙ К ТЕСТУ: При решении задач в тесте используйте формулу: Выбор длины кодовых слов L определяется условием M^L ³ M ₀, где M ₀ — мощность алфавита исходного сообщения и M — мощность нового алфавита. В одной из задач вам нужно будет определить, сколько различных кодовых слов определённой длины можно получить с помощью определённого алфавита. Для решения этой задачи используйте формулу M^L, где M – мощность алфавита, а L – длина кодовых слов. Желаю удачи!!!

Измерение количества информации.

Поиск по сайту