Кодирование информации при передаче ее по дискретному каналу без помех.

Задание 1. Ответить на следующие вопросы:

В чем суть эффективного статистического кодирования?

Задание 2. Решить следующие задачи:

Задача 1. Разработать код с использованием метода Шеннона-Фано для входного алфавита Z = {z₁,...z₈} и выходного алфавита В = {0,1}, если вероятность использования знаков входного алфавита:

Знаки	Вероятность
Z₁	0,22
Z₂	0,20
Z₃	0,16
Z₄	0,16
Z₅	0,10
Z₆	0,10
Z₇	0,04
Z₈	0,02

Определить коэффициент избыточности полученного кода и среднее число символов на знак сообщения.

Задача 2. Разработать код с использованием метода Хаффмена для входного алфавита Х = {x₁,...x₈} и выходного алфавита В = {0,1}, если

р(х₁)= 0,19; р(х₂)= р(х₃)= 0,16; р(х₄)= 0,15; р(х₅)= 0,12; р(х₆)= 0,11; р(х₇)= 0,09; р(х₈)= 0,02,

и определить коэффициент избыточности полученного кода.

Задача 3. Алфавит сообщений состоит всего из двух знаков Z₁ и Z₂ с вероятностями появления соответственно p(z₁) = 0,9 и p(z₂) = 0,1.
Рассчитать и сравнить эффективность кодов, полученных при побуквенном кодировании, при кодировании блоков, содержащих по две буквы, при кодировании блоков, содержащих по три буквы.
Так как знаки статистически не связаны, вероятности блоков определяются как произведение вероятностей составляющих знаков.

Решение.

Задание 1.

В чем суть эффективного статистического кодирования?

Эффективное (статистическое) кодирование осуществляется с целью повышения скорости передачи информации и приближения её к пропускной способности канала.

Теорема Шеннона для эффективных кодов: для канала без помех всегда можно создать систему эффективного кодирования дискретных сообщений, у которой среднее количество двоичных кодовых сигналов на один символ сообщения будет приближаться как угодно близко к энтропии источника сообщений.

Задание 2. Решить следующие задачи:

Знаки	Вероятность
Z₁	0,22
Z₂	0,20
Z₃	0,16
Z₄	0,16
Z₅	0,10
Z₆	0,10
Z₇	0,04
Z₈	0,02

Определить коэффициент избыточности полученного кода и среднее число символов на знак сообщения.

Решение:

Метод Шеннона-Фано:

Знаки алфавита сообщений выписывают в таблицу в порядке убывания вероятностей их использования. Затем их разделяют на 2 группы так, чтобы суммы вероятностей в каждой из них были по возможности одинаковы. Всем знакам верхней половины в качестве первого символа приписывают единицу, а всем нижним - ноль. Каждую из полученных групп, в свою очередь, разбивают на 2 подгруппы с одинаковыми суммарными вероятностями и так далее, процесс повторяется до тех пор, пока в каждой подгруппе не останется по одному знаку.

Проделаем следующие действия:

Знаки	Вер.	Код
Z₁	0,28
Z₃	0,16
Z₅	0,10
Z₈	0,02

Знаки	Вер.	Код
Z₂	0,20
Z₄	0,16
Z₆	0,10
Z₇	0,04

Знаки	Вер.	Код
Z₁	0,28
Z₈	0,02

Знаки	Вер.	Код
Z₃	0,16
Z₅	0,10

Знаки	Вер.	Код
Z₁	0,28

Знаки	Вер.	Код
Z₈	0,02

Знаки	Вер.	Код
Z₃	0,16

Знаки	Вер.	Код
Z₅	0,10

Знаки	Вер.	Код
Z₄	0,16
Z₆	0,10

Знаки	Вер.	Код
Z₄	0,16

Знаки	Вер.	Код
Z₆	0,10

Знаки	Вер.	Код
Z₂	0,20
Z₇	0,04

Знаки	Вер.	Код
Z₂	0,20

Знаки	Вер.	Код
Z₇	0,04

Знаки	Вероятность	Код
Z₁	0,22
Z₂	0,20
Z₃	0,16
Z₄	0,16
Z₅	0,10
Z₆	0,10
Z₇	0,04
Z₈	0,02

Запишем полученный код

Среднее число символов на знак сообщения считается по следующей формуле:

где p(z_i) – вероятность использования знака z_i

n(z_i) – число символов в кодовой комбинации, соответствующей знаку z_i

Рассчитаем:

H_max(z) – максимально возможная энтропия, равная log L, где L – количество знаков в алфавите сообщений. Рассчитывается по уже известной формуле Хартли;

H(Z) – энтропия кода. Рассчитывается по формуле Шеннона.

Произведем расчет:

Задача 2.

Разработать код с использованием метода Хаффмена для входного алфавита Х = {x₁,...x₈} и выходного алфавита В = {0,1}, если р(х₁)= 0,19; р(х₂)= 0,17; р(х₃)= р(х₄)= 0,15; р(х₅)= 0,12; р(х₆)= 0,11; р(х₇)= 0,09; р(х₈)= 0,02, и определить коэффициент избыточности полученного кода.

Решение:

Методика Хаффмена для построения двоичных эффективных кодов:

Знаки алфавита сообщений выписывают в таблицу в порядке убывания вероятностей их использования. Две последние буквы объединяют в одну вспомогательную букву, которой приписывают суммарную вероятность, объединенные буквы обозначают 1 и 0. Затем вероятности снова располагают в порядке убывания, учитывая и суммарную вероятность. Две последние буквы объединяют, обозначают 1 и 0. Процесс продолжается до тех пор, пока не получат единственную вспомогательную букву с вероятностью, равной единице - это "корень" дерева, знаки сообщения - "листья" дерева. Символы 0 и 1, встречающиеся на пути от "корня" к некоторому "листу" дерева, составляют кодовую комбинацию, соответствующего "листу" сообщения.

Составим таблицу:

Знаки	Вероятность
x₁	0,19
x₂	0,17
x₃	0,15
x₄	0,15
x₅	0,12
x₆	0,11
x₇	0,09
x₈	0,02

Теперь применим методику Хаффмена:

Знаки	Вероятность
x₁	0,19
x₂	0,17
x₃	0,15
x₄	0,15
x₅	0,12
x₆	0,11
x₇	0,09
x₈	0,02

Знаки	Вероятность
x₁	0,19
x₂	0,17
x₃	0,15
x₄	0,15
x₅	0,12
x₆	0,11
x₇₈	0,11

Знаки	Вероятность
х₆₇₈	0,22
x₁	0,19
x₂	0,17
x₃	0,15
x₄	0,15
x₅	0,12

Знаки	Вероятность
х₄₅	0,27
х₆₇₈	0,22
x₁	0,19
x₂	0,17
x₃	0,15

Знаки	Вероятность
х₃₂	0,32
х₄₅	0,27
х₆₇₈	0,22
x₁	0,19

Знаки	Вероятность
х₁₆₇₈	0,41
х₃₂	0,32
х₄₅	0,27

Знаки	Вероятность
х₂₃₄₅	0,59
х₁₆₇₈	0,41

Теперь запишем полученные коды для всех знаков алфавита:

Знаки	Вероятность	Код
x₁	0,19
x₂	0,17
x₃	0,15
x₄	0,15
x₅	0,12
x₆	0,11
x₇	0,09
x₈	0,02

Среднее число символов на знак сообщения считается по следующей формуле:

где p(z_i) – вероятность использования знака z_i

n(z_i) – число символов в кодовой комбинации, соответствующей знаку z_i

Избыточность кода определяется по формуле:

где

H_max(z) – максимально возможная энтропия, равная log L, где L – количество знаков в алфавите сообщений. Рассчитывается по формуле Хартли;

H(Z) – энтропия кода. Рассчитывается по формуле Шеннона

Произведем расчет:

Задача 3. Алфавит сообщений состоит всего из двух знаков Z₁ и Z₂ с вероятностями появления соответственно p(z₁) = 0,9 и p(z₂) = 0,1.
Рассчитать и сравнить эффективность кодов, полученных при побуквенном кодировании, при кодировании блоков, содержащих по две буквы, при кодировании блоков, содержащих по три буквы. Так как знаки статистически не связаны, вероятности блоков определяются как произведение вероятностей составляющих знаков.

Решение:

В качестве меры эффективности кодов можно использовать энтропию. Энтропия является мерой неопределенности, соответственно, чем она ниже тем выше определенность, что и говорит об эффективности кода.

1. Побуквенное кодирование:

Знаки	Вероятность
z₁	0,9
z₂	0,1

Рассчитаем энтропию:

2. Кодирование блоков, содержащих по две буквы:

Знаки	Вероятность
z₁z₁	0,81
z₁z₂	0,09
z₂z₁	0,09
z₂z₂	0,01

Рассчитаем энтропию:

3. Кодирование блоков, содержащих по три буквы:

Знаки	Вероятность
z₁z₁z₁	0,729
z₁z₁z₂	0,081
z₁z₂z₁	0,081
z₁z₂z₂	0,009
z₂z₁z₁	0,081
z₂z₁z₂	0,009
z₂z₂z₁	0,009
z₂z₂z₂	0,001

Рассчитаем энтропию:

Как видно из вышеприведенных расчетов самым эффективным является побуквенное кодирование, т.к. при таком кодировании энтропия минимальна.

Кодирование информации при передаче ее по дискретному каналу без помех.

Поиск по сайту