Цель работы
Получение практических навыков численного определения количества информации, содержащегося в сообщении.
Порядок выполнения лабораторной работы
1. Создать таблицу (50 рабочих строк) в Excel аналогичную рис.1.
Таблица расчета энтропии источника | ||||||
№ п/п | Символ | Код символа | Число вхождений символа в текст | Вероятность вхождения символа (рi) | Ii | |
… | … | |||||
я | ||||||
Всего символов в тексте (K) | ||||||
Полная вероятность(Р) | (должна получиться «1») | |||||
Энтропия источника (Iср) |
Рис.1.
2. Заполнить столбец Символ следующими значениями:
Ø 33 буквы русского алфавита;
Ø 10 цифр (0 — 9);
Ø Знаки препинания – «.», «,», «:», «;», «-», «», «(».
3. Заполнить столбец Код символа используя функцию «КОДСИМВ(…)», находящуюся в категории «Текстовые».
4. Открыв каскадом текст по варианту и таблицу и используя в Word «Правка Þ Заменить » заполнить столбец Число вхождений символа в текст. (Предполагается, что других символов в тексте НЕТ.) Сосчитать общее число символов.
5. По формулам заполнить столбцы «рi » и «Ii ». Сосчитать полную вероятность и энтропию источника.
6. Создать таблицу, аналогичную рис.2 и заполнить ее по формулам.
Неопределенность | Разрядность кода | Абсолютная избыточность | Относительная избыточность | |
Стандартная кодовая таблица ASCII | ||||
Мера Хартли |
Рис.2.
7. Выписать применяемые формулы с расшифровкой использыемых символов.
Приложение к лабораторной работе «Определение количества информации, содержащегося в сообщении»
|
Основные положения
Общие сведения об информации.
Понятие «информация» происходит от латинского слова informatio - разъяснение, осведомление, изложение и обозначает одно из основных свойств материи. В рамках науки — информация — первичное, неопределенное понятие. Оно предполагает наличие материального носителя информации, источника информации, передатчика и т.п. Конкретное толкование элементов, связанных с понятием информации, связано с методологией конкретной области науки.
Можно выделить некоторые свойства информации, определяющие смысл этого понятия:
Ø Информация переносит знания об окружающем мире, которых в рассматриваемой точке не было до получения информации;
Ø Информация не материальна — она проявляется в форме материальных носителей — дискретных знаков, сигналов или функций времени;
Ø Информация может быть заключена в знаках или в их взаимном расположении;
Ø Знаки и сигналы несут информацию только для получателя, который может их распознать.
Термин «информация» имеет много определений. В широком смысле —
Информация — отражение реального мира.
Существует определение термина в узком смысле, применимого к предметной области автоматизированной обработки информации.
Информация — любые сведения, являющиеся объектом хранения, передачи и преобразования.
В процессе передачи информации важно определить следующие понятия:
Сообщение — информация, представленная в определенной форме и предназначенная для передачи. Сообщение представляется последовательностью знаков и сигналов.
|
Сигнал — процесс, несущий информацию. Таким образом, сигнал служит для переноса информации.
Знак — реально различимые получателем материальные объекты: буквы, цифры, предметы. Знаки служат для хранения информации.
Данные — информация, представленная в формализованном виде и предназначенная для обработки техническими средствами.
Таким образом, любой информационный процесс, может быть представлен как процесс передачи информации от объекта, являющегося источником информации, к получателю. Для обеспечения передачи информации необходим канал связи, некоторая физическая среда, через которую информация, представленная в виде сигналов, передается получателю.
Множество всех знаков и сигналов, использующееся для формирования сообщения, называется алфавит.
Размер (глубина) алфавита A определяется количеством символов, составляющих алфавит. Если считать, что сообщение передается одним знаком алфавита размером A, всего может быть передано N=А сообщений.
Из знаков алфавита может быть составлено слово. Если размер слова фиксировано и составляет n знаков, то количество возможных слов N составленных символов из алфавита А, таким образом, что каждый символ алфавита может входить в слово 0,1,2,…,n, раз определяется
N = Аn. | (1) |
Таким образом, с помощью слов можно представить информацию о любом из N сообщений.
Выражение (1) позволяет определить размер слова из алфавита А, с помощью которого можно представить N сообщений
n=élogA Nù. | (2) |
Мы можем сопоставить тому или иному сообщению комбинацию знаков, тогда при приеме сообщения, зная правила сопоставления, можно распознать сообщение.
|
Информация всегда представляется в виде сообщения, которое передается некоторой физической средой. Носителем сообщения выступает сигнал, выражающийся в изменении энергии среды передачи информации — канала связи. Для того, чтобы передать информацию по каналу связи необходимо сопоставить исходному сообщению некоторое правило изменения сигнала. Такое правило сопоставления называют кодированием.
Кодирование — представление сообщений в форме, удобной для передачи информации по каналам связи.
Естественно, можно говорить о кодировании на различных этапах передачи информации. Так, например, можно говорить о кодере источника, кодере канала связи и т.д. Принятое сообщение подвергается декодированию.
Декодирование — операция восстановления принятого сообщения. В системе связи необходимо ввести устройства кодирования и декодирования. Очевидно, что правила кодирования и декодирования в системе должны быть согласованы.
Важный вопрос теории передачи и преобразования информации — установление меры, количества и качества информации.