Объективный (алфавитный) подход к измерению информации




Инструкционно-технологическая карта на выполнение практической работы №2

По предмету: информатика и ИКТ

Тема: Измерение информации.

Цель работы: научиться решать задачи на количественное измерение информационного объема текстовой информации.

Учебно-методическое оснащение рабочего места: инструкционно-технологическая карта.

Основные правила ТБ: требование безопасности во время занятия.

Литература: Михеева, Е.В. Информатика; Цветкова М.С. Информатика и ИКТ.

Краткие теоретические сведения

В связи с разными подходами к определению информации выделяют два подхода к измерению информации.

Субъективный (содержательный) подход

При данном подходе информация – это сведения, знания, которые человек получает из различных источников. Таким образом, сообщение информативно (содержит ненулевую информацию), если оно пополняет знания человека.

При содержательном подходе возможна качественная оценка информации: достоверность, актуальность, точность, своевременность, полезность, важность, вредность…

С точки зрения информации как новизны мы не можем оценить количество информации, содержащейся в новом открытии, музыкальном стиле, новой теории развития.

Единица измерения количества информации называется бит ( bit – binary digit), что означает двоичный разряд.

Количество информации – это количество бит в сообщении.

Сообщение, уменьшающее информационную неопределенность (неопределенность знаний) в два раза, несет для него 1 бит информации.

Что же такое «информационная неопределенность»?

Информационная неопределенность о некотором событии – это количество возможных результатов события.

Пример_1: Книга лежит на одной из двух полок – верхней или нижней. Сообщение о том, что книга лежит на верхней полке, уменьшает неопределенность ровно вдвое и несет 1 бит информации.

Сообщение о том, что произошло одно событие из двух равновероятных, несет 1 бит информации.

Научный подход к оценке сообщений был предложен еще в 1928 году Р. Хартли.

Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий (равновероятность обозначает, что ни одно событие не имеет преимуществ перед другими). Тогда количество информации, заключенное в этом сообщении, - x бит и число N связаны формулой:

2x = N

где x – количество информации или информативность события (в битах);

N – число равновероятных событий (число возможных выборов).

Данная формула является показательным уравнением относительно неизвестной x. Решая уравнение, получим формулу определения количества информации, содержащемся в сообщении о том, что произошло одно из N равновероятных событий, которая имеет вид:

x = log 2N

логарифм от N по основанию 2.

Если N равно целой степени двойки, то такое уравнение решается легко, иначе справиться с решением поможет таблица логарифмов.

Если N = 2 (выбор из двух возможностей), то x = 1 бит.

Пример_2: Какое количество информации несет сообщение о том, что встреча назначена на июль?

Решение: В году 12 месяцев, следовательно, число равновероятных событий или число возможных выборов N = 12. Тогда количество информации x = log 212. Чтобы решить это уравнение воспользуемся таблицей логарифмов или калькулятором.

Ответ: x = 3,58496 бита.

Объективный (алфавитный) подход к измерению информации

Теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется объективный или алфавитный подход.

При объективном подходе к измерению информации мы отказываемся от содержания информации, от человеческой важности для кого-то.

Информация рассматривается как последовательность символов, знаков.

Количество символов в сообщении называется длиной сообщения.

Основой любого языка является алфавит.

Алфавит – это набор знаков (символов), в котором определен их порядок.

Полное число символов алфавита принято называть мощностью алфавита. Обозначим эту величину буквой M.

Например, мощность алфавита из русских букв равна 33:

мощность алфавита из английских букв равна 26.

При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (т.е. от числа знаков в тексте) и от мощности алфавита. Тогда информацию можно обрабатывать, передавать, хранить.

Каждый символ несет x бит информации. Количество информации x, которое несет один символ в тексте, зависит от мощности алфавита M, которые связаны формулой 2x = M. Следовательно x = log2M бит.

Количество информации в тексте, состоящем из K символов, равно K*x или

K* log2M, где x – информационный вес одного символа алфавита.

Удобнее измерять информацию, когда мощность алфавита M равна целой степени числа 2. Для вычислительной системы, работающей с двоичными числами, также более удобно представление чисел в виде степени двойки.

Пример_3, в 2-символьном алфавите каждый символ несет 1 бит информации (2x = 2, откуда x = 1 бит).

Если M=16, то каждый символ несет 4 бита информации, т.к. 24 = 16.

Если M=32, то один символ несет 5 бит информации.

При M=64, один символ «весит» 6 бит и т.д.

Есть алфавит, который можно назвать достаточным. Это алфавит мощностью 256 символов. Алфавит из 256 символов используется для представления текстов в компьютере. В этом алфавите можно поместить практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания, знаки псевдографики. Поскольку 256=28, то один символ этого алфавита «весит» 8 бит.

8 бит информации присвоили свое название – байт.

Байт – поле из 8 последовательных бит. Байт широко используется как единица измерения количества информации.

1 байт = 8 бит

Компьютерные текстовые редакторы работают с алфавитом мощности 256 символов. Поскольку в настоящее время при подготовке книг используются текстовые редакторы, легко посчитать объем информации в тексте. Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов, полученное значение даст информационный объем текста в байтах.

Для измерения больших объемов информации используются производные от байта единицы:

1 килобайт = 1 Кб = 210 байт = 1024 байта

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб = 1048576 байт

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб = 1048576 Кб = 1073741824 байт

Пример_4: Книга, набранная с использованием текстового редактора, содержит 70 страниц, на каждой странице 38 строк, в каждой строке 56 символов. Определить объем информации, содержащейся в книге.

Решение: Мощность компьютерного алфавита равна 256 символов. Один символ несет 1 байт информации. Значит 1 страница содержит 38*56=2128 байт информации. Объем всей информации в книге 2128*70=148960 байт.

Если оценить объем книги в килобайтах и мегабайтах, то

148960/1024 = 145,46875 Кбайт.

145,46875/1024 = 0,142059 Мбайт.

Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода. Только алфавитный подход пригоден при использовании технических средств работы с информацией.

Задания для выполнения.

Решения необходимо оформить в электронном виде и предоставлять на проверку преподавателю.

Примечания:

1. пробел тоже символ;

2. количество символов в сообщении можно подсчитать приблизительно (количество символов в строке * количество полных строк – воспользуйтесь калькулятором);

3. количество символов при двоичном восьмиразрядном кодировании = количеству байтов.

Задание 1. Измерьте информационный объем сообщения «Ура! Скоро Новый год!» в битах, байтах, килобайтах (Кб), мегабайтах (Мб).

В кодировке ASCII(чаще всего используется) 1 символ занимает 1 байт(8 бит).

Т.к. в Вашей фразе 20 символов(считаются и пробелы, и знаки препинания)

получаем:

8 * 20 = 160 бит.

1 * 20 = 20 байт

0,16 килобита

0,02 килобайта

0,000015 мегабита

0,000019 мегабайта.

Указание: считается, что текст набран с помощью компьютера, один символ алфавита несет 1 байт информации. Пробел – это тоже символ в алфавите мощностью 256 символов.

Задание 2. Измерьте примерную информационную емкость одной страницы любого своего учебника, всего учебника.

Указание: Для выполнения задания возьмите учебник по любимому предмету, посчитайте число строк на странице, число символов в строке, включая пробелы. Помните, что один символ алфавита несет 1 байт информации. Перемножив полученные значения, Вы найдете информационную емкость одной страницы учебника (в байтах).

Задание 3. Информационное сообщение объемом 1.5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

I=1,5 Кбайта=1,5 * 1024 байта = 1,5 * 1024 *8 бит = 12288 бит

i=I/K=12288/3072 = 4 бита - на один символ

 

Значит N=2^4 = 16 символов в алфавите.

Задание 4. Подсчитать в килобайтах количество информации в тексте, если текст состоит из 600 символов, а мощность используемого алфавита – 128 символов.

N=2^b => 128=2^7=>b=7 бит на 1 символ
600*7=4200
4200\8=525 БАЙТ
525\1024=0.5 Килобайт

Задание 5. Скорость информационного потока – 20 бит/сек. Сколько времени потребуется для передачи информации объемом в 10 килобайт.

Итак считаем, что 1 байт = 8 бит
10 кбайт = 10 * 1024 = 10 240 байт или 10 240 * 8 = 81920 бит

20 бит передается за 1 секунду
81920 --"-- за х секунд

x = 81920 * 1 / 20 = 4096 секунд = 68 минут 16 секунд.

 

Задание 6. Сравните (поставьте знак отношения)

·

o 200 байт и 0,25 Кбайт.

o 3 байта и 24 бита.

o 1536 бит и 1,5 Кбайта.

o 1000 бит и 1 Кбайт.

o 8192 байта и 1 Кбайт.

    • В одном килобайте 1024 байт, в одном байте 8 бит.
    • а) 200 байт < 256 байт = 0,25 Кб
    • б) 3 байта = 3 * 8 бит = 24 бита
    • в) 1536 бит < 1536 байт = 1,5 Кб
    • г) 1000 бит < 1024 байт = 1 Кб
    • д) 8192 байт > 1024 байт = 1 Кб

Задание 7. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге?

150 * 40 = 6000 - количество строк во всей книге;
6000 * 60 = 360000 - количество символов во всей книге;
Если в задаче не указана разрядность символа, то по умолчанию считают, что 1 символ равен 1 байту. Исходя из этого:
360000 символов = 360000 байт.

Задание 8. Подсчитайте объем информации, содержащейся в романе А. Дюма "Три мушкетера", и определите, сколько близких по объему произведений можно разместить на одном лазерном диске? (590 стр., 48 строк на одной странице, 53 символа в строке).

53 * 48 * 590 = 1500960 это количество символов.
Как известно один символ это один байт.
теперь переведем 700 Мб в байты.
700 Мб = 716800 кб = 734003200

734003200/1500960 = 489 книги

Задание 9. Какое количество информации несет сообщение: “Встреча назначена на сентябрь”.

Решение
N=29.
М- мощность алфавита.
i- кол-во. инф., выделяемой для 1-го символа.
Все сообщение состоит из 29 (N) символов, среди этих символов 13 (в,с,т,р,е,ч,а,_,н,з,я,б,ь) разных. Эти 13 символов и составляют мощность алфавита М. M=13

1) Найдем i по формуле
i=log M=log 13=4 бита.
(Не указано основание логарифма, т.к в информатике обычно не записывают основание равное 2).

Если, вы, не "знакомы" с логарифмом, то решение имеет вид:

2^х=13;

х= 4.

(Почему 4, а не 3,...? Должно быть целое число, и если х примерно равен n,1(2,3,4,5), то округление не производится до n, а к n прибавляется 1, в противном случае будет недостаточно выделенной памяти для закодирования всего алфавита в 2-й системе.)

2) Кол-во. инф., которое содержит данное сообщение вычисляется по формуле:

I=N*i=29*4 бита= 116 бит или 14,5 байт.

Ответ: 116 бит или 14,5 байт.

Задание 10. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?

Надо посчитать количество символов в сообщении: 3 * 25 * 60 = 4500;

Сообщение занимает 1125 байт, посчитаем, сколько байт занимает каждый символ: 1125 / 4500 = 0.25;

Т. к. символ занимает 0.25 байт, одним байтом можно закодировать 4 символа. Байт состоит из 8 бит.

8 / 4 = 2 (количество битов чтобы закодировать каждый символ)

Двумя битами можно закодировать 4 символа, значит в алфавите может быть до четырех символов

Задание 11. Измерьте информационный объем сообщения “Ура! Закончились каникулы!!” (с точки зрения технического подхода, то есть не учитывая смысл сообщения). Выразите этот объем в битах, байтах, килобайтах.

Для начала посчитаем количество символов строки

Ура! Закончились каникулы!! =27 символов (пробелы тоже считаем)

 

1) в школе учат что информационный вес символа =8 бит

27*8=216 бит = 27 байт =0,0263671875 кбайт

 

2) но в стандарте Unicode информационный вес одного символа 2 байта = 16 бит

27*16=432 бит = 53 байт=0,0263671875 кбайт

 

(информационный вес 8 бит - 1 вариант, 16 бит - 2 вариант)

 

Задание 12. Считая, что каждый символ кодируется одним байтом, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах):

Сегодня метеорологи предсказывали дождь

Кол-во символов = 40.

40 * 8 = 320 бита = 40 Байт

Вывод: научился решать задачи на количественное измерение информационного объема текстовой информации.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-07-23 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: