ИЗМЕРЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ
Информация относится к фундаментальным, неопределяемым понятиям науки информатика. Тем не менее:
ü в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;
ü в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);
ü в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности, неполноты имеющихся о них знаний.
Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения.
1бит — минимальная единица измерения информации. При вероятностном подходе к измерению информации это количество информации, уменьшающее неопределенность знаний в 2 раза.
Связь между единицами измерения информации:
• 1 байт = 8 бит;
• 1 Кб (килобайт) = 210 (1024) байт = 213 бит;
• 1 Мб (мегабайт) = 210 (1024) Кб = 220 (1 048 576) байт = 223 бит;
• 1 Гб (гигабайт) = 210Мб = 220 Кб = 230 байт = = 233 бит;
• 1 Тб (терабайт) = 210 Гб = 220 Мб = 230 Кб = 240 байт = 243 бит.
Кодирование информации - это представление сообщений в конкретном виде при помощи некоторой последовательности знаков. Правило отображения одного набора знаков в другой называется кодом. Обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход.
|
При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация — будь то числа, текст, графическое изображение, звук или видео — представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Этот способ кодирования был выбран потому, что технически реализовать два существенно различных состояния, представляющих, соответственно, 0 или 1, значительно проще, чем, например, три или десять. Действительно, отсутствие напряжения может обозначать 0, наличие — 1; отсутствие намагниченности участка носителя информации — 0, присутствие намагниченности — 1 и т.д. Каждая цифра машинного кода несет 1 бит информации.
Для кодирования одного символа используют 8 бит - один байт.
Байт - это наименьшая единица обработки информации. С помощью одного байта можно закодировать 28=256 символов.
Существует таблица кодов символов. Первые коды с 0 по 127 являются стандартными и обязательными для всех стран и всех компьютеров.
Коды с 0 по 32 соответствуют операциям (перевод строки, ввод пробела и т.д.)
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 225 являются национальными (в каждой стране разные), т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.
|
Первую половину называют таблицей ASCII (Американский стандартный код для обмена информацией).
Для русских букв существует пять однобайтовых таблиц:
Windows, MS-DOS, КОИ-8, Mac, ISO.
Также разработан международный стандарт Unicode, в котором каждый символ кодируется двумя байтами.
ЗАДАНИЯ НА КОДИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ
Задание 1
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 720 бит. Какова длина сообщения в символах?
1) 90
2) 45
3) 180
4) 720
Решение:
Пусть в первоначальном сообщении х символов. Тогда его объем равен:
16 бит* х = 16х бит
В перекодированном сообщении количество символов не изменилось, т.е. оно также равно х, а вот его объем стал равен: 8 бит* х = 8х бит.
И этот объем меньше первоначального на 720 бит. Составим уравнение и решим его:
16х — 8х =720
8х = 720
х = 90
Ответ: 1
Задание 2
В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.
1) 384 бита;
2) 192 бита;
3) 256 бит;
4) 48 бит.
Решение:
24 * 2байта=48 байтов=384 бита
Ответ: 1
Задание 3
Текстовый документ, состоящий из 5120 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.
Решение. После перехода от 8-битной кодировки из 16-битного на каждый символ стало тратиться на 8 бит = 1 байт больше. На 5120 символов будет нужно больше на 5120*8 бит =5120*1 байт = 5120 байт = 5*1024 байт = 5 Кбайт.
|
Ответ: 5
Задание 4
Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующей Пушкинской фразы в кодировке Unicode:
Привычка свыше нам дана: Замена счастию она.
1) 44 бита;
2) 704 бита;
3) 44 байта;
4) 704 байта.
Решение
Данное предложение содержит 44 символа (включая точку и двоеточие), то есть в кодировке Unicode оно содержит 88 байт или 704 бита.
Ответ: 2
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО ВЫПОЛНЕНИЯ НА ЗАНЯТИИ
Вариант 1
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинских строк:
Певец Давид был ростом мал, Но повалил же Голиафа!
1) 400 битов; 2) 50 битов; 3) 400 байтов; 4) 5 байтов.
Задание 2 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 100 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.
Вариант 2
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине – только один.
1) 92 бита; 2) 220 бит; 3) 456 бит; 4) 512 бит.
Задание 2 Текстовый документ хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode, при этом размер памяти, необходимой для хранения документа увеличился на 4 Кбайт. При этом хранится только последовательность кодов символов. Укажите, сколько символов в документе. В ответе запишите только число.
Вариант 3
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Алексея Толстого:
Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.
1) 512 бит; 2) 76 байт; 3) 8 Килобайт; 4) 123 байта.
Задание 2 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. При этом длина сообщения уменьшилась на 600 бит. Укажите, сколько символов было в сообщении.
Вариант 4
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Рене Декарта:
Я мыслю, следовательно, существую.
1) 28 бит; 2) 272 бита; 3) 32 Кбайта; 4) 34 бита.
Задание 2 Текстовый документ, состоящий из 5120 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 32-битную кодировку. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.
Вариант 5
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Дени Дидро:
Что такое истина? Соответствие наших суждений созданиям природы.
1) 64 бита; 2) 128 бит; 3) 256 бит; 4) 512 бит.
Задание 2 Текстовый документ хранился в 8-битной кодировке КОИ-8, а затем был преобразован в 32-битную кодировку. При этом для хранения документа дополнительно потребовалось 30 Кбайт. Определите длину документа (в символах). В ответе запишите только число.
Вариант 6
Задание 1 Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Блеза Паскаля:
Красноречие – это живопись мысли.
1) 264 бита; 2) 28 бит; 3) 32 Кбайт; 4) 34 байта.
Задание 2 Текстовый документ, состоящий из 3072 символов, хранился в 16-битной кодировке Unicode, а затем был преобразован в 8-битную кодировку КОИ-8. Укажите, на какое количество Кбайт уменьшился размер файла, в котором хранился документ.