Г) Двоичное кодирование текста




А) Измерение информации

В информатике используются различные подходы к измерению информации:

-Содержательный подход к измерению информации.

Количество информации, заключенное в сообщении, определяется по формуле Хартли:

где N – количество равновероятных событий;
I – количество информации (бит), заключенное в сообщении об одном из событий.

-Алфавитный (технический) подход к измерению информации - основан на подсчете числа символов в сообщении.

Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, заключенное в сообщении вычисляется по формуле:

Ic – информационный объем сообщения

К – количество символов

N – мощность алфавита (количество символов)

i - информационный объем 1 символа

Б) Двоичное кодирование информации

К достоинству двоичной системы счисления относится:

– простота совершаемых операций,

-возможность автоматической обработки информации

-операция сдвиг

Кодирование – это операция преобразования знаков одной знаковой системы в знаки другой знаковой системы.

Декодирование – расшифровка кодированных знаков, преобразование кода символа в его изображение

Двоичное кодирование – кодирование информации в виде 0 и 1

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться:

-числа

-символьная информация (буквы, цифры, знаки)

-графические изображения

-звук

В) Двоичное кодирование чисел

Для записи информации о количестве объектов используются числа.

Числа записываются с использованием особых знаковых систем, которые называют системами счисления.

Система счисления – совокупность приемов и правил записи чисел с помощью определенного набора символов.

Все системы счисления делятся на две большие группы:


ПОЗИЦИОННЫЕ

Количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра: 0,7 7 70
НЕПОЗИЦИОННЫЕ

Количественное значение цифры числа не зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.

XIX


Г) Двоичное кодирование текста

Кодирование – присвоение каждому символу десятичного кода от 0 до 255 или соответствующего ему двоичного кода от 00000000 до 11111111

Присвоение символу определенного кода – это вопрос соглашения, которое фиксируется в кодовой таблице.

В качестве международного стандарта была принята кодовая таблица ASCII (American Standard Code for Information Interchange):

Коды с 0 по 32 (первые 33 кода) - коды операций (перевод строки, ввод пробела, т.е. соответствуют функциональным клавишам);

Коды с 33 по 127 – интернациональные, соответствуют символам латинского алфавита, цифрам, знакам арифметических операций, знакам препинания;

Коды с 128 по 255 – национальные, т.е. кодировка национального алфавита.

На 1 символ отводится 1 байт (8 бит), всего можно закодировать 28 = 256 символов

С 1997 года появился новый международный стандарт Unicode, который отводит для кодировки одного символа 2 байта (16 бит), и можно закодировать 65536 различных символов (Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, множество математических, музыкальных, химических и прочих символов)

В настоящий момент существует пять кодировок кириллицы: КОИ-8, CP1251, CP866, ISO, Mac.

Для преобразования текстовых документов из одной кодировки в другую существуют программы, которые называются Конверторы.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-12-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: