Стандарты ASCII; КОИ; ISO 8859; Unicode и UTF-8 кодирования текстовой информации.




Определение понятия «информация», ее виды, способы хранения и обработки.

Информация – это осознанные сведения об окружающем мире, кот. являются О. хранения, преобразования, пе­редачи и использования. Сведения – это знания, выраженные в сигналах, сообщениях, известиях, уведомлениях и т.д. Каждого человека в мире окружает море информации различ­ных видов. Мозг чело­века хранит множество информации, и использует для хранения ее свои способы, основа которых –

двоичный код, как и у компьютеров. Человек всегда стремился иметь возможность поделиться своей ин­формацией с другими людьми и найти надежные средства для ее пе­редачи и долговременного хранения. Основные виды информации по ее форме представления, спо­собам ее кодирования и хранения, что имеет наибольшее значение для информатики, это: графическая или изобразительная – первый вид, для которого был реализован способ хранения информации об окружающем мире в виде наскальных рисунков;

звуковая – мир вокруг нас полон звуков и задача их хранения и тиражирования была решена с изобретением звукозаписывающих устройств в 1877 г.;

текстовая – способ кодирования речи человека специальными символами – буквами,

числовая – количественная мера объектов и их свойств в окру­жающем мире;

видеоинформация – способ сохранения движущихся картин окру­жающего мира, появившийся с изобретением кино.

Хранение информации при использовании компьютеров осуще­ствляется на магнитных дисках или лентах, на лазерных дисках (CD и DVD), специальных устройствах энергонезависимой памяти (флэш-память и пр.).

Хранение информации при использовании компьютеров осуще­ствляется на магнитных дисках или лентах, на лазерных дисках (CD и DVD), специальных устройствах энергонезависимой памяти (флэш-память и пр.). Эти методы постоянно совершенствуются, изобрета­ются новые устройства и носители информации. Обработку информа­ции (воспроизведение, преобразование, передача, запись на внешние носители) выполняет процессор компьютера. С помощью компьютера возможно создание и хранение новой информации любых видов, для чего служат специальные программы, используемые на компьютерах, и устройства ввода информации.

Особым видом информации в настоящее время можно считать информацию, представленную в глобальной сети Интернет. Здесь ис­пользуются особые приемы хранения, обработки, поиска и передачи распределенной информации больших объемов и особые способы ра­боты с различными видами информации.

Стандарты ASCII; КОИ; ISO 8859; Unicode и UTF-8 кодирования текстовой информации.

Вся информация, которую хранит, обрабатывает и передает по сетям компьютер, представлена в виде двоичных чисел. Существуют международные стандарты и методы кодирования текстовой, числовой, изобразительной, звуковой и видеоинформации.

Для кодирования букв и других символов, используемых в пе­чатных документах, необходимо закрепить за каждым символом чи­словой номер – код.

Первой 7-разрядной кодовой таблицей была ASCII (American Standard Code for Information Interchange), опубликованная как стандарт в 1963 г. американской организацией по стандартизации American Standards Association (ASA), которая позднее стала имено­ваться ANSI. Таблица содержала 32 кода команд или управляющих символов (от 0 до 31), большая часть которых сегодня не используется, и 95 кодов (от 33 до 127) для различных знаков, достаточных для работы с английскими текстами. В последующем данная таблица ASCII была принята как стан­дарт ведущими международными организациями по стандартизации:

ISO/IEC 646:1991 (ISOhttps://www.iso.org/ – International Organization for Standardization. Для нашей страны и многих других стран необходимо было добавить в кодовую таблицу символы национальных алфавитов. Для этого было предложено использовать 8-битную кодовую таблицу, которая могла содержать дополнительно еще 128 символов (с 128 по 255).

В дальнейшем был принят стандарт на 8-битную таблицу ASCIIISO/IEC 8859, в которой первые 128 символов оставались те же, что и в 7-битной таблице, а символы с 128 по 255 отводились для неанглийских символов.

Первые русские ЭВМ использовали 7-битную кодировку символов КОИ-7,в которой присутствовали прописные латинские буквы, а на месте строчных латинских были русские прописные буквы (кириллица).

В 1991 году в Калифорнии была создана некоммерческая организация Unicode Consortium, в которую входят представители многих компьютерных фирм (Borland, IBM, Lotus, Microsoft, Novell, Sun, WordPerfect и др.), и которая занимается развитием и внедрением стандарта «The Unicode Standard».

Стандарт кодирования символов Unicode становится доминирующим в интернациональных программных многоязычных средах. Microsoft Windows NT и его потомки Windows 2000, 2003, XP, Vista используют Unicode, точнее UTF-16, как внутреннее представление текста. UNIX-подобные операционные системы типа Linux, BSD и Mac OS X приняли Unicode (UTF-8), как основное представления многоязычного текста.

Unicode резервируют 1114112 (220+216) символов кода, в настоящее время используются более 96000 символов. Первые 256 кодов символов точно соответствуют таковым ISO 8859-1, наиболее популярной 8-разрядной таблицы символов «западного мира»; в результате, первые 128 символов также идентичны таблице ASCII.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-07-22 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: