Принципы представления данных в компьютере
Информация, хранимая в памяти компьютера и предназначенная для обработки, называется данными.
Данные в компьютере представляются в виде кода, который состоит из единиц и нулей в разной последовательности.
Код - набор условных обозначений для представления информации. Кодирование - процесс представления информации в виде кода. Компьютер может обрабатывать информацию, представленную только в числовом виде. Вся другая информация (звуки, изображения, видео) должна быть преобразована в числовую форму, закодирована.
Единицей информации в компьютере является 1 бит, т.е. двоичный разряд, который принимает значение 0 или 1. Однако, компьютер редко работает с конкретными битами в отдельности. Наименьшая единица информации, с которой работает компьютер – это совокупность из восьми битов, воспринимаемая компьютером как единое целое. Эта комбинация битов называется байтом. Байт можно трактовать иначе: как символ, как ячейку памяти, как единицу измерения оперативной и внешней памяти.
Большие наборы байтов удобнее измерять крупными единицами:
1024 байт = 1 килобайт (1 Кб)
1024 Кбайт (или 1048576 байт) = 1 мегабайт (1Мб)
1024 Мбайт (или 1073741824 байт) = 1 гигабайт (1 Гб)
Кодирование текстовой информации
Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.
Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно
Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов.
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111.
Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
Кодирование текстовой информации с помощью байтов опирается на несколько различных стандартов, но первоосновой для всех стал стандарт ASCII (AmericanStandartCodeforInformationInterchange), разработанный в США в Национальном институте ANSI (AmericanNationalStandartsInstitute).
В системе ASCII закреплены две таблицы кодирования - базовая и расширенная.
Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.
Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д.).
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.
С распространением современных информационных технологий в мире возникла необходимость кодировать символы алфавитов других языков: японского, корейского, арабского, хинди, а также других специальных символов.
На смену старой системе пришла новая универсальная – UNICODE, в которой один символ кодируется не одним, а двумя байтами.
WINDOWS, KOI8-R, KOI8-U, UNICODE и др.), поэтому тексты, созданные в одной кодировке, могут не правильно отображаться в другой.
Кодирование графической информации
Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек.
Давайте посмотрим на экран компьютера через увелечительное стекло.
В зависимости от марки и модели техники мы увидим либо множество разноцветных прямоугольничков, либо множество разноцветных кружочков.
И те, и другие группируются по три штуки, причем одного цвета, но разных оттенков.
Они называются ПИКСЕЛЯМИ (от английского PICture'sELement).
Пиксели бывают только трех цветов - зеленого, синего и красного.
Другие цвета образовываются при помощи смешения цветов.
Рассмотрим самый простой случай - каждый кусочек пикселя может либо гореть (1), либо не гореть (0).
Тогда мы получаем следующий набор цветов:
Из трех цветов можно получить восемь комбинаций.
Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности, тогда количество различных вариантов их сочетаний, дающих разные краски и оттенки, увеличивается.
Шестнадцатицветная палитра получается при использовании 4-разрядной кодировки пикселя: к трем битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трех цветов одновременно.
Число цветов, воспроизводимых на экране монитора (N), и число бит, отводимых в видеопамяти на каждый пиксель (I), связаны формулой:
Величину I называют битовой глубиной или глубиной цвета.
Чем больше битов используется, тем больше оттенков цветов можно получить.
Итак, любое графическое изображение на экране можно закодировать c помощью чисел, сообщив, сколько в каждом пикселе долей красного, сколько - зеленого, а сколько - синего цветов.
Также графическая информация может быть представлена в виде векторного изображения.
Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг.
Положение этих элементарных объектов определяется координатами точек и длиной радиуса.
Для каждой линии указывается ее тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет.
Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.
Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается.
Чем больше разрешающая способность, т.е. чем больше количество строк растра и точек в строке, тем выше качество изображение.