Единицы хранения информации

Кластер (Cluster) – в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов. Например, на дисках с размером секторов 512 байт 512-байтный кластер содержит один сектор, тогда как 4-килобайтный кластер содержит восемь секторов.

Как правило, это наименьшее место на диске, которое может быть выделено для хранения файла. Понятие «кластер» используется в файловых системах FAT и NTFS. Другие файловые системы оперируют схожими понятиями (зоны в Minix, блоки в UNIX).

Единицы измерения информации. Бит – наименьшая единица измерения информации при ее представлении. Байт – наименьшая единица измерения информации при ее обработке и передаче.

Решая различные задачи, человек использует информацию об окружающем нас мире. Часто приходится слышать, что сообщение несет мало информации или, наоборот, содержит исчерпывающую информацию, при этом разные люди, получившие одно и то же сообщение (например, прочитав статью в газете), по-разному оценивают количество информации, содержащейся в нем. Это означает, что знания людей об этих событиях (явлениях) до получения сообщения были различными. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя. Если в результате получения сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет необходимости в дополнительной информации на эту тему. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было (нулевая информация).

Подбрасывание монеты и слежение за ее падением дает определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию размером 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара размером 1 бит.

Слово «бит» (Bit) – сокращение от английских слов Binary Digit, что означает «двоичная цифра».

В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено – не намагничено, есть отверстие – нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое – цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (Binary Encoding).

В информатике часто используется величина, называемая байтом (Byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, – один вариант из 256 (2⁸). Наряду с байтами для измерения количества информации используются более крупные единицы:

– 1 Кб = 2¹⁰байт = 1024 байт;

– 1 Мб = 2¹⁰ Кб = 1024 Кб;

– 1 Гб = 2¹⁰ Мб = 1024 Мб.

Допустим, например, что книга содержит 100 страниц; на каждой странице 35 строк, в каждой строке 50 символов. Объем информации, содержащийся в книге, рассчитывается следующим образом.

Страница содержит 35 х 50 = 1750 байт информации. Объем всей информации в книге (в разных единицах):

– 1750 х 100 = 175000 байт;

– 175000 / 1024 = 170,8984 Кб;

– 170,8984 / 1024 = 0,166893 Мб.

Файл. Файл – форма хранения информации, содержащая последовательность байтов и имеющая уникальное имя.

Основное назначение файлов – хранить информацию. Они предназначены также для передачи данных от программы к программе и от системы к системе. Другими словами, файл – это хранилище стабильных и мобильных данных. Но файл – это нечто большее, чем просто хранилище данных. Обычно файл имеет имя, атрибуты, время модификации и время создания.

Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, например на диске. Файлы организованы в каталоги (иногда называемые директориями или папками). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги.

Способ, которым данные организованы в байты, называется форматом файла.

Для того чтобы прочесть файл, например, электронной таблицы, нужно знать, каким образом байты представляют числа (формулы, текст) в каждой ячейке; чтобы прочесть файл текстового редактора, надо знать, какие байты представляют символы, а какие – шрифты или поляг, а также другую информацию.

Программы могут сохранять данные в файле способом, выбираемым программистом. Часто предполагается, однако, что файлы будут использоваться различными программами, поэтому многие прикладные программы поддерживают наиболее распространенные форматы, чтобы другие программы могли понять данные в файле. Компании по производству программного обеспечения (которые хотят, чтобы их программы стали «стандартами») часто публикуют информацию о создаваемых ими форматах, чтобы их можно было использовать в других приложениях.

Все файлы условно можно разделить на две части – текстовые и двоичные.

Текстовые файлы – наиболее распространенный тип данных в компьютерном мире. Для хранения каждого символа чаще всего отводится один байт, а кодирование текстовых файлов выполняется с помощью специальных таблиц, в которых каждому символу соответствует определенное число, не превышающее 255. Файл, для кодировки которого используется только 127 первых чисел, называется ASCII-файлом (сокращение от American Standard Code for Information Intercange – американский стандартный код для обмена информацией), но в таком файле не могут быть представлены буквы, отличные от латиницы (в том числе и русские). Большинство национальных алфавитов можно закодировать с помощью восьмибитной таблицы. Для русского языка наиболее популярны на данный момент три кодировки: Koi8-R, Windows-1251 и так называемая альтернативная (alt) кодировка.

Такие языки, как китайский, содержат значительно больше 256 символов, поэтому для кодирования каждого из них используют несколько байтов. Для экономии места зачастую применяется следующий прием: некоторые символы кодируются с помощью одного байта, в то время как для других используется два или более байтов. Одной из попыток обобщения такого подхода является стандарт Unicode, в котором для кодирования символов используется диапазон чисел от нуля до 65536. Такой широкий диапазон позволяет представлять в численном виде символы языка любого уголка планеты.

Двоичные файлы, в отличие от текстовых, не так просто просмотреть, и в них обычно нет знакомых человеку слов – лишь множество непонятных символов. Эти файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображениями.

Алгоритмизация

Появление алгоритмов связывают с зарождением математики. Более 1000 лет назад ученый из города Хорезма создал книгу по математике, в которой описал способы выполнения арифметических действий над многозначными числами.

Само слово «алгоритм» возникло в Европе после перевода на латынь этой книги. Научное определение понятия алгоритма дал выдающийся американский математик и логик, внесший значительный вклад в основы информатики, А. Черч в 1930 г. (рис. 5.1).

Алгоритм – описание последовательности действий (план), строгое исполнение которых приводит к решению поставленной задачи за конечное число шагов.

Единого «истинного» определения понятия «алгоритм» нет.

«Алгоритм – это конечный набор правил, который определяет последовательность операций для решения конкретного множества задач и обладает пятью важными чертами: конечность, определенность, ввод, вывод, эффективность» (Д.Э. Кнут).

«Алгоритм – это всякая система вычислений, выполняемых по строго определенным правилам, которая после какого-либо числа шагов заведомо приводит к решению поставленной задачи» (А. Колмогоров).

«Алгоритм – это точное предписание, определяющее вычислительный процесс, идущий от варьируемых исходных данных к искомому результату» (А. Марков).

«Алгоритм – это строго детерминированная последовательность действий, описывающая процесс преобразования объекта из начального состояния в конечное, записанное с помощью понятных исполнителю команд» (Н. Угринович).

Алгоритм позволяет формализовать выполнение информационного процесса. Алгоритм, записанный на «понятном» компьютеру языке программирования, является программой.

Единицы хранения информации

Поиск по сайту