Систематизация и хранение информации
Кто владеет информацией, тот владеет миром. В каком виде может храниться информация, чтобы с ней было удобно работать? У вас наверняка есть записная книжка. Если вы записываете информацию без всякой системы: телефоны, дни рождения друзей, расписание ваших занятий, какие-либо ближайшие события, — то, вероятно, вам сложно найти нужную информацию. Что же делать? Вы можете навести какой-либо порядок в своей информации. Например, записывать информацию об Иванове на странице «И», выделить часть книжки под текущие события и т.д. Т.е. структурировать вашу информацию.
Информационной системой (ИС) можно считать совокупность любой связанной структурированной информации. Например, в качестве информационной системы можно рассматривать расписание движения поездов или книгу регистрации данных о заказах. Слова «структурированная информация» означают, что информация определенным образом организована.
Информационная система позволяет облегчить труд человека, повысить качество и достоверность обработки информации.
Информационная система может храниться как в «бумажном» варианте, так и в памяти компьютера.
Основу информационной системы составляют хранящиеся в ней данные. Хорошая информационная система должна предоставлять достоверную информацию в определенное время конкретному лицу с ограниченными затратами.
Объектом называется элемент информационной системы, информация о котором сохраняется в ней.
Объект может быть реальным (человек, населенный пункт, какой-либо предмет) и абстрактным (событие,,счет покупателя).
Например, при продаже автомобилей ИС будет содержать такие объекты: модель автомобиля (например, «ВАЗ-2107»), клиент (Сидоров), счет.
На товарном складе это будут поставщик, товар, отгрузка товара и т.д.
Каждый объект обладает набором свойств, которые запоминаются в ИС.
Например, объект — клиент Сидоров — может характеризоваться фамилией, именем, годом рождения, телефоном, адресом, номером счета.
Свойства, характеризующие объект, называются атрибутами объекта.
Например, модель автомобиля характеризуется типом кузова, рабочим объемом двигателя, количеством цилиндров, мощностью, габаритами и т.д.
Каждый атрибут имеет свое имя — идентификатор.
Атрибут, записанный на каком-либо носителе информации, называют элементом данных, полем данных или просто полем.
При обработке данных часто встречаются однотипные объекты с одинаковыми свойствами. Клиент Булкин такэке характеризуется фамилией, именем, годом рождения и т.д.
Совокупность объектов, обладающих одинаковым набором свойств, называется классом объектов. Сидорова и Булкина можно объединить в класс «Клиенты».
Базы данных. Общие сведения. Основные понятия баз данных
База данных (БД) – это совокупность хранимых в памяти ЭВМ и специальным образом организованных взаимосвязанных данных, единицей хранящейся в БД информации является таблица .
Создавая базу данных, пользователь стремится упорядочить информацию по различным признакам и быстро извлекать выборку с произвольным сочетанием признаков. Сделать это возможно, только если данные структурированы.
Единицей хранящейся в БД информации является таблица. Каждая таблица представляет собой совокупность строк и столбцов, где строки соответствуют экземпляру объекта, конкретному событию или явлению, а столбцы - атрибутам (признакам, характеристикам, параметрам) объекта, события, явления. В терминах БД столбцы таблицы называются полями, а ее строки -записями.
В каждой таблице БД может существовать первичный ключ - поле или набор полей, однозначно идентифицирующий запись. Значение первичного ключа в таблице БД должно быть уникальным, то есть в таблице не должно существовать двух или более записей с одинаковым значением первичного ключа. Вторичные ключи (индексы) устанавливаются по полям, которые часто используются при поиске и сортировке данных: вторичные ключи помогут системе значительно быстрее найти нужные данные. В отличие от первичных ключей поля для индексов могут содержать неуникальные значения - в этом, собственно, и заключается главная разница между первичными и вторичными ключами.
Между отдельными таблицами БД могут существовать связи (отношения). Связанные отношениями таблицы взаимодействуют по принципу главная-подчиненная. Главную таблицу называют родительской, а подчиненную - дочерней. Одна и та же таблица может быть главной по отношению к одной таблице БД и дочерней по отношению к другой. Существует три типа отношений между таблицами:
1) отношение один-ко-многим означает, что одной записи из родительской таблицы может соответствовать несколько записей в дочерней таблице. Связь один-ко-многим является самой распространенной, она позволяет моделировать иерархические структуры данных;
2) отношение один-к-одному имеет место, когда одной записи в родительской таблице соответствует одна запись в дочерней таблице. Данное отношение встречается значительно реже, чем отношение один-ко-многим. Его используют, если не хотят, чтобы таблица БД "распухала" от второстепенной информации. Связь один-к-одному приводит к тому, что для чтения связанной информации в нескольких таблицах приходится производить несколько операций чтения, что замедляет
получение нужной информации;
3) отношение многие-ко-многим означает, что каждой записи первой таблицы может соответствовать несколько записей второй таблицы, а каждой записи второй таблицы может соответствовать несколько записей первой таблицы. Считается, что БД всегда можно перестроить так, чтобы любая связь многие-ко-многим была заменена на одну или более связей один-ко-многим.
Система управления базами данных (СУБД) - комплекс программ и языковых средств, предназначенных для создания, ведения и использования баз данных.
Одним из важнейших назначений СУБД является обеспечение независимости данных (независимость данных и использующих их прикладных программ друг от друга в том смысле, что изменение одних не приводит к изменению других). Подобные системы служат для поддержания базы данных в актуальном состоянии и обеспечивают эффективный доступ пользователей к содержащимся в ней данным в рамках предоставленных пользователям полномочий.
Реляционные базы данных
Очень удобно заносить данные в таблицы.
Базы данных, которые организованы в виде нескольких таблиц, называются реляционными.
Таблица — это некоторая структурированная информация, содержащая характеристики объекта или класса объектов.
В настоящее время это самый популярный способ хранения информации в электронном виде.
Каждая строка называется записью, а каждый столбец — полем.
Данная таблица характеризует класс объектов «Сотрудник» и содержит 5 полей и 4 записи. Каждое поле имеет имя и тип.
Различают символьные, числовые, графические, даты, время, и др. типы полей. Поля Фамилия и Пол — это символьные поля, Дата рождения имеет тип дата, Зарплата и Аванс — суммы (денежный тип).
Домен — это набор допустимых значений поля. Для приведенного примера:
1) домен поля Фамилия — любые русские буквы и дефис, поле не может содержать латинских букв, цифр, знаков препинания или каких-либо других символов;
2) домен поля Пол — значения «М», «м», «Ж», «ж»;
3) домен поля Дата рождения — значения в диапазоне от 1 января 1930 г. до 1990 г. (т,к. вряд ли на предприятии могут работать глубокие старцы и грудные младенцы);
4) зарплата и аванс могут принимать только положительные значения.
Типы моделей данных
В настоящее время существует 3 модели данных.
• Иерархическая.
• Сетевая.
• Реляционная.
Исторически первой появилась Иерархическая модель данных. Иерархическая модель данных строится по принципу иерархии типов объектов, т.е. один тип объекта является главным, а остальные подчиненными.
Данные представлены в виде деревьев. Две вершины дерева связаны отношением подчиненности. Дерево обязательно содержит одну вершину, которая не имеет главных. Такая вершина называется корнем. В данном случае это вершина 3. Вершины, которые не имеют подчиненных называются листьями, на рисунке это 1,2, 5, 7, 8, 9.
Вершина дерева хранит данные, характеризующие некоторый объект и несколько связей с подчиненными вершинами.
Между главными и подчиненными объектами установлено отношение «один ко многим». Для каждого подчиненного типа объекта может быть только один исходный тип объекта.
Главная вершина — Отдел — содержит информацию о названии, бюджете и телефоне отдела. Отдел имеет подчиненную вершину Руководитель с информацией Фамилия, Год рождения, Разряд и несколько подчиненных вершин сотрудники, каждый сотрудник характеризуется Фамилией, Адресом и т.д. Данное дерево содержит информацию об одном отделе. Для описания второго отдела требуется второе дерево. База данных будет содержать несколько деревьев одинаковой структуры. Возможные операции с иерархической базой данных: переход между деревьями, создание и удаление дерева, поиск вершины дерева, изменение информации в вершинах. Работа с иерархическими базами данных основана на математической теории графов.
Сетевая модель данных.
Понятие главного и подчиненного объекта несколько расширено. Любой объект может быть главным и подчиненным.
![]() |
Каждый объект может участвовать в любом числе взаимодействий. Единственное ограничение — отношение подчиненности не может вернуться обратно к вершине, с которой оно начиналось.
Отдел содержит информацию: Название, Бюджет, Телефон и связи с Руководителем и несколькими Сотрудниками. Руководитель характеризуется Датой вступления в должность, Годом рождения, Разрядом. Сотрудники характеризуются Фамилией, Адресом. Вершина Руководитель связана с одной из вершин Сотрудников, в ней хранятся Фамилия и Адрес руководителя.
Реляционная модель данных.
В реляционной модели данных объекты и взаимодействия между ними представляются с помощью таблиц. Каждая таблица должна иметь первичный ключ — поле или комбинацию полей, которая единственным образом идентифицирует каждую строку таблицы.
В настоящее время реляционная модель данных является наиболее популярной. На ее идеологии построены СУБД FoxPro, Access, Visual C++ и д.p.
Возможные операции в реляционной базе данных: создание таблиц и связей, изменение структуры таблиц, добавление, удаление и изменения записей, поиск данных, отбор данных из одной или нескольких таблиц и т.д.
Работа с реляционными базами данных основана на реляционной алгебре.