Введение
Мы знаем, что понятие информация и данные это взаимосвязанные понятия, но не тождественные. Хотя можно заметить следующее:
В те годы, когда формировалось понятие база данных, то в ней действительно хранились данные и только данные. Однако в современных системах управления базами данных имеется возможность не только хранить данные в своих структурах, но и хранить программный код, т.е. методы, с помощью которых происходит взаимодействие с потребителем или с другим программно – аппаратным комплексом.
Таким образом, можно утверждать, что в современных базах данных хранятся не только данные, но и информация.
С понятием база данных тесно связано понятие система управления базами данных. Именно о ней пойдет сегодня речь.
Понятия и определения
В настоящее время жизнь человека настолько насыщена различного рода информацией, что для ее обработки требуется создание огромного количества хранилищ информации различного назначения.
Современные информационные системы характеризуются огромными объемами хранимых данных, сложной организацией, необходимостью удовлетворять разнообразные требования многочисленных пользователей.
Основой информационной системы является база данных.
Целью любой информационной системы является обработка данных об объектах реального мира.
В широком смысле слова база данных - это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области.
Кроме того, база данных – это хранилище данных для совместного использования. При автоматизации деятельности человека происходит перенос реального мира в электронный формат. Для этого выделяется какая-то часть этого мира и анализируется на предмет возможности автоматизации. Она называется предметной областью и строго очерчивает круг объектов, которые изучаются, измеряются, оцениваются и т.д. В результате этого процесса выделяются объекты автоматизации и определяются реквизиты, по которым данные объекты оцениваются. Графически данный процесс схематично показан на рис. 1.
|
Предметная область
Объекты
Реквизиты: рост, возраст, размер обуви
Рис. 1. Понятие предметной области
Результатом данного процесса становится база данных, которая описывает конкретную часть реального мира со строго определенных позиций. Итак, оценивая все вышесказанное, можно сказать, что:
Предметная область - это часть реального мира, подлежащего изучению для организации управления и автоматизации.
Объект - это элемент предметной области, информацию о котором мы сохраняем.
Реквизит (атрибут) – поименованная характеристика объекта. Он показывает, какая информация об объекте должна быть собрана.
Объектами могут быть:
· люди, например, перечисленные в какой-либо платежной ведомости или являющиеся объектами учетов органов внутренних дел;
· предметы, например, номерные или имеющие характерные отличительные особенности вещи, средства автомототранспорта;
· построения - воображаемые объекты;
· события.
Базы данных выполняют две основные функции. Они группируют данные по информационным объектам и их связям и предоставляют эти данные пользователям.
Данные - это формализованное представление информации, доступное для обработки, интерпретации и обмена между людьми или в автоматическом режиме.
|
Информация может храниться в неструктурированном виде, например, в виде текстового документа, где данные об объектах предметной области записаны в произвольной форме:
Студент Иванов Иван родился 4 апреля 1981 года, обучается в 411 группе, номер его зачетной книжки 200205; студент Виктор Сидоров 06.08 1982 г.р., имеет зачетную книжку №200213, обучается в 413 группе; Женя Петров, родился в 1982 году 25 марта, номер зачетной книжки 200210, обучается в 411 группе.
В качестве предметной области в данном примере может быть представлена сфера деятельности деканата факультета по учету студентов. Объектами этой предметной области выступают как сами студенты, так и данные их номеров зачетных книжек.
Структурированный вид хранения информации предполагает введение соглашений о способах представления данных. Это означает, что в определенном месте хранилища могут находиться данные определенного типа, формата и содержания. Указанная выше информация о гражданах Петрове, Сидорове и Иванове в структурированном виде будет выглядеть следующим образом:
№ | Фамилия | Имя | Дата рождения | Учебная группа | № зачетной книжки |
1 | ИВАНОВ | ИВАН | 04.04.1981 | 411 | 200205 |
2 | ПЕТРОВ | ЕВГЕНИЙ | 25.03.1982 | 411 | 200210 |
3 | СИДОРОВ | ВИКТОР | 06.08.1982 | 414 | 200213 |
Рис. 2. Пример структурированных данных
Представление информации в таблице - наилучший способ структурирования данных. Все данные записаны в клеточках таблицы по определенным правилам – форматам, одинаковым для всего столбца. Все столбцы имеют названия. Кроме этого нетрудно заметить, что фамилии студентов записаны по алфавиту, при этом для записей имен и фамилий используются заглавные буквы. Каждая строка таблицы имеет порядковый номер.
|
Автоматизировать обработку данных, которые хранятся в неструктурированном виде сложно, а порой и просто невозможно. Поэтому вырабатывают определенные соглашения о способах представления данных. Обычно это делает разработчик базы данных. В результате все реквизиты имеют одинаковый вид и тип данных, что делает их структурированными и позволяет создать базу данных. В результате можно сказать, что:
База данных - это поименованная совокупность структурированных данных, относящихся к определенной предметной области.
Обрабатывает структурированные данные централизованный программный механизм, который называется системой управления базами данных.
Система управления базами данных (СУБД) - это программный механизм, предназначенный для записи, поиска, сортировки, обработки (анализа) и печати информации, содержащейся в базе данных.
В компьютерной базе данных информация представляется в виде таблицы, очень похожей на электронную таблицу. Названия столбцов, представляющих «шапку» таблицы, называют именами полей или реквизитами, а самистолбцы - полями. Данные в полях называют значениями реквизитов или значениями полей. Для описания поля, кроме его имени используются следующие характеристики и свойства полей:
Тип поля. Подобно электронной таблице, работающей с тремя типами полей: текстовый, числовой и формула, в таблицах используется несколько большее количество типов полей.
Длина поля – максимально возможное количество символов.
Точность (для числовых типов полей) – количество знаков после запятой.
Маска ввода – форма средства автоматизации ввода, в которой вводятся данные в поле. Например, одно и то же значение имеют поля даты: 03.03.95 или 03.03.1995, или 03-март-1995, но отличаются по формату.
Сообщение об ошибке – текстовое сообщение, которое выдается в поле при попытке ввода ошибочных данных.
Условие на значение – ограничение, используемое для проверки правильности ввода данных.
Пустое и обязательное поле – свойство поля, определяющее обязательность заполнения поля при наполнении базы данных.
Индексированное поле – дополнительное имя поля, позволяющее ускорить операции поиска и сортировки записей.
Строки данных таблицы называются записями (рис.3).
Таким образом:
Поле - это элементарная единица логической организации данных, которая соответствует неделимой единице информации - реквизиту.
Запись - совокупность логически связанных полей, представленных одной строкой таблицы.
Файл (таблица) – совокупность экземпляров записей одной структуры.
Строки-записи Столбцы=поля
Имена полей
Фамилия | Имя | Отчество | Клички |
Авраменко | Юрий | Иванович | Авраам |
Белов | Виктор | Петрович | Белый |
Петрова | Галина | Сергеевна | Худоба |
Сидоров | Иван | Захарович | Захар |
Рис. 3. Основные структурные элементы базы данных
Классификация баз данных
Многообразие характеристик и видов баз данных порождает многообразие классификации. Рассмотрим основные виды классификации.
По технологии обработки данных базы данных подразделяются на централизованные и распределенные.
Централизованная база данных хранится в памяти одной вычислительной системы, к которой подключены несколько других компьютеров.
Распределенная база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ПК компьютерной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
По способу доступа к данным базы данных подразделяются на базы данных с локальным доступом и базы данных с удаленным (сетевым) доступом.
Системы централизованных баз данных с сетевым доступом предполагают различные архитектуры подобных систем:
· файл-сервер. Согласно этой архитектуре в компьютерной сети выделяется машина- сервер для хранения файлов централизованной базы данных. Файлы базы данных могут быть переданы на рабочие станции для обработки: ввода, корректировки, поиска записей. При большой интенсивности доступа к одним и тем же файлам производительность системы падает. В этой системе сервер и рабочие станции должны быть реализованы на достаточно мощных компьютерах.
· клиент-сервер – архитектура, используемая не только для хранения файлов централизованной базы данных на сервере, но и выполняющая на том же сервере основной объем работы по обработке данных. Таким образом, при необходимости поиска информации в базе данных рабочим станциям - клиентам передаются не файлы данных, а уже записи, отобранные в результате обработки файлов данных. Такая архитектура позволяет использовать маломощные компьютеры в качестве рабочих станций, но обязательно в качестве сервера используется очень мощный компьютер.
Прежде чем создавать базу данных, с которой вам придется работать, необходимо выбрать модель данных, наиболее удобную для решения поставленной задачи.
Модель данных - совокупность структур данных и операций их обработки.
С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними. Модели данных, которые поддерживают СУБД, а, следовательно, и сами СУБД делят на:
· иерархические;
· сетевые;
· реляционные.
Иерархическая база данных (рис. 4), в основу которой положена разветвленная структура с элементами подчиненности.
К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Узел - это совокупность атрибутов данных, описывающих некоторый объект. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне.
Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в базе данных определяется числом корневых записей. В каждой записи базы данных существует только один (иерархический) путь от корневой записи.
Уровни Корневой узел
Узлы
Рис. Структура учебной дисциплины (иерархическая база данных)
Несмотря на кажущуюся целесообразность, для получения ответов на некоторые запросы в иерархической модели требуется выполнение большого числа операций. Например, чтобы узнать о практических занятиях по всем дисциплинам БЮИ требуется просмотреть все записи «Практическое занятие», имеющиеся в данной базе.
Сетевая (полносвязная) база данных. В сетевой структуре базы данных при тех же основных понятиях иерархической базы данных: узел, уровень, связь - каждый элемент может быть связан с любым другим элементом.
Реляционная база данных, в основу которой положена реляционная информационная система. Реляционная структура базы данных ориентирована на организацию данных в виде двумерных таблиц, называемых еще реляционными таблицами.
Каждая реляционная таблица обладает следующими свойствами:
· каждый элемент таблицы - один элемент данных;
· все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковые характеристики и свойства;
· каждый столбец имеет уникальное имя;
· одинаковые строки в таблице отсутствуют;
· порядок следования строк и столбцов может быть произвольным.
Понятие реляционный (relation – отношение) связано с разработками известного американского специалиста в области баз данных Э. Кодда. В основу реляционной базы данных положено понятие алгебры отношения и реляционного исчисления.
Реляционный подход к построению базы данных предполагает отображение реальных объектов (явлений, событий, процессов) в виде информационных объектов или объектов предметной области. Информационные объекты описывают реальные с помощью совокупности взаимосвязанных реквизитов.
Отношения представлены в виде таблиц, строки которых представляют записи, а столбцы – атрибуты отношений – поля. Если значение поля однозначно определяет соответствующую запись, то такое поле называют ключевым.
Имеется возможность связать две реляционные таблицы, если ключ одной таблицы ввести в состав ключа другой таблицы (рис. 5).
Так, если ключом таблицы книга будет выбран «№ в каталоге», то такую таблицу можно связать, например, с таблицей «Список библиотечного фонда». В этой таблице кроме полей, определяющих оценки по дисциплинам сессии, обязательно должно быть поле «№ в каталоге». Таким образом, между этими таблицами может быть установлена связь по этому ключевому полю.
Информация, введенная в одну реляционную таблицу, может быть связана с одной или несколькими записями другой таблицы
Ключи
Связи между таблицами
Рис. 5. Структура библиотеки (реляционная база данных)
.
Реляционная база данных является объединением нескольких двумерных таблиц, между которыми установлены связи.
Между записями двух таблиц могут быть установлены следующие основные виды связей:
· один к одному - эта связь предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует не более одного экземпляра информационного объекта В и наоборот; например, начальник курса – курс;
· один к многим - эта связь предполагает, что одному экземпляру информационного объекта А соответствует 0, 1, 2 или более экземпляров объекта В, но каждый экземпляр объекта В связан не более чем с 1 экземпляром объекта А, например, начальник курса – курсант;
· многие к многим - эта связь предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует 0, 1, 2 или более экземпляров объекта В и наоборот, например, учебная дисциплина - курсант.
Одни и те же данные могут группироваться в таблицы различными способами, т.е. возможна различная форма наборов отношений взаимосвязанных информационных объектов.
При этом должен выполняться принцип нормализации:
· в одной и той же таблице не может находиться повторяющихся полей;
· в каждой таблице ключ должен однозначно определять запись из множества записей;
· значению ключа должно соответствовать исчерпывающая информация об объекте таблицы;
· изменение значения любого не ключевого поля не должно влиять на информацию в других полях.
В последние годы подавляющее большинство баз данных являются реляционными и практически все СУБД ориентированы на такое представление информации.
Список литературы
1. Згадзай О.Э. Информатика и математика. Учебник/ О.Э. Згадзай, С.Я. Казанцев, А.В. Филиппов. – М.: ИМЦ ГУК МВД России. 2002. с. 130-166.
2. Информатика: Базовый курс/Под ред. С.В.Симоновича. - СПБ.:Питер,2002. С. 198-243.
3. Леонтьев В.П. Новейшая энциклопедия персонального компьютера 2003./В.П. Леонтьев.-М.:ОЛМА-ПРЕСС, 2003.-с 632-705.
4. Лукьянов Д.Б.Информатика и математика. Курс лекций./Д.Б.Лукьянов. А.Н. Прокопенко.-Белгород ООНИ и РИД БелЮИ МВД России, 2004.-с106-140.