Тема: Информационные системы и базы данных.

Учебные вопросы:

1. Понятие об информационной системе и базе данных.

2. Реляционная база данных.

Во всех сферах деятельности человека, связанных с необходимостью сбора, обработки и использования большого количества информации давно возникла идея использования информационных систем.

Первыми такими информационными системами стали библиотеки, архивы, адресные и телефонные справочные бюро и др.

Информационная система – это комплекс, предназначенный для хранения информации в специальным образом организованной форме, обеспечивающей её накопление и обработку.

Любая ИС должна выполнять три основные функции:

· Ввод данных. В это понятие включается, как правило, и редактирование (уточнение).

· Организация структуры массива данных.

· Вывод данных. Причем должен осуществляться быстрый поиск и вывод данных необходимых конкретному пользователю.

Работа с ИС, реализованными в бумажном виде, сопряжена с большими затратами труда.

Компьютеризация позволила создать ИС, на несколько порядков повысив эффективность их работы и расширив среду их применения.

Компьютеризированные ИС получили название базы данных.

Появились:

· Информационно – справочные и информационно – поисковые системы;

· Системы, обеспечивающие автоматизацию документооборота и учёта, в том числе бухгалтерские;

· Автоматизированные системы управления;

· Экспертные системы;

· Системы автоматизации научных исследований и автоматизированного проектирования

· Информационно – обучающие системы и др.

Возникновение баз данных было вызвано накоплением больших количеств информации в виде данных. Возникли потребности – в организации, хранении и эффективности использовании данных.

База данных на ЭВМ – это организованная совокупность данных, предназначенная для длительного хранения во внешней памяти ЭВМ и постоянного их использования.

Организовать совокупность данных – это значит расположить их в памяти ЭВМ в соответствии с определённым порядком. Первые технологии организации хранения документов возникли во второй половине 80х годов ХХ века.

Этому способствовали разработки ряда понятий:

1. Информационный объект – логические сущности, имеющие различимые свойства. К ним относятся не только данные, но и информационные связи, и вычислительные процессы, различимыми объекты делают их уникальные свойства (имя, адрес и др.).

2. Объединение объектов: компоновка и группировка. Цели объединения – либо получение объекта с новыми свойствами (компоновка), либо эффективное хранение (группировка). Группировка – объединение в группы объектов со сходными свойствами.

3. Принципы адресации к объектам: два принципиально разные принципа адресации – символьный (почтовый адрес) и числовой (номер полевой почты, номер телефона).

В тех случаях, когда информационный обмен происходит между людьми и техническими устройствами используется принцип двойной адресации. Он заключается в применении средства преобразования адресов из одной формы в другую (FAT, NTFS – таблицы размещения файлов).

4. Структура данных. Группировкой информационных объектов данные объединяют в конкретную структуру. Примером простейшей структуры может быть список (list). В этой структуре однотипные информационные объекты имеют уникальное свойство – порядковый номер.

Структура данных в виде записей (records) похожая на список, но отличающаяся тем, что может содержать данные разных типов. Для каждого типа данных в записи выделено отдельное поле. Поля образуют структуру записи. Данные соседних полей отделяются друг от друга символом–разделителем (часто ®).

Таблица (table) представляет собой информационный объект контейнерного типа. Она обеспечивает эффективный доступ к данным за счет того, что записи располагаются в цепочке контейнеров (ячейках) таблицы, имеющих собственную систему адресации. Кроме того, каждая запись в таблице имеет уникальное имя.

Файловая структура также использует в качестве структурных единиц контейнеры – файлы. Кроме того структура включает в себя ряд контейнеров, способных включать в себя другие контейнеры вплоть до файлов – папки. Файл имеет уникальное свойство – имя (способ символьной адресации).

Требования к хранению данных обобщённо сводятся всего к требованиям экономичности и эффективности. На практике выполнение этих двух требований одновременно не получается.

· Экономичность предполагает минимальные затраты на хранение одной условной единицы данных (файловая система).

· Эффективность предполагает минимальные затраты времени на обращение к нужным данным (база данных).

Понятие база данных изначально связана с компьютерными системами, их историей и развитием.

База данных (БД) – это организованная в соответствии с определенными правилами и поддерживаемая в памяти ЭВМ в виде структуры совокупность данных, отражающая актуальное состояние объектов и их отношений в рассматриваемой предметной области.

В основе любой БД лежит модель данных, информационная структура. Термин «модель данных», впервые введенный в 1970^х годах основоположником теории баз данных Джорджем Коддом, отображает совокупность правил создания структур данных в БД, последовательности их изменения.

Модель данных является средством интерпретации как содержимого будущей БД, так и реализации операций по обработке и управлению данными.

Для организации БД используют три типа информационных структур (моделей данных) иерархическую, сетевую и реляционную.

В иерархической БД существует упорядоченность элементов в записи (информационные объекты). Для неё характерна подчинённость объектов нижнего уровня объектам верхнего уровня.

· Файловая система Windows. Каталог папок. Верхний уровень – это корневая папка.

· Системный реестр Windows. Это БД о конфигурации установленного на ЭВМ аппаратного и программного обеспечения.

· Доменная система имён. Это БД о подключенных к Интернету ЭВМ. Настолько велика, что её составные части располагаются на различных DNS – серверах. (Распределенная иерархическая БД).

Сетевая БД отличается большей гибкостью, так как дополнительно к вертикальным «иерархическим» связям в ней существует возможность установления горизонтальных связей. Это облегчает процесс поиска нужных данных, так как исчезает необходимость обязательного прохождения всех иерархических ступеней. Сетевая структура данных представляет собой произвольный граф.

Пример: Глобальная сеть Интернет. Связь между элементами осуществляется с помощью гиперссылок.

Реляционными (от английского relation – отношения) являются БД, содержащие информацию, организованную в виде связанных логическими связями таблиц.

Характеризуется простотой структурных данных, удобными для пользователя табличным представлением, значительно большими возможностями для автоматизации работы (посредством объектов – форм, запросов, отчетов) с данными, ликвидацией избыточности (дублирования) данных при хранении (в отличие от иерархической модели).

Реляционная модель данных предполагает использование некоторых новых понятий.

Отношение – представляет собой двумерную таблицу, состоящую из заголовка и содержательной части. Содержательная часть отношения состоит из компонентов:

· Кортеж – это запись из взаимосвязанных по смыслу данных;

· Атрибут – это поле (столбец), имеющее уникальное в пределах отношения имя;

· Домен – это множество допустимых однородных значений для того или иного атрибута или именуемое множество, состоящее из логически неделимых единиц.

Для отношения также предусматривается уникальный идентификатор (первичный ключ, часто являющийся и индексом). В качестве уникального идентификатора могут выступать один или несколько атрибутов, значения которых являются уникальными в пределах данного отношения, определяющих его (идентификатор) однозначно.

Отношение имеет ряд свойств, называемых свойства первой нормальной формы:

· В отношении не должно быть двух одинаковых кортежей (записей). Первичный ключ исключает создание одинаковых кортежей;

· Кортежи не упорядочены – они располагаются в любом порядке, так как в отношении отсутствует понятие номера по порядку;

· Атрибуты также не упорядочены – они могут быть расположены в заголовке отношения в любом порядке, при этом состояние целостности данных не нарушается;

· Значения атрибутов состоят из логически неделимых единиц – они составляют домены, каждый из которых составляет неделимую часть данных.

Планирование конфигурации базы данных.

Построение любой базы данных необходимо для хранения и использования информации о какой–либо предметной области (всё начинается с предметной области).

При разработке БД принято выделять уровни моделирования, которые служат переходом от предметной области к реализации БД на конкретной СУБД:

· Предметная область;

· Общая модель предметной области;

· Логическая модель данных;

· Физическая модель данных;

· База данных и приложения.

(I) Предметная область.

Представляет описание части реального мира, которое должно охватывать реальные объекты и процессы. Так, в качестве предметной области можно выбрать работу отдела кадров предприятия, учёт успеваемости студентов вуза и т.д. предметная область многогранна и включает в себя массу понятий и данных. Задача состоит в определении, какие понятия и данные должны быть отраженные в будущей БД, для обеспечения решения стоящих перед ней задач.

(II) Общая модель предметной области и логическая модель данных на практике разрабатываются вместе и называются инфологической моделью (ИЛМ – информационно – логическая модель).

Основным понятием на данном этапе является информационный объект. Это информационное описание некоторой сущности предметной области (реального объекта) или связанных с ним событий, процессов.

Реальная сущность описывается своими признаками – именованными свойствами.

Информационный объект. Это информационное описание некоторой сущности предметной области (реального объекта) или связанных с ним событий, процессов.

Реальная сущность описывается своими признаками – именованными свойствами.

Информационный объект образуется совокупностью логически связанных атрибутов, представляющих качественные и количественные характеристики. Информационный объект – это обобщенное понятие, имеющее множество реализаций – экземпляров.

Каждый экземпляр информационного объекта характеризуется уникальным набором конкретных значений атрибутов.

Между информационными объектами определяются связи, описывающие их взаимодействие. Связь характеризуется классом принадлежности, показывающим обязан ли каждый экземпляр информационного объекта участвовать в связи (обычно: обязан – 1, не обязан -2) и степенью связи, определяющей максимальное количество экземпляров одного информационного объекта, связанных с одним экземпляром другого (обычно 1 или * - много).

1, *

Пример: фрагмент инфологической модели ВУЗа:

· Каждый экземпляр информационного объекта «студент» характеризуется конкретными значениями атрибутов «№ зачетной книжки» и «ФИО».

· Связь между информационными объектами «Студент» и «Факультет» трактуется как – «студент обязан обучаться только на одном факультете; на факультете должен обучаться минимум один студент»

· Степень связи в этом случае «один (факультет) – ко многим (студентам);

· Определены также и атрибуты связи, которые характеризуют не информационные объекты, а только их взаимодействие.

(III) На основе инфологической модели с учётом экономических и организационных обстоятельств принимается решение о выборе СУБД (например Access), в которой будет реализована разрабатываемая база данных.

(IV) Последним уровнем моделирования при создании реляционной базы данных является разработка схем каждого отношения, схемы всех отношений и специальных объектов (форм, запросов, отчетов) в применяемой СУБД.

Тема: Информационные системы и базы данных.

Поиск по сайту