Типы связи, их представление на er-диаграмме.

Понятие базы данных

Термин база данных обычно связывают с компьютерами. В действительности базы данных появились задолго до компьютеров. Представление о базе данных может дать записная книжка, заполненная однотипными записями, содержащими, например, такие данные: фамилии, имена, отчества, телефоны, адреса, даты рождения. Другими примерами базы данных может служить библиотечная картотека, картотека учет кадров, расписание движения поездов. То есть любая база данных содержит набор данных, представляющих собой совокупность взаимосвязанных сведений о некотором объекте.

Пользоваться реальными базами данных без применения компьютера достаточно сложно, поэтому современные базы данных компьютеризированы. База данных – это совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимо от прикладных программ (ГОСТ 20886-85).

Другими словами, под базой данных понимается вся необходимая для решения задач в конкретной области совокупность данных, организованная по определенным правилам, позволяющим обеспечить независимость данных от прикладных программ, удобство хранения, поиска, манипулирования данными, которые записаны на машинных носителях.

Базы данных представляют собой интегрированную систему информации, в которой:

отсутствует тесная связь данных и обрабатывающих их программ;
значительно сокращена избыточность данных за счет ликвидации их дублирования;
совместно используются данные различными пользователями для решения широкого круга задач;
удобен доступ к данным за счет стандартной их организации;
упрощен процесс организации защиты данных;
значительно снижены затраты на все виды манипуляции с данными, особенно в процессе их актуализации;
имеются достаточно гибкие и удобные формы эксплуатации данных, которые постоянно совершенствуются, будучи не зависимыми от самих данных.

Основное достоинство компьютерных баз данных в том, что к хранящимся в них сведениям возможен быстрый доступ. При этом поиск нужных данных может быть осуществлен по различным признакам и ихсовокупностям. Например, к записной книжке удобно обратиться только по алфавиту, а к компьютерной базе данных сотрудников предприятия можно обратиться, получив сведения о том, какие сотрудники имеют трех и более детей, кто из сотрудников в отпуске и т.д. И ответ на любой заданный вопрос будет быстро удовлетворен. Преимущество компьютерной базы данных в компактном представлении больших объемов данных на машинных носителях и удобстве их использования. Обобщая все сказанное, можно сказать, что главное в компьютерных базах данных – качественно новые возможности в работе с данными за счет новых информационных технологий.

В каждой базе данных отражается своя предметная область, то есть совокупность объектов реального мира с их связями, относящихся к некоторой области и имеющих практическую ценность для пользователей. Реальные базы данных состоят из множества связанных файлов, разделенных различными пользователями.

Для поддержки адекватного отображения состояний предметной области базу данных необходимо динамически, в процессе функционирования, обновлять, то есть актуализировать содержимое базы данных в соответствии с теми изменениями, которые происходят в предметной области.

Таким образом, база данных является динамической информационной моделью некоторой предметной области, отображением внешнего мира: объектов, явлений, процессов и состоящая из нескольких файлов. Каждому объекту присущ ряд характерных для него свойств (признаков, параметров). Например, объекту студент присущи следующие свойства: ФИО, номер зачетки, факультет, курс, группа. Между элементами объекта фиксируется и поддерживается связь.

Пользователями базы данных могут быть различные прикладные программы, а также специалисты предметной области, выступающие в роли потребителей или источников данных, называемые конечными пользователями. Обслуживанием базы данных занимается администратор базы.

Модели данных

Одними из основополагающих в концепции баз данных являются категории «данные» и «модель данных». Данные – это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию и др., например: 200 руб., Петров Петр Петрович и т.п. Данные не обладают определенной структурой, они становятся информацией лишь тогда, когда пользователь задает им определенную структуру, то есть наделяет их смысловым содержанием. Поэтому центральным понятием в области баз данных является понятие модели данных. Не существует однозначного определения этого термина, но можно выделить нечто общее в существующих определениях.

Модель данных – это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть как сведения, содержащие осмысленные данные и взаимосвязь между ними. Например, имеются данные: Иванович, 180, 350, – смысл которых не ясен. Но, если сказать, что это содержимое таблицы, имеющей графы: Фамилия. Рост, Оклад, – то приведенные данные сразу приобретают конкретный смысл и превращаются в информацию. Другой пример: написано слово CAD. Что оно обозначает, опять не ясно: это может быть имя поля, содержимое поля, но это может быть и число в шестнадцатеричной системе счисления. И только задание модели, приложенной к этому данному, позволяет трактовать истинный смысл этого данного.

С другой стороны, любая база данных состоит из элементов данных (реквизитов) и связей между ними. Значит, чтобы организовать данные в базу, необходим предварительный процесс моделирования, предполагающий разработку схемы, позволяющей изобразить связи между элементами данных. Такую схему принято называть моделью данных. Таким образом, модель данных – это систематизация разнообразной информации и отражение ее свойств по содержанию, структуре, объему, связям, динамике с учетом потребностей пользователей. Модель данных – это ядро базы данных. Она является представлением реального мира объектов и событий, а также существующих между ними связей. Это некоторая абстракция, в которой акцент делается на самых важных и неотъемлемых аспектах деятельности.

В настоящее время в результате теоретических изысканий, рожденных реальными потребностями практики обработки данных, разработано много моделей данных, которые различаются по способу связи между данными. Однако наибольшее практическое применение нашли три модели: иерархическая, сетевая, реляционная. Их иногда называют традиционными моделями данных. В последние годы ведутся работы по созданию баз данных, построенных на постреляционной, многомерной, объектно-ориентированной и других моделях, которые называют нетрадиционными моделями.

6. Иерархическая модель данных: достоинства и недостатки.

Иерархическая модель появилась впервые в результате обобщения структур данных языка Кобол. В иерархических моделях основная структура представления данных имеет форму дерева. На самом высшем (первом) уровне иерархии находится только одна вершина, которая называется корнем дерева. Эта вершина имеет связи с вершинами второго уровня, вершины второго уровня имеют связи с вершинами третьего уровня и т.д. Связи между вершинами одного уровня отсутствуют. Следовательно, данные в иерархической структуре не равноправны: одни жестко подчинены другим. Доступ к информации возможен только по вертикальной схеме, начиная с корня, так как каждый элемент связан только с одним элементом на верхнем уровне и с одним или несколькими на низком.

Примером иерархической структуры может служить книга, как иерархическая последовательность букв, которые объединяются в слова, слова – в предложения, предложения – в параграфы, затем в главы и т.д.

С точки зрения теории графов иерархическая модель представляет собой древовидный граф (перевернутое дерево).

Реальный пример иерархической модели данных

Иерархическая модель является наиболее простой, поэтому исторически она появилась первой. К достоинствам иерархической модели данных относится: достаточно эффективное использование памяти и неплохие временные показатели выполнения операций над данными. Однако, удобна эта модель в основном для работы с иерархически организованной информацией. Недостатками иерархической модели являются достаточно сложные логические связи и соответствующая громоздкость в обработке данных. К тому же иерархическая модель достаточно трудно модифицируется, а потому она не может обеспечить должное быстродействие, необходимое для работы в условиях одновременного модифицирования файлов несколькими прикладными программами.

Первые системы управления базами данных, появившиеся в середине 60-х годов, позволяли работать с иерархической базой данных. Наиболее известной была иерархическая система IMS (Information Management System) фирмы IBM. Она появилась в результате повышенных требований к огромному хранилищу информации, связанной с полетом на Луну по программе Apollo. Известны и другие системы этого класса: PC/Focus, Team-Up, Data Edge,Ока, ИНЭС, МИРИС.

7. Сетевая модель данных: достоинства и недостатки.

Дальнейшим развитием иерархической модели является сетевая. На основе этой модели предпринимались попытки создания стандарта базы данных и устранения основного недостатка иерархической модели – невозможность эффективного представления составных связей.

Сетевая модель – это структура, у которой любой элемент может быть связан с любым другим элементом (рис). В этой модели один или несколько элементов имеют более одного исходного элемента. Сетевые модели более универсальны, так как взаимосвязи большинства предметных областей имеют сетевой характер. Технология работы с сетевыми моделями достаточно удобна для пользователя, так как возможен непосредственный доступ к элементам данных.

Сетевая база данных состоит из наборов записей, которые связаны между собой так, что записи могут содержать явные ссылки на другие наборы записей. Тем самым наборы записей образуют сеть. Связи между записями могут быть произвольными, и эти связи явно присутствуют и хранятся в базе данных.

Сетевые модели были призваны устранить некоторые недостатки иерархических моделей. Первоначально сетевая модель замышлялась как инструмент для программистов. В качестве базового языка программирования был выбран COBOL. Сетевая модель была принята в качестве основной модели данных Ассоциацией по языкам и системам обработки данных CODACYL (Conferens on Data SYstem Languages) и стала в свое время (1971 г.) стандартом СУБД. Эта модель позволила ускорить доступ к данным, но изменение структуры базы по-прежнему требовало значительных усилий и времени. Операции модификации и удаления данных требовали перестановки указателей, а манипуляции данными остались ориентированными на записи и описывались языком процедурного типа.

Основное достоинство сетевой модели – это высокая эффективность затрат памяти и оперативность обработки данных. Недостаток – сложность и жесткость схемы базы, а также сложность понимания. Кроме того, в этой модели ослаблен контроль целостности, так как в ней допускается устанавливать произвольные связи между записями.

Одна из первых сетевых моделей данных, разработанная группой CODASYL, была предложена в 1969 г. и развивалась до 80-х годов. К известным сетевым системам управления базами данных относятся: DBMS, IDMS, TOTAL, VISTA, Сеть, Сетор, Компас и др.

Сравнивая иерархические и сетевые модели, можно сказать, что сетевые модели обеспечивают достаточно быстрый доступ к данным, поскольку в сетевых моделях основная структура представления информации имеет форму сети, в которой каждая вершина (узел) может иметь связь с любой другой. Данные в сетевой модели более равноправны, так как доступ к ним может быть осуществлен, начиная с любого узла.

Подводя итоги, можно сказать, что рассмотренные модели обладают двумя фундаментальными недостатками: независимость от данных поддерживается в минимальной степени и для них не разработано общепринятой теоретической основы.

8. Реляционная модель данных: достоинства и недостатки.

Концепция реляционной модели данных была предложена в 1969 году Эдгаром Коддом, известным специалистом в области баз данных, а в 1970 году она была им опубликованы. Однако широкую популярность эта модель получила лишь в 80-е годы ХХ-го века. Сегодня публикацию этой статьи принято считать поворотным пунктом в истории развития систем баз данных. В концепции реляционной модели Э. Кодд использовал математическую терминологию, взятую из теории множеств. В теории множеств таблице соответствует термин отношение (relation), физическим представлением которого является таблица, отсюда и название модели – реляционная. Реляционная модель представляет собой совокупность данных, состоящую из набора двумерных таблиц.

Реляционная модель является удобной и наиболее привычной формой представления данных. При табличной организации данных отсутствует иерархия элементов. Строки и столбцы могут быть просмотрены в любом порядке, поэтому высока гибкость выбора любого подмножества элементов в строках и столбцах.

Любая таблица в реляционной базе состоит из строк, которые называют записями, и столбцов, которые называют полями. На пересечении строк и столбцов находятся конкретные значения данных. Для каждого поля определяется множество его значений, например, поле «Месяц» может иметь двенадцать значений.

Структура таблицы в реляционной базе характеризуется следующим:

она состоит из совокупности столбцов;
каждый столбец имеет уникальное, то есть не повторяющееся в других столбцах, имя;
последовательность столбцов в таблице не существенна;
все строки таблицы организованы по одинаковой структуре, то есть имеют одно и то же количество реквизитов и имеют одинаковую длину;
в таблице нет одинаковых строк;
количество строк в таблице практически не ограничено;
последовательность строк в таблице не существенна;
при выполнении манипуляций с таблицей все строки и столбцы могут просматриваться в произвольном порядке безотносительно к их содержанию и смыслу.

Терминология, используемая в реляционной модели, альтернативна, то есть для одного и того же понятия используются разные термины (табл. 1). Это следует иметь в виду при работе с реляционной моделью.

Математические термины	Экономические термины	Терминология баз данных
Отношение	Таблица	Файл
Кортеж	Строка	Запись
Атрибут	Столбец	Поле

Один или несколько атрибутов, значения которых однозначно определяют кортеж отношения, называют его ключом, или первичным ключом, или ключевым полем. Ключ – это атрибут (или несколько атрибутов), значения которого в данной таблице не повторяется и не является нулевым. Так, если таблица содержит список сотрудников, и в ней имеются поля: Табельный номер, ФИО, Должность, – то в качестве ключа можно взять поле Табельный номер. Другими словами, первичный ключ – это минимальный набор атрибутов, который используется для уникальной идентификации кортежей в конкретном отношении, и никакое подмножество первичного ключа не может быть достаточным для уникальной идентификации кортежей.

Базовые понятия реляционной модели

Ключ может быть простым, состоящим из одного поля, и сложным, состоящим из нескольких полей. Сложный ключ выбирается в тех случаях, когда ни одно поле таблицы однозначно не определяет запись. Записи в таблице хранятся упорядоченными по ключу.

Кроме первичного ключа в таблице могут быть вторичные ключи, называемые еще внешними ключами, или индексами. Индекс – это атрибут или совокупность атрибутов внутри отношения, которая соответствует ключу некоторого отношения, и ее значения являются своеобразными номерами кортежей в некотором отношении, имеются в нескольких отношениях и является первичным ключом в одном из них. Значения индекса могут повторяться в некоторой таблице. Индекс обеспечивает логическую последовательность записей в таблице, а также прямой доступ к каждой записи. Введение индексов не изменяет физического расположения записей в таблице, но влияет на последовательность их просмотра.

По первичному ключу всегда отыскивается только одна строка, а по вторичному – может отыскиваться группа строк с одинаковыми значениями первичного ключа. Ключи нужны для однозначной идентификации и упорядочения записей таблицы, а индексы для упорядочения и ускорения поиска. Отношение, в котором имеется первичный ключ, называют базовым (материнским) отношением, а отношение, которое связано с материнским отношением, – дочерним.

Индексы можно создавать и удалять, оставляя неизменным содержание записей реляционной таблицы. Индексы позволяют эффективно реализовать поиск и обработку данных, формируя дополнительные индексные файлы. При корректировке данных автоматически упорядочиваются индексы, изменяется местоположение каждого индекса согласно принятому условию (возрастанию или убыванию значений). Сами же записи реляционной таблицы при удалении или включении новых экземпляров записей, изменении значений их ключевых полей не перемещаются. Количество индексов, имена индексов, соответствие индексов полям таблицы определяется при создании схемы таблицы.

С помощью индексов и ключей устанавливаются связи между таблицами. Связь устанавливается путем присвоения значений внешнего ключа одной таблицы значениям первичного ключа другой. Группа связанных таблиц называется схемой данных. Информация о таблицах, их полях, ключах и т.п. называется метаданными.

Первичный ключ любой таблицы должен содержать уникальные (не повторяющиеся) непустые значения для данной таблицы. Система управления базой данных должна контролировать уникальность первичных ключей. При попытке присвоить первичному ключу значение, уже имеющееся в другой записи таблицы, выдается сообщение об ошибке первичного ключа. Если это не контролировать, то может произойти нарушение целостности. Под целостностью понимается свойство базы данных, означающее, что она содержит полную, непротиворечивую информацию, адекватно отражающую предметную область. Контроль целостности обеспечивает такое взаимодействие между данными, что возникающие противоречия устраняются в процессе этого взаимодействия.

Целостное состояние базы задается с помощью ограничений целостности в виде условий, которым должны удовлетворять хранимые в базе данные. Среди ограничений целостности выделяют: ограничения на значения атрибутов (например, размер атрибута Год рождения не должен превышать четырех символов) и структурные ограничения на кортежи. Структурные ограниченияна кортежи определяют требования целостности сущностей и целостности ссылок. Ограничения целостности сущностей касается первичных ключей базовых (материнских) отношений. Требование целостности сущностей состоит в том, что в базовом отношении ни один атрибут первичного ключа не может содержать отсутствующих значений. Требования ссылочной целостности состоит в том, что для каждого значения внешнего ключа дочернего отношения должна найтись запись в базовом (материнском) отношении с таким же значением первичного ключа. Например, в ведомости на зарплату должны быть фамилии только тех, кто работает на предприятии и имеется в списке его работников.

Дополнительные правила поддержки целостности данных могут быть определены пользователем или администратором базы данных. Их называют корпоративными ограничениями.

Важным механизмом поддержания целостности базы данных является транзакция. Транзакция – это совокупность операций, которые должны быть выполнены до конца, чтобы база данных не оказалась в противоречивом состоянии. То есть все действия, составляющие транзакцию, должны либо выполниться полностью, либо все не выполниться. Транзакция – это обычно логически завершенная единица работы, содержащая одну или несколько элементарных операций обработки данных. В современных системах управления данными для сохранения непротиворечивости системы предусмотрено средство автоматического отката транзакции в случае сбоев в системе.

С появлением ПЭВМ реляционные системы стали доминировать среди систем баз данных. Быстрому распространению реляционных моделей способствовало три фактора.

Во-первых, в реляционной системе данные представляются в виде таблиц (отношений), встречающихся в повседневной практике. Поиск и обработка данных в этих таблицах не зависит от их организации и хранения в памяти машины.

Во-вторых, с математической точки зрения реляционная база – это конечный набор отношений (различной степени). Таким образом, теория реляционных баз данных становится областью математической логики и реляционной алгебры.

В-третьих, множество объектов реляционной модели данных однородно – структура данных определяется только в терминах отношений. Основная единица обработки в операциях реляционной модели данных не запись (как в сетевых и иерархических моделях данных), а множество записей, то есть отношение.

Таким образом, достоинства реляционных моделей данных можно сформулировать так.

Упрощенная схема представления (в виде таблицы) и модификации данных.
Оптимизация доступа к данным, поскольку системы сами выбирают наиболее эффективную последовательность действий.
Улучшение целостности и защиты, поскольку реляционная модель позволяет улучшить выражение требований целостности путем использования языка высокого уровня.
Возможности различных применений, в том числе и рассчитанных на не специалистов в области программирования.
Обеспечение пользователя языками высокого уровня при работе с базой данных.
Простота инструментальных средств поддержки реляционной модели.
Обеспечение методологического подхода, поскольку главной целью модели является возможность описания реального мира, что проще всего осуществляется в реляционной модели данных.

Недостаток реляционной модели – в жесткости структуры данных, например, невозможно задать строку таблицы произвольной длины, а также в сложности описания иерархических и сетевых связей средствами реляционной модели. К недостаткам можно отнести и значительную фрагментацию данных, в то время как в ряде задач требуется соединение фрагментированных данных.

Реляционные модели относят к моделям второго поколения. В настоящее время многие известные системы управления базами данных используют именно реляционную модель представления данных. Это СУБД и для мейнфреймов, и для микрокомпьютеров: FoxPro, Access фирмы Microsoft; Paradox, Visual dBase фирмы Borland; Oracle, Clarion, Clipper, Ingres и др.

9. Операции реляционной алгебры (объединение, пересечение, декартово произведение, разность, проекция, выборка, соединение, деление).

Отношение – таблица; Столбец – атрибут; строка – кортеж.

Теоретической основой реляционной БД является реляционная алгебра, основанная на теории множеств и рассматривающая специальные операции над отношениями, и реляционное исчисление, базирующееся на математической логике. Операция Выборка позволяет выбрать из отношения только те кортежи, которые удовлетворяют заданному условию. При Проекции отношения на заданный набор его атрибутов получается новое отношение, создаваемое посредством извлечения из исходного отношения кортежей, содержащих указанные атрибуты. При Умножении (декартовом произведении) двух отношений получается новое отношение, кортежи которого являются сцеплением (конкатенацией) кортежей первого и второго отношений. Декартово произведение доменов-D1, D2,D3...Dn называется множество всех кортежей V1,V2…Vn длиной n, где любое V1 принадлежит D1. Отношение – некоторое подмножество декартова произведения 1-го или более доменов R принимает D1*D2*…*Dn.

В результате Объединения двух отношений получается третье, включающее кортежи, входящие хотя бы в одно отношение, то есть содержащее все элементы исходных отношений. При Вычитании выдаются лишь те кортежи первого отношения, которые остались от вычитания второго отношения, то есть из первого отношения выбрасываются все кортежи второго. Операция Соединение применяется к двум отношениям, имеющим общий атрибут. Результат этой операции для двух отношений по некоторому условию есть отношение, состоящее из кортежей, которые являются сочетанием первого и второго отношений, удовлетворяющих указанному условию. Результатом операции Пересечение двух отношений является отношение, включающее все кортежи, входящие в оба отношения. Операция Деление предполагает, что имеется два отношения: одно – бинарное (содержащее два атрибута), другое – унарное (содержащее один атрибут). В результате получается отношение, состоящее из кортежей, включающих значения первого атрибута кортежей первого отношения, но только таких, для которых множество значений второго атрибута первого отношения совпадает с множеством значений атрибутов второго отношения.

10. Постреляционная модель данных.

Стройность и мощность реляционных моделей сделали их доминирующими в среде баз данных. Но постоянное усложнение данных позволило выявить ряд неудобств, возникающих при работе с реляционными базами:

Реляционные системы ограничены в структурах представления данных, так как все данные хранятся в них в виде отношений, состоящих из простых атрибутов. Классическая реляционная модель предполагает неделимость данных, хранящихся в полях таблицы. Однако на практике иногда возникают ситуации, когда такое ограничение снижает эффективность работы с базой.
Данные в реляционной системе пассивны, и для описания их поведения требуется создавать прикладные программы.
Возможности реляционных модели недостаточны в тех случаях, когда объекты данных сложны, например: географические информационные системы, мультимедийные базы, базы с проектной документацией и др.

Все эти требования можно реализовать с помощью реляционных методов, но в результате получается не очень естественное представление требований пользователя.

Постреляционная модель снимает ограничение неделимости данных, допуская многозначные поля, значения которых состоят из подзначений, и набор значений воспринимается как самостоятельная таблица, встроенная в главную таблицу. Она является расширением реляционной модели.

Сопоставим реляционную и постреляционную модели данных на примере. В таблицах 1 и 2, связанных по полю Номер накладной, отражена поставка товара в реляционной базе, а в таблице 3 – в постреляционной. Как видно из приведенного примера, в постреляционной базе данные хранятся более компактно, и не требуется выполнять операции связи двух таблиц. Такое хранение обеспечивает высокую наглядность представления данных и повышение эффективности их обработки.

Таблица 1

Номер накладной	Код покупателя

Таблица 2

Номер накладной	Наименование товара	Количество
	Соль
	Сыр
	Мед
	Сок
	Рыба
	Мясо

Таблица 3

Номер накладной	Код покупателя	Наименование товара	Количество
		Соль Сыр
		Мед
		Сок Рыба Мясо

Спецификой постреляционной модели является и то, что, помимо вложенности полей, она поддерживает множественные группы, называемые ассоциированными множественными полями, например, в ней может присутствовать множественное поле Выпуск, состоящее из полей, указывающих выпуск по кварталам года, выпуск по кварталам может состоять из выпуска по месяцам. С овокупность объединенных множественных полей называется ассоциацией. В постреляционной модели не накладываются требования на длину и количество полей в записях, что делает структуру таблиц более наглядной.

Таким образом, основным достоинством постреляционной модели является возможность представления совокупности связанных реляционных таблиц в виде одной постреляционной таблицы. Кроме того, на длину полей и их количество в записях таблицы не накладывается требования постоянства, что обеспечивает большую гибкость постреляционной модели по сравнению с реляционной. Все это в комплексе приводит к наглядности представления информации и повышает эффективность ее обработки.

А недостатком этой модели является сложность обеспечения целостности и непротиворечивости данных, хранимых в базе.

Постреляционная модель данных реализована в СУБД uniVers, Bubba и Dasdb.

11. Объектно-ориентированная модель данных. Ее базовые понятия (объекты, классы, методы, наследование, инкапсуляция, расширяемость, полиморфизм), достоинства и недостатки.

Объекты инкапсулируют данные и методы, т.е. доступ к значениям данных возможен только через методы. Внутренняя структура объекта скрыта от пользователя. Изменение состояния объекта, манипуляция с ним возможны только через его методы.

В наиболее общей и классической постановке объектно-ориентированный подход базируется на понятиях:

•Объект и идентификатор объекта

•Атрибут и метод

•Класс

•Иерархия и наследование классов

Метод – программный код, привязанный к определенному классу и применяемый к объектам этого класса.

Класс – абстракция, определяющая множество объектов одной структуры. Каждый объект является экземпляром некоторого класса. Между классами устанавливаются отношения наследования. Состояние объекта определяется набором значений множества свойств. Этими свойствами могут быть атрибуты объекта и связь между объектом и одним или несколькими другими объектами. Поведение объекта определяется набором операций, которые могут быть выполнены над данными объекта или самим объектом.

БД хранит объекты, позволяя совместно использовать их различным пользователям и приложениям.

Структура ООБД графически представима в виде дерева, узлами которого являются объекты. ООБД: POET, Jasmine, Orion, Iris.

Основным достоинством является возможность отображения информации о сложных взаимосвязанных объектах. Объектно-ориентированная модель позволяет также идентифицировать отдельные записи в базе и определять функции их обработки. Основной недостаток состоит в сложности понимания ее сути и низкой скорости выполнения запросов.

12. Многомерная модель данных, ее базовые понятия (измерение, ячейка), достоинства и недостатки.

Многомерные модели:

информация представляется в виде многомерных массивов-гиперкубах

в одной БД, построенной на многомерной модели, может храниться множество кубов разной размерности, на основе которых можно проводить совместный анализ показателей (поликубическая)

конечный пользователь получает для анализа определенные срезы (проекции кубов), представлен в виде обычных двумерных таблиц или графиков

Измерение – множество однотипных данных, образующих одну из границ гиперкуба. Наиболее часто используемые в анализе измерения:

временные: день, месяц, год

географические: город, район, регион

Ячейка – часть данных, которая определяется путем определения одного элемента в каждом измерении многомерного массива. Ячейки гиперкуба могут быть пусты или полны. Когда значительное число ячеек куба не содержит данных – разреженный куб. Для многомерной модели применяются след операции:

•срез – подмножество гиперкуба, полученное путем фиксации одного или нескольких измерений.

•вращение - изменение порядка измерений при визуализации данных

•агрегация – более общее представление данных

•детализация – более детальное представление данных

Достоинства:

удобство

эффективность анализа больших объемов данных, имеющих временную связь

быстрота реализации сложных нерегламентированных запросов

Недостаток – громоздкость

Многомерные модели поддерживают: Essbare, Media Multi-matrix, Orade Express Server, Cache. Некоторые системы поддерживают одновременно реляционные и многомерные модели, например, Media MR.

13. Этапы жизненного цикла БД.

Жизненный цикл базы данных – это процесс проектирования, реализации и поддержки базы данных. Он состоит из семи этапов:

1. Предварительное планирование.

2. Проверка осуществимости.

3. Определение требований.

4. Концептуальное проектирование.

5. Логическое проектирование.

6. Физическое проектирование.

7. Оценка работы и поддержка базы данных.

В эксплуатации любого экономического объекта наступает момент, когда для достижения дальнейших успехов, необходимо данные, находящиеся в личном пользовании работников, интегрировать в единый ресурс и воспринимать их как корпоративный ресурс совместного использования. Для этого надо создать базу данных, произведя ее проектирование и выполнив все этапы жизненного цикла данных.

Предварительное планирование БД – важный этап в процессе перехода от разрозненных данных к интегрированным. На этом этапе: - анализ деятельности объекта; - постановка задач и определение ограничений; - определение цели; - определение сферы действий и возможностей.

Проектирование БД – процесс разработки структуры БД в соответствие с требованиями пользователей. На этом этапе: - концептуальное проектирование (на этом этапе создаются подробные модели пользовательских представлений о данных предметной области. Затем они интегрируются в концепт.модель, кот. фиксирует все эл-ы корпоративных данных, подлеж-х загрузке в БД. Эту модель еще называют концепт. схемой БД). – логическое проектирование (на этом этапе осущ-тся выбор типа модели данных. Концепт. модель отображ. в логич.модель, основан. уже на структурах, характерн. для выбранной модели). – физическое проектирование (на этом этапе логич.модель расширяется характер-ми, необход. для опред. способов физич. хранения БД, типа устройств для хранения, методов доступа к данным базы, требуемого объема памяти, правил сопровожд-я БД и др). – Проверка осуществимости БД предполагает подготовку отчетов по трем вопросам: 1) есть ли технология для реализации запланированной БД (технологическая осуществимость); 2)имеются ли персонал, средства и эксперты для успешного осуществления плана создания БД (операционная осуществимость);

1)окупится ли запланир. БД (экономическая эффективность).

2)Реализация и загрузка БД включает: - установка СУБД; - создание СУБД; - загрузка или конвертирование данных.

Тестирование включает: тестирование БД, настройку и оценку БД и её прикладных программ. Оценка и поддержка базы данных. включает опрос пользов

Типы связи, их представление на er-диаграмме.

Поиск по сайту