Терминология: информация, данные, знания




Тема «Технологии хранения, поиска и сортировки данных»

Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятие, передача, преобразование, хранение или использование.

Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ.

Подготовка информации – состоит в ее формализации, сборе и переносе на машинные носители.

Обработка данных – это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде.

Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.

Управление данными – совокупность функций обеспечения требуемого представления данных, их накопления и хранения, обновления, удаления, поиска по заданному критерию и выдачи данных.

Предметная область – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге автоматизации.

База данных (БД) – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ. Эти данные относятся к определенной предметной области и организованы таким образом, что могут быть использованы для решения задач многими пользователями.

Введение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования.

Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами.

Автоматизированная информационная система (АИС) представляет собой совокупность данных, экономико-математических методов и моделей, технических, программных средств и специалистов, предназначенную для обработки информации и принятия управленческих решений.

Банк данных (БнД) - это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.

 

2. Классификация баз данных

Развитие средств вычислительной техники и информационных технологий обеспечило возможности для создания и широкого применения автоматизированных информационных систем (АИС) разнообразного назначения. Разрабатываются и внедряются информационные системы управления хозяйственными и техническими объектами, модельные комплексы для научных исследований, системы автоматизации проектирования и производства, всевозможные тренажеры и обучающие системы.

Технологии баз данных одна из наиболее востребованных технологий в практической разработке информационных систем, сформирована широкая сфера самых разнообразных приложений систем баз данных. Обычно БД создается для хранения и доступа к данным из некоторой предметной области.

Под автоматизированной информационной системой (АИС) понимают совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. АИС, основанная на базе данных, служит для сбора, накопления, хранения информации, а также ее эффективного использования для различных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ.

По сферам применения и правилам организации различают два основных класса АИС, основанных на базе данных: информационно-поисковые (ИПС) и системы обработки данных (СОД).

ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересует, в основном, сами извлекаемые из базы данных сведения, а не результаты их обработки. Примером ИПС является любая справочная служба: к ней обращаются с запросом и получают в результате те данные, которые удовлетворяют этому запросу.

Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД – банковские системы, осуществляющие открытие\закрытие счетов, пересчет вкладов в зависимости от процентов, прием\снятие сумм и т.п.

В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические. На практике используются также системы комбинированного типа.

Фактографические АИС хранят сведения об объектах предметной области, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции (нахождение суммы, минимума, максимума и т.п.). Фактографические АИС обычно принадлежат к классу систем обработки данных.

В документальной системе объект хранения – документ, который содержит информацию, относящуюся к определенной предметной области. Это могут быть графические изображения (например, географические карты): информация на естественном языке (монографии, тексты законодательных актов, научные отчеты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки данных не важно, какие сведения хранятся в документах. Обычно (но не всегда) документальные АИС реализуются в виде информационно-поисковых систем (ИПС).

 

3. Назначение и основные компоненты систем баз данных

Система БД включает два основных компонента: собственно базу данных и систему управления базами данных – СУБД (рисунок 3.1.). Большинство СОД включают также программы обработки данных (прикладное программное обеспечение), которые обращаются к данным через СУБД.

Рисунок 3.1. Компоненты системы баз данных

 

Таким образом, обращение к базе данных возможно только через СУБД. База данных предназначена для хранения данных информационной системы. Пользователи обращаются к базе данных обычно не напрямую через средства СУБД, а с помощью внешнего интерфейса – приложения, входящего в состав АИС. Основной характеристикой баз данных является совместное использование данных многими пользователями.

 

4. Основные модели данных

Модель данных - является фундаментом технологий баз данных; на ней базируется конкретная СУБД. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ими базы данных, если они основываются на этой модели. Создавая базу данных, необходимо упорядочить информацию по различным признакам для того, чтобы потом извлекать из нее необходимые данные в любом сочетании. Сделать это возможно, только если данные структурированы. Структура данных упорядочивает элементы информации и описывает их взаимосвязи.

Модель данных – это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения.

История создания и развития СУБД насчитывает около сорока лет. За этот период были разработаны многочисленные модели данных, прежде всего это сетевые, иерархические и реляционные модели данных. Сетевые и иерархические модели в настоящее время считаются устаревшими, но существует множество баз данных созданных на их основе и требующих поддержания их работы.

Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней. Сетевая модель позволяет организовывать БД, структура которых представляется графом общего вида. Сетевая база данных является обобщением иерархической, в которой каждый элемент вышестоящего уровня может быть связан одновременно с любым элементом следующего уровня. На связи между объектами в сетевых моделях не накладывается никаких ограничений. Пример сетевой базы данных приведён на рисунке 4.1.

 

Рисунок 4.1. Пример фрагмента сетевой базы данных

 

Сетевой базой данных фактически является «всемирная паутина» сети Интернет. Гиперссылки связывают собой сотни миллионов документов в единую сетевую базу данных.

Иерархическая модель позволяет строить БД с иерархической древовидной структурой. В основе иерархической модели лежит понятие дерева. Дерево – это связный неориентированный граф, который не содержит циклов. При работе с деревом выделяют какую-то конкретную вершину, определяют её как корень дерева и рассматривают особо – в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным, ориентация определяется от корня. Иерархическая база данных по своей структуре соответствует иерархической файловой системе.

В иерархических моделях данных используется ориентация древовидной структуры от корня к листьям. Поиск данных в таком случае может осуществляться последовательным «спуском» с одного уровня на другой Пример иерархической базы данных приведён на рисунке 4.2.

Рисунок 4.2. Пример фрагмента иерархической базы данных

 

5. Реляционная модель данных

Реляционная модель данных была предложена в 1970 г. математиком Эдгаром Коддом. Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL.

Реляционная модель БД (от английского “ relation” - отношение) представляет собой одну или несколько взаимосвязанных двумерных таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные.

В основе реляционной модели лежит понятие множества, как неупорядоченного набора уникальных значений. Основные особенности множества:

· уникальность составляющих элементов,

· ограниченность,

· неупорядоченность.

Ограниченность определяет условием вхождения данных в заданное множество. Например, «все целые числа», или «все числа от минус 0,5 до плюс 0.5». В общем случае элементов множества может быть бесконечно много, но всегда есть способ понять – число 3,1415 к обоим множествам не относится.

Уникальность позволяет однозначно определить объект в базе данных. Уникальность позволяет не только искать и находить, но находить с гарантией, что эта находка будет единственной. Система поиска, таким образом, «строится» исходя из твердой уверенности, что данный объект – уникальный, правильно идентифицированный, и именно к нему относятся взятые в другом месте характеристики. Именно к этому речному переходу по каталогу, например, относятся данные промеров русла, а не к рекам со сходным названием вообще.

Неупорядоченность гарантирует, что при любомобращении операция обойдет все элементы в множестве (все объекты в базе данных).



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-05-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: