Введение
Обработка экономической информации является одним из важнейших направлений научно-технического развития. Для описания всех средств обработки информации на конкретном экономическом объекте используется понятие "экономическая информационная система" (ЭИС).
Информация – это новые сведения, позволяющие улучшить процессы, связанные с преобразованием вещества, энергии и самой информации. Информацией являются сведения, расширяющие запас знаний потребителя информации. Выделяют три фазы существования информации:
- ассимилированная информация – представление сообщений в сознании человека, наложенное на систему его понятий и оценок;
- документированная информация – сведения, зафиксированные в знаковой форме на каком-либо физическом носителе;
- передаваемая информация – сведения, рассматриваемые в момент передачи информации от источника к приемнику.
При проектировании ЭИС обычно используется документированная или передаваемая информация. Существуют следующие принципы построения и проектирования ЭИС:
- соответствие (ЭИС должна обеспечивать функционирование объекта с заданной эффективностью);
- регламентность (информация должна поступать в ЭИС с некоторой периодичностью);
- самоконтроль (ЭИС должна непрерывно вести работу по обнаружению и исправлению ошибок в данных и процессах обработки);
- интегральность (многократное и многоцелевое использование информации при ее однократном вводе в ЭИС);
- адаптивность (ЭИС должна быть способна изменять свою структуру и закон поведения для достижения оптимального результата при изменении внешних условий).
Лабораторная работа № 1
|
ПРЕДСТАВЛЕНИЕ ДАННЫХ
В ИНФОРМАЦИОННЫХ ЭКОНОМИЧЕСКИХ
СИСТЕМАХ
Цель работы
Ознакомление с основными понятиями теории информационных экономических систем, приобретение навыков представления данных в виде составных единиц информации.
Методические указания
1. Классификация и основные свойства
Единиц информации
Существуют две основные единицы информации: атрибут и составная единица информации (СЕИ).
Атрибут – информационное отображение отдельного свойства некоторого объекта, процесса или явления. Атрибут характеризуется своим именем и значением и соответствует понятию переменной в языках программирования.
Имя атрибута – условное обозначение атрибута в процессах обработки данных.
Значение атрибута – величина, характеризующая некоторое свойство объекта, процесса или явления.
Доменом (областью определения) атрибута называется множество всех допустимых значений атрибута. При определении домена задаются его имя и множество значений. Если число значений в домене невелико, то их список можно задать при объявлении данных в программе. Например,
type
day = 1..31;
month = 1..12;
year = 1900..1999;
Если перечислить все допустимые значения домена невозможно, то указывается его имя и длина значения. Например,
var
fam: string [ 20 ]; (* фамилия, имя, отчество *)
Если в домене необходимо перечислить обозначения объектов из некоторого класса, разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены. Классификация может быть осуществлена одним из следующих способов.
|
1. Производится нумерация объектов, кодом объекта является его порядок. Такая система кодирования называется порядковой.
2. При классификации множества объектов по одному признаку коды объектов подразделяются на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии используются последовательные номера.
3. При использовании нескольких классификационных взаимноподчиненных признаков выделяются классы объектов, подклассы внутри каждого класса и т.п., что соответствует разрядной системе кодирования.
Рассмотрим различные системы кодирования на примере значений атрибута "КОД СТУДЕНТА".
Порядковый номер – это номер студента в списке всех студентов.
Если необходимо произвести классификацию студентов по форме обучения (дневная, вечерняя или заочная), то для этого можно использовать порядковые номера следующим образом:
1..5999 – при кодировании студентов дневного отделения,
6000..7999 – при кодировании студентов вечернего отделения,
8000..9999 – при кодировании студентов заочного отделения.
При введении разрядной системы кодирования первый знак кода будет принимать три значения (1 – дневное отделение, 2 – вечернее отделение, 3 – заочное отделение), а следующие четыре знака отводятся для нумерации студентов каждого отделения.
Разрядный код можно усложнить, введя большее количество признаков, например, код отделения, код факультета, код курса, код группы и порядковый номер студента в группе.
При необходимости можно произвести перекодирование кодов отделений вуза, например:
|
Д – дневное,
В – вечернее,
З – заочное.
Если значения атрибутов определены на одном и том же домене, то такие атрибуты называются ролевыми. Атрибуты, по значениями которых можно однозначно различать объекты, называются атрибутами-идентификаторами. Например, на домене fam можно определить ролевые атрибуты АВТОР, СТУДЕНТ, ПРЕПОДАВАТЕЛЬ. Атрибуты ФАМИЛИЯ СТУДЕНТА и НОМЕР ЗАЧЕТНОЙ КНИЖКИ не являются ролевыми, хотя описывают одних и тех же людей.
Атрибут ФАМИЛИЯ СТУДЕНТА не является атрибутом-идентификатором, а атрибут НОМЕР ЗАЧЕТНОЙ КНИЖКИ – атрибут-идентификатор в пределах одного вуза.
Составная единица информации (СЕИ) – набор атрибутов и, возможно, других СЕИ.
Определение СЕИ дается рекурсивно, но, ввиду конечности сообщений, вложенные СЕИ в какой-то момент будут состоять только из одних атрибутов.
Множество атрибутов объединяется в одну СЕИ по следующим принципам:
- соответствующие атрибуты описывают один и тот же факт или экономический процесс;
- значения атрибутов, входящих в СЕИ, возникают одновременно, связаны логическими или арифметическими соотношениями.
СЕИ характеризуются именем, структурой и значением. Имя СЕИ – это ее обозначение в процессах обработки информации. Структура СЕИ определяется вхождением одних единиц информации в другие.
Аппарат СЕИ предназначен для описания структур экономических документов.
Документ – материальный носитель, содержащий оформленные в установленном порядке сообщения и имеющий юридическую силу.
При описании СЕИ необходимо указать после имени СЕИ: в круглых скобках ее размерность (количество одинаковых по структуре значений этой СЕИ) и, используя точку в качестве разделителя, в других круглых скобках список имен входящих в нее атрибутов и других СЕИ.
Пусть СЕИ ПРИХ для документа ПРИХОДНЫЙ ОРДЕР содержит следующий сокращенный набор атрибутов:
ДАТА (дата поступления материалов),
ПОСТ (код поставщика материалов),
СКЛАД
и
таблицу (СЕИ) с именем ТАБЛ с атрибутами:
ННМ (номенклатурный номер материала),
КВО-ДОК (количество материала, принятое по товарно-транспортной накладной),
КВО-ПР (количество материала, принятое на складе),
ЦЕНА (цена материала),
СУММА (общая стоимость принятого на складе материала).
Пусть размерность СЕИ ПРИХ равна двум, что определяется наличием двух документов (двух бланков приходного ордера), а размерность СЕИ ТАБЛ равна трем, что соответствует трем строкам таблицы.
Тогда ПРИХОДНЫЙ ОРДЕР имеет структуру:
ПРИХ(2).(ДАТА, ПОСТ, СКЛАД, ТАБЛ(3).(ННМ, КВО-ДОК, КВО-ПР, ЦЕНА, СУММА)).
Собрание СЕИ – множество ее значений в составе СЕИ более высокого уровня. Количество значений СЕИ равно ее размерности.
Значение СЕИ – набор значений, непосредственно входящих в нее атрибутов, и набор собраний, непосредственно входящих в нее СЕИ.
Одно значение СЕИ ПРИХ содержит по одному значению атрибутов ДАТА, ПОСТ, СКЛАД и собрание СЕИ ТАБЛ.
Собрание СЕИ ТАБЛ содержит три значения, в каждое из которых входят по одному значению атрибутов ННМ, КВО-ДОК, КВО-ПР, ЦЕНА и СУММА.
ПРИХ | ||||||||||
ДАТА | ПОСТ | СКЛАД | ||||||||
21.05.06 | ||||||||||
ННМ | КВО-ДОК | КВО-ПР | ЦЕНА | СУММА | ||||||
ПРИХ | ||||||||||
ДАТА | ПОСТ | СКЛАД | ||||||||
18.01.07 | ||||||||||
ННМ | КВО-ДОК | КВО-ПР | ЦЕНА | СУММА | ||||||
Для представления СЕИ могут быть использованы записи:
type
Date = record
Day: 1..31;
Month: 1..12;
Year: 1900..1999;
end;
rec = record
tn: 1..1000; (* табельный номер *)
fio: string [ 1..30 ]; (* ф.и.о *)
dr: Date; (* дата рождения *)
r: 1..6; (* разряд *)
nc: real; (* заработная плата *)
end;
var
zap: rec;
2. Показатели. Атрибуты-основания и атрибуты-признаки
При анализе экономические документы разбиваются на элементарные осмысленные фрагменты – показатели.
Показатель – это полное описание количественного параметра, характеризующего некоторый объект или процесс.
Показатель – это разновидность СЕИ.
Соответствующее описание произвольного свойства называется атомарным фактом.
Атрибуты показателя подразделяются на атрибуты-основания и атрибуты-признаки.
Атрибут-основание – это информационное отображение количественного свойства некоторого объекта, предмета или процесса.
Атрибут-признак – это информационное отображение качественного свойства некоторого объекта, предмета или процесса.
В состав показателя должен входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания.
Структура показателя имеет вид
,
где – атрибуты-признаки, – атрибут-основание.
Показатель с двумя основаниями можно разделить на два показателя, каждый из которых будет содержать по одному атрибуту-основанию и характеризующие его признаки.
Минимальный набор атрибутов показателя должен содержать:
- атрибуты, отображающие идентификаторы объектов;
- атрибуты, отображающие признаки времени;
- атрибут, отображающий некоторое количественное свойство объекта или взаимодействия.
Для установки признаков и оснований в экономических документах используются следующие закономерности.
1. Если значение атрибута является исходным данным или результатом арифметической операции, то это основание.
2. Если значение текстовое, то это признак.
3. Если атрибут обозначает предмет, то это признак.
4. Если атрибут в некотором показателе является признаком, то он будет признаком и в других показателях.
5. Если показатели описывают сходные процессы, то их призначные части совпадают.
6. Если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.
Показатели отображают количественные свойства объектов, процессов и явлений.
Однако существуют документы, которые не являются показателями, так как не содержат в своем составе атрибутов-оснований.
В качестве примера можно привести анкеты кадрового учета, сведения о структуре подразделений в каких-либо организациях и пр.
Критерием качества базы данных является минимальная избыточность хранимой информации, что описывается принципом: «Каждое сообщение хранится в базе данных один раз».
Соблюдение этого принципа позволяет:
- уменьшить объем памяти ПЭВМ, требуемый для хранения базы данных;
- сократить трудоемкость ввода данных и упростить проблему контроля достоверности вводимой информации;
- упростить алгоритмы корректировки данных, так как корректировка выполняется за одно обращение к базе данных.
При использовании экономических показателей удается создать базу данных с минимальной избыточностью: сначала все сведения анализируемой экономической информационной системы разбиваются на показатели, а затем атрибуты родственных показателей объединяются по принципу: «В памяти ПЭВМ под группу показателей с одинаковым составом атрибутов-признаков отводится один файл».
Показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность).
Эта группа является достаточной для образования самостоятельного документа.
Для ПРИХОДНОГО ОРДЕРА атрибутами-основаниями являются КВО-ДОК, КВО-ПР, ЦЕНА, СУММА.
С использованием закономерностей 1-6 можно сформировать четыре показателя:
П1 (КМАТ, СКЛАД, ПОСТ, ДАТА, КВО-ДОК),
П2 (КМАТ, СКЛАД, ПОСТ, ДАТА, КВО-ПР),
П3 (КМАТ, ЦЕНА),
П4 (КМАТ, СКЛАД, ПОСТ, ДАТА, СУММА),
где КМАТ – количество материалов с конкретным кодом,
СУММА = ЦЕНА * КВО-ПР.
Данные показатели образуют в базе данных два файла:
- файл с одним показателем, имеющим в своем составе атрибуты-признаки КМАТ, ЦЕНА;
- файл с тремя показателями, имеющими в своем составе общие атрибуты-признаки КМАТ, СКЛАД, ПОСТ, ДАТА, КВО-ДОК, КВО-ПР, СУММА.
Существует аналогия между показателями и переменными с индексами. В общем случае переменная всегда соответствует атрибуту-основанию, а индексы этой переменной – значениям атрибутов-признаков этого показателя. Отличие заключается в том, что индексы изменяются от 1 до некоторого фиксированного значения, а, значения атрибутов-признаков (например, номенклатурные номера материалов) могут кодироваться любыми способами, и необязательно – порядковыми номерами.
Так, показателю П3 (КМАТ, ЦЕНА) можно поставить в соответствие переменную , в которой сама переменная сопоставлена атрибуту-основанию ЦЕНА, а индекс сопоставлен атрибуту-признаку КМАТ.
Показатели являются средством описания информационных потребностей пользователей на этапе формулирования требований к системе.
Постановка экономической задачи содержит описание структуры исходных, нормативно-справочных, выходных, промежуточных показателей и расчетные соотношения для вычисления выходных и промежуточных показателей, дополненные графом взаимосвязи показателей.
3. Операции над структурой СЕИ
При операциях над структурой СЕИ происходит изменение не только структуры СЕИ, но и множества значений СЕИ.
Нормализация – это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой.
Общее число значений в нормализованной СЕИ равно произведению размерностей всех СЕИ в исходном описании структуры.
Нормализация ПРИХОДНОГО ОРДЕРА приводит к следующему результату:
ПРИХ | |||||||
ДАТА | ПОСТ | СКЛАД | ННМ | КВО-ДОК | КВО-ПР | ЦЕ-НА | СУМ-МА |
21.05.06 21.05.06 18.01.07 18.01.07 18.01.07 |
Структура нормализованного ПРИХОДНОГО ОРДЕРА имеет вид:
ПРИХ(6).(ДАТА, ПОСТ, СКЛАД, ННМ, КВО-ДОК,
КВО-ПР, ЦЕНА, СУММА).
Свертка – это операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой.
Свертка может быть произведена в исходную структуру (при этом свертка и нормализация являются обратными операциями) или к другой ненормализованной СЕИ, имеющей экономический смысл.
Например, могут быть получены карточки СКЛАДСКОГО УЧЕТА:
КАРТ(3).(СКЛАД, ННМ, ЦЕНА,
ТАБЛ(3).(ПОСТ, ДАТА, КВО-ДОК, КВО-ПР, СУММА)).
КАРТ | ||||||||
СКЛАД | ННМ | ЦЕНА | ||||||
ПОСТ | ДАТА | КВО-ДОК | КВО-ПР | СУММА | ||||
21.05.06 | ||||||||
18.01.07 | ||||||||
КАРТ | ||||||||
СКЛАД | ННМ | ЦЕНА | ||||||
ПОСТ | ДАТА | КВО-ДОК | КВО-ПР | СУММА | ||||
21.05.06 | ||||||||
18.01.07 | ||||||||
КАРТ | ||||||||
СКЛАД | ННМ | ЦЕНА | ||||||
ПОСТ | ДАТА | КВО-ДОК | КВО-ПР | СУММА | ||||
18.06.06 | ||||||||
Декомпозиция – операция преобразования исходной СЕИ в несколько СЕИ с различными структурами.
При этом множество атрибутов до декомпозиции должно совпадать с множеством значений после нее.
Композиция – операция преобразования нескольких СЕИ с различными структурами в одну СЕИ.
Операции композиции и декомпозиции являются обратными.
СЕИ ПРИХ в результате декомпозиции можно разделить на две СЕИ:
ПРИХ1(6).(ДАТА, ПОСТ, СКЛАД, ННМ, КВО-ДОК, КВО-ПР, СУММА),
ЦЕНЫ(3).(ННМ, ЦЕНА).
ПРИХ1 | ||||||
ДАТА | ПОСТ | СКЛАД | ННМ | КВО- ДОК | КВО- ПР | СУММА |
21.05.95 21.05.95 18.01.96 18.01.96 18.01.96 |
ЦЕНЫ | |
ННМ | ЦЕНА |
Выборка – операция выделения подмножества значений СЕИ, которые удовлетворяют заранее заданным условиям выборки.
Корректировка – выполнение одной из операций – добавление нового значения СЕИ, исключение существующего значения СЕИ, замена некоторого значения СЕИ на новое.
Задание
В соответствии с вариантами необходимо создать СЕИ и выполнить предложенные задания. Кроме того, необходимо произвести включение, исключение записей, а также корректировку какого-либо значения записи.
Пусть
А = ПРИХ(2).(ДАТА, ПОСТ, СКЛАД,
ТАБЛ(3).(ННМ, КВО-ДОК, КВО-ПР,ЦЕНА, СУММА)),
B = ПРИХ(6).(ДАТА, ПОСТ, СКЛАД, ННМ,