В базе данных интегрированной корпоративной информационной системы накапливается огромный объем информации. Перед менеджерами предприятия встает вопрос: как и для каких целей использовать это море информации? Чаще всего пользователи ограничиваются простыми запросами, например: выдать отчет по всем заказчикам, задерживающим по данным на сегодняшний день оплату отгруженной в их адрес продукции.
Но можно поставить и более сложное задание: каков информационный «портрет» (т.е. характерные черты) заказчика, задерживающего оплату?
Кто по преимуществу эти заказчики: крупные или малые предприятия?
К какой отрасли они чаще всего относятся - транспортники, сельхозпроизводители, связисты?
В каких регионах находятся?
Есть ли сезонные закономерности в поведении таких недобросовестных заказчиков?
И самое главное - есть ли ассоциации (т.е. одновременное присутствие) между перечисленными атрибутами предприятий?
Если удастся получить такой информационный «портрет», то может быть принято решение об особом порядке взаимоотношений с подобными заказчиками - например, требовать от них полную предоплату за выполнение заказа.
Вторая задача на два порядка сложнее первой. Если первую задачу можно решить, используя стандартный аппарат запросов к базам данных, то для решения второй придется применить методы интеллектуального анализа данных. Однако результаты решения и первой, и второй задачи можно использовать для поддержки принятия решений.
Выделяют три основные технологии поддержки принятия управленческих решений на основе накопленной информации [23]:
• технологии, ориентированные на оперативную (транзакционную) обработку данных и реализованные в большинстве транзакционных систем (OLTP). Сфера действия таких технологий - область детализированных данных. Классические реляционные СУБД нормально справляются с подобными задачами, поэтому в подробном их рассмотрении нет необходимости;
• технологии OLAP (On-line Analytical Processing - интерактивная аналитическая обработка данных), ориентированные на область агрегированных показателей]
• технологии интеллектуальной обработки данных, ориентированные на область закономерностей. Интеллектуальная обработка проводится методами интеллектуального анализа данных (ИАД, в западной литературе - Data Mining [10]).
С помощью этих технологий решаются задачи поиска функциональных и логических закономерностей в накопленной информации, объяснения аномалий в данных. Рассмотрим подробнее перечисленные технологии.
Технологии OLAP
Технологии OLAP основаны на понятии хранилище данных, которое определено родоначальником этого направления Биллом Инмоном (W. Inmon) как «предметно-ориентированное, интегрированное, поддерживающее хронологию собрание данных для поддержки процесса принятия управленческих решений». Данные в хранилище поступают из оперативных систем (OLTP-систем), из внешних источников, например статистических отчетов, «скачанных» из Интернета прайс-листов других компаний и т.п. Зачем создавать хранилища данных, ведь информация и так находится в файлах оперативных систем? Еще несколько лет назад в качестве главных причин назывались различие форматов хранящихся данных, их разрозненность, локализация в разных местах корпоративной сети.
Действительно, до 1998-2000 гг. хранение всех данных на центральном сервере БД было редким явлением. Сейчас в связи с интенсивным внедрением ИКИС положение меняется.
Однако принципиальны такие причины необходимости создания хранилищ данных:
• сложные аналитические запросы к оперативным данным «забирают» ресурсы сервера и тормозят работу информационной системы;
• оперативные данные мало пригодны для непосредственного сложного анализа;
• системы OLTP предназначены для оперативной обработки данных, поэтому они не приспособлены для хранения информации за длительный (более нескольких месяцев) период, в то время как для OLAP интересен анализ объекта «в исторической ретроспективе». Оперативные корпоративные данные, а также данные из различных внешних источников «очищаются», интегрируются, «складываются» в хранилище, затем готовятся для OLAP-анализа и И АД (рис. 6).
Рисунок 6. Структура корпоративной информационно-аналитической системы
.
В основе OLAP лежит наглядная модель данных, организуемая самим пользователем в виде многомерных кубов (гиперкубов). Осями многомерной системы координат служат атрибуты анализируемого бизнес-процесса (измерения). Данные, количественно характеризующие бизнес-процесс, называются мерами. На рис. 7 в качестве мер в трехмерном кубе использованы суммы продаж, в качестве измерений - Время, Товар и Магазин. Измерения показаны на определенных уровнях агрегирования (группировки): товары группируются по категориям, магазины - по странам, данные о времени продаж - по месяцам.
Рисунок 7. Пример OLAP куба
Для наглядного представления данных, хранящихся в кубе, используют двумерные срезы поперек одной или нескольких осей (измерений).
На рис. 8 приведен двумерный срез куба для одной меры Unit Sales (продано штук) и двух «неразрезанных» измерений Магазин и Время.
Рисунок 8. Двумерный срез куба для одной меры
Может возникнуть вопрос: а разве представленные на рис. 1.13-1.16 результаты нельзя получить с помощью обычного аппарата создания запросов и отчетов к реляционным базам данных? Конечно, можно. Но тогда пользователю-аналитику придется каждый раз вызывать программиста для подготовки соответствующих отчетов. Количество всевозможных «срезов» и «разрезов» данных, как видно из приведенного примера, огромно. Очевидно, что пользователю-аналитику, не обладающему навыками в программировании, необходим инструмент, который бы позволил «сворачивать», «разворачивать», «разрезать» данные быстро и удобно. Именно таким инструментом и является технология OLAP.
Наиболее простые OLAP-продукты - средства многомерного представления данных, или OLAP-клиенты (например, «Pivot Tables» в Excel 2000 фирмы Microsoft, «ProClarity» фирмы Knosys). Значительно большими возможностями обладают многомерные серверные СУБД (например, «Oracle Express Server») и OLAP-cepверы (например, «Microsoft OLAP Services»).
В России разработкой технологий OLAP занимаются несколько компаний. Наиболее известный программный продукт - аналитическая платформа Контур фирмы «InterSoft Lab» [30].
Все большую известность приобретает модуль Галактика Zoom системы «Галактика» [38], о котором будем подробнее говорить в разд. 3.2. Отметим, что эти программные продукты получили международное признание и благодаря привлекательному сочетанию цена/качество заняли свою нишу на западном рынке OLAP- продуктов.
Наличие в ERP-системе «встроенной OLAP-аналитики» станет в ближайшие годы важным конкурентным преимуществом ИКИС.