Начало работы в Deductor Academic.





Общие сведения о Deductor Academic.

Deductor – это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов.

 

До появления аналитических платформ анализ данных осуществлялся в основном в статистических пакетах. Их использование требовало высокой квалификации пользователя. Большинство алгоритмов, реализованных в статистических пакетах, не позволяло эффективно обрабатывать большие объемы информации. Для автоматизации рутинных операций приходилось использовать встроенные языки программирования.

 

В конце 80-х гг. произошел стремительный рост объемов информации, накапливаемый на машинных носителях и возросли потребности бизнеса по применению анализа данных. Ответом этому стало появление новых парадигм в анализе: хранилища данных, машинное обучение, Data Mining, Knowlegde Discovery in Databases. Это позволило популяризировать анализ данных, вывести его на промышленную основу и решить огромное число бизнес-задач с большим экономическим эффектом.

 

Венцом развития анализа данных стали специализированные программные системы – аналитические платформы, которые полностью автоматизировали все этапы анализа от консолидации данных до эксплуатации моделей и интерпретации результатов.

 

Первая версия Deductor увидела свет в 2000 г. и с тех пор идет непрерывное развитие платформы. В 2007 г. выпущена пятая по счету версия системы, в 2009 г. – версия 5.2. Сегодня Deductor – это яркий представитель как настольной, так и корпоративной системы анализа данных последнего поколения.

 

Аналитическая платформа Deductor состоит из пяти модулей:

 

1. Warehouse – многомерное хранилище данных, аккумулирующее всю необходимую информацию для анализа предметной области. Его использование позволяет обеспечить непротиворечивость данных, их централизованное хранение и автоматически обеспечивает всю нужную поддержку процесса анализа данных.

2. Studio – рабочее место аналитика. Программа, реализующая функции импорта, обработки, визуализации и экспорта данных. Deductor Studio может функционировать и без хранилища данных, получая информацию из любых других источников, но наиболее оптимальным является их совместное использование. В Deductor Studio включен полный набор механизмов, позволяющий получить сведения из произвольного источника данных, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удачным образом (OLAP, диаграммы, деревья и т.д.) и экспортировать результаты на сторону.

3. Viewer – рабочее место конечного пользователя. Позволяет отделить процесс построения сценариев от использования уже готовых моделей. Все сложные операции по подготовке сценариев обработки выполняются аналитиками-экспертами при помощи Deductor Studio , а Deductor Viewer обеспечивает пользователям простой способ работы с готовыми резуль татами, скрывает от них все сложности построения моделей и не предъявляет высоких требований к квалификации сотрудников.

4. Server – служба, обеспечивающая удаленную аналитическую обработку данных. Позволяет автоматически обрабатывать данные и переобучать модели на сервере, оптимизирует выполнение сценариев за счет кэширования проектов и использования многопоточной обработки.

5. Client – клиент доступа к Deductor Server. Обеспечивает доступ из сторонних приложений и управление его разработкой.

 

 

Начало работы в Deductor Academic.

При запуске Deductor появится вот такое окошко:

Оно говорит нам о том, что это неполная версия программы, которая поддерживает только два источника данных – Deductor Warehouse и txt-файлы. Жмем ОК.

Главное окно программы выглядит следующим образом:

В данной версии есть два демопримера, с которыми можно ознакомиться:

Также в поставке с программой есть справочные файлы (папка Manual). C ними также можно и желательно ознакомиться перед началом работы:

 

Справка по программе вызывается из главного окна системы следующими способами:

· главное меню ? ►Справка,

· клавиша F1,

· кнопка на панели инструментов.

 

Помощь содержит подробное описание работы с Deductor Studio: системные требования, настройки узлов, способы осуществления действий с объектами системы.

 

Вся функциональность аналитической платформы Deductor Academic отражена в Сервис j Компоненты.

Чтобы загрузить файл в проект, можно воспользоваться Мастером импорта.

 

Понятие проекта.

В Deductor Studio ключевым понятием является проект. Это файл с расширением *.ded, по структуре соответствующий стандартному xml-файлу. Он хранит в себе:

· последовательности обработки данных (сценарии);

· настроенные визуализаторы;

· переменные проекта и служебную информацию.

Каждый проект имеет авторские сведения: Название, Версия, Автор, Компания, Описание. Они заполняются в диалоговом окне Свойства проекта(меню Файл►Свойства проекта…).

 

 

Создать новый проект можно следующими способами:

· главное м еню Файл►Создать;

· кнопка Создать новый проектна панели инструментов;

· клавиша Ctrl+N.

 

Открытие существующего проекта:

· главное м еню Файл►Открыть;

· кнопка Открыть проектна панели инструментов;

· клавиша Ctrl+O.

 

Открыть проект можно еще одним способом – в главном меню Файл►Историянайти имя проекта. Способ работает в том случае, если вы недавно открывали этот проект, и он сохранился в менеджере историй проектов. В одной запущенной копии Deductor Studio можно открыть только один проект. Для сохранения проекта под текущим именем нужно выбрать главное меню Файл►Сохранить, нажать кнопку или комбинацию Ctrl+S. Для сохранения текущего проекта под другим именем: главное меню Файл►Сохранить как…

 

В Deductor Studio вся работа ведется с использованием пяти мастеров:

· Мастер импорта;

· Мастер экспорта;

· Мастер обработки;

· Мастер визуализации;

· Мастер подключений.

 

С помощью мастеров импорта, экспорта и обработки формируется сценарий. Сценарий состоит из узлов. Мастер подключений предназначен для создания настроек подключений к различным источникам и приемникам данных. Мастер визуализации настраивает визуализаторы для конкретного узла.

 

Визуализатором называется любое представление набора данных в каком-либо виде: табличном, графическом, описательном. Примеры визуализаторов: таблица, дерево, гистограмма, диаграмма, OLAP-куб и т.д.

 

Сценарии.

В Deductor Studio для аналитика основополагающим понятием является сценарий. Сценарий представляет собой последовательность операций с данными, представленную в виде иерархического дерева. В дереве каждая операция образует узел, заголовок которого содержит: имя источника данных, наименование применяемого метода обработки, используемые при этом поля и т.д. Кроме этого, слева от наименования узла стоит значок, соответствующий типу операции.

 

Если узел имеет подчиненные узлы, то слева от его названия будет расположен значок «+», щелчок по которому позволит развернуть узел, т.е. сделать видимыми все его подчиненные узлы, при этом значок «+» поменяется на «–». Щелчок по значку «–», наоборот, сворачивает все подчиненные узлы. С помощью клавиш Ctrl+↑и Ctrl+↓можно перемещать узлы по дереву вверх-вниз в пределах подчинения родительскому узлу.

 

Сценарий состоит из ветвей. Deductorне имеет собственных средств для ввода данных, поэтому сценарий всегда начинается с узла импорта из какого-либо источника. Любой вновь создаваемый узел импорта будет находиться на верхнем уровне (подчиненным главному узлу Сценарии).

 

Создание нового узла импорта осуществляется с помощью мастера импорта. Вызвать мастер можно следующими способами:

· кнопка на панели инструментов закладки Сценарии;

· клавиша F6;

· контекстное меню Мастер импорта...

В нем все источники данных сгруппированы по следующим четырем категориям:

· хранилища данных;

· настроенные подключения;

· файлы данных;

· бизнес-подключения.

 

Некоторые категории могут отсутствовать в списке. Причинами этого может быть следующее:

· Версия Deductor. Например, категории Настроенные подключенияи Бизнес-подключенияотсутствуют в версии Academic.

· В дереве подключений (вкладка Подключения) не зарегистрировано ни одного объекта из данной категории. Например, если не настроено ни одного подключения к хранилищу данных, то категория Хранилища данныхбудет отсутствовать.

· Отключена «видимость» объекта или категории объекта.

 

Дальнейшие шаги мастера импорта будут зависеть от того, какой объект дерева категорий был выбран аналитиком.

 

К любому узлу импорта можно добавить узел обработки или узел экспорта, предварительно выделив узел импорта мышью. Новый узел будет добавлен как подчиненный к узлу импорта.

 

Создание нового узла обработки осуществляется с помощью мастера обработки. Вызвать мастер можно следующими способами:

· кнопка на панели инструментов закладки Сценарии;

· клавиша F7;

· контекстное меню Мастер обработки...

 

В нем все обработчики сгруппированы по следующим четырем категориям:

· Очистка д анных;

· Трансформация д анных;

· Data Mining;

· Прочее.

 

Некоторые узлы могут отсутствовать в списке. Причины этого следующее:

· версия Deductor;

· отключена «видимость» объекта (или целой категории) объекта;

· узел «устарел» и в текущей версии Deductor его создание невозможно.

 

Создание нового узла экспорта осуществляется с помощью мастера экспорта. Вызвать мастер можно следующими способами:

· кнопка на панели инструментов закладки Сценарии;

· клавиша F8;

· контекстное меню Мастер экспорта...

В нем все приемники данных сгруппированы по следующим 5 категориям:

· хранилища данных;

· базы данных;

· файлы;

· Web-серверы;

· прочее.

 

Причины отсутствия некоторых объектов или категорий мастера экспорта аналогичны тем, что перечислены при описании мастера импорта. После узла экспорта невозможно добавить ни один узел.

 





Читайте также:
Роль языка в формировании личности: Это происходит потому, что любой современный язык – это сложное ...
Особенности этнокультурного развития народов Пензенского края: Пензенский край – типичный российский регион, где проживает ...
Основные этапы развития астрономии. Гипотеза Лапласа: С точки зрения гипотезы Лапласа, это совершенно непонятно...
Средневековье: основные этапы и закономерности развития: Эпоху Античности в Европе сменяет Средневековье. С чем связано...

Рекомендуемые страницы:


Поиск по сайту

©2015-2020 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту:

Обратная связь
0.028 с.