Содержание
Содержание 2
Введение3
Что такое ECM?4
Возможности ECM4
Интеграция структурированной
и неструктурированной информации5
1. Захват5
2. Хранение7
3. Сохранение8
4. Управление9
5. Доставка10
Список используемых источников11
Введение
ECM ориентируется на работу с неструктурированной информацией в любом виде, включая офисные текстовые и табличные электронные документы, документы в формате PDF, а также рисунки, чертежи, графики, презентации, сканированные изображения, сообщения электронной почты, web-страницы, видео, аудиофайлы. Flash-анимация, словом всё многообразие контента, необходимого для эффективного ведения бизнеса. Основная задача системы ECM — это поддержание полного жизненного цикла информации, от ее создания или получения извне до уничтожения, когда она теряет свою ценность.
Отличие функциональности ECM-систем от систем электронного документооборота - возможность работать не только с документами, которые сегодня являются лишь малой частью корпоративного контента, но и с любыми другими видами данных: сообщениями электронной почты, графическими изображениями, фотографиями, аудио и видео файлами, web-страницами, файловыми системами, оцифрованными материалами.
Помимо инструментов для сбора, управления, накопления, хранения и доставки информации, ECM-системы обладают средствами потоковой загрузки контента, управления web-сайтами, правами доступа, безопасного корпоративного поиска. Следует отметить, что возможности разграничения прав доступа к данным позволяют ECM-системам соответствовать одному из наиболее важных требований безопасности использования контента в госструктурах, зачастую содержащего персональную или секретную информацию.
|
Что такое ECM?
EnterpriseContentManagement (ECM) — управление корпоративным содержанием, управление корпоративными информационными ресурсами. Под термином ECM подразумеваются технологии, используемые для сбора, управления, накопления, хранения и доставки информации всем пользователям организации.
ECM – это не только информационные системы, но и стратегии и методики управления информацией. Если нет понимания задачи и выработанной стратегии, если не разработаны и не соблюдаются методики, то внедрение ECM-инструментов не сможет решить задач организации. Если нет инструментов, нет технологий, то методики останутся только на бумаге. В этой связке важны все три элемента: стратегии, методики, инструменты.
Возможности ECM
Условно к ECM относятся системы, поддерживающие хотя бы 3 из 6 функций:
· Управление документами (выписка/возврат, контроль версий, безопасность, группировка документов и т. д.);
· Ввод в систему и управление полученными образами бумажных документов;
· Совместная работа над общими документами и поддержка проектных работ;
· Управление электронным архивом, автоматизация правил и нормативов хранения, гарантирование соответствия записей законодательству и регулирующим правилам;
· Workflow для поддержки бизнес-процессов, маршрутизации контента, назначения рабочих задач и состояний, трассировка маршрутов и контроль исполнения;
· Автоматизации публикаций, управление динамическим контентом (например, WEB или интранет) и взаимодействием пользователей для этих задач.
|
Таким образом, ECM-система интегрирует все контентно- и процессно-ориентированные технологии внутри предприятия, обеспечивает единую инфраструктуру для управления документооборотом, минимизирует необходимость развертывания и поддержки множества технологий для реализации различных бизнес-задач. Такой инфраструктурный подход делает корпоративное содержимое доступным для практически всех бизнес-приложений организации. Однако, в ряде случаев ECM-система может не иметь решающих преимуществ в использовании перед «чистым» электронным архивом или workflow системой.
Интеграция структурированной и неструктурированной информации
ECM ориентируется на работу с неструктурированной информацией в любом виде, включая форматы:
1. MS Word, MS Excel,
2. PDF,
3. Графические форматы
4. Сообщения электронной почты,
5. Web-страницы,
6. Видео
7. Другую информацию в электронном виде.
Основная задача ECM состоит в поддержании полного жизненного цикла информации, от ее создания или получения извне до уничтожения, когда она потеряет актуальность и ценность.
Захват (Capture)
На этом этапе жизненного цикла информация создается или импортируется в ECM-систему извне. С этого первого шага начинается движение информации в организации, и как следствие, возникает задача по управлению данной информацией. Условно можно выделить два класса информации: создаваемой человеком и создаваемой приложениями.
К первому классу относятся бумажные и электронные документы, различные заполненные формы и анкеты, мультимедийная информация (аудио, видео, изображения и т.п.), а также информация на архивных носителях.
|
Ко второму классу (информация, создаваемая приложениями), относятся данные, выгружаемые из других информационных систем (ERP, CRM, специализированные системы), электронные формы, электронные данные, полученные по каналам электронного обмена.
На этапе захвата используются следующие технологии:
● Сканирование документов.
Эта технология позволяет в системе работать с образами бумажных документов, что не только многократно повышает удобство работы, но и делает возможным параллельную и удаленную работу с одними и теми же документами.
● Распознавание образов документов (OCR/HCR/ICR/OMR).
Это целая совокупность технологий, включающая не только оптическое распознавание символов, но и такие «продвинутые» технологии, как интеллектуальное распознавание символов и даже целых документов, распознавание рукопечатных символов (используется при распознавании бумажных форм), распознавание меток.
· OCR (OpticalCharacterRecognition)
Преобразует информацию изображения в машинно-читабельные символы. Используется для печатного текста.
Цель и смысл распознавания с помощью OCR сканированного текста заключается в быстрой и дешевой передаче печатного или рукописного содержимого в электронный файл. Важно отметить, что машинное распознавание текста в 20-25 раз быстрее, чем ручное переписывание.
Новые OCR-программы для распознавания сканированного текста оснащены дополнительными функциями для проверки орфографии (как в MS Word), что позволяет улучшить процесс распознавания.
· HCR (HandprintCharacterRecognition)
Преобразует рукописный текст или надписи в машинные символы.
· ICR (IntelligentCharacterRecognition)
ICR - дальнейшая разработка OCR и HCR, которая использует сравнение, логическое соединение и проверки по спискам ссылок и существующим основным данным, чтобы улучшить результаты.
· OMR (OpticalMarkRecognition)
OMR читает специальную маркировку в предопределенных полях с очень большой точностью.
● Обработка форм.
Формы могут быть бумажные, электронные или веб-формы. Заполненные формы пересылаются на участок обработки, где их содержимое заносится в систему.
● Агрегация.
Информация может поступать из разных источников, но в ECM системе должна быть представлена, как логически целая.
● Интеграция.
Информация в ECM-систему может поступать из других информационных систем. Интеграционному решению приходится решать массу задач: захват и преобразование данных и метаданных, сохранение юридической значимости информации и т.п.
● Классификация.
Полученная информация индексируется, классифицируется и категорируется, получает регистрационные номера, чтобы в дальнейшем была возможность найти информацию, а также на нее ссылаться.
Хранение (Store)
Информация, поступившая в систему, хранится в ней в соответствии с установленными для этого класса информации политиками. Вопросы хранения могут быть рассмотрены на нескольких уровнях абстракции, от физических методов хранения информации, и до политик хранения и общей стратегии управления информацией в организации. Потому здесь приведены некоторые технологии хранения разного уровня:
● SAN (StorageAreaNetwork), NAS (NetworkAttachedStorage), CAS (ContentAddressableStorage), магнито-оптические диски, CD/DVD, дисковые и ленточные библиотеки, SSD, RAID.
Это целый парк технологий и периферийных устройств, предназначенных для хранения информации. Выбор той или иной технологии обуславливается объемом информации, сроком хранения, параметрами доступа к ней пользователей, требуемым уровнем надежности и безопасности.
1. SAN (StorageAreaNetwork) — высокоскоростная коммутируемая сеть передачи данных. Ар- хитектурное решение для подключения внешних устройств хранения данных, таких как диско- вые массивы, ленточные библиотеки и оптические приводы, к серверам таким образом, чтобы операционная система распознала подключенные ресурсы как локальные.
2. NAS (NetworkAttachedStorage) — архитектура сетей хранения данных, при которой кли- ент обращается к хранилищу данных на уровне сетевой файловой системы. По сравнению с серверным хранилищем или хранилищем SAN система хранения на базе NAS является более эффективным и экономичным решением для хранения быстрорастущих объемов данных
3. CAS (ContentAddressedStorage) — хранилище с адресацией по содержанию, предлагает подход к управлению и консолидации информации, который удовлетворяет требованиям фик- сированного содержания. Благодаря адресации по содержанию, приложениям не нужны дан- ные о физическом расположении информации в хранилище. Адреса вычисляются на основе самого содержания и служат для поиска объектов в хранилище и их извлечения.
4. RAID (redundantarrayofindependentdisks) — технология виртуализации данных, которая объединяет несколько дисков в логический элемент для избыточности и повышения производительности.
● Файловые системы, CMS (Content Management System), базы данных, хранилища данных, репозитории.
На этом уровне решаются вопросы организации хранения данных на уровне файлов, записей в базе данных, контента в хранилище и CMS.
CMS (Content Management System) - информационная система или компьютерная программа, используемая для обеспечения и организации совместного процесса создания, редактирования и управления содержимым, иначе — контентом.
Перечисленные технологии призваны решать следующие задачи, возникающие в процессе хранения:
● Поиск
● Контроль версий
● Регистрация прибытия/убытия документов и информации
● Блокировки
● Аудит действий пользователей
● Извлечение документов и информации.
Сохранение (Preserve)
Обеспечение сохранности – это даже не этап, это отдельное направление деятельности, включающее в себя ряд задач:
● Обеспечение юридической значимости информации
● Перевод системы в специальные режимы (аудит, проверка и т.п.)
● Восстановление информации, пострадавшей в результате катастроф природного и техногенного характера
● Своевременная миграция в новые форматы и на новые носители (особенно актуально при долговременном хранении информации)
Для решения этих и других задач могут быть использованы различные инструменты и технологии:
● Электронная подпись
● Специальные архивные форматы, например, PDF-A
● Вывод информации на архивные носители: бумага, микрофильмы
● Резервное копирование и восстановление информации
● Контролируемая конвертация и перенос на другие носители
Управление (Manage)
Информация, которая обращается в организации и хранится в ECM-системе, только абстрактно представляет собой что-то логически целое. На практике выделяют несколько классов, и, соответственно, несколько отдельных видов деятельности или дисциплин:
● Управление документами (DocumentManagement)
● Управление информацией, значимой с точки требований законодательства или бизнеса (RecordsManagement)
● Управление цифровыми активами (DigitalAssetManagement)
● Управление электронной почтой (EmailManagement)
● Управление веб контентом (WebContentManagement)
● Организация взаимодействия (Collaboration)
● Управлениебизнеспроцессами (Business Process Management, Workflow).
Стоит сказать сразу, что эти задачи могут пересекаться и включать в себя другие, и выделение этих дисциплин носит достаточно условный характер.
Доставка (Delivery)
Хранение информации в ECM-системе – не самоцель, информация постоянно используется в повседневной деятельности. Поэтому в сферу деятельности ECM-систем входит организация ее доставки потребителям. Можно выделить следующие задачи:
● Управление правами доступа.
В системе, как правило, хранится информация, предназначенная для разных групп пользователей. Поэтому невозможно представить себе ECM-систему без механизма управления правами доступа.
● Управление отчетами, печатью и публикациями.
Результатом ряда бизнес-процессов является бумажный или электронный документ, доступ к другой информации осуществляется через интернет и интранет порталы. Или же затребованные документы отправляются электронной почтой или по другим каналам связи. Все эти процессы должны осуществляться в соответствии с утвержденными методиками и стратегиями.
● Организация доступа с мобильных устройств.
Наверно, самое динамично развивающееся направление в сфере ECM, так как удаленная и мобильная работа с корпоративной информацией для ряда сотрудников становится уже не вспомогательным, а основным сценарием.
● Межведомственный электронный документооборот (МЭДО).
Также одно из динамично развивающихся направлений. Отказ от бумаги и переход на элеткронный документооборот между организациями позволяет кроме экономии на бумаге, печати и расходов на доставку, позволяет организовать совместную работу над документами, увеличить скорость и эффективность взаимодействия.
Для решения этих и других задач используется современные и проверенные временем технологии:
● Управление правами доступа к цифровой информации (DRM, DigitalRightsManagement), «водяные знаки» (Watermark)
● Электронная подпись, инфраструктура публичных ключей подписи (PKI, PublicKeyInfrastructure)
● Преобразование (Transformation), форматирование (Format), сжатие (Compression) и объединение (Syndication) информации
● XML, JSON, SOAP, REST.
Список используемых источников
· Журнал о системах электронного документооборота (СЭД)(https://ecm-journal.ru)
· Википедия(https://ru.wikipedia.org)
· TADVISER. Государство. Бизнес. ИТ (tadviser.ru)