Второй класс средств, входящих в состав ЛО ЭБ, не является языками. Выше мы назвали их лингвистическими процессорами. Как уже было отмечено, это достаточно широкий класс информационных и программных продуктов и технологий, но конкретно применительно к ЭБ к этим средствам мы будем относить два класса технологий: системы автоматической обработки текста и лингвистические банки данных.
Под автоматической обработкой текста понимаются процессы автоматического формирования описания текста (документа) на одном или нескольких информационных языках, включая и автоматическое индексирование, аннотирование или реферирование. В основе этих процессоров лежат конкретные лингвистические алгоритмы, прежде всего, морфологического и синтаксического анализа.
Лингвистические банки данных (ЛБД) – важный обеспечивающий компонент развитых ЛО АИС. Практически значительная доля затрат на создание и эксплуатацию ЛО – это затраты на создание и поддержание ЛБД. В этой части ЛО АИС смыкается с таким направлением информатики как компьютерная лексикография.
Итак, ЛО включает следующие виды языков и лингвистических процессоров:
1. Информационно-поисковые языки.
1.1. Системы метаданных.
1.2. Классификационные языки.
1.3. Вербальные языки.
1.4. Фактографические (объектно-признаковые) языки.
2. Лингвистические процессоры.
2.1. Системы автоматической обработки текста.
2.2. Лингвистические банки данных.
Классификационная схема лингвистических средств представлена на рисунке 21.
1. Информационно-поисковый язык (ИПЯ) – формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. К ИПЯ относятся:
|
· Классификационный ИПЯ.
· Предметизационный ИПЯ.
· ИПЯ координатного индексирования.
· Объектно-признаковые ИПЯ.
Лингвистические средства |
1. ИПЯ |
2. Языки-идентификаторы |
3. Нормативно-справочная база |
4. Методики индексирования |
5. Средства представления данных |
Рис. 21. Классификация ЛС
Классификационные ИПЯ – средство формализованного представления содержания документа, данных и информационных запросов посредством кодов или описаний классов логически упорядоченного множества понятий:
· десятичная классификация Дьюи (ДКД);
· универсальная десятичная классификация (УДК);
· библиотечно-библиографическая классификация (ББК);
· государственный рубрикатор научно-технической информации (ГРНТИ);
· международный классификатор изобретений (МКИ).
Вербальный ИПЯ – информационно-поисковый язык, использующий для представления своих лексических единиц слова и выражения естественного языка в их орфографической форме.
К вербальным ИПЯ относятся:
· дескрипторный язык, информационно-поисковые тезаурусы;
· язык предметных рубрик.
Дескрипторный язык (от англ. слова descriptor – «описатель») – информационно-поисковый язык, предназначенный для координатного индексирования документов и информационных запросов посредством дескрипторов или ключевых слов.
Информационно-поисковый тезаурус («тезаурус» в пер. с греч. «сокровищница», «запас», «клад») – нормативный словарь понятий и классификационных связей между ними (иерархических, т. е. родовидовых, и неиерархических).
|
2. Языки-идентификаторы
Международные стандартные номера (книг – ISBN, сериальных изданий – ISSN, музыкальных произведений – ISMN и т. д.).
Коды названий (языков, стран, физических величин и т. д.).
Таблица авторских знаков.
Штрих-коды (документов, читателей).
3. Нормативно-справочная база
Справочные издания (энциклопедии, словари и справочники, которые помогут разобраться в незнакомых терминах, выявить связи предмета с другими предметами, уточнить сущность вопроса.
Нормативные документы (государственные и отраслевые стандарты).
Стандарты по информации, библиотечному и издательскому делу – СИБИД:
ГОСТ 7.1 – 2003. Библиографическое описание документа. Общие требования и правила составления.
ГОСТ 7.80 – 2000 Библиографическая запись. Заголовок. Общие требования и правила составления.
ГОСТ 7. 82 – 2001 Библиографическая запись. Библиографическое описание электронных ресурсов. Общие требования и правила составления.
4. Методики индексирования (систематизации, предметизации).
Основные принципы общей методики электронной предметизации:
1) структура предметной рубрики (ПР) и принципы ее построения;
2) заголовки и подзаголовки ПР;
3) принципы применения ПР.
Конечный результат предметизации – предметные рубрики различного вида. По широте отражаемой тематики предметные рубрики подразделяются на адекватные и обобщающие.
Адекватные – рубрики, формулировка которых выражает объем понятия, наиболее точно соответствующий объему понятия о предмете документа.
Обобщающая – рубрика, формулировка которой выражает объем понятия, более широкий, чем объем понятия о предмете документа.
|
Электронная предметизация, сохраняя основные принципы традиционной обработки документа, предоставляет более широкие возможности для раскрытия его содержания. Это связано с тем, что в электронной среде вопрос об объеме термина индексирования перестает быть актуальным. Появляется возможность адекватно отражать содержание документа, не сокращать слова. Если в карточных каталогах библиографические записи традиционно содержат 1–1,5 рубрики, то в машиночитаемых ИПС их число значительно увеличивается, что способствует более точному раскрытию содержания документа.
Предметная рубрика может состоять:
- из одного термина индексирования (одной лексической единицы) – Заголовка;
- из нескольких терминов индексирования (нескольких ЛЕ), объединенных в цепочку в соответствии с правилами синтаксиса, принятыми в системе предметизации (Заголовок с подзаголовками).
Заголовок ПР – это первая лексическая единица многочленной ПР, отделяемая от последующих разделительным знаком. По структуре различают два вида предметных рубрик: простые и сложные.
1. Простая предметная рубрика – это предметная рубрика, состоящая из одной лексической единицы – Заголовка ПР.
Простая предметная рубрика всегда однозначна и отражает общее понятие о предмете каталогизируемого документа.
Простая предметная рубрика присваивается каталогизируемому документу при предметизации так называемых общих работ, то есть документов, в каждом из которых предмет рассматривается в целом и всесторонне.
Сложная ПР – это ПР, состоящая из нескольких лексических единиц (Заголовка и подзаголовка), отделенных друг от друга разделительными знаками.
Сложная предметная рубрика применяется в нескольких формах:
1) многочленная ПР;
2) описательная ПР;
3) комбинированная ПР.
Основная форма сложной ПР – многочленная ПР, состоящая из нескольких лексических единиц: заголовка ПР и подзаголовков, отделенных друг от друга разделительным знаком.
Описательная ПР – сложная ПР, в которой комбинация лексических единиц, чаще всего отделенных друг от друга предлогами и союзами, представлена в виде единого словосочетания.
По своей формулировке описательные ПР более близки к естественному языку, но использование их при автоматизированной обработки документов нежелательно. Описательные ПР используются в тех случаях, когда их формулировки являются устоявшимися терминами.
Например:
1. Налог на имущество физических лиц.
2. Авангардизм в искусстве.
3. Машин и механизмов теория.
5. Средства представления данных.
5.1. Коммуникативный формат представления библиографических данных (RUSMARC, UNIMARC, MARC21).
5.2. Коммуникативный формат представления нормативных/авторитетных данных.
Таким образом, лингвистические средства библиотечной технологии – совокупность компонентов, необходимые для обработки, систематизации, поиска и хранения информации.
Реализация лингвистическими средствами библиотечной технологии одной из важнейших функций библиотеки – обеспечение доступа потребителей информации к информационным ресурсам за счет раскрытия смыслового содержания хранящихся в библиотеке документов средствами соответствующих ИПЯ и методов индексирования. Без адекватных лингвистических средств невозможно проведение ни одного из видов информационного поиска: от элементарного адресного (основанного на языке библиографического описания документа), широкотематического (базирующегося на классификационных ИПЯ), узкотематического, предметного (язык предметных рубрик или дескрипторный ИПЯ), фактографического (связанного с объектно-признаковыми языками, до самого сложного – комплексного, предполагающего использование всего многообразия существующих лингвистических средств.
Контрольные вопросы
1. Назовите группы средств технологического обеспечения информационных технологий.
2. Как классифицируются технические средства в разрезе информационных процессов?
3. Назовите базовые программные средства информационных технологий.
4. В чем заключаются основные тенденции развития программного обеспечения?
5. Назовите подходы к определению понятия «лингвистическое обеспечение».
6. Дайте характеристику лингвистическим средствам информационных технологий.
Глава 7
РЕГЛАМЕНТИРУЮЩИЕ ДОКУМЕНТЫ
Неотъемлемым свойством любых технологий, включая информационные, является их регламентация (нормализация) – установление однозначных требований к процессам, обеспечивающим подсистемам, промежуточным и конечным результатам.
Регламентация информационных технологий – это процесс создания, организации и использования информации, определяющей нормы, требования, правила и порядок осуществления информационных процессов, устанавливающей образцы и эталоны производимых продуктов и услуг.
Нормализующая информация, актуальная для многократного использования при производстве информационных продуктов и услуг, находит отражение в регламентирующих документах.
Потенциальными объектами регламентации могут быть:
• информационные продукты и услуги (с точки зрения номенклатуры, потребительских свойств, количественных и качественных параметров);
• основные методические решения (принципы, приемы и правила деятельности);
• способы организации и производства (тип производства, его особенности);
• технологические процессы (номенклатура, операционный состав, квалификационное разделение труда, оснащенность оборудованием и техническими средствами, нормативы длительности и др.);
• ресурсы информационного производства (в аспекте предъявляемых к ним требований, состава и распределения в процессе производства);
• орудия труда (номенклатура, параметрическая характеристика, распределение по технологическим процессам, структурным подразделениям, рабочим местам);
• кадры исполнителей (штатная численность, профессиональный, должностной и квалификационный состав);
• производственная структура информационного учреждения, службы (состав и распределение структурных подразделений, рабочих мест, распределение численности работающих по производственным участкам и др.);
• методы контроля качества информационных продуктов и услуг;
• эффективность информационного производства (показатели, методы измерения и расчета).
Стандарты Системы менеджмента качества ISO 9000 придают особое значение разработке регламентирующей документации, утверждая, что ее применение способствует: удовлетворению потребительских требований;улучшениюкачества; обеспечению необходимой подготовки кадров; повторяемости и прослеживаемости процессов; организации надежного производственного контроля; объективной оценке качества продукции и услуг и эффективности деятельности.
Для регламентации информационных технологий определяющее значение имеют следующие виды регламентирующих документов:
• государственные нормативно-правовые акты;
• стандарты;
• нормы и нормативы;
• организационная документация;
• технологическая документация.
7.1. Государственные нормативно-правовые акты
Нормативно-правовые акты в области информационных технологий – это законы, указы, распоряжения, постановления, решения и другие документы государственных органов, учреждений, ведомств, региональных и муниципальных органов власти, определяющие государственную политику в сфере информации и информатизации, правовой статус информационных ресурсов, информационные права граждан и другие вопросы.
Эти нормативные акты регламентируют информационную терминологию, уточняют содержание деятельности информационных учреждений и служб, регулируют организационно-правовые основы их функционирования, предъявляют рамочные требования к ассортименту информационных продуктов и услуг.
Российское информационное законодательство формируется с начала 90-х гг. XX в.
Конституция Российской Федерации фиксирует информационные права граждан: свободно искать, получать, передавать, производить и распространять права граждан любым законным способом (ст. 29 ч. 4). Конституция гарантирует свободу массовой информации, запрещает цензуру.
Механизм реализации информационных прав граждан России конкретизирован в Федеральных законах. Базовым в ряду «информационных» нормативно-правовых актов является закон РФ «Об информации, информатизации и защите информации» (1995 г.). Основное внимание закон уделяет правовым аспектам формирования и использования информационных ресурсов: определяет порядок документирования информации (включая документы, хранимые, обрабатываемые и передаваемые с помощью автоматизированных информационных и телекоммуникационных систем), регламентирует процесс формирования государственных информационных ресурсов, классифицирует информационные ресурсы по категориям доступа (общедоступные, ограниченного доступа); прописывает механизм реализации права граждан и организаций и доступ к информации и информационным ресурсам. Касаясь вопросов разработки и производства информационных систем, технологий и средств их обеспечения, закон определяет право авторства и право собственности на эти объекты, порядок их сертификации и лицензирования деятельности по формированию и использованию информационных ресурсов. Важный раздел закона – защита информации и прав субъектов в области информационных процессов информатизации. Предусмотрена защита государством прав собственников, владельцев или пользователей информации от несанкционированного доступа к ней, а также защита прав субъектов в информационных процессах и при разработке, производстве, применении информационных систем, технологий и средств их обеспечения.
Закон РФ «Об участии в международном информационном обмене» (1996 г.) регламентирует обязанности государства, муниципальных образований и отдельных субъектов как участников международного информационного обмена. Этот закон обеспечивает российским гражданам и юридическим лицам выход в мировое информационное пространство: определяет свободы и ограничения на ввоз и вывоз информационных продуктов, порядок использования средств международного информационного обмена (информационных сетей и систем), гарантирует защиту от недостоверной, ложной иностранной документированной информации, предусматривает контроль государства за осуществлением международного информационного обмена.
Закон «Об обязательном экземпляре документов» (1994 г.) обязывает производителей информационной продукции (издательства, полиграфические предприятия, редакции средств массовой информации, музыкальные фирмы, теле- и радиокомпании, киностудии, видеопредприятия, кинематографические предприятия, научно-исследовательские учреждения, высшие учебные заведения, проектные и конструкторские учреждения и др.) формировать и доставлять обязательный экземпляр информационным учреждениям, определенным законодателем. В состав обязательного экземпляра (бесплатного и платного) включены следующие виды документов: издания (текстовые, нотные, картографические, изоиздания); издания для слепых (рельефно-точечные, «говорящие» книги); официальные документы; аудиовизуальная продукция (кино-, видео-, фото-, фонодокументы), электронные документы (программы, базы данных); неопубликованные документы (диссертации, отчеты о научно-исследовательских и опытно-конструкторских работах, депонированные рукописи, алгоритмы и программы). Законом определены количество и порядок доставки бесплатных экземпляров в Российскую книжную палату и Комитет РФ по печати, а также информационные учреждения и библиотеки – хранители обязательного федерального бесплатного экземпляра.
Помимо законов общего характера, в России действуют Федеральные законы, регулирующие отдельные сферы информационного производства и сервиса «О средствах массовой информации» (1991 г.), «Патентный закон Российской Федерации» (1992 г.), «О правовой охране программ для электронных выделительных машин и баз данных» (1992 г.), «Об авторском праве и смежныхп р авах» (1993 г.), «О библиотечном деле» (1994 г.), «О связи» (1995 г.), «О рекламе» (1995 г.), «О музейном фонде Российской Федерации и музеях Российской Федерации» (1996 г.), «О государственной и военной тайне» (1993 г. с изменениями от 06.07.1997) и др. Этот список дополняют законодательные акты: «Основы законодательства Российской Федерации об Архивном фонде Российской Федерации и архивах» (1993 г.), «Положение о государственной системе научно-технической информации» (1997 г.) и др.
Одной из ключевых проблем российского информационного законодательства является контроль со стороны законодателя и исполнительных органов за соблюдением принятых правовых норм. Особенно много нареканий вызывают нарушения законов «Об авторском праве и смежных правах», «Об обязательном экземпляре документов», «О рекламе» и др. Законодательство нуждается в совершенствовании в части приведения его в соответствие с международными нормами права, отработки процедуры постоянного пересмотра отдельных правовых норм и принятия подзаконных актов.
7.2. Стандарты
Наибольшее нормализуюшее значение для информационного производства имеют стандарты: международные, государственные (межгосударственные), государственные (ГОСТ), гармонизированные с международными стандартами ИСО (ГОСТ Р), отраслевые (ОСТ), предприятий (СТП), корпораций, консорциумов.
Стандарты в области информационных технологий – это утвержденные в соответствии с действующим законодательством единые нормы и требования к понятийному аппарату, а также к основным компонентам информационной технологии (ресурсам, средствам, методам, регламентам, процессам и продуктам информационного производства) и информационным системам.
Стандарты выполняют функции эталонов:
а) нормализующих профессиональную терминологию;
б) предписывающих рациональную последовательность действий;
в) определяющих показатели полезности (эффективности и качества);
г) ограничивающих риск сверхнормативных издержек, брака, неблагоприятных воздействий на производителя, потребителя и т. п.
Международные стандарты в области информационных технологий разрабатывают Международная организация по стандартизации (ИСО) – Intenational Standards Organization (ISO), Международная электротехническая комиссия (МЭК) – International Electrotechnical Commission (IEC) и др.
Межгосударственные стандарты действуют в рамках Содружества Независимых Государств (СНГ).
Несколько комплексов (систем) отечественных (межгосударственных) стандартов и руководящих документов являются регламентами информационных технологий.
Особое место в этом ряду принадлежит «Системе стандартов по информации, библиотечному и издательскому делу» (СИБИД). Эта система (регистрационный номер 7) насчитывает около 60 действующих стандартов в области научно-технической информации, библиотечного дела, библиографической деятельности, издательского дела, научно-технической терминологии, архивного дела.
Стандарты и руководящие документы на автоматизированные системы объединены в комплекс «Информационная технология» (регистрационный номер 34). Они задумывались в конце 1980-х гг. как всеобъемлющий комплекс взаимоувязанных межотраслевых документов. Основное назначение стандартов этой группы – обеспечение совместимости компонентов систем и информационных ресурсов, переносимость прикладных программ и баз данных между отдельными операционными платформами. Они предъявляют требования к моделям, структуре, функциям информационных систем, их отдельным компонентам, процессам, языковым средствам, процедурам тестирования и т. п. Так, ГОСТ 34.003-90. «Автоматизированные системы. Термины и определения» содержит понятийную характеристику автоматизированных систем, их основных компонентов, специфических свойств и показателей эффективности, процессов создания и функционирования, описание обеспечивающих подсистем. В стандартах данного комплекса охарактеризованы основные стадии создания автоматизированных систем (ГОСТ 34.601-90. Автоматизированные системы. Стадии создания; ГОСТ 34.603-92. Виды испытаний автоматизированных систем); предъявлены жесткие требования к документации (виды, комплектность, структура, содержание), создаваемой на различных этапах создания и функционирования информационных систем (ГОСТ 34.201-89. Виды, комплектность и обозначения документов при создании автоматизированных систем); классифицированы технические и иные обеспечивающие средства (ГОСТ 34.401-90. Средства технические периферийные автоматизированных систем дорожного движения. Типы и технические требования).
Актуальными для сферы информационных технологий являются стандарты других систем, например, Единая система программной документации (ЕСПД, регистрационный номер 19). Стандарты этого комплекса связаны преимущественно с документированием функциональных характеристик программных средств, т. е. регламентируют процесс их разработки. Большая часть стандартов ЕСПД была разработана в 1970–1980-е гг., морально устарела и нуждалась в пересмотре на основе международных требований. Поэтому в 90-е гг. в России были разработаны на основе прямого применения международных стандартов ИСО: ГОСТ Р ИСО/МЭК 9294-93. Информационная технология. Руководство по управлению документированием программного обеспечения; ГОСТ Р ИСО/МЭК 9125-93. Информационная технология. Оценка программной продукции. Характеристика качества и руководства по их применению и другие регламенты. С 1999 г. в России и странах СНГ введен базовый стандарт ЮСТ Р ИСО/МЭК 12207-99. Информационная технология. Процессы жизненного цикла программных средств. В стандарте охарактеризованы типовые процессы разработки и функционирования компьютерных программ: основные (приобретение, поставка, разработка, функционирование, сопровождение), вспомогательные (решение проблем, документирование, управление конфигурацией, гарантирование качества), организационные (управление, создание инфраструктуры, усовершенствование, обучение).
Формируется подсистема регламентов в области защиты информации, она включает государственные и международные стандарты (например, стандарт ISO 17799: 2000. Информационная технология. Практический кодекс по менеджменту информационной безопасности; ГОСТ Р 50922-96. Защита информации. Основные термины и определения и др.), руководящие документы (РД) Госкомтехкомиссии России (ГКТ) («Концепции защиты средств вычислительной техники от несанкционированного доступа к информации», «Средства вычислительной техники. Защита от несанкционированного доступа к информации. Показатели защищенности от несанкционированного доступа к информации», «Автоматизированные системы. Защита от несанкционированного доступа к информации. Классификация автоматизированных систем и требования по защите информации» и др.).
Регламентирована процедура оценки качества и сертификации БД и программных продуктов (ГОСТ 28195-89. Оценка качества программных средств. Общие положения; ГОСТ 28806-90. Качество программных средств. Термины и определения и др.).
Государственные и международные стандарты на программные средства и автоматизированные информационные системы носят рекомендательный характер и становятся обязательными в случае, если договор на разработку программных средств или автоматизированных систем содержит ссылку на конкретные регламенты.
Внедрение в практику информационных учреждений менеджмента качества невозможно без опоры на стандарты Системы менеджмента качества ISO 9000.
Взаимодействие информационных систем, сетевые информационные технологии обеспечивается регламентами особого вида – протоколами.
Протокол – совокупность правил, нормализующих формат и процедуры обмена информацией между взаимодействующими компонентами и подсистемами информационных систем, например, протокол передачи файлов с компьютера на компьютер (File Transfer Protocol – FTP), широко используемый в среде Интернет; протокол обмена HTML – документами (Hypertext Transfer Protocol – HTTP); Z39.50 – группа стандартов и соответствующих им протоколов, обеспечивающих сетевой поиск в распределенных информационных системах.
Интернет как виртуальное объединение десятков тысяч локальных, региональных, национальных и международных сетей стал реальностью благодаря тому, что разработчики смогли предложить такие протоколы обмена данными в сети, которые были приняты и поддержаны де-факто как единые стандарты обмена между всеми существующими типами локальных сетей в мире.
В условиях глобализации информационного пространства, информатизации всех сфер человеческой деятельность унификация и стандартизация информационных технологий, совместимость их программного, технического, лингвистического обеспечения становятся ключевыми теоретическими, практическими и организационными проблемами информационной деятельности.
7.3. Нормативная документация
Понятие «нормативный документ» будем употреблять в узком смысле: документ, устанавливающий нормы и нормативы (расчетные величины всех видов затрат) на производство информационных продуктов и услуг.
Это допущение необходимо для того, чтобы не отождествлять понятия «нормативный» и «регламентирующий» применительно к документационному обеспечению информационных технологий.
В промышленности норма характеризует максимально допустимую абсолютную величину затрат живого и овеществленного труда на единицу выпускаемой продукции или выполняемых работ в определенных условиях производства. Исключение составляет норма выработки – минимальная величина выпуска продукции в единицу времени.
Норматив является обобщенным показателем, характеризующим степень использования производственных ресурсов. Нормативы могут выражаться абсолютными значениями (нормативы штатной численности, запаса ресурсов, длительности процессов и т. п.) и относительными величинами (себестоимость – денежный эквивалент всех видов затрат на единицу продукции, удельная трудоемкость – затраты времени на производство единицы продукции, фондовооруженность – стоимость основных производственных фондов в расчете на одного работника и т. п.). Следовательно, нормативная документация содержит заданные количественные параметры производства: его объемов, эффективности, расхода ресурсов, технической оснащенности и тому подобных характеристик.
Существуют различные методы разработки нормативных документов:
• расчетно-аналитический: на основе сочетания экономических расчетов всех видов затрат с анализом производственных условий;
• опытный: на основе наблюдений за производственным процессом и замера фактических затрат времени, расходов материалов и других ресурсов на выпуск продукции и предоставление услуг;
• отчетно-статистический: на основе отчетно-статистических данных о среднем расходе единиц нормирования за предыдущий период;
• метод заимствования: использование норм, разработанных для других предприятий, организаций, отраслей или сфер деятельности.
Использование любого метода нормирования (или их сочетания) требует специальных знаний и определенных навыков. Поэтому централизованная подготовка нормативной документации обладает очевидными преимуществами в плане эффективного использования интеллектуального потенциала, радиальной организации работ и прогнозируемого результата.
Все охарактеризованные выше нормы и нормативы находят применение в информационном производстве, обычно в виде отраслевых или межотраслевых норм времени на основные информационные процессы или норм выработки отдельных видов информационной продукции, типовых нормативных сроков выполнения отдельных видов работ, нормативов трудоемкости, ресурсной обеспеченности, расхода материалов, эффективности и тому подобных регламентов. Сложность научно обоснованного нормирования длительности и трудоемкости информационных процессов обусловлена преимущественно интеллектуальным характером деятельности, связанной с созданием, семантической обработкой, поиском информации, предоставлением информационных услуг.