Индексирование документов по сложности может быть




1) Одноаспектным, когда поисковый образ документа (ПОД) состоит из одной лексической единицы ИПЯ, например:

- одного классификационного индекса;

- одного предметного заголовка.

Применяется при широком тематическом профиле фонда и относительно малом наполнении отдельных тем. Его преимущества — простота и дешевизна.

2) Многоаспектным, когда ПОД состоит из нескольких лексических единиц ИПЯ. В теории И ПС различают два режима многоаспектного индексирования (в зависимости от типа используемого ИПЯ):

- режим предварительной координации (предкоординатное (классификационное) индексирование);

- режим последующей координации (посткоординатное индексирование).

Системами предкоординатного индексирования называются ИПС, в которых индексы (лексические единицы) поискового образа образуют линейную запись. Порядок следования индексов в этой записи является жестким и устанавливается индексатором в ходе обработки документа до поступления запроса (отсюда «предварительность» индексирования). Примерами поисковых образов с предварительной координацией могут служить классификационные индексы, состоящие из нескольких табличных индексов и индексов типовых делений (определителей) и сложные предметные рубрики, которые включают заголовок и 1—2 подзаголовка.

Системами посткоординатного индексирования называются ИПС, в которых индексы поискового образа задаются списком (перечнем). Порядок следования индексов в перечне не имеет значения, он может быть любым. Индексы связываются друг с другом после поступления запроса (отсюда определение этого режима как «режима последующей координации»). Типичным примером систем посткоординатного индексирования являются дескрипторные ИПС. Поскольку все автоматизированные поисковые системы работают в режиме посткоординации, их часто называют системами координатного индексирования, а ИПС ручного поиска, где практикуется одноаспектное или предкоординатное многоаспектное индексирование, именуют традиционными ИПС.

Следует обратить внимание на то, что режимы индексирования не определяются однозначным образом типом ИПЯ (методы индексирования и ИПЯ — это различные элементы информационно-поисковой системы). Например, иерархические библиотечно-библиографические классификации могут использоваться в режиме предварительной координации (традиционный режим) или в режиме посткоординатного индексирования (нетрадиционный режим). Многочисленные попытки «механизации» или «автоматизации» УДК или ББК как раз заключались в том, чтобы использовать эти ИПЯ в режиме посткоординатного индексирования. Различие между предметными и дескрипторными языками фактически сводится к различиям в режиме использования одного и того же ИПЯ, и поэтому осуществить переход от языка предметных рубрик к дескрипторному языку и обратно весьма просто.

Индексирование реализуется в следующих процессах:

- Систематизация – вид индексирования, при котором содержание документа и (или) запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). Такой принцип индексирования принято считать классификационным. Классификационный принцип индексирования обеспечивает возможность организации информационного поиска по иерархическому признаку.

- Предметизация – вид индексирования, при котором содержание документа и (или) запроса выражено предметной рубрикой в соответствии с правилами соответствующего предметизационного ИПЯ. Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе определённого естественного языка и на использовании в качестве терминов индексирования ЛЕ естественного языка. Предметизационный принцип индексирования обеспечивает возможность организации информационного поиска по алфавитному признаку.

- Координатное индексирование – вид индексирования, при котором смысловое содержание документа и (или) запроса многоаспектно выражается множеством ключевых слов или дескрипторов. ИПЯ, предназначенный для координатного индексирования документов (или частей документов) и запросов посредством ключевых слов и (или) дескрипторов, называется дескрипторным языком.

 

Систематизация и предметизация.

 

Методика определения и использования классификационных индексов, а также предметных рубрик регламентирована ГОСТ 7.59-2003 «Индексирование документов. Общие требования к систематизации и предметизации».

 

С и с т е м а т и з а ц и я

 

Классификационные индексы присваиваются документам на основании созданных специалистами таблиц классификации. Систематизаторы не имеют права самовольно вносить в них изменения, чтобы не нарушить стройную, продуманную систему. Классификационные системы создаются специальными подразделениями крупных национальных библиотек, органов НТИ или отдельными известными учёными. Примеры классификационных систем:

- десятичная классификация М. Дьюи (ДКД);

- универсальная десятичная классификация (УДК);

- библиотечно-библиографическая классификация (ББК);

- Рубрикатор Государственной системы научно-технической информации (Рубрикатор ГСНТИ);

- классификация двоеточием Ш.Р. Ранганатана (КД) и др.

Классификационные деления в большинстве современных классификаций распределены по основным и вспомогательным таблицам.

Основная таблица классификации – составная часть таблиц классификации, включающая иерархические таблицы классификационных делений по основным классификационным признакам. В её основе лежит научная классификация (отраслей знания). Например, в ББК основные таблицы расположены следующим образом:

1. Общенаучное и междисциплинарное знание.

2. Естественные науки.

3. Техника. Технические науки.

4. Сельское и лесное хозяйство. Сельскохозяйственные и лесохозяйственные науки.

5. Здравоохранение. Медицинские Науки.

6/8. Общественные и гуманитарные науки.

9. Литература универсального содержания.

Вспомогательная таблица классификации – часть классификационной таблицы, выделенная из состава основной классификационной таблицы и включающая классификационные деления, которые используются, главным образом, для детализации классов основной классификационной таблицы.

В ББК вспомогательные таблицы называются таблицами типовых делений, в УДК и ДКД – таблицами определителей.

Принципы систематизации:

1) Основным принципом является приоритет содержания документа над всеми другими его признаками: конструктивной формой, естественным языком, читательским назначением и т.п. Документ, прежде всего, получает индекс отраслевого отдела основных таблиц, а его второстепенные признаки отражаются с помощью вспомогательных типовых делений.

2) Принцип объективности требует выявления основной сути документа, возможно более точного отражения его содержания и других признаков с помощью правильного классификационного решения. При необходимости систематизатор обязан обратиться к специалистам в данной области знания, консультантам, экспертам. Реализация этого принципа требует постоянного слежения за последними дополнениями и изменениями в классификационной системе. Важна проработка методических рекомендаций, которые публикуются в специальных журналах.

3) Выполнение принципа последовательности означает, что принятое однажды классификационное решение всегда применяется в идентичных случаях систематизации.

 

Методы систематизации:

1) метод многократного (последовательного) отражения. В процессе систематизации порой становится очевидно, что для отражения содержания документа недостаточно одного индекса. В классификационных системах предусмотрена возможность составления нескольких классификационных индексов на один документ, которые соединяются знаком плюс (+). Два и более индекса, первый из которых является основным, а последующие – дополнительными, позволяют отразить документ в разных отделах ИПС. Классификационные системы рекомендуют применение данного метода в следующих случаях:

- при систематизации документов, в которых рассматривается два вопроса или предмета. Например, книга Б.И. Андреева «Франция. Италия: Очерки по экономической географии» получит индекс «65.049 (4Фра) + 65.049 (4Ита)».

- при систематизации особо важных материалов с точки зрения их научной ценности и актуальности. К ним относятся научные монографии, официальные документы.

- когда этого требуют методические указания классификационных делений – в которых написано «… повторно отражаются …», или «… за счёт повторного отражения …».

Среди систематизаторов сложилось условие: не присваивать одному документу более 3-х индексов, иначе, как показывает практика, при поиске документов возникает избыточный информационный шум, неоправданно быстро растёт объём ИПС.

2) метод аналитической систематизации. Используется, когда возникает необходимость отражения составной части (статьи или произведения из журнала, сборника и др.) документа. Основным в этом случае становится индекс, в целом отражающий содержание документа, в котором помещена составная часть, а дополнительным – аналитический индекс, отражающий содержание составной части.

 

Правила систематизации

1. Предпочтение частного вопроса общему. Анализируя документ, необходимо не просто сформулировать отрасль знания, к которой относится содержание документа (общий вопрос), а конкретизировать его предмет, аспект рассмотрения и вести поиск индекса, соответствующего частному вопросу. Знание особенностей построения основных и вспомогательных таблиц препятствует присвоению документу общего - неверного индекса, а методические указания подскажут правильный путь – к частному вопросу.

2. Систематизация по аспекту рассмотрения предмета. Данное правило вступает в силу в том случае, когда документ посвящён предмету, который относится к какой-либо области знания или практической деятельности, но рассматривается в аспекте другой области знания или практической деятельности. Например, в документе «Правовые вопросы аграрных реформ» мы имеем предмет, относящийся к экономике сельского хозяйства – аграрные реформы. Он рассматривается в аспекте отрасли права. Систематизаторы, плохо знающие правила систематизации, обычно принимают решение об использовании метода многократного отражения (65.32-1 + 67.407). Но его следует отнести только в один отдел, который раскрывает аспект рассмотрения предмета - т.е. присвоить классификационный индекс «67.407 Земельное (аграрное) право. Горное право. Лесное право. Водное право».

3. Систематизация по области применения объекта. Данное правило вступает в силу, когда в документе рассматриваются вопросы использования положений, законов, методов какой-либо науки или практической деятельности в других науках или отраслях практики. Правило 3 (как и правило 2) требует отражать документ только в одном отделе, а именно в том, в котором применяются «чужие» методы, законы, положения. То есть документ относится к области применения и книги о применении статистических методов в экономике, например, соберутся под индексом «65.051 Экономическая статистика», о методике статистики населения – в делении «60.7 Демография».

4. Систематизация по объекту, испытывающему влияние. Документы, при систематизации которых следует использовать это правило, также содержат два объекта. Первый объект – это принципы и правила какой-либо науки или отрасли практики. Второй объект – это другие науки или отрасли практики, на которые оказывает влияние первый объект. При систематизации с помощью индекса отражают только второй объект, испытывающий влияние первого. Книга о влиянии ледников на климат получит индекс «26.237.8 Климатология», а о влиянии климата на ледники – «26.222.8 Гляциология», где систематизируется литература о ледниках.

5. Систематизация документов широкого содержания. Правило распространяется на документы, в которых рассматривается три и более предмета или предмет освещается в трёх и более аспектах. Такие документы отражаются в классификационном делении, содержание которого объединяет информацию обо всех предметах или аспектах. Здесь неприемлемы ни метод многократного отражения, ни правило систематизации по аспекту рассмотрения предмета.

Например, книга «Сад. Поле. Огород» получит не три частных индекса, а один обобщающий индекс «42. Специальное (частное) растениеводство».

 

 

П р е д м е т и з а ц и я

 

Языки предметных рубрик (ЯПР) получили различные названия: «Алфавитный указатель ПР и ссылок», «Рубрикатор», «Служебная картотека ПР», «Общий алфавитный ключ», «Словарь ПР», «Словарь предметного каталога» и др. Они позволяют ориентироваться в каталогах (списках, указателях), придерживаться принятых ПР и ссылок, избегать дублирования, своевременно включать новые рубрики и обновлять устаревшие, отрабатывать единообразные методические приёмы, развивать методику предметизации, способствовать большей оперативности и производительности работы. На выявленные «перспективные» предметы формулируются рубрики, использование которых планируется в будущем.

ЯПР относится к вербальным ИПЯ, поскольку для представления своих ЛЕ использует слова и выражения естественного языка в их орфографической форме.

Словарь русского языка и словарь ПР содержат перечень слов в алфавитном порядке, но на этом их сходство заканчивается. «Слова», представленные в ЯПР проходят жёсткий отбор из лексики естественного языка и формулируются по собственным правилам. Именно поэтому ЯПР является искусственно созданным языком на основе естественного. Его ЛЕ следует называть не словами, а заголовками и подзаголовками предметных рубрик.

Многие достоинства естественного, например, русского языка, делающие его «великим и могучим», оборачиваются недостатком для языка предметных рубрик.

Многозначность, синонимичность, свойственные естественному языку, являются непреодолимым препятствием при содержательном поиске документов. Поэтому, прежде чем использовать слова естественного языка в качестве рубрик, их всесторонне анализируют по ряду параметров и дорабатывают в соответствии с правилами, которые изложены ниже.

При создании ЯПР используется ряд приёмов формализации лексики.

Прежде всего, необходимо устранить синонимию, полисемию и омонимию естественного языка

1) Устранение синонимии. В словарь предметных рубрик вводят все синонимы и синонимичные выражения. В качестве рубрики выбирают один из синонимов, остальные исключаются с помощью отсылки, обозначаемой пометкой «см.»:

Самоцветы

см.

Драгоценные камни

2) Полисемия устраняется с помощью развёрнутой формулировки рубрик (в рубрике многозначные слова без уточнения их значения не используются):

Банковские операции

Военные операции

3) Устранение омонимии (омонимия – внешнее совпадение слов, одинаковых по написанию и звучанию, но выражающих различные понятия – например «ключ», «лук»). Для разграничения терминов-омонимов используются реляторы – уточняющие термины, которые указываются в круглых скобках. Например:

Гармония (иск.)

Гармония (лит.)

Гармония (муз.)

Гармония (филос.)

Гармония (эстет.)

В качестве реляторов могут использоваться понятия, характеризующие научные дисциплины, отрасль, этническую группу, язык, тип объекта, географическое название и т.д.

При формировании предметных рубрик используются следующие грамматические категории русского языка: существительные, прилагательные, порядковые числительные, наречия, предлоги, союзы, а также словосочетания на их базе.

В ЯПР не входят слова естественного языка, которые не несут серьёзной смысловой нагрузки, с помощью которых нельзя сформулировать чёткий запрос.

 

Отличие лексических единиц ЯПР заключается в том, что они могут быть выражены не только одним словом, но и словосочетанием. Чаще всего используются сочетания прилагательного (одного ил нескольких) с существительным, а также сочетания существительного с существительным (предложные и беспредложные).

Певцы

Музыка

Авторская песня

Детские театры

Классицизм в искусстве

Личность и культура

Анатомия человека

Игр теория

 

Лексические единицы ЯПР формулируются, как правило, во множественном числе. Однако это правило не применяется для формулировки Лексических единиц, отражающих абстрактные понятия, такие как свойства, процессы, явления и т.п., например Вязкость, Резание, Нравственная культура и др.

Названия конкретных наук, языков формулируются в единственном числе (Социология культуры, Русский язык), а названия дисциплин, объединяющих группу родственных отраслей знания (или группу языков) во множественном числе, например, Педагогические науки, Восточные языки. Единственное число используется для формулировки тех лексических единиц, которые во множественном числе обозначают другое понятие, например, Театр как вид искусства и Театры как вид учреждений культуры, Вишня (ягода) и Вишни (деревья), Сказка (вид литературы) и Сказки (тексты сказок).

 

При формулировании рубрики большое значение имеет употребление полной или краткой форы именования предмета. Как правило, отдаётся предпочтение полной форме (Министерство иностранных дел, а не МИД).

В сокращённой форме употребляются общепринятые сокращения слов, например: КПСС, ЮНЕСКО, Колхозы, Совхозы.

 

 

ЯПР состоит из алфавитного перечня предметных рубрик -единичных предметных рубрик (заголовков) и комплексов рубрик.

Единичная предметная рубрика состоит из одной ЛЕ, т.е. только из заголовка рубрики.

При формулировке заголовка, состоящего из нескольких слов, особое значение имеет правильный выбор его первого (ведущего, ударного) слова. Оно определяет местонахождение данной рубрики в ЯПР, а в дальнейшем и в информационно-поисковом массиве. От того, насколько удачно выбрано первое слово заголовка рубрики, в большой степени зависит оперативность поиска нужных документов. В этом состоит эвристическая функция первого слова рубрики.

Первым в заголовке должно быть то слово, которое обозначает или сущность предмета документа, или его специфические особенности, либо является начальным словом установившегося термина, не допускающего перестановки в нём слов. Например:

Великая Отечественная война

Детские сады

Сопротивление материалов

С выбором ведущего слова в заголовке рубрики связан вопрос об инверсии прилагательного или другой части речи.

Инверсия – методический приём изменения прямого порядка слов для придания термину, несущему максимальную смысловую нагрузку, статуса ведущего слова рубрики. Например:

Холодильники домашние

Бойля-Мариотта закон

Ферма теорема

Олимпийские игры, 26-е

Олимпийские игры, 27-е.

В заголовке предметной рубрики используются условные разделительные знаки «.» - точка, «,» - запятая, «()» - круглые скобки, а также краткие пояснительные пометки. Например

«Берёзка», хореографический ансамбль.

 

Ведущее слово ПР, несущее максимальную смысловую нагрузку, объединяет предметные рубрики в комплекс предметных рубрик.

Комплексы рубрик представляют собой совокупность лексических единиц, соединённых определённой тематикой. Они создаются для всестороннего раскрытия предмета и его связей с другими предметами. Каждый подзаголовок позволяет раскрыть аспект рассмотрения предмета, выраженного заголовком.

Если под заголовком по алфавиту расположены подчинённые ему подзаголовки, то такая совокупность ЛЕ представляет собой комплекс рубрик. Например:

Автомобили

- Амортизаторы

- Вождение

- Динамика

За подзаголовками первой ступени по алфавиту могут располагаться подзаголовки второй ступени, которые часто выделены двумя тире. Например:

Автомобили

- Динамика

- - Моделирование

- - Телеизмерение

Различают узкий и широкий комплексы предметных рубрик

Узкий комплекс рубрик – это комплекс, в котором рубрики об одном предмете собраны в одном месте. Например:

Типография

Типографская бумага

Типографские орнаменты

Широкий комплекс предметных рубрик – это комплекс, в котором собраны рубрики о многих тематически взаимосвязанных предметах, расположенных в различных местах ЯПР. При организации широкого комплекса рубрики связывают с помощью ссылочно-справочного аппарата. Например:

Города

см. также

Столицы мира

Города

- История

- Озеленение

Ссылочно-справочный аппарат словаря – это совокупность указаний, фиксирующих связи и размежевания между рубриками.

Отсылки могут характеризовать:

1) логические отношения:

а) отношения равнозначности – отсылки направляют

- от устаревшего термина к современному;

- от сокращённой формы рубрики к полной и наоборот;

- от отвергнутых рубрик с прямым порядком слов к инверсированным и наоборот;

- от отвергнутых многочленных рубрик к принятой простой рубрике и наоборот;

- от рубрик, состоящих из одного слова к рубрике, состоящей из двух и более слов, соединённых союзом «и» (от «Теплицы» к «Парники и теплицы»);

- от возможных, но отвергнутых в данном словаре рубрик к принятым;

- от псевдонимов к реальным фамилиям, а при необходимости наоборот.

б) отношения подчинения – ссылки отражают связь общего с частным, родового с видовым, целого с частью.

в) отношения противоположности (например, ссылки от «Проводники» к «Диэлектрики» и наоборот).

2) ассоциативные отношения – выражают связи не между понятиями, а между самими предметами (технологические, системно-элементные и др.). К ним относятся отношения:

- система – элемент;

- целое – часть;

- перерабатываемый материал – продукт переработки (изделие);

- материал (изделие) – применение;

- теория (наука) – объекты её изучения;

- предмет – свойство;

- теория (наука) – выдающиеся представители;

- школа – последователи.

 

В отдельных случаях в ЯПР встречаются особые пометы, например, в виде звёздочки «*». Они проставляются рядом с рубриками, которые включены в словарь в качестве перспективных, но которые не используются из-за недостаточного объёма информации на данную тему.

 

Функции ссылочно-справочного аппарата:

1) Систематизирующая;

2) Комплексирующая;

3) Терминологическая;

4) Эвристическая (ССА является эффыективным средством повышения полнтоы выдачи информации, то есть средством борьбы с потерями информации из-за распыления релевантных документов по разным предметным рубрикам);

5) Функция компенсации линейности предметной рубрики (применение отсылок и ссылок позволяет проводить поиск по любому из терминов, входящих в рубрику, и этим разрушаептся жёсткая линейность её структуры:

Жилые здания высотные

см.

Высотные здания)

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-11-04 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: