Технические средства реализации ИПС




Информационно-поисковые системы (ИПС): виды, элементы

 

Понятие ИПС

 

Поисковые процедуры осуществляются с помощью специальных средств, называемых поисковыми системами (или системами поиска).

Поисковая система - это совокупность методов и средств, предназначенная для отыскания па важнейшим характеристикам каких-либо документов, сведений или материальных объектов среди множества других.

Поисковая система, предназначенная для отыскания документов, содержащих необходимую информацию, иди фактов, называется информационно-поисковой системой.

На первом этапе развития информационно-поисковых систем они реализовались в виде элементов традиционного справочно-поискового аппарата (СПА), представляющего собой совокупность указателей, картотек, предназначенных преимущественно для ручного поиска.

В середине XX в. на базе ЭВМ, которые появились к этому времени, стали создавать узкоцелевые системы, предназначенные для решения ограниченного круга информационных задач, в частности для решения задач поиска (автономные ИПС).

Развитие таких систем привело к объединению в одну систему многих функций узкоспециализированных систем и при однократной обработке документа - обеспечению его многократного и многоаспектного использования. Такие системы стали называть интегральными информационными системами.

Развитие вычислительной техники привело к следующей фазе развития ИПС - построению баз и банков данных. Под банком данных понимают совокупность информационных массивов (баз данных) и средств общения с этими массивами (языковых и программных). Основное назначение банков данных - обеспечить безизбыточное хранение информации и доступ к ней различных категорий пользователей.

По мере развития научно-технического прогресса проблемы, решаемые наукой, техникой и производством, все более становятся межотраслевыми, поэтому дальнейшее развитие автоматизированных информационных систем связано с объединением автономных (локальных) автоматизированных баз и банков данных в информационные сети.

Характерной особенностью современной научно-технической революции является стремительный рост объема потоков различных видов информации, усложнение и расширение спектра общественных коллективных и индивидуальных потребностей, возрастание ценности информация, которая превращается в один из важных ресурсов социально-экономического и научно-технического прогресса.

Эффективность информационного обеспечения зависит от полноты сбора, качества обработки, надежности хранения и поиска, оперативности и избирательности распространения информации. Не случайно процессы хранения и поиска занимают в информационном процессе центральное место.

Решение проблем, связанных с патентным поиском, имеет большое практическое значение. Поиск информации - это процесс отыскания в запоминающем устройстве (ЗУ) ИПС таких документов (текстов, записей), которые соответствуют поступившему запросу. Хранение осуществляется с целью создания условий для последующего поиска, а поиск можно производить только при наличии массива документов, введенных в ЗУ ИПС, а также запроса, указывающего отличительные признаки искомых документов (формальные или содержательные). Следовательно, операции хранения и поиска неразрывно связаны. Именно поэтому они осуществляются в рамках единой информационной системы.

Поиск патентной информации - процесс отбора соответствующих запросу документов или сведений по одному или нескольким признакам из массива патентных документов или данных.

В качестве средства хранения и поиска информации выступают информационно-поисковые системы.

ИПС представляет собой функциональную систему, предназначенную для хранения и поиска информации. Хранение информации возможно только в том случае, если она зафиксирована на каком-либо материальном носителе, т.е. документе, предназначенном для чтения людьми или ввода в ЭВМ (книга, бланк, магнитная лента и т.д.).

Поэтому ИПС должна иметь запоминающее устройство (хранилище), в котором располагаются документы (тексты, записи), организуемом в виде массивов (фондов, файлов).

ИПС с некоторой степенью условности можно классифицирования по следующим основным аспектам:

- роду выполняемых функций;

- режиму поиска;

- типу информационно-поискового языка (ИПЯ);

- типу критерия выдачи;

- степени автоматизации.

Традиционными ИПС являются картотеки и библиографические указатели, библиотечные каталоги, справочники и т.д. В этих ИПС поиск информации осуществляется вручную в соответствии с принятой системой расположения документов или отдельных записей.

Для облегчения и ускорения поиска используются разнообразные технические средства, в том числе средства оргтехники. Имеются автоматизированные ИПС, основанные на ЭВМ.

 

Виды поиска

 

Различают документальный и Фактографический поиск. Документальный поиск - это информационный поиск, цель которого - нахождение в хранилище ИПС документов, соответствующих подученному запросу (с последующей выдачей самих документов или их копий). Существуют хранилища первичных документов (книгохранилица библиотек, массивы микродокументов и т.д.) и вторичных (картотеки, каталоги, записи в памяти ЭВМ и т.п.).

В реальных условиях документальный поиск осуществляется чаще всего в два этапа (по двум контурам): в хранилище вторичных документов, затем в хранилище первичных документов. Соответственно выделяют два вида документального поиска: библиографический и библиотечный.

Библиографический поиск - документальный, осуществляемый с целью нахождения данных о первичных документах и их адресов. Информационно-поисковая система, обеспечивающая хранение вторичных документов и библиографический поиск, называется библиографической ИПС.

Библиотечный поиск - документальный, осуществляемый с целью нахождения первичных документов в их собрании (фонде). Соответствующая ИПС называется библиотечной.

При документальном поиске потребитель информации сам извлекает из документов интересующие его факты и идеи.

Фактографический поиск представляет собой поиск фактов, непосредственно отвечающих на запрос. Например, на запрос "Суда на подводных крыльях, выпускаемые промышленностью СССР", документальная ИПС выдает книги, статьи, информационные материалы, содержащие сведения об этих судах; фактографический поиск выдает перечень судов с их техническими характеристиками. Важно иметь в виду, что фактографические ИПС (ФИПС) способны обслуживать не любые запросы, а только запросы фактографического характера. Например, если специалисту нужно ознакомиться с состоянием какой-либо проблемы, проследить развитие идеи, то ему требуется документальный поиск.

Фактографическая ИПС - информационно-поисковая система, обеспечивающая хранение и поиск фактографической информации. ФИПС используется в системах экономического управления, научно-технической информации, в городских справочных службах.

К фактографической информации относят как сведения, извлекаемые из документов (первичных или вторичных), так и получаемые непосредственно от источников их возникновения (специалистов, измерительных систем и т.д.). Чтобы обеспечить хранение и поиск такой информации, ее фиксируют на специальных форматах в виде фактографических описаний. Фактографическое описание - совокупность данных (признаков, характеристик), относящихся к некоторому объекту (процессу, явлению).

Существуют автоматизированные ФИПС трех поколений. Системы первого поколения обеспечивают накопление данных об объектах, их коррекции и поиск по одному типу запроса с выдачей всего набора данных, имеющихся в фактографическом описании. Отображаемые объекты принадлежат к одному классу и записываются заданным набора данных (характеристик) в фиксированном формате. В таких системах автоматизируются поиск и вывод информации, а в некоторых случаях - ввод и коррекция фактографических описаний. ФИПС второго поколения решают задачи накопления данных об объектах, их коррекции поиска по фиксированному набору типов запросов с селективной, выдачей информации об объектах, а также осуществляют в определенных пределах синтез информации. Отображаемые объекты могут принадлежать различным классам и имеют регламентированный для каждого класса набор данных фиксированного формата. В таких системах автоматизированы ввод-вывод, поиск, коррекция и синтез информации...

ФИПС третьего поколения накапливают данные об объектах, осуществляют их коррекцию, поиск по нерегламентированному кругу запросов с селективной выдачей информации, а также решают нерегламентированный круг задач синтеза информации. Отображаемые объекты принадлежат к различным классам и имеют не регламентированный набор данных нефиксированного формата.

В системах этого рода автоматизированы ввод-вывод, поиск, коррекция и синтез информации, а также процесс внешнего взаимодействия потребителей с системой. Основное отличие документальной ИПС в том, что она выдает потребителю на выходе те же документы, которые в свое время поступили на ее вход, а фактографическая ИПС выдает фактографические описания, созданные в результате аналитико-синтетической переработки входных документов внутри системы.

Для синтезирования фактографических описаний ФИПС должны располагать специальным аппаратом, проверяющим достоверность вновь поступившей информации, сопоставление ее с уже известной, корректировку и пополнение фактографических описаний. Эффективная реализация такого аппарата возможна лишь в автоматизированных ИПС.

С точки зрения режима распространения информации различают три вида ИПС:

избирательное распространение информации (ИРИ), обеспечивающее периодические (раз в две недели или раз в месяц) поиски в массиве новых поступлений в соответствии с постоянно действующими запросами и выдачу потребителям оповещений о найденных документах;

ретроспективный поиск (Ш), осуществляющий справочное обслуживание по разовым запросам в массиве информации долговременного хранения;

интегральные системы, работающие как в режиме текущего информирования (ИРИ), так и в режиме справочного Обслуживания (РП).

Следует отметить, что и документальные, и фактографические ИПС могут работать во всех режимах распространения информации.

 

Элементы ИПС

 

Элементами реальной ИПС являются:

- массив документов (текстов, записей), выступающих в качестве объекта поиска;

- информационно-поисковый язык - искусственный язык, предназначенный для описания содержания и формы документов и (или) запросов для последующего осуществления поиска;

- правила (алгоритмы, методы) индексирования, следуя которым производится описание средствами ИПЯ документов и запросом (перевод их с естественного языка на информационно-поисковый) в результате индексирования документа получается поисковый образ документов (ПОД), а индексирования запроса – поисковое предписание (ПП);

- правила (алгоритмы, методы) поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);

- технические средства, с помощью которых реализуется ИПС, т.е. осуществляются гранение и поиск информации;

- обслуживающий персонал - индексаторы и технические работники, обеспечивающие обработку и ввод в систему документов, а также операторы ИПС, производящие поиск информации и выдачу ее потребителю (в качестве оператора ИПС может выступать и сам потребитель информации).

Информационный запрос не включается в состав ИПС и рассматривается как сигнал, поступающий из внешней среды к оператору.

От состава и тематики документов зависят ИПЯ, правила индексирования и поиска. Выбор ИПЯ обусловливает способ организации ЗУ и пригодные для реализации ИПС технические средства. ИПЯ и технические элементы ИПС предъявляют определенные требования к квалификации обслуживающего персонала. Учет системных взаимосвязей необходим для правильной разработки реальных ИПС.

В процессе анализа ИПС часто рассматривают отдельно материальные составляющие (массивы документов, технические средства, персонал) и семантические средства (ИПЯ, методы индексирования и поиска). Совокупность ИПЯ, методов индексирования и поиска принято в теории ИПС называть абстрактной ИПС.

С помощью семантических средств ИПС осуществляются смысловые операции обработки документов и запросов и отбор документов, подлежащих выдаче. Последовательность этих операций представлена в виде формулы (I).

Li ® Si «Sd Ld (I)

где Li – текст запроса на естественном языке;

Si – представление запроса на ИПЯ (ПП);

Ld - текст документа на естественном языке;

Sd - представление документа на ИПЯ (ПОД);

® - индексирование; «- сопоставление ПОД и ДП в соответствии с заданным критерием выдачи.

Из формулы (I) видно, что семантические информационно-поисковые операции сводятся к моделированию смысла текста, что требуется для перевода с естественного языка на ИПЯ (операция индексирования) и к сравнению смысла текстов на информационно-поисковом языке для установления их соответствия.

 

Технические средства реализации ИПС

 

Идя информационного поиска используются технические средства специального и более широкого назначения. Можно выделить следующие виды информационно-поисковых устройств (ИПУ);

1) библиотечные - картотеки или книжные издания (реферативные журналы, справочники, энциклопедии и др.);

средства организационной техника (оргтехники) - ручные (обозримые картотеки, вращающиеся картотеки, рейтерные карты) и малой механизации (перфокарты с краевой или щелевой перфорацией, суперпозиционные перфокарты);

вычислительная техника общего значения (счетно-перфорационная, электронные вычислительные машины);

специальные селекторы, применяющиеся для поиска перфоносителей, магнитных записей, микроизображений.

Носители информации бывают двух видов: непрерывные, и дискретные [3].



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-07-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: