Информационно-поисковые системы( АИПС).




АИПС- это прикладные программы, предназначенные для поиска по запросам пользователей инф-ции, хранящейся на матер.носителях в памяти комп. или в памяти мн.компьютеров, объединенных в сеть. Большую актуальность данные программы приобрели в связи с активным участием пользователей в работе глобальной сети Интернет. В сети Интернет объемы хранящейся инф-ции составляют тысячи терабайт и отыскивают нужную инф- цию можно только с помощью прикладных программ данного типа. Элементами поисковой системы являются:

1)массив инф-ции доступной для пользователя.

2)информационно-поисковый язык(ИПЯ)-это искусственный язык,предназначенный для описания информационных потребностей пользователя в форме запросов.

3) Критерий выдачи (соответствия)- это формальные правила в соответствии с которыми определяется подлежит тот или иной документ, ин-ция выводу в ответ на запрос или нет. По своему назначению поисковые системы делятся на: документальные, фактографические.

Документальными наз-ся системы, целью работы которых является отыскание документов, соответствующих запросу, а в фактографических системах целью работы является поиск фактов, отвечающих на запрос.
По режиму поиска и выдачи результатов различают 3 разновидности:

1) Избирательное распространение инф-ции(ИРИ).Этот режим характеризуется тем, что осуществляется периодически действующий поиск по постоянно действующим запросам во всей вновь поступающей инф-ции.

2) Ретроспективные поиск. Он заключается в том, что поиск осуществляется по разовым запросам во всем объеме доступной инф-ции.

3) Интегральный поиск. Он сочетает в себе эл-ты первого и второго.

Эффективность работы поисковой системы зависит не только от выбранного режима, но и от вида критерия соответствия, критерия выдачи. Если рассматривать множество доступных документов как объект поиска, можно выделить 3 разновидности критерия соответствия(выдачи):

1) Критерий вхождения.

М документа
М документа
М запроса    
М запроса

 

 


2)Более строгим критерием является критерий совпадения. В

Этом случае соответствующим запросу считается документ, если множество эл-тов документа и запроса совпадают.

 

М документа
М запроса

 

 


3)Критерий пересечения. Он требует неполного, а лишь частичного вхождения эл-тов запроса во множество эл-тов документа.

М док
М запр

 


Для усиления наиболее важных элементов запроса в поисковых системах вводят весовые коэффициенты(К важности), которые задают больший вес наиболее востребованным элементам запроса. Применение таких коэф позволяет вычислить степень соответствия найденных эл-тов запросу, затем найденные док-ты по величине критерия выдачи.

КС формируются с помощью логичсеких операторов и здесь также можно классифицировать несколько критериев соответствия:

1)одноаспектный поиск;

2) логическая сумма(А или В или С)

3)логическое умножение(А и В и С.. и тд)

4) критерий отрицания(нет А)

Поиск инф-ции по фактографическим данным подразумевает применение критериев выдачи с использованием требований, типа =,>,<, интервал, диапазон, максимум, минимум и в кач-ве результата поиска будет пользователю попадать только та инф-ция, которая отвечает данным количественным требованиям. Для каждой поисковой системы существуют инструкции по работе, в которых описываются возможности формирования критериев соответствия. Среди таких возможностей можно назвать поиск группы терминов, нах-ся в одном предложении. Поиск комбинаций слов и фраз, поиск терминов нах-ся на определенном расстоянии друг от друга. Поиск по терминам без учета суффиксов и окончаний, поиск по синонимам, поиск с использованием словарей, для ПС они носят название «тезариус» и при работе с поисковой системой целесообразно ознакомиться с предоставленными возможностями. Поисковые системы, используемые в сети интернет носят также название поисковых машин. Например, при поиске в Google число доступных документов превышает сотни миллионов. А в поиске участвуют свыше 500 тыс.комп.

Базы данных.

БД-это прикладная программа, которая содержит в памяти ЭВМ совокупность организованных взаимосвязанных данных, отображающих состояние изучаемой предметной области.

Работа БД осуществляется с помощью спец.комплекса программ,который наз-ся система управления БД.(СУБД).Эта программа управляет процедурами описания структурв БД,регистрации данных,быстрого поиска инф-ции,надежного хранения массива данных.

Сущ. Различные модели хранения инф-ции в БД.

Наиболее распространенные типы БД: иерархические, реляционные, сетевые.

Иерархические БД имеют структуру дерева, в котором один элемент предшествует другому и любой из элементов БД приобретает смысл и значение только если подойти к нему, начиная с общего уровня.

Комп(вершив)
Устр.памяти
ОЗУ
V памяти
разрядность
Тип устр.

 


Более гибкой структурой обладает сетевая модель БД.В этой структуре для обращения к любому из элементов инф-ции, хранящемуся в базе требуется меньшее кол-во времени.

 

Устр.памяти
ОЗУ
ПЗУ
ВН.ПАМЯТЬ
компьютер
ТИП
Объем памяти
разрядность

 

 


Наиболее часто используемый в современных прогр. приложениях- реляционный тип. Она наиболее полно соответствует возможностям современных комп. особенностью модели является то, что вся инф-ция представляется в единой унифицированной форме таблиц.Таблицами в матем соответствует хорошо разработанный аппарат- реляционная алгебра, в которой определены хорошо используемые операции с данными(объдинение, пересечение, сложение, вычитание табл.данных)

компьютер
комплектующие тип Объем памяти разрядность
ОЗУ
ПЗУ

Основ.фун-ции, которые выполняют БД являются:

-ввод данных,

-формирование запросов и вывод данных по запросам,

-выдача ответов по запросам на поиск,

-составление отчетов.

Отчет-форма ответа на запрос, в котором просматривается вся БД и выводится ее содержание в сжатом виде.

Процессу эксплуатации БД предшествует важный этап проектирование с помощью СУБД, Необходимо определить:какое количество полей будет иметь БД, какой тип и объем инф-ции будет заноситься в соответствующее поле.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: