АИПС- это прикладные программы, предназначенные для поиска по запросам пользователей инф-ции, хранящейся на матер.носителях в памяти комп. или в памяти мн.компьютеров, объединенных в сеть. Большую актуальность данные программы приобрели в связи с активным участием пользователей в работе глобальной сети Интернет. В сети Интернет объемы хранящейся инф-ции составляют тысячи терабайт и отыскивают нужную инф- цию можно только с помощью прикладных программ данного типа. Элементами поисковой системы являются:
1)массив инф-ции доступной для пользователя.
2)информационно-поисковый язык(ИПЯ)-это искусственный язык,предназначенный для описания информационных потребностей пользователя в форме запросов.
3) Критерий выдачи (соответствия)- это формальные правила в соответствии с которыми определяется подлежит тот или иной документ, ин-ция выводу в ответ на запрос или нет. По своему назначению поисковые системы делятся на: документальные, фактографические.
Документальными наз-ся системы, целью работы которых является отыскание документов, соответствующих запросу, а в фактографических системах целью работы является поиск фактов, отвечающих на запрос.
По режиму поиска и выдачи результатов различают 3 разновидности:
1) Избирательное распространение инф-ции(ИРИ).Этот режим характеризуется тем, что осуществляется периодически действующий поиск по постоянно действующим запросам во всей вновь поступающей инф-ции.
2) Ретроспективные поиск. Он заключается в том, что поиск осуществляется по разовым запросам во всем объеме доступной инф-ции.
3) Интегральный поиск. Он сочетает в себе эл-ты первого и второго.
Эффективность работы поисковой системы зависит не только от выбранного режима, но и от вида критерия соответствия, критерия выдачи. Если рассматривать множество доступных документов как объект поиска, можно выделить 3 разновидности критерия соответствия(выдачи):
1) Критерий вхождения.
М документа |
М документа |
М запроса |
М запроса |
2)Более строгим критерием является критерий совпадения. В
Этом случае соответствующим запросу считается документ, если множество эл-тов документа и запроса совпадают.
М документа |
М запроса |
3)Критерий пересечения. Он требует неполного, а лишь частичного вхождения эл-тов запроса во множество эл-тов документа.
М док |
М запр |
Для усиления наиболее важных элементов запроса в поисковых системах вводят весовые коэффициенты(К важности), которые задают больший вес наиболее востребованным элементам запроса. Применение таких коэф позволяет вычислить степень соответствия найденных эл-тов запросу, затем найденные док-ты по величине критерия выдачи.
КС формируются с помощью логичсеких операторов и здесь также можно классифицировать несколько критериев соответствия:
1)одноаспектный поиск;
2) логическая сумма(А или В или С)
3)логическое умножение(А и В и С.. и тд)
4) критерий отрицания(нет А)
Поиск инф-ции по фактографическим данным подразумевает применение критериев выдачи с использованием требований, типа =,>,<, интервал, диапазон, максимум, минимум и в кач-ве результата поиска будет пользователю попадать только та инф-ция, которая отвечает данным количественным требованиям. Для каждой поисковой системы существуют инструкции по работе, в которых описываются возможности формирования критериев соответствия. Среди таких возможностей можно назвать поиск группы терминов, нах-ся в одном предложении. Поиск комбинаций слов и фраз, поиск терминов нах-ся на определенном расстоянии друг от друга. Поиск по терминам без учета суффиксов и окончаний, поиск по синонимам, поиск с использованием словарей, для ПС они носят название «тезариус» и при работе с поисковой системой целесообразно ознакомиться с предоставленными возможностями. Поисковые системы, используемые в сети интернет носят также название поисковых машин. Например, при поиске в Google число доступных документов превышает сотни миллионов. А в поиске участвуют свыше 500 тыс.комп.
Базы данных.
БД-это прикладная программа, которая содержит в памяти ЭВМ совокупность организованных взаимосвязанных данных, отображающих состояние изучаемой предметной области.
Работа БД осуществляется с помощью спец.комплекса программ,который наз-ся система управления БД.(СУБД).Эта программа управляет процедурами описания структурв БД,регистрации данных,быстрого поиска инф-ции,надежного хранения массива данных.
Сущ. Различные модели хранения инф-ции в БД.
Наиболее распространенные типы БД: иерархические, реляционные, сетевые.
Иерархические БД имеют структуру дерева, в котором один элемент предшествует другому и любой из элементов БД приобретает смысл и значение только если подойти к нему, начиная с общего уровня.
Комп(вершив) |
Устр.памяти |
ОЗУ |
V памяти |
разрядность |
Тип устр. |
Более гибкой структурой обладает сетевая модель БД.В этой структуре для обращения к любому из элементов инф-ции, хранящемуся в базе требуется меньшее кол-во времени.
Устр.памяти |
ОЗУ |
ПЗУ |
ВН.ПАМЯТЬ |
компьютер |
ТИП |
Объем памяти |
разрядность |
Наиболее часто используемый в современных прогр. приложениях- реляционный тип. Она наиболее полно соответствует возможностям современных комп. особенностью модели является то, что вся инф-ция представляется в единой унифицированной форме таблиц.Таблицами в матем соответствует хорошо разработанный аппарат- реляционная алгебра, в которой определены хорошо используемые операции с данными(объдинение, пересечение, сложение, вычитание табл.данных)
компьютер | |||
комплектующие | тип | Объем памяти | разрядность |
ОЗУ | … | … | … |
ПЗУ | … | … | … |
… | … | … | … |
Основ.фун-ции, которые выполняют БД являются:
-ввод данных,
-формирование запросов и вывод данных по запросам,
-выдача ответов по запросам на поиск,
-составление отчетов.
Отчет-форма ответа на запрос, в котором просматривается вся БД и выводится ее содержание в сжатом виде.
Процессу эксплуатации БД предшествует важный этап проектирование с помощью СУБД, Необходимо определить:какое количество полей будет иметь БД, какой тип и объем инф-ции будет заноситься в соответствующее поле.