Использование ИПС для поиска лингвистической информации

СОДЕРЖАНИЕ

СПИСОК СОКРАЩЕНИЙ…………………………………………………...…..3

ВВЕДЕНИЕ…………………………………………………………………...…...4

§1. ИСТОРИЯ РАЗВИТИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ
………………………………………………………………………………….......5

§2. ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫИ ИХ ТИПЫ………....8

§3 ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ ДЛЯ ПОИСКА ЛИНГВИСТИЧЕСКОЙ ИНФОРМАЦИИ…………………….……18

§4. НАПРАВЛЕНИЯ РАЗВИТИЯ ИНФОРМАЦИОННОГО ПОИСКА В ИНТЕРНЕТ……………………………………………………………………....22

ЗАКЛЮЧЕНИЕ…………………………………………………………….……25

СПИСОК ЛИТЕРАТУРЫ…………………………………………………….…24

СПИСОК СОКРАЩЕНИЙ

ИПС Информационно-поисковая система

FTP File Transfer Protocol

URL Uniform resource locator

WWW World Wide Web

ВВЕДЕНИЕ

Сегодня, когда Интернет стал одним из основных источников информации, поиск в сети приобретает всё большую практическую ценность. Но с быстрым увеличением объёма доступных данных всё более усложняется и сама процедура поиска.

Сеть Интернет можно назвать необъятной, так как количество web-документов в ней исчисляется миллиардами. Такой объём информации требует правильной организации процесса поиска и применения специальных технических средств, таких как поисковые машины. Простой поиск по достаточно распространённому ключевому слову даёт обычно от десятков тысяч до нескольких миллионов ссылок. Очевидно, что работа с таким большим количеством документов практически невозможна, тем более что подавляющая их часть нерелевантна, то есть содержит информацию, не относящуюся к делу.

Теперь, кода Интернет предоставляет информацию широким массам пользователей, найти в ней какой-то ресурс без специальных средств практически невозможно. Но это под силу поисковым системам. Принцип работы таких систем весьма прост, но ушли годы, чтобы его разработать в том виде, в каком он существует сегодня.

За время существования Интернет предпринимались различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие же привели к созданию удобных систем поиска информации. В данной работе мы рассмотрим поиск лингвистической информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска. Всего же в мире существуют стони различных поисковых систем, и выбор той или иной системы зависит только от наших личных предпочтений.

История развития ИПС

Основные принципы информационного поиска были сформулированы ещё в первой половине этого века. Между 1939 и 1945 годами. У. Е. Баттеном была разработана система для отыскания патентов.

Каждый патент классифицировался в соответствии с понятиями, к которым он имел отношение. Для каждого понятия, использовавшегося в системе, была создана специальная позиционная перфокарта. При регистрации в системе нового патента находились карты, соответствующие тем понятиям, которые в нем рассматриваются, и в позиции пробивались номера патента. Чтобы найти патент, в котором рассматривается одновременно несколько понятий, необходимо было совместить карты, соответствующие этим понятиям. Номер нужного патента определялся из позиции просвета [6; 7].

Основные принципы информационного поиска с тех пор не изменились. На примере уже этой ИПС видно, как происходит процесс поиска. Во-первых, должен быть создан массив указателей на информационные ресурсы. Указатель (index) содержит в себе некое свойство документа и ссылки на документы, этим свойством обладающие. Указатели могут быть различных видов. Широко распространен, например, авторский указатель. Такой указатель позволяет получить ссылки на работы интересующего нас автора. Также указатели могут быть составлены и по другим атрибутам документа. В системе Баттена использовался предметный указатель, то есть документы классифицировались по понятиям (предметам), которые в них затрагиваются.

Процесс создания указателей на документы называется индексированием, а термины, использующиеся для индексирования, называются терминами индексирования. В случае с авторским указателем роль терминов индексирования будут выполнять фамилии авторов хранящихся в фонде работ. Совокупность используемых терминов индексирования называется словарем.

Массив указателей, полученный после индексации информационных ресурсов, называется индексом (Index database). После создания индекса к нему обращаются посредством запросов. Так как процесс поиска заключается в сопоставлении запроса пользователя с имеющимися данными, полученный запрос также должен быть переведен на язык индексирования. В индексе выполняется поиск соответствующих запросу документов, пользователю выдается список ссылок на подходящие ресурсы.

Для повышения скорости индексирования и поиска словарь и индекс должны быть упорядочены по системе, наиболее отвечающей задачам поиска в данной предметной области [6].

Первым инструментом, используемым для поиска в Интернете, был Арчи, что расшифровывается как архив. Он был создан в 1990 году Аланом Эмтэджем, Биллом Хиланом и Дж. Питером Дойчем, студентами информатики в университете Макгилла в Монреале. Программа создавала доступную для поиска базу данных имён всех файлов, расположенных на общедоступных анонимных FTP-серверах; однако, Арчи не индексировал содержание этих сайтов, так как объем данных был небольшой и их можно было легко найти вручную.

1991 год ознаменовал подьём Gopher, созданного Марком П. Маккэхилом в университете Миннесоты, привёл к двум новым поисковым программам, Veronica и Jughead. Как Арчи, они искали имена файлов и заголовки, сохраненные в индексных системах Gopher.

Летом 1993 года ни одной поисковой системы для веб-сети не существовало, хотя многочисленные специализированные каталоги поддерживались вручную. Оскар Нирштрасс в Женевском университете написал ряд сценариев Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это сформировало основу дляW3Catalog, первой примитивной поисковой системы сети, выпущенной 2 сентября 1993 года.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в июне 1993 года. Цель Wandex состояла в том, чтобы измерить размер всемирной паутины. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Aliweb не использовал поискового робота, но вместо этого зависел от получения уведомления от администраторов веб-сайтов на наличие на каждом объекте индексного файла в определенном формате.

Первой полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах [7].

Вскоре появилось множество других конкурирующих поисковых машин, таких, как «Magellan», «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность.

ИПС и их типы

Поиск информации в интернет может быть произведен по нескольким методам, значительно различающимся как по эффективности и качеству поиска, так и по типу навлекаемой информации, Можно выделить следующие основные методы поиска информации в интернет, которые, в зависимости от целей и задач пользователя, используются по отдельности или в комбинации друг с другом [3]:

1. Непосредственный поиск с использованием гиперссылок. Поскольку все сайты в пространстве WWW фактически окатываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера. Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей более 60 млн. узлов, «ручной» просмотр web-страниц часто окатывается единственно возможным на заключительных этапах информационного поиска.

2. Использование поисковых машин. Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Сети, подлежащих детальному рассмотрению. Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаю поисковым серверам в качестве аргументов поиска: что искать.

Центральное место по праву принадлежит информационно-поисковым системам (ИПС).

Таким образом, ИПС - это система, обеспечивающая поиск и отбор необходимых данных в специализированной базе с описаниями источников информации на основе информационно-поискового языка и соответствующих правил поиска.

Каждая поисковая система имеет и постоянно пополняет свою (локальную) базу данных. База данных поисковой системы содержит основные параметры (индексы) каждого известного данной системе (проиндексированного) документа. Каждая поисковая система использует свои методы индексации. Кроме того, различные поисковые системы имеют разные объемы базы данных.

Главной задачей ИПС является поиск информации в соответствии с информационными потребностями пользователя, формируемыми в виде запросов [2].

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС). Количество одновременно обслуживаемых посетителей наиболее популярных систем достигает многих тысяч. Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом. В ее основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы периодически исследуют содержимое всех ресурсов Интернета. Для этого они перемещаются, или как говорят, ползают, по разным ресурсам. Соответственно такие программы называются роботы. Есть и другие названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то такую программу естественно назвать спайдером по англ. – паук. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URL-адресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее, многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы.

Итак, работа поисковой системы обеспечивается тремя составляющими [2]:

Программа «робот» (спайдер). Она анализирует ресурсы и производит их индексацию.

Индексы поисковой системы. Они формируют создаваемые поисковой системой собственные БД.

Программа, которая в соответствии с запросом пользователя готовит ему ответ на основе анализа индексов, то есть собственных БД.

Пользователь реально имеет дело только с последней из этих трех составляющих.

Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. Познакомимся с основными отечественными и зарубежными поисковыми системами. [8]

Яndex (https://www.yandex.ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она содержит более 33 миллионов документов, поддерживает собственный каталог Интернет-ресурсов. В настоящее время Яндекс – признанный лидер российского поискового сервиса. Демонстрирует высокие показатели, как по объёму проиндексированных документов, так и по релевантности поиска. На начало февраля 2007 года Яндексом проиндексировано свыше 970 тысяч российских и зарубежных русскоязычных серверов, а так же серверов на территории СНГ (всего учтено более 140 миллионов оригинальных документов). Актуализация базы осуществляется еженедельно.

Отличительные особенности системы [3]:

- Полнотекстовый поиск с полным учётом морфологии русского и английского языков.

- Мощный язык запросов (в том числе возможность поиска с расстоянием).

- Возможность запроса на естественном языке.

- Корректная обработка сленговых слов.

- Возможность поиска похожего документа.

- Очень компактный индекс.

- Подсветка слов из запроса в найденных документах.

- Развитая релевантность, позволяющая найти искомую информацию, не перегружая пользователя тысячами ссылок на ненужные документы.

- Высокая скорость поиска.

Яндекс – это не только поисковая машина, но и каталог ресурсов: новости, словари, сводка погоды, курсы валют. Он имеет дополнительные сервисы, такие как размещение пользовательских домашних страниц на серверах Narod.ru, бесплатные почтовые ящики, онлайновую платёжную систему Яндекс Деньги.

В поисковую машину Яндекс вносятся в основном русскоязычные сайты. Для увеличения скорости поиска информации Яндекс даёт возможность поиска по категориям: культура и искусство; наука и образование; бизнес и экономика; общество и политика; компьютеры и связь; дом и семья; развлечение и отдых и т.д.

Чтобы получить возможность работы с персональными настройками, необходимо зарегистрироваться. Яндекс не требует от пользователя знания специальных команд для поиска, но обладает развитым языком запросов, позволяющим осуществлять «тонкий» поиск. Для того чтобы воспользоваться широким спектром возможностей, нужно перейти на страницу «расширенный поиск» [3].

Существует также такая услуга как почтовая подписка на поисковый запрос. Эта услуга позволяет узнать, когда в сети появляется новая информация на интересующую пользователя тему.

Список найденных документов перед выдачей пользователю сортируется по количеству совпадений с ключевой фразой в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, расстояния между искомыми словами в тексте документа и т.д.

Для формирования более точного запроса целесообразно обратиться к «Расширенному поиску». С помощью структурированного меню можно легко задать ограничения по различным сочетаниям ключевых слов, местоположению термина в документе, времени и языку публикации, месте на сайте.

Максимально детализированный запрос можно создать также и в простой форме с использованием языка запросов Яндекс, который включает множество специальных символов: ~, &, /, “”, (), |, $, #. Слова с такими символами вводятся как и обычный запрос в поисковую строку.

Яндекс – единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.

Rambler (https://www.rambler.ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Система индексирует домены ru, su, ua, by, kz, kg, ge, zu и некоторые русскоязычные ресурсы из доменов com, bet, org. Ежедневно в базу данных этого поисковика вносятся десятки тысячи изменений и дополнений, что обеспечивают постоянное пополнение базы сведениями обо всех новинках, появляющихся в русскоязычной части сети [8].

Поисковая система Rambler учитывает координаты слов, обучена строгой и нечёткой морфологии, связывает поиск с каталогом, в качестве которого используется рейтинг «Top 100», группирует результаты поиска по сайтам, ищет по датам. Достаточно удачная структура продукта позволяет Rambler иметь для поисковика количество серверов в 2 раза меньше, чем у Яндекса и в 3 раза меньше, чем у Апорта.

«Паук» Rambler производит индексирование в новостях 5 раз в день, в на сайтах, которые входят в Top 100 – 1 раз в день, все прочие посещаются не чаще, чем 1 раз в две недели. Rambler не индексирует личные странички, находящиеся на публичных зарубежных серверах, а страницы подобных русскоязычных сайтов обходит медленней, чем другие ресурсы.

Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

АПОРТ (https://www.aport.ru). Данная система является проектом фирмы «Агама» при поддержке российского отделения Intel. Система задумана и реализована как web-индекс для осуществления поиска в российской части Интернет, на русскоязычных серверах СНГ и мирового Интернет. Позволяет искать не только сайты, но и картинки, музыку, а также производит поиск в серверах знакомств и поиск работы. Апорт имеет свой собственный обширный каталог, разбитый по различным тематическим разделам.

Одним из существенных преимуществ Апорта является англо-русский и русско-английский on-line перевод запросов и поиск результата, благодаря чему можно исследовать «русский Интернет» не зная ни слова по-русски. Более того, благодаря ряду уникальных особенностей системы, можно проводить поиск, использую контекстные выражения даже для предложений.

На сегодняшний день объем ее базы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. АПОРТ обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы, как на русском, так и на английском языках. Кроме того, АПОРТ имеет специальные режимы для поиска иллюстраций и аудио файлов [8].

Система имеет развитый язык запросов и гибкую форму вывода результатов. Основные свойства поисковой системы Апорт [8]:

- Перевод запроса и результатов поиска с русского на английский и наоборот.

- Автоматическая проверка орфографических ошибок запроса.

- Более информативный вывод результатов писка для найденных сайтов (выводит не только первое предложение найденного документа).

- Возможность поиска в любой грамматической форме – сильный язык расширенных запросов для профессиональных пользователей.

- Поддержка пяти основных кодовых страниц (различных операционных систем) для русского языка.

- Технология поиска с использованием ограничений по URL (адресу), дате документов.

- Поиск ведётся не только по тексту, но и по заголовкам, комментариям, записям и картинкам.

- Сохранение параметров поиска и определённого числа предыдущих запросов пользователя.

- Объединение копий документа, находящихся на разных серверах.

Наиболее популярными зарубежными поисковыми системами являются Google, Alta Vista, Scirus.

Google (https://www.google.com) — одна из самых полных зарубежных ИПС. Объем ее базы составляет более 560 миллионов документов. Лидер поисковых машин Internet, Google, занимает более 60% мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в поисках информации в Internet. Сейчас регистрирует ежедневно около 50 миллионов поисковых запросов и индексирует более 8 миллиардов веб-страниц [2].

Была разработана в 1998 выпускниками Стэндфордского университета Сергеем Брином и Лари Пейджем, которые применили для ранжирования документов технологию PageRank, где одним из ключевых моментов является определение «авторитетности» конкретного документа на основе информации о документах, ссылающихся на него. Говоря общими словами, чем больше документов ссылается на данный документ и чем они авторитетнее, тем более авторитетным данный документ становится. Количественное значение авторитетности документа (другими словами, взвешенное количество ссылок или PageRank) относится к так называем статическим факторам (то есть независящим от конкретного запроса) и учитывается при определении релевантности документа конкретному запросу как весовой коэффициент. Наряду с этим Google применит для определения релевантности документа не только текст самого документа, но и текст ссылок на него. Эта технология позволила ему обеспечить выдачу довольно релевантных результатов на фоне других поисковиков. Довольно быстро Google стал лидировать в различных опросах по такому показателю, как удовлетворенность пользователей результатами поиска [8].

Google осуществляет поиск по документам на более чем 35 языках, в том числе русском. В настоящее время многие порталы и специализированные сайты предоставляют услуги поиска информации в Internet на базе Google, что делает задачу успешного позиционирования сайтов в Google еще более важной. Google проводит переиндексацию своей поисковой балы примерно раз в четыре недели. Во время этого усовершенствования, неофициально называемого Google dance, происходит обновление базы на основе информации, собранной роботами за время, прошедшее с предыдущего усовершенствования, и перерасчет значений PageRank документов. Также существует определенное количество документов с достаточно большим значением PageRank, информация о которых в поисковой базе обновляется ежедневно, однако значение PageRank пересчитывается только во время Google dance. Нормированное значение PageRank для конкретного документа, загруженного в браузер, можно узнать, скачав и установив Google ToolBar – специальную панель инструментов для работы с этим поисковиком. Несмотря на то, что в поисковике имеется форма для бесплатного добавления страницы в базу, Google предпочитает сам находить новые документы по ссылкам с уже известных и не будет индексировать добавленную через форму страницу, если в его базе не найдется ни одной страницы, ссылающейся на нее.

Кроме поисковой системы, сайт google.com представляет много других бесплатных услуг, в частности популярный сервис Google Mail (Gmail).

Yahoo! (https://www.yahoo.com) Одна из самых первых поисковых систем (создана Дэвидом Фило и Джерри Янгом в апреле 1994 года) по сей день остается и самой популярной из них, традиционно сочетая как по ключевым словам, так и с помощью иерархического дерева разделов.

Нынешнее развитие Yahoo можно определить как движение в он-лайн, интерактивность. Yahoo быстро осваивает эту область Интернет-услуг, но возникает одна проблема: ядро Yahoo! не было на это рассчитано. Не была в 1994 году заложена в него «онлайновая» составляющая, ее «приклеил» Тим Кугл несколькими годами позже. Естественно возникает угроза хакерских атак через эту незащищенную область [8].

Одно из новшеств поисковой системы Yahoo – панель задач для браузера Firefox. Этот инструмент помогает пользоваться поиском Yahoo, не заходя на официальный сайт, а лишь используя кнопки панели.

1 сентября 2005 года поисковик Yahoo, которому принадлежит более 200 миллионов адресов электронной почты по всему миру, анонсировал запуск новой системы поиска текстов, фотографий и других документов, содержащихся в письмах.

Необходимость такого нововведения возникла вслед за увеличением объёма хранимых данных, ведь некоторые пользователи создают целые почтовые архивы. Подгоняемый конкурентом Google и его почтовым сервисом Gmail, Yahoo для хранения почты предлагает отныне 1 гигабайт бесплатного места, или 2 гигабайта по годовому абонементу. Как только Вы получаете возможность хранить больше информации, вам необходимы и расширенные поисковые возможности.

Пользователи поисковой системы Yahoo, в свою очередь, могут использовать возможности детализированного поиска слов в названии или непосредственно в тексте письма, а также в присоединенных документах, не открывая их. Результат поиска отражается в трех строках с указанием всех атрибутов. На панели справа отображаются все похожие документы. Найденные фотографии выводятся на экран в уменьшенном виде, что значительно облегчает поиск. Система также учитывает орфографические ошибки, позволяя искать слова лишь по первым буквам.

Для начала Yahoo планирует предложить новую систему небольшому числу американских пользователей, а затем распространить её по всему миру. Со стороны клиентов это не потребует никаких дополнительных усилий. «Когда услуга станет доступна, в левом верхнем углу страницы вашего почтового ящика появится соответствующий баннер», - обещает компания Yahoo[3].

Домену Yahoo принадлежит 31,5% мирового рынка, уступая лишь Microsoft, чьему сервису Hotmail принадлежит 35,5% рынка.

AltaVista (https://www.altavista.com) – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы [8].

Использование ИПС для поиска лингвистической информации

Точность и полнота поиска лингвистической информации зависят не только от характеристик самой ИПС, но и от того, как создается запрос. Идеальный запрос может быть составлен пользователем, в полном объеме знакомым с нужной предметной областью, а также с используемой ИПС.

Остальные же пользователи вынуждены довольствоваться или низкой точностью поиска, или низкой полнотой. Для повышения качества поиска можно использовать различные методы. Наиболее употребляемый из них – использование логических операторов AND, OR, NOT.

Использование логических операторов – довольно простой способ повысить релевантность выдаваемой лингвистической информации, но он имеет и свои недостатки. Главный из них – плохая масштабируемость. Применение оператора AND может сильно сузить выдачу, а оператора OR – сильно расширить [7].

Степень точности и полноты поиска зависит от того, насколько общие термины использовались при формулировке запроса. Может быть неверным использование как наиболее общих терминов (возрастает уровень информационного шума), так и слишком специфичных терминов (снижается полнота поиска). Использование слишком специфичных терминов может быть чревато еще и тем, что в словаре ИПС этого термина может не оказаться.

В общем виде процедура поиска является процедурой итеративной, то есть за этапом выдачи результатов поиска следует коррекция запроса, поиск по этому запросу и т. д. Коррекция запроса происходит исходя из количества полученных документов и их релевантности, и может выполняться как пользователем, так и самой информационно-поисковой системой [7].

В зависимости от соотношения полноты и точности найденной информации пользователь может сузить или расширить область поиска, перейдя к более общим или, наоборот, более специфичным терминам, а также использовав родственные понятия. В случае поиска по нескольким терминам такая коррекция области поиска может происходить по одному из нескольких терминов, что позволяет изменять эту область достаточно плавно.

Может оказаться полезным знание пользователя о наличии определенно релевантных документов. Не найдя их в списке найденных документов, область поиска надо расширить.

Коррекция запроса системой информационного поиска происходит на основании анализа документов, помеченных пользователем как наиболее точно отвечающих его потребности. В таком случае при следующем поиске система ищет те документы, в которых, помимо заданных в первоначальном запросе, содержатся термины, встречающиеся в документах, отмеченных пользователем [5].

Использование ИПС для поиска лингвистической информации

Поиск по сайту