Первый запрос – Авторское право




Кафедра информационных технологий и управляющих систем

 

ОТЧЁТ ПО ЛАБОРАТОРНОЙ РАБОТЕ (ПРАКТИЧЕСКОЙ РАБОТЕ) № 05

 

По дисциплине «Основы научного поиска в мировых Web ресурсах»

 

Группа БМО-01

 

 

Студент: Дьячкова С.С. _____________________________

(подпись, дата)

 

Оценка работы____________

 

Преподаватель: Стреналюк Ю.В. _____________________________

(подпись, дата)

 

 

Королев, 2012

Лабораторная работа № 5

Обзор и анализ информационно поисковой системы Google

 

1. В качестве информационной потребности данной работы выступает поиск статей по авторскому праву (интеллектуальной собственности) и его защите. Тема магистерской диссертации «Разработка методов защиты интеллектуальной собственности (авторских прав) в ВУЗе»

2. Поисковые запросы:

- Авторское право;

- Интеллектуальная собственность;

- Защита интеллектуальной собственности;

3. Описание интерфейса поисковой системы Google:

 

При вводе адреса www.google.ru в адресную строку окна Microsoft Internet Explorer загружается начальная страница информационно-поисковой системы Google с разнообразными закладками и поисковой строкой. Google — крупнейшая поисковая система, принадлежащая корпорации Google Inc. Первая по популярности (79,65 %https://ru.wikipedia.org/wiki/Google - cite_note-4), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %), индексирует более 25 миллиардов веб-страниц, может находить информацию на 191 языке. Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

Индексация сайтов в данной поисковой системе происходит с помощью поискового робота Google, который имеет свой User Agent — Googlebot (Поисковый робот), который и является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:

  • Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
  • Google Search Appliance (Google) gsa-crawler[10] — поисковый робот нового аппаратно-программного комплекса Search Appliance,
  • Googlebot-Image — робот, сканирующий страницы для индекса картинок,
  • Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
  • Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.

Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти. Также существует обратная теория, называющаяся «бонус новичка», в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий PageRank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google. Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст, где он применяется. Данная возможность упрощала процедуру поиска, исключив необходимость в открытии каждого результата.

Глубина поиска – количество найденных документов по заданному запросу. Если документов много – большая глубина поиска (плохо), если документов мало – малая глубина поиска (хорошо).

Язык запроса – Оператор: - (минус), OR; + — по умолчанию Google перебирает грамматические формы английских слов. Оператор +, поставленный перед словом, устраняет такой перебор. Кроме того, оператор + ставится перед служебными словами (or, the, a, in и т. д.), чтобы попытаться включить их в поиск. ~ — поиск слова и всех его синонимов. По запросу ~smel1 найдутся страницы, где есть слова «nose», «taste» «smells» и т. д. Оператор по умолчанию. AND. Скобки. Отсутствуют. Фразы. Допускаются. Ищутся все слова, составляющие фразу (в том числе и служебные). Шаблоны. Знак * заменяет слово при поиске фразы. Регистр. Не учитывается. Типы файлов. HTML, PDF, PS, DOC, XLS, TXT, PPT, RTF, ASP, WPD1. Префиксы: intitle — поиск в заголовках, например: intitle:hamlet; link — показывает сайты, ссылающиеся на заданный2, например: Link:www.spillikins.ru; allinanchor — ищет в текстах ссылок, например: allinanchor:"пойди туда не знаю куда"; related — находит страницы, похожие на заданную3, например: related:Iove.me.tender.com

 

4. Тип доступных документов: doc, pdf, html, rar, txt, rtf

5. Формирование простых поисковых запросов и поисковых запросов с вводом логических функций:

Первый запрос – Авторское право

Результат поиска: примерно 12 500 000 (0,15 сек.)

В данном случае система находит документы, в которых в одном предложении встречаются все слова “авторское” и “право”.

Результат поиска самый большой. Причем будут найдены слова как с большой, так и с маленькой буквы

Второй запрос – +Авторское~право

Результат поиска: примерно 8 860 000

 

Результат поиска существенно уменьшился.

Третий запрос – статьи +~авторское +право:

Результаты поиска: примерно 3 820 000

Результат поиска существенно уменьшился.

 

Четверный запрос - intitle:статьи+авторское+право:

 

 

Результаты поиска: примерно 3 060 000

Результат поиска уменьшился.

 

Пятый запрос - allinanchor:"авторское право"

Результат поиска: примерно 8 310 000

Результаты поиска значительно увеличились.

 

Вывод: в результате поиска статей по авторскому праву количество всех найденных документов (среди которых также найден необходимый материал, удовлетворяющий информационную потребность данной лабораторной работы) сведен к минимуму, т.е. достигнута малая глубина поиска.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-01-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: