Состав и принципы работы поисковой системы.




Санкт-Петербургский Государственный Институт Технологий Механики и Оптики Факультет Среднего Профессионального Образования

Работу сдал: студент 233 группы Крысенко Пётр Работу принял:
Научно-исследовательская работа, на тему «Поисковые системы»

 
 
2011 г.


Содержание:

Поисковые системы

Принципы работы поисковых систем

Состав и принципы работы поисковой системы

Основные характеристики поисковой системы

Сводная таблица

Вывод

Список литературы


Поисковые системы


Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.
Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обработки запросов пользователей, о том, из чего эти системы состоят и как функционируют…
Понятие и функции поисковой системы
Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo». В русском Интернете это – «Яндекс», «Рамблер».


Принципы работы поисковых систем

Рассмотреть более подробнее понятие поискового запроса можно на примере любой поисковой системы. Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию о том, как выбрать автомобиль. Для этого, открываем главную страницу поисковой системы, и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Урюпинске»)
Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.
Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?
Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

Состав и принципы работы поисковой системы.

 

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.
Модуль индексирования
Модуль индексирования состоит из трех вспомогательных программ (роботов):
Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.
Ссылки извлекаются из тэгов. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:
• URL страницы
• дата, когда страница была скачана
• http-заголовок ответа сервера
• тело страницы (html-код)
Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.
Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.
База данных
База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.
Поисковый сервер
Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.
Поисковый сервер работает следующим образом:
• Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
• Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
• В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
• Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
• Полученные результаты поиска передаются пользователю в виде SERP (SearchEngineResultPage) – страницы выдачи поисковых результатов.
Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Yahoo!

В 1994 году, студенты Стэндфордского университета, Джерри Янг и Дэвид Фило, готовились к защите диссертации в области компьютерного проектирования интегральных схем. Для этого им приходилось много времени проводить в сети Интернет, в поисках нужной информации и копить ссылки. Списки со ссылками росли, потом Янг и Фило забросили диссертацию и принялись исключительно коллекционировать ссылки. К середине 1994 года их стало много, они отсортировали ссылки по категориям, потом в категориях ссылок стало тоже много, появились подкатегории.

И кто бы мог подумать, что у самого успешного Интернет проекта www.yahoo.com собственный поиск появился совсем недавно! Но список Джерри и Дэвида не был предназначен для всеобщего обозрения - он составлялся исключительно для друзей. Время шло, а посещаемость все росла и росла. Адрес сайта пошел по рукам....

Первым шагом к успеху стало новое, запоминающееся название - Yahoo!. Следуя пожеланиям пользователей, создатели www.Yahoo.com, стали преобразовывать сайт. Появились новые категории, и разделы "What'sNew" и "What'sCool". К концу 1994 Янг и Фило забросили свои диссертации и полностью отдались работе над поисковиком Яху.

В это время на дороге появилась компания Netscape, предложившая ресурсы для содержания поисковой системы Yahoo!. В результате у Yahoo! появился свой домен - yahoo.com, и каталог переехал на 10 станций SiliconGraphicsIndy. Примерно в это же время Yahoo! получил и первого инвестора - инвестиционный фонд "SeqouiaCapital". Джерри и Янг обзавелись офисами и наняли энергичную команду web-серферов. Темп роста составил, в среднем, 1000 страниц в день.

12 апреля 1996 года www.Yahoo.com выпустил свои акции. При номинальной цене в 12 долларов за штуку к концу дня они продавались уже по 33 доллара. Создатели Яху первыми стали применять рекламу своего ресурса в печатных СМИ и на телевидении. Новый управляющий поисковой системы Yahoo! - Тим Кугл решил развить Яху из простого перечня упорядоченных линков до настоящего портала. А из финансовых новостей сделать аукционы, добавляя к ядру Yahoo.com элементы онлайнового доступа.

Следующие вложения в поисковик Yahoo! составили 560 миллионов долларов. Yahoo.com взрослеет и начинает действовать на рынке как самостоятельная акула капиталистического мира. Конкуренты, в лице AmericaOnline и Microsoft, сбиваются в различные корпоративные альянсы, чтобы укреплять свои позиции в бизнесе. Подсмотрев у "врагов" методы, Yahoo в 1999 году покупают поставщика бесплатной электронной почты rocketmail.com. В то время на просторах Интернета появляются различные сайты, претендующие на звание Портал. С конкурентами расправляются по-разному. Webring.com покупают, с остальными ведут войну на бирже.

Таким образомYahoo представляет из себя в первую очередь портал (ранее - каталог сайтов с поиском по этому каталогу - аналогично Rambler TOP100), предоставляющий любому все что он захочет, с очень хорошей персонализацией (возможностью пользователю настроить сайт <под себя> и большим количеством сервисов). Как таковой Поиск Yahoo использует ядро поисковика www.overture.com (компанию, которую он приобрел, чтобы качественно улучшить свой поиск). Сейчас Overture в рамках корпорации Yahoo занимается разработкой системы контекстной рекламы в поиске Yahoo.

Но в истории компании были не только взлеты. Первая публичная эмиссия акций Yahoo состоялась в апреле 1996 года и совпала с началом бума дот-комов - количество маленьких и больших интернет-компаний росло с каждым днем. Большая часть денег, вырученных от IPO, была истрачена на рекламу портала. Ежегодный доход Yahoo достиг 1 млрд. долларов США, а рыночная стоимость компании превысила 120 млрд. долларов США.

Затем последовал крах дот-комов. Выручка Yahoo сократилась на две трети, несколько кварталов подряд были убыточными, рыночная стоимость компании упала до 4,6 млрд. долларов США. Янг и Файло начали бороться за выживание. В мае 2001 года на место Кугла был приглашен Терри Семел, который и вытащил Yahoo из кризиса. Портал стал предлагать пользователям новые сервисы, причем за некоторые услуги взималась плата. Yahoo возродился - объемы продаж выросли до 3,57 млрд. долларов США, прибыль увеличилась до 840 млн. долларов США, а рыночная стоимость компании поднялась до 50 млрд. долларов США.

Сегодня в спину Yahoo дышат конкуренты, главный из которых - компания Google, которая, кстати, в пору своего становления финансировалась именно фирмой Yahoo. Немного меньшую опасность представляют Microsoft MSN и AOL, принадлежащийTimeWarner. Янг и Файло относятся к этому философски: "Люди не давали нам шансов еще десять лет назад. У нас всегда было много конкурентов, однако сейчас наш будущий успех зависит только от нас".

В настоящее время аудитория интернет-порталаYahoo насчитывает 345 миллионов человек, из них 165 миллионов являются зарегистриованными пользователями. Более 30 представительств компании действуют в Северной Америке, Европе, Азии и тихоокеанском регионе.

В середине 2005 года, компания Yahoo, официально объявила о достижении важного преимущества в борьбе со своим главным конкурентом на рынке сетевого поиска - компанией Google. Менеджеры считают, что поисковик Yahoo позволяет найти в два раза больше документов, чем Google. По их мнению, база данных поисковой системы Yahoo включает в себя 20,5 млрд объектов - 19 миллиардов текстовых документов и 1,5 миллиардов изображений. Таким образом, ее поисковый индекс (число объектов, которые пользователь может найти в интернете при помощи поисковика), почти в два раза превышает аналогичный показатель поисковой системы интернет-корпорацииGoogle - 11,3 миллиардов объектов, из которых 8,2 миллиардов текстовых документов и 3,1 миллиардов изображений.

Google (Гугл)

Поисковая система Google по-прежнему остается самой популярной поисковой системой сети Интернет. За все время нахождения Google на рынке пока ещё ни одной из конкурирующих поисковых систем не удалось сместить американскую поисковую систему с лидирующих позиций. Однако же, как и у других Интернет-ресурсов у Google имеются как существенные преимущества, так и недостатки.

Основным преимуществом поисковой системы Google является простота её использования. Разработчики этой поисковой системы – студенты стэндфордского университета Ларри Пейдж и Сергей Брин стремились создать поисковую систему, которая была бы доступна каждому пользователю сети Интернет без использования каких-либо специальных знаний. Им это удалось. Поисковая система является простым и удобным Интернет-ресурсом. При внесении ключевых слов, она не требует использования кавычек, заглавных букв и так далее, что значительным образом облегчает процесс поиска информации. Кроме того, среди плюсов Google можно назвать её обширную базу данных. На настоящий момент там насчитывается более 3 миллиардов вэб-страниц, благодаря чему эта база данных этой поисковой системы входит в список самых крупных.

Кроме того, среди основных преимуществ этой поисковой систем можно назвать высокую скорость работы. Перед специалистами компании Google стояла задача сделать работу поисковой системы быстрой и эффективной, и им это удалось. Сделав запрос, пользователи практически мгновенно получают результаты поиска (на это уходит всего лишь несколько секунд). Это стало возможным благодаря тому, что разработчики значительно «облегчили» страницы с результатами поиска. Там содержится минимальное количество графики, рекламных объявлений, кроме того, значительно сокращен текст с описанием сайтов.

Плюс ко всему поисковая система Google выдает достаточно точную информацию. Результаты поиска в большинстве случаев соответствуют совершаемым запросам. При этом ссылки к сайтам, которые более всего соответствуют указанным ключевым словам, находятся в верхней части страницы. Также отметим, что Google является практически единственной поисковой системой, в которой учитывается не только количество страниц в результатах поиска, но и их качество. Особые специалисты этой компании регулярно производят «чистку» результатов поиска своей поисковой системы, благодаря чему достигается достаточно высокое качество предлагаемой информации.

Кроме того, одним из неоспоримых преимуществ Google является наличие дополнительных функций. Так, например, эта поисковая система позволяет пользователям ознакомиться с содержанием некоторых страниц, которые уже были закрыты.

Вместо привычной надписи «errоr 404», пользователи могут ознакомиться в с Интернет -страницами, правда в том виде, в каком они были размещены в поисковой системе. Кроме того, повторяющиеся ссылки, ведущие к одному и тому же сайту отображаются в Google в правой части страницы с результатами поиска. Подобная функция значительно сокращает время поиска информации, поскольку в этом случае пользователи не обращаются по нескольку раз на один и тот же сайт.

И, наконец, пользователям предлагается функция «Мне повезёт», благодаря которой, не дожидаясь результатов поиска они сразу же попадают на сайт, находящийся в списке на первом месте. Однако же у Google имеется и ряд недостатков. Так, например, нередко там встречаются ссылки на сайты с уже устаревшей информацией. Кроме того, также случается, что ссылки, которые находятся в результатах поиска, ведут на сайт, находящийся в стадии разработки. Из-за подобных сайтов пользователи тратят свое время впустую, в связи с чем снижается продуктивность работы поисковой системы. Кроме того, при совершении запросов пользователям необходимо проявлять внимательность. Так, например, результаты поиска, содержащие слово «фильм» будут значительно отличаться от результатов поиска, содержащих слово «фильмы». Вместе с тем, результаты поиска будут содержать и сайты, в которых находятся слова «фильм», «фильмов» и так далее.

Кроме того, отсутствие возможности указать конкретную грамматическую форму слова, либо ударение также значительно усложняет процесс поиска информации.

Однако же, несмотря на эти немногочисленные недостатки, поисковая система Google считается самой быстрой и эффективной, что позволяет ей завоевывать доверие всё большего количества пользователей сети Интернет, что обеспечивает ей звание самой популярной поисковой системы. Кроме того, специалисты компании Google занимаются постоянным усовершенствованием возможностей своей поисковой системы, что дает превосходные результаты.

Mail.ru
www.mail.ru

Непосредственно сама поисковая система не плохая, а даже скорее наоборот. Можно найти множество полезной и интересной информации для себя. Весьма радует своевременное обновление новостей на главной странице. Там в сжатом формате можно прочитать о происшествиях во всём мире. Но далее начинают светиться откровенные «дыры». Отсутствие полезных дополнительных сервисов (Достойны внимания лишь Погода и «Ответы»).
Мой мир – отдельный разговор. Обилие бесполезных «писем любви», «писем счастья» (отправь 10 друзьям это письмо - и получишь счастье через 3 часа). Наличие дуэлей между друзьями (за кого больше проголосуют) превращается в рассылку глупых приглашений и «набивания» количества друзей. Всё это сопровождается частыми ошибками системы. Более того, неясно: для кого же предназначен сервис? Подростки чаще для общения используют «контакт», люди взрослые, состоявшиеся - «Одноклассников».
Идея сервиса «Ответы» вполне неплохая. На этом проекте можно найти множество полезной информации и достойных ответов. Но рядом с ними присутствуют и бессмысленные комментарии беспощадных людей («Аффтар, упейся ап стену»). Это местами раздражает.
Далее следует проблема многих почтовых сервисов: спам. На мой взгляд, у Mail.ru антиспамовая система далеко не самого лучшего качества. Она часто не справляется со своей работой. Таким образом в почтовом ящике накапливается множество спама, что замедляет и без того не самую скоростную работу сервиса.

Google
www.google.com

Самая популярная из поисковых систем не только в России, но и в граничащих с ней странах (Беларусь и других стран-участниц СНГ). Залог её успеха - удобство и простота в использовании. Разработчики стремились создать простую, доступную для всех поисковую систему. По праву заметим, что им это удалось. Например: при вводе ключевых слов, система не просит вас использовать спецзнаки (запятые, другие метки), а это существенно ускоряет сам процесс поиска и экономит ваше время, а как следует из известной поговорки, и деньги.
Второй большой плюс в копилку Google-высокая скорость работы. Мастера из компании сделали систему эффективной и быстрой. Кликнув мышью, клиент в скором времени получал лаконичную и чёткую информацию о содержании сайтов (программисты «облегчили» некоторые страницы, уменьшили описание, убрали ненужные баннеры и т.д.).
Главный плюс-точность информации, выдаваемой системой. Результаты поиска, обычно, соответствуют запросам пользователя. Кроме этого, Google является поисковиком, учитывающим качество страниц.
Очередное преимущество Google-наличие разнообразных дополнительных функций(переводчики, страница пользователя, возможность просматривать уже закрытые сайты и многие другие полезные мелочи).
Однако Google имеет ряд недостатков. Например, часто можно увидеть ссылки на устаревшие сайты с ненужной вам информацией. Случается, что ссылки, определённые машиной поиска, ведут на сайт, который только разрабатывается. Из-за этих лишних сайтов пользователи тратят свое время попусту, и поэтому снижается продуктивность всей работы поиска. Отсутствие возможности выделить конкретную грамматическую особенность слова, или ударение тоже значительно мешают. Но все же, несмотря на недостатки, система Google считается самой эффективной и быстрой поисковой системой на данный момент.

Yandex
www.yandex.ru

Входит в тройку самых популярных поисковых систем рунета. В Западной Европе-3-ий по популярности поисковик. Ходят слухи, что Яндекс даже потеснил Google с первых строчек рейтинга самых популярных систем. Основная статья доходов и основное преимущество Яндекса – развитая система рекламы. Программисты из офиса активно работают в этой сфере. Доходы с контекстной рекламы Яндекс.Директа(рекламный сервис) держатся на уровне с GoogleAdsense(аналогичный сервис Google). Для пользователей наличие рекламы превращалось ранее в серьёзную головную боль. Теперь же стартовая страница оформлена довольно просто, реклама более не мозолит глаза.
Радует служба поддержки Яндекса. Ответы на письма приходят адекватные, и приходят они очень быстро. Не нужно ждать ответа по несколько дней, как во многих других поисковых системах.
Дополнительный сервис Яндекс Деньги хорошо выполняет свою работу, деньги приходят своевременно и сбоев в самой системе не наблюдается. Хотя по многим другим дополнительным сервисам Яндекс уступает своему основному конкуренту – Google. Отсутствие современного переводчика не даёт Яндексу преимущества.
Поисковые свойства Яндекса на высоте. Часто можно встретить такой скромный момент, как то, что на запрос пользователь может получить много ссылок на один и тот же сайт, но на разных страницах.
Яндекс является вполне успешным, реализовавшим себя интернет - поисковиком и многим его конкурентам приходится считаться с этой системой, чтобы оставаться конкурентоспособными.

Rambler
www.rambler.ru

Рамблер также является одной из популярных поисковых систем в рунете. Существует мнение, что Рамблер уступает всем другим поисковым системам, являясь самой худшей в своём роде. Это не так. Большой плюс этого поисковика - расширенная система ассоциаций. Что-то вроде «У нас тоже ищут». Очень полезно, если пользователь вводит размытые запросы, или сам знает мало о предмете поиска. Эта же система на запрос vepsrf выдаст результаты по запросу «Музыка» (Рамблер реализовал это впереди планеты всей).
Электронная почта на Рамблере очень качественна. «Держится» она долго. Некоторые почтовые ящики созданы 7, 10 лет назад и теперь успешно функционируют. Работает это «мыло» весьма адекватно.
Многие недовольны службой поддержки Рамблера. Искренне надеюсь, что программисты будут работать в этом направлении, обеспечивая своевременные и квалифицированные ответы на письма и многое другое.
Некоторым пользователям (врагам Рамблера, если можно так сказать) не нравится сама система поиска, но это скорее издержки. Наличие развитых дополнительных сервисов радует и дополняет картину положительным образом.
В итоге Рамблер - самая «средняя» из поисковых систем. Разные люди могут оценить это как преимущество, так и как недостаток.

Каталог Google

https://dmoz.org Каталог Google (https://www.google.com/dirhp). Построен на основе каталога ODP - OpenDirectoryProject (https://dmoz.org) Это крупнейший модерируемый каталог в интернете и практически единственный путь для попадания в каталог Google. ODP интересен ещё и тем, что редакторами в нём являются волонтёры, т.е. люди, для которых это занятие является хобби. При желании редакторами в этом каталоге можете стать и вы. Ресурсы в каталоге Google сортируются по PageRank и имеют название и описание, причём название является текстовой ссылкой. По сравнению с влиянием каталогов Яндекса, влияние каталога Google можно назвать менее значительным. Влияет лишь заголовок ресурса, который собственно и является обычной текстовой ссылкой, и влияние это целиком укладывается в схему ссылочного ранжирования. Ещё одним небольшим аргументом за регистрацию в каталоге служит наличие в результатах поиска под ссылкой на ресурс ссылки на категорию каталога и части каталожного описания, что, может положительно повлиять на решение пользователя перейти по этой ссылке. Ресурсы добавляются именно в том разделе, в котором им предстоит находиться. Найдите подходящую для вас категорию и перейдите по ссылке вверху страницы "Предложить URL".

www.google.com (google.ru)

"Googol (гугол)" - это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена "Математика и воображение" (MathematicsandtheImagination). Использование этого термина компанией Google отражает нашу задачу организовать огромные объемы информации в Интернете.

Поисковик Google был основан двумя аспирантами Стэндфордского университета Лари Пейджем (LarryPage) и Сергеем Брином (SergeyBrin), выходцем из Бывшего СССР. Их основной работой был поиск нужной информации в массивах данных.

В 1996 г. они начали сотрудничать с поисковым сервером BackRub, который работал по принципу "backlinks" (т.н. обратные ссылки). Эта формула определяла количество ссылок ведущих на заданный сайт. Создатели справедливо решили, что на популярный и интересный сайт ссылаться будут гораздо чаще, чем на скучный и полумертвый ресурс.

Уже в сентябре 1998г. Пейдж и Брин, собрав около одного миллиона долларов инвестиций, регистрируют поисковую систему Google как юридическое лицо. Даже в бета-версии поисковик Google обрабатывал 10 000 запросов в день, показывая высокую релевантность запросам. Дальнейшая история развития поисковой системы Google, по своей стремительности, напоминает взлет ракеты.

Февраль 1999-го года - 500 000 запросов в день. Напопулярный поисковик обращает внимание мастодонт Интернета AOLNetscape выбрав Google своим поисковым сервером. Поисковик Гугл преодолел барьер в 3 миллиона запросов в день. 26 июня Google и Yahoo объявляют о своем сотрудничестве, результат - 18 миллионов запросов в день. К концу 2000 года - 100 млн.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск intitle: Googlesite:seo-miheeff.ru даст все статьи расположенные на этом ресурсе, на всех языках, в заголовке которых встречается слово.

В активах компании сотрудничество с крупнейшими Интернет-корпорациями, множество наград, и любовь пользователей. Слагаемых успеха поисковой системы Google - три.

Первое - крайне релевантный алгоритм поиска. В отличие от большинства поисковых систем Google не использует программы с механизмом мета поиска. Она анализирует все содержание каждой web-страницы, шрифт и место расположения всех заданных слов. В случае запроса фразой несущей смысловую нагрузку, выдается ссылка на главную страницу сайта, посвященного указанной теме. А не просто на статьи, содержащие отдельные слова из текста запроса.

Второе - крайне дружелюбный к пользователям интерфейс. Пользователь, впервые попавший на сайт поисковой системы Google, удивится чистому окну, не содержащему ничего кроме строки поиска. Это позволяет загружать его гораздо быстрее конкурирующих поисковиков. Следуя современным традициям, Google разрешает любому познакомиться с исходным текстом его программного обеспечения и предложить свои улучшения.

Третье - поисковая система Google подчеркнуто некоммерческий проект. Задумывался и создавался он без всякого бизнес-плана, реклама никогда не была основной статьей доходов. Выступая всегда очень ненавязчиво и контекстуально. А основной целью создателей поисковой системы Google была и остается мечта - создать бесконечно огромную базу данных для поиска.

Поисковая система Google 19 августа 2004 года, начала продажу своих акций на фондовом рынке (IPO), то есть стала публичной. Разошлись почти 20 миллионов акций на общую сумму в 1,67 млрд. долларов США. Собственно Google достались только $1,2 миллиарда. Компания продала не все принадлежащие ей ценные бумаги: у поисковика Google есть ещё более 250 миллионов акций, которыми она вольна распоряжаться по своему усмотрению. Google выпустила акции двух типов: обычные (Class A, всего 33,6 миллионов штук), которые перепродаются теперь в системе NASDAQ, и привилегированные (Class B - 237,6 миллионов штук), хождение которых ограничено <стенами> компании. Каждая привилегированная акция при голосовании может уравновесить десять обычных. 30 августа 2004 года, на специализированных торговых площадках начались торги опционами компании Google.

Для удобства пользователей Google постоянно создает новые плагины и сервисы, вот некоторые из них:

  • GoogleToolbar для IE - Этот плагин для браузера InternetExplorer представляет собой панель поискового сервиса Google. Кроме поиска Google, Toolbar добавляет браузеру и другие полезные функции: автоматическое заполнение web-форм, подсветка найденных результатов при поиске на открытой на web-странице, блокирование всплывающих окон. Поиск по категориям (графика, софт, музыка и др.). Панель можно настроить по своему усмотрению, добавить или убрать с неё кнопки, выбрать регион поиска.
  • Русская версия GoogleToolbar для IE.
  • GoogleToolbar для Firefox.
  • GoogleDeskbar.
  • LostGoogles - эта маленькая программка значительно расширяет функциональность самого популярного поискового сайта. Мало того, что LostGoggles выдает больше информации, так она ещё и показывает фотографии искомых страниц. Она размером 300 КБ и устанавливается на браузер IE 5.0 или более поздних версий.
  • GoogleEarth - модель планеты Земля, созданная при помощи спутниковых снимков.
  • Picasa - это программа, созданная Google, для работы с цифровыми фотографиями. Аналог AdobePhotoalbum, Elements, но главное отличие Picasa в том, что она бесплатна.
  • GoogleTalk - интернет-пейджер и интернет-телефон.
  • GoogleMaps - картографический сервис предоставляемый Google по адресу https://maps.google.com/. Сервис представляет собой карту и спутниковые снимки всего мира (а такжеЛуны). С сервисом интегрирован бизнес-справочник и карта автомобильных дорог. Включающая в себя поиск маршрутов, охватывающая США, Канаду, Японию, Гонконг, Китай, Великобританию, Ирландию и некоторые районы Европы.

С историей существования поисковика Google, как и с историей любой другой крупной компании, связано большое количество скандалов. Конечно, большинство этих скандалов преследуют чисто рекламные цели, но такова - уж история почти всех поисковых систем.

29 января2004 года адвокаты компании Google отправили письмо владельцам поисковика <для взрослых>Booble с требованием закрыть пародийный сервис. В заявлении представителей Google говорится о том, что Booble нарушает авторские права компании. Booble - это поисковик по эротическим сайтам и товарам, интерфейс которого в точности повторяет интерфейс Google, за исключением логотипа, который, хоть и напоминает лого Google, но сделан с отражением <особенностей> поисковика. На данный момент дизайн сайта не имитирует Google.

20 июля 2004 года бывший операционный директор Google Брайан Рид обвинил поисковую компанию в дискриминации по возрастному признаку. В феврале этого года Рид был уволен, как он утверждает, из-за того что не соответствует корпоративной культуре, главными элементами которой являются молодость и энергичность. Рид, которому сейчас 54 года, в эту картину не вписывался. Потеряв работу, менеджер лишился зарплаты в 200 тысяч долларов в год, а также 119 тысяч опционов, которые можно было превратить в акции из расчета по 30 центов за штуку. Учитывая, что цена акций Google на аукционе составит от 108 до 135 долларов за штуку, Рид лишился неплохого состояния, поэтому в своем гражданском иске он просит суд обязать Google возместить ему нанесенный материальный и моральный ущерб.

7 апреля 2004 года новый почтовый сервис Google, ещё не успев приступить толком к работе, столкнулся с претензиями на собственное имя. Бренд Gmail оказывается уже на протяжение 2 лет используется одной английской фирмой. Представители компании MarketAge заявляют о том, что ещё в июне 2000-ого года они начали использовать брэнд Gmail. В связи с очевидным преимуществом на право владения имени, английская компания собирается отстаивать его вплоть до судебного разбирательства. Это обстоятельство, впрочем, нисколько не смущает юристов Google. Перед открытием почтового сервиса они тщательно изучили вопрос регистрации, и не обнаружили, что брэндом Gmail владеет какая-либо фирма.

В мае 2004 года иск к компании вчинили родственники американского математика Эдварда Казнера, который придумал термин googol, обозначающий число единицу со ста нулями. Именно от этого термина произошло название Google.

6 июля 2004 - Продолжается судебная тяжба между крупнейшим поисковиком Google и небольшой фирмой по производству программного обеспечения AffinityEngines за права на использование некоторых программных технологий. Бывший сотрудник AffinityEnginesОркутБюйюккоктен (OrkutBuyukkokten), работающий ныне в Google, обвиняется в том, что использовал разработанный им ранее программный код для создания социальной сети Orkut.com. Данный сервис принадлежит Google и предназначен для онлайнового общения. В качестве доказательств истцы приводят похожие по тексту строки в оформлении Orkut.com и в продукции AffinityEngines. Замечено также около 10 технологических ошибок, совпадающих с ошибками в продуктах AffinityEngines. Тем временем, представители Google утверждают, что не раз предлагали привлечь независимых экспертов, чтобы провести анализ программных кодов. Однако,AffinityEngines ни разу не согласилась с этим предложением.

23 марта 2004 года жителю Калифорнии Майклу Брэдли придется предстать перед судом по обвинению в вымогательстве. Как сообщает Silicon.com, мужчина требовал от поискового гиганта Google выплаты 100 тысяч долларов США. В случае невыполнения требований подозреваемый угрожал разослать спамерам программу, генерирующую фальшивые клики на рекламных баннерах Google.

31 марта 2004 года малоизвестная компания DigitalEnvoy подала в суд на корпорацию Google, обвинив поискового интернет-гиганта в нарушении лицензионного соглашения от 2000 года. Соответствующее исковое заявление было зарегистрировано в начале этой недели в окружном суде северной Джорджии. Фирма DigitalEnvoy занимается разработкой и продажей программного обеспечения, посредством которого владельцы тех или иных веб-ресурсов могут по IP-а



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: