Ссылки на псевдообменники




Общие правила

 

Базовой единицей оценки является оценка рел+. Релевантный ответ предоставляет решение пользовательской задачи (бывают запросы, для которых задача, по сути, одна, а бывают запросы, для которых существует спектр задач или которым соответствует несколько объектов поиска).

 

Если страница позволяет решить сразу несколько задач (для запросов с несколькими потребностями), информации гораздо больше, чем на среднего уровня релевантной странице, она лучше структурирована, - такой странице стоит поставить оценку полезный.

Когда наоборот, страница не полностью решает задачу, слишком сужает её или наоборот, расширяет, если страница посвящена малозначительному объекту - тогда оценка должна быть ниже, это рел- ответ.

 

Витальный ответ - это официальный ответ на вопрос, он несколько отличается от прочей шкалы. Для многих запросов витального ответа не может существовать в принципе, потому что нет официального владельца информации по теме. Обычно определить витальный довольно просто, но иногда бывают и более запутанные случаи.

 

Также в шкале присутствуют две близких по смыслу оценки нерел и не про то. Нерелевантный - это документ, который в целом соответствует теме запроса, но на него не отвечает. Не про то - это оценка для случаев, когда документ не просто не отвечает на запрос, но вообще относится к совершенно другой тематике.

 

Помимо релевантности есть ещё оценка спама. Для документов, где присутствуют признаки спама, надо поставить оценку "спам", остальные - "не спам".

 

Документам с оценкой рел+ и полезный также надо ставить срок устаревания (чаще всего - никогда, но некоторые документы релевантны запросу в момент оценки, а со временем теряют релевантность).

 

Философия оценки

 

Во время выполнения заданий у вас могут возникнуть разные вопросы по работе, например: в какой части инструкции искать правила к моему запросу? Как понять, где граница между релевантным и нерелевантным ответом? Может ли тут быть витальный ответ? Что делать, если задание в корне противоречит здравому смыслу? Как не скатиться в формализм и не забыть про здравый смысл? Как не потерять веру в человечество после всего этого?

В первую очередь важно понимать, что автоматизировать систему оценки невозможно, требуются именно человеческие оценки, а не ответ от робота. С другой стороны, оценки разных людей (экспертов) должны быть согласованы и проставлены по единой схеме, иначе вместо оценки получится сомнительного качества опрос общественного мнения.

 

Чтобы экспертные оценки обладали достаточным качеством, была разработана инструкция асессоров, которая постоянно обновляется и улучшается. Предусмотреть все возможные комбинации запрос-ответ невозможно, но самые распространённые варианты в ней описаны. Если ваш случай однозначно попадает в описание из инструкции, надо оценивать страницы из задания согласно этому описанию. Если же прямого ответа на свой вопрос в инструкции вы не нашли, нужно ориентироваться на здравый смысл.

 

Часто запросы бывают однозначные сами по себе, например [бесплатные новые игры винкс ТОЛЬКО БРОДИЛКИ винкс только про винкс и больше не чего только бродилки]. Логично предположить, что если ответ не содержит игр-бродилок про Winx, релевантность у него нулевая, так что формальный подход к запросам такого рода вполне уместен. Или [как раки относятся к своей прошлой любви?]: тут тоже подойдут только страницы, на которых рассматривается отношение людей, родившихся под знаком Рака, к своим бывшим вторым половинкам. Прочие знаки зодиака и иные психологические особенности Раков совершенно точно не соответствуют запросу. Предположение о том, что речь идёт о членистоногих животных, хотя и забавно, но лишено разумных оснований. Многие запросы сформулированы более общо и им соответствуют несколько типов ответов, например [мангалы из кирпича своими руками]. К такому запросу подойдут тексты (желательно с картинками) с описанием процесса или видеоуроки.

 

Определить, какая именно информация больше нужна помогает не только здравый смысл, но и статистика. Например, логично предположить, что если что-то можно скачать бесплатно, то предложение покупки этого объекта гораздо менее интересно людям, и статистика это подтверждает. Самые типичные запросы с несколькими разными релевантными ответами это запросы, которые состоят только из названия песни или фильма, имени известного человека или коллектива. Также иногда попадаются запросы, для которых существует несколько подходящих объектов. Без статистики определить, какие именно объекты релевантны, может быть довольно затруднительно. В таких случаях стоит ориентироваться на аннотацию.

Чтобы понять, может ли у запроса вообще быть витальный ответ, надо ответить на два вопроса: является ли запрос навигационным (то есть пользователю, скорее всего, нужна единственная страница), например [вконтакте], [скачать песню кино перемен с зайцев нет]? Если запрос навигационный, то та самая главная искомая страница будет витальной. Если нет, то важно понимать, есть и объекта поиска официальный источник или правообладатель? Если объект поиска - товар, объект авторского права (песня, книга, фильм, программа,..), закон или у объекта поиска существует официальный сайт, то витальный ответ в принципе возможен. Во всех прочих случаях витального ответа не бывает. Например, для запроса [погода в томске сегодня] не может быть витального, поскольку не существует производителя или правообладателя погоды. С другой стороны, для запроса [погода в томске сегодня гисметео] витальный существует, потому что это навигационный запрос, пользователя интересует не просто информация о погоде, но информация на определённом ресурсе.

 

Определить, какой ответ релевантный, а какой - нет, в общем случае несложно. Но иногда возникают непредвиденные ситуации. Предугадать всё заранее невозможно, поэтому если вы столкнулись с ситуацией, для которой нет явного правила, постарайтесь найти разумную аналогию из инструкции. Если и этого не получается, надо действовать исходя из здравого смысла. Важно удержать баланс между формальным подходом и субъективным мнением по ситуации. Иногда это не получается, но расстраиваться по этому поводу не стоит: работать со стопроцентной точностью невозможно, какие-то ошибки будут всегда.

 

Иногда непредвиденные сложности возникают в простых, казалось бы, ситуациях. Например, легко представить себе, какие картинки релевантны запросу [фото белой собаки], а какие - нет. Если на фотографии изображена белая собака - фото релевантно, а если, скажем, чёрная собака или белая кошка - то точно нет. Что делать, если собак несколько, а белая только одна? Ну это вроде несложно, релевантность ниже, чем в первом случае, но не ноль всё-таки, белая собака же есть. А что делать, если у собаки маленькое чёрное пятнышко на лапе? Она формально не совсем белая, но так ли это важно? А что делать, если она какая-то светлая, но не особо понятно, это всё ещё белая или это уже другой цвет? Крайние точки тут несложно обозначить: если собака - далматин, она уже не белая, а вполне пятнистая. Но одно маленькое пятно, например, не достаточно "портит" белую собаку. Но где провести границу? Считать площадь не белого? Может, учитывать местоположение пятен (например, пятно на лапе не важно, а на голове - важно) или их количество, а не площадь? В какой момент светлая шерсть перестаёт называться белой? Внимательный читатель уже наверняка понял, что все эти вопросы - верный путь себя запутать и поставить вообще бог знает что вместо адекватной оценки. В таких случаях надо полагаться на здравый смысл, а формализм только навредит.

 

В целом, стоит помнить, что правила в инструкции создавались на основе здравого смысла и известной статистики, причём в них описывается максимально общий подход, то есть правила написаны таким образом, чтобы составленная на их основании выдача поисковой системы удовлетворила потребности максимально возможного числа людей. Угодить совсем уж всем и сразу кажется невозможным, но мы очень стараемся подобраться к этому идеалу.

Поэтому оценивайте страницы, исходя из инструкции, но не доводите следование ей до абсурда.

 

May the force be with you!

 

Товарный запрос

 

(Релевантность)

 

Если запрос товарный, то важно обращать внимание не только на содержание страниц, но и на регионы магазинов и сайта производителя. Рассмотрим, для примера, запрос [нокиа п 86 ] //(Томск)//. Запрос без уточнения, какого рода информация об этом телефоне требуется, поэтому релевантных ответов будет много.

 

Поскольку у товара есть производитель, страница с сайта производителя про этот телефон будет витальной:

 

https://www.nokia.ru/products/phones/nokia_n86_8mp/specifications

 

Данная модель телефона больше не выпускается, поэтому на сайте производителя осталась только такая страница. Заглавная страница раздела о телефоне, который ещё выпускается, выглядит чуть иначе.

 

По общему запросу будут релевантны хорошие обзоры телефона:

 

https://zoom.cnews.ru/publication/item/17880

 

На этой странице представлен качественный обзор (много текста, иллюстрации), есть комментарии пользователей. Подобная страница заслуживает оценки рел+. Пример ещё одного хорошего развёрнутого обзора:

 

https://zoom.cnews.ru/publication/item/17880

 

https://www.mobile-review.com/review/nokia-n86.shtml

 

 

По общим запросам магазины также могут быть релевантны.

 

www.sotmarket.ru/product/nokia_n86_8mp.html

 

Здесь предлагается та самая модель телефона, однако регион магазина не совпадаете регионом запроса (пользователя). Надо проверить, как обстоят дела с доставкой в Томск. Во-первых, имеет смысл проверить наличие Томска в поле "ваш регион":

Список довольно большой, но Томска там нет. Надо посмотреть, что пишут в разделе "Доставка и оплата":

 

По ссылке попадаем на страницу, посвящённую доставке

 

https://www.sotmarket.ru/showparam/magaz-deliver.html.

 

Там про Томск ничего явно не прописано, но можно уточнить: Видно, что доставка в регион пользователя есть и она платная: Таким образом, карточка товара (урл из задания) заслуживает оценки рел-, поскольку магазин находится за пределами региона пользователя и есть платная доставка. Положительная оценка будет только у магазина из региона пользователя (или из другого региона, в котором есть бесплатная доставка в нужный).

По товарным запросам иногда попадается Яндекс Маркет. Регион у него определяется как ваш, то есть чтобы понять, что же видел пользователь из Томска (в данном случае), надо поменять регион:

 

В Томске, оказывается, купить телефон не предлагают, но характеристики, фотографии, а главное, большая коллекция отзывов никуда не пропадают: Таким образом, маркету тоже стоит поставить рел+.

 

Могут попасться страницы, содержащие только отзывы, например:

 

https://www.e-katalog.ru/opinion_ie.php?resolved_Name=NOKIA-N86

 

 

На этой странице представлена очень большая подборка отзывов пользователей (экранов десять), такая страница также заслуживает оценки рел+.

 

Мультиобъектные запросы

 

(Релевантность)

 

Иногда попадаются запросы, которым соответствуют несколько значений. Например, слово запроса - омоним и само по себе многозначно. Или есть несколько разных объектов, названных одинаково и все их пользователи достаточно активно ищут.

Как правило, все эти значения описаны в аннотации. Если вам попался какой-то странный объект, вроде бы релевантный запросу, но не описанный в аннотации и вы не понимаете, как его оценивать, смело пишите разметчику. В целом, если страница заслуживает положительной оценки для какого-то одного из указанных значений запроса, значит, так её и надо оценивать.

 

Посмотрим, для примера, на запрос [перехват]. В аннотации сказано, что запросу соответствуют несколько объектов: фильм, системы и программы с таким названием, передачи на радио и ТВ с таким названием (витального при этом нет).

 

https://www.autoreview.ru/archive/2008/16/vzlom/

 

На странице представлен обзор противоугонного устройства "Перехват". Это один из возможных объектов, причём обзор хороший (и не зависит от региона), так что эта страница заслуживает оценки рел+.

 

На следующей странице мы видим уже другой объект из возможных, передачу на радио с названием "Перехват":

 

https://echo.msk.ru/programs/interceotion/758209-echo/

На этой странице представлена передача за определённое число, это только один выпуск еженедельной Передачи. Такому урлу стоит поставить рел- или даже не рел, если страница совсем уж старая. Положительно следует оценить раздел сайта "Эха Москвы", посвящённый этой передаче:

 

https://www.echo.msk.ru/programs/interception/

На этой странице представлен архив передач, самую последнюю можно прослушать прямо отсюда, а к более старым выпускам - перейти по ссылкам. Эта страница уже

будет рел+.

 

https://www.bnti.ru/showart.asp?lvl=&aid=66

 

На странице описано несколько способов перехвата, статья большая (но несколько экранов текста мелким шрифтом неинтересно вставлять в скриншот), такую статью также уместно оценить положительно.

 

Помимо устройств это ещё и фильм:

 

https://www.fast-torrent.ru/film/zhestokij-zahvat.html

На этой странице есть совсем уж краткая информация, совершенно не содержательные комментарии пользователей и возможность скачать фильм (через торрент). Вот за то, что скачать всё-таки можно, странице стоит поставить положительную оценку.

 

Мультиинтентные запросы

 

По многим запросам релевантными могут быть разнообразные типы ответов. Например, для общих запросов про музыкантов и их творения, фильмы, товары. Рассмотрим запрос [белое солнце пустыни]. Это запрос про кинофильм, в нём не указан тип информации, который пользователь хотел найти. Поэтому здесь возможно несколько релевантных типов ответов.

Например, хорошая информация про сам фильм, как часто бывает на википедии:

 

https://ru.wikipedia.org/wiki/WhiteSun_of_the_Desert

 

Страницы, на которых можно посмотреть фильм по общему запросу заслуживают положительной оценки:

 

https://kinobanda.net/modules.php?name=News&file=view&news%20id=5118

Для всех таких страниц надо проверять, что видео играется (конечно, смотреть фильм целиком не требуется).

 

Может попасться страница, на которой есть ссылка на скачивание фильма, например:

 

https://vagonkino.ru/fighters/2170-beloe-solnce-pustvni-1970-dvdrip.html

 

Видео не играет, но есть ссылка на скачивание. Перед тем, как поставить оценку релевантности, надо её поверить:

 

Скачать бесплатно можно, размер файла похож на разумный для длинного фильма. Поэтому исходной странице надо поставить рел+ (за то, что можно скачать желанное кино).

Хорошие страницы на которых находится много разнообразной информации, могут получатъ даже оценку полезный, но если информации недостаточно, всё равно будет только рел+:

 

https://www.kinopoisk.rU/level/l/film/46066/

 

Хотя на кинопоиске и нельзя посмотреть кино или скачать его, практически всё остальное, что только может заинтересовать пользователя, тут есть. Тем не менее, именно для "Белого солнца пустыни" контента не очень много и оценивать его полезным не стоит (в этом можно убедиться, если походить по вкладкам).

 

Если же фильм предлагают купить, оценка такой странице может быть не выше рел-, потому что если что-то можно бесплатно скачать, покупать файл пользователи не хотят:

 

https://www.ozon.ru/context/detail/id/64141/

 

Так же могут попасться страницы про какие-то иные объекты с таким названием, например, ресторан:

 

https://www.restorate.ru/?id=172&pkevl=0000200001

 

Чтобы оценить эту страницу, можно обратиться к аннотации (в ней написано только про фильм). Однако, может оказаться, что какой-то вполне релевантный объект оказался пропущен при разметке. В нашем примере, впрочем, и без аннотации видно, что страница нерелевантна: запрос из Кирова, а ресторан - в Москве.

 

Однозначный запрос

 

Помимо общих запросов, которым соответствуют несколько объектов или несколько типов разных ответов, регулярно попадаются чётко сформулированные запросы. За счёт того, что формулировка запроса более конкретна, спектр возможных релевантных объектов сильно сужается. Посмотрим, например, на запрос [A-Style - Remember me текст]. Единственным релевантным ответом будет только текст этой песни.

 

https://muzprivet.ru/lyrics/QStTdHlsZSslMiZhbXAlM01rQXNvQTpSZWllbWJIcittZTo2MiQlMDI3.html

Страница с текстом - ровно то, что искал пользователь. Это релевантный ответ.

 

https://www.zaycev.net/pages/7655/765542.html

На этой странице можно только скачать песню (ссылка на текст уводит на другой сайт).- Это нерелевантно запросу, поэтому странице следует поставить оценку нерел.

Статьи про песню без искомого текста, как и возможность скачать, будут нерелевантными:


Возможность послушать будет тоже нерелевантной запросу про текст:

 

https://livemusic.org.ua/song/381442.html

 

Страница с видеоклипом и текстом будет релевантна, потому что на ней есть текст. Наличие видеоролика "в нагрузку" не снижает релевантность:

 

https://www.probelov.net/l6763.html

 

Информационный запрос

Один из существенных моментов а работе - понимание разницы между оценками рел+ и полезный. Хотя эта разница и не влияет на зарплату асессора (ошибка не значима), оценка "полезный" сама по себе очень важна. К ней надо относиться ответственно и не ставить за всё подряд, слегка отличающееся от среднего релевантного ответа.

Рассмотрим для примера запрос [Айрон-Мейдон] (речь о британской рок-группе Iron Maiden).

 

https://iron-maiden.ru/

 

На главной странице видны только новости о группе. В случае, когда по широкому запросу нашёлся раздел сайта или главная страница тематического сайта, стоит ориентироваться не только на контент этой заглавной страницы, но и fi осмотреть на содержание сайта в целом.


Например, раздел "Дискография":

 

https://iron-maiden.ru/Discography.html

 

По любому диску можно кликнуть, перейти на описание альбома, а оттуда - на тексты песен, например:

 

https://iron-maiden.ru/Diskografiya/No-Prayer-For-The-Dying-Lyrics/Fates-Warning.html

В разделе "Аудиотека" представлены ссылки на скачивание альбомов, при этом ссылки рабочие. Например:

 

https://iron-maiden.ru/Audio/Audioteka/1980-Entire-Exile.html

 

https://iron-maiden.ru/Galereya.html

 

Есть большая коллекция клипов, рассказы про группу, биографии участников, форум. Сайт при этом аккуратный и даже без рекламы. Настолько качественный сайт по теме (много разносортной информации, нет рекламы) заслуживает оценки "полезный".

 

Впрочем, не любой фан-сайт достаточно хорош, чтобы быть полезным. Вот, скажем, такой:

 

https://ironmaidenfans.ru/

 

На сайте есть некоторое количество текстовой информации, не особо большая фотогалерея:


В общем-то, сайт приличный, но совсем нет треков и видео, отсутствует площадка для общения. Оценки рел+ он, безусловно, заслуживает, но полезным его назвать уже нельзя.

Конечно же, по подобным запросам регулярно попадается википедия:

 

https://ru.wikipedia.org/wiki/Iron_Maiden

Статья содержательная, есть обширная историческая ссылка, некоторое количество фотографий, список альбомов и даже график участников. Но тут совсем нет медиа­контента, а в запросе про группу аудио и видео, несомненно, важны. Хотя страница и релевантна запросу, ставить ей полезный будет ошибкой, правильная оценка этой статье - рел+.

Качественный ответ по одной прагматике (то есть ответ определённого типа) может быть не только текстом, но, например, только прослушиванием, как на нашем

Музыкальный колдунщик яндекса, как бы ни был мил нашему сердцу, всё-таки заслуживает только оценки рел+. По запросу про группу может попасться не подборка, а какая-то одна песня, например:

 

https://www.lastfm.ru/music/lron+Maiden/ /Iron+Maiden

Хотя тут и можно посмотреть клип на песню, но песня всего одна, такая страница заслуживает только оценки рел-.

 

Запрос про организацию

 

Возьмём, для примера, запрос [банк советский санкт-петербург] //(Санкт-Петербург)//. Во-первых, конечно же, у банка есть официальный сайт (он указан в аннотации):

 

https://www.sovbank.ru/

 

Проблем с определением витального в таком случае возникнуть не должно. А вот. разобраться в том, какие урлы будут рел+, а какие - полезными, несколько сложнее.

 

https://www.banki.ru/banks/bank/?ID=68763

 

Перед вами страница с популярного сервиса banki.ru. На ней можно увидеть контакты, краткую информацию о рейтинге (составленном экспертами) и посмотреть список филиалов. Ниже на странице находится справка о компании, далее - информация по вкладам кредитам:

Также можно посмотреть дизайн карт и народный рейтинг, почитать отзывы о банке:

Эта визитка содержит исчерпывающее количество информации, она структурирована и удобна для использования. Эта страница является полезной.

 

Не столь насыщенные разнообразной информацией визитки уже не будут получать оценку полезный, например:

 

https://account.spb.ru/banks/items/14

 

На этой странице представлены общие контакты банка, отделения нанесены на карту (также можно посмотреть список во вкладке "отделения") и можно найти некоторую

информацию по услугам. Однако информация неполная, подробного описания вкладов и кредитов тут нет. Для рел+ информации на этой визитке уже достаточно, но ставить ей полезный - ошибка.

 

https://www.bank-klient.ru/spr/spbb/sovet/sovetski-bank-spb.html

 

Такая визитка ещё более примитивна, однако содержит список контактов отделений. Это тоже рел+ страница.

Положительной оценки заслуживают и разделы витального сайта:

 

https://www.sovbank.ru/private/deposit/

 

На странице представлены только вклады для частных лиц. Этот раздел сайта достаточно содержательный, чтобы быть рел+, но полезный ему ставить совершенно не за что.

Совсем уж примитивные визитки без развёрнутой информации получают оценку рел-, например, вот такие:

 

https://www.bank24.ru/info/banks/info/?ID=271147

 

и

 

https://www.mk-kadar.ru/partners/sovetskw.htm

 

На двух последних страницах недостаточно информации для положительной оценки, однако они не являются совсем уж нерелевантными, их правильно оценить рел-.

Запросный спам

 

(Релевантность)

Запросный спам встречается как на релевантных страницах, так и на нерелевантных. На оценку релевантности он не влияет. Однако, если он присутствует На странице, ей необходимо поставить оценку "спам".

 

Например, для запроса [скачать dirt 2 yf rjvgm.nth торрент] //(Москва)// в оценке оказался такой урл:

 

https://www.best-plays.ru/simuiator/arcade-simuiator/419-colin-mcrae-dirt-2.html

 

С этого сайта можно скачать искомый торрент, поэтому оценка релевантности - рел+, однако на странице присутствует и запросный спам, поэтому по шкале спамности страница получает оценку спам.

 

Типичный пример запросного спама, как выше - блок с названием "у нас нашли", "у нас ищут", "последние запросы" и подобными, сами запросы снабжены фавиконками поисковиков, из которых эти запросы задавали. Спам ставится не за название блока, а за то, что это часть внутренней статистики, которую вебмастера нарочно выставляют наружу, чтобы повысить свои позиции в поиске. Часто таким образом накручивается релевантность и по запросам, для которых страница нерелевантна. За подобные махинации мы ставим оценку "спам".

 

Приведённый пример - один из характерных, на деле запросный спам бывает и хитрее. Но подобные яркие примеры должны быть оценены как спам обязательно. Пропустить оценку "спам" в случае, аналогичном приведённому - это совершенно точно ошибка, свести к спорным её не получится.

 

Запросный спам также ставится в случаях, когда на странице очень много поисковых запросов (необязательно в виде протянутой наружу внутренней статистики), например по запросу [drjynfrnt] //(Киев)// попался такой урл:

 

https://www.f1cd.ru/companies/vkontakteru_vkontakte_vkontakteru_ooo_vkontakte/

Здесь название сайта во всевозможных написаниях повторяется сильно больше, чем того требует нормальный текст (даже в урле три раза вписано). Важно ещё, что название повторяется кириллицей и латиницей, а ещё есть строчка "Часто/ошибочно эту компанию называют: В Контакте, drjynfrnt, d rjynfrnt, d контакте, В Контакте ру, dKOHTaKTe, В контак, В конт, v kontakte, v kontakte ru, В контакте ru", которая сама уже достаточное основание поставить оценку "запросный спам", даже не учитывая текст выше. За перечисление названия вконтакта всеми способами, включая опечатки, обязательно надо поставить оценку "спам".

 

Ещё примеры:

 

https://www.warez999.ru/serialv/6541-ne-rodis-krasivov-vse-200-seriv-2005dvdrip788-gb.html

 

https://psi-journal.ru/1176-vse-tainye-zhelaniya-muzhchiny.html

Партнерка

 

(Релевантность)

Партнёрки - это один из видов спама. Если вы определили какую-то страницу как партнёрку, ей надо поставить оценку по релевантности и оценку спам. Например, партнёрка какого-либо магазина - это тоже магазин (в смысле, сам сайт будет сайтом магазина';, но по сути покупка осуществляется только в основном магазине. Когда какой-то сайт плодит партнёрки, он преследует цель занять как можно больше позиций в выдаче по подходящему запросу (например, по названию товара, которым он торгует). Тогда пользователь может кликнуть на оригинальный магазин или на партнёрку, но в результате всё равно попадёт в основной магазин. Таким образом оригинальный магазин получает посетителей больше, чем получил бы в условиях честной конкуренции. Сайты-пустышки, которые ведут на первоначальный сайт, получают деньги за рекламу и переход пользователей (создатель партнёрской сети платит за привлечение клиентов). Таким образом сайтовладельцы получают клиентов (а с ними и дохода) больше, а пользователи лишаются возможности выбрать наиболее подходящий для себя магазин. Сам оригинал спамом не является, а вот все прочие сайты из партнёрской сетки - спам, они не несут никакой пользы для пользователей и снижают конкуренцию в выдаче. Если не бороться с партнёрками, может получиться, что вся выдача будет заполнена одним магазином (но выглядеть на первый взгляд будет так, словно их несколько). Поэтому партнёрки - зло.

 

Чтобы поверить, является ли магазин партнёркой или нет, надо начать совершение покупки, дойти до стадии оформления заказа. На самом деле оформлять ничего не надо, естественно. Но если в процессе вас перекидывает на какой-то другой магазин - это партнёрка. Если перекидывает на какую-то систему оплаты (Paypal, Webmoney и тп) - это, естественно, не имеет никакого отношения к партнёркам.

 

Например, запрос [Л Нильсон Ребенок родился! Чудо зарождения новой жизни скачать] //(Петрозаводск)// и вот такой урл:

 

https://www.03portal.kz/index.php/option=com/content&task=view&id=21226

 

Это магазин, скачать с него нельзя, поэтому оценка релевантности - нерел. Но надо ещё проверить на предмет, а не партнёрка ли это (да и вообще вид сайта намекает на то, что что-то тут нечисто). Надо попробовать оформить покупку, нажав на ссылку "купить". В норме, это должно привести к тому, что появится товар в корзине. Но в этом случае пользователя перебрасывает на другой сайт

 

https://www.flip.kz/catalog?prod=6316

 

Таким образом, сайт из оценки - партнёрка, а значит, спам.

 

Сателлит

 

(Релевантность)

Сателлиты, как и партнёрки, являются в некотором роде вспомогательными сайтами, которые искусственно увеличивают выгоду основного сайта. Но есть и отличия. Партнёрскими сайтами (которые перенаправляют людей на оригинальный сайт), как правило, владеют какие-то люди, не связанные с владельцем исходного сайта, связанные с ним только договором о работе партнёрской сети. Сателлиты же создают сами хозяева основных сайтов, они выглядят как сайт другой компании (иногда даже с другими контактами), но организация за основным сайтом и его сателлитами стоит одна. Цель всё та же - заполонить выдачу "своими" результатами, плюс умелый вебмастер может манипулировать ссылками между своими сайтами ради искусственного повышения релевантности какого-то из них. В общем, сателлит в выдаче выгоден его создателям, а пользователям - нет.

 

Если вы определили какой-то сайт как сателлит, ему надо поставить оценку релевантности, которую он заслуживает и оценку "спам".

 

Рассмотрим, например, запрос [молоковоз на шасси Камаз 65115] //(Алматы)//. В оценку попал следующий урл:

 

https://www.spectechnikagaz.ru/molokovozy/

Вроде бы сайт называется АвтоСпецТехника, но урл - СпецТехникаГаз, как будто этот домен для части большего общего целого. Дизайн шаблонный без изысков. Это ещё не повод поставить спам, конечно, но должно насторожить, то есть при беглом взгляде вам должно стать понятно, что сайт подозрительный и надо его проверить. Можно просто кликнуть по логотипу "АвтоСпецТехника" и увидеть, что он перенаправляет на основной сайт, а можно и повнимательнее посмотреть на страницу из оценки:

 

Адрес электронной почты указан для другого домена, того самого, на который ведёт ссылка из логотипа.

 

В данном случае владельцы сетки сателлитов не потрудились сделать им существенно разный дизайн и даже указали контакты основного сайта на второстепенном. Это довольно простой случай, но иногда удаётся опознать и более качественно сделанные сателлиты, их хорошо видно, когда сателлит и основной сайт попадаются в одном задании. Однако особенно искусно сделанные сателлиты и вовсе почти невозможно обнаружить без основного сайта в том же задании (без сравнения).

 

Псевдосайт

 

Псевдосайты очень похожи на нормальные сайты, но на самом деле являются просто подделкой под сайт организации или бессмысленным набором данных, они создаются для того, чтобы зарабатывать на рекламе и продажных ссылках. За счёт похожести на нормальные сайты и наличие вторконтента, который сам по себе вполне

нормальный, такие сайты могут оказываться на высоких позициях в поиске.

 

Например, для запроса [консультация логопедаонлайн] //(Москва)// в оценке оказался урл

 

https://jenkoncult.ucoz.ru/news/2009-01-06-100

Он немного похож по конструкции на нормальную консультацию. Однако нет никаких контактов, совершенно неясно, что будет, если отправить письмо через форму и вообще на сайт сколь-нибудь адекватной компании это непохоже.

 

Эта страница - псевдосайт, она выдаёт себя за онлайн-консультацию, на деле таковой не являясь.

 

Ссылки на псевдообменники

 

Примечание: антивирус Доктор Веб с некоторой точностью умеет определять наличие этих вредоносных ссылок и сообщает о том, что страница может представлять опасность для компьютера. В целом, это, конечно, верно. Однако ставить таким страницам оценку "вирус" некорректно, надо ставить оценку релевантности и спам.

 

Ссылки на ненастоящие файлообменники по текущей инструкции являются один из видов спамконтента. Многие вебмастера грешат их использованием и этот вид мошенничества довольно регулярно попадается в запросах про скачивание или Просмотр чего-то онлайн, поэтому заслуживает отдельного рассмотрения в силу своей популярности.

 

Проверять, что же за файл скачивается с вредоносной ссылки, асессорам не надо. Однако, чтобы подтвердить подозрения, мы Пробовали качать файлы с таких обманных ссылок, когда они вообще есть (иногда ссылка ведёт в какое-нибудь невразумительное место, даже без скачивания). В большинстве случаев качается архив, который просит смску за открытие. ЭТО уже подозрительно.

 

Но даже если архив удаётся распаковать (например, потеряв некоторую сумму на экспериментах с смсками), в нём, в лучшем случае, находится Инструкция по работе с нормальными и файлообменниками и торрентами (не подробная, конечно). В худшем ещё и какой- нибудь вирус сидит. В общем, качать это всё, естественно, не надо. Однако пользователи по ошибке могут и скачать что-то с этих ссылок. При этом желанного контента они не получат в любом случае. Поэтому урлам с такими нехорошими ссылками, помимо оценки релевантности необходимо поставить "спам", потому что на странице присутствует обман. При этом на релевантность обманные ссылки влияния не оказывают.

Вот например, в оценке запроса [скачать торрент бесплатно на русском языке без регистрации] //(Москва)// попался урл

 

https://iuxvri.biz/download/%Dl%81%D0%BA%D0%B0%Dl%87%D0%B0%Dl%82%Dl%

8C+%D0%B1%D0%B5%D1%81%D0%BF%D0%BB%D0%B0%D1%82%D0%BD%D0%

BE+torrent+1.8.5+%D0%BD%D0%B0+%Dl%80%Dl%83%Dl%81%Dl%81%D0%BA%D0%

BE%D0%BC+%Dl%8F%PQ%B7%Dl%8B%D0%BA%D0%B5+%D0%BD%P0%B5+zip.html

 

Как правило, эти обещания в этих ссылках повторяют контент страницы, но тут сама страница вообще о другом, а с запросом связана только эта спамная реклама. При оценке нет необходимости углубляться в изучение вредоносных ссылок, важно поставить оценку "спам" за их наличие (если вам нужно углубиться в изучение, чтобы понять, что ссылка спамная, то придётся таки углубиться). Посмотрим на примере этого сайта, почему же такой блок ссылок - обман, а значит и спам.

 

Первая ссылка ведёт на скачивание файла с сомнительным названием в домене.tk (в этом домене примерно 99% сайтов спам, утверждать, что любой сайт в этом домене - спам, нельзя, но подозрение вызывает существенное). Чтобы убедиться, что это какой- то обман, можно, например, зайти на этот сайт, однако настоятельно рекомендуется этого не делать, на таких сайтах почти всегда находятся вирусы (на этом сайте, например, троян есть):

 

При скачивании файла по ссылке из нехорошего блока пользователь получит только текст этой самой "оферты", возможно, снабжённый вирусом (в рассматриваемом случае вирус будет). Это проверено экспериментально, асессорам перепроверять не стоит, ибо шанс подцепить вирус велик (в примере шанс и вовсе стопроцентный).В некоторых случаях эти ссылки вместо скачивания мусорного файла (замаскированного под искомый) уводят пользователя на псевдофайлообменники. Например, для запроса [Лучшие книги серии метро 2033] //(Москва)// в оценке оказался такой урл:

 

https://dbbook.ru/xbook/fantastika/apocalipsis/metro/3249-metro-2033-bezvmvanka--audiokn.html

 

Спамная ссылка ведёт на такую страницу:

 

https://deposit.stimulnmall.com/results.php?notds=l&query=%CC%E5%F2%F0%EE%202033.%20%Cl%E5%E7%FBo/0EC%FF%ED%EA%E0%20%28%CQ%F3%E4%E8%EE%EA%ED%

E8%E3%E0%29%20%F0%E0%E7%EC%E5%F0:59Q%EC%E1

Это псевдообменник, который маскируется под Deposit Files.

 

Ещё несколько примеров спамных блоков:

 

https://multikonline.ru/935-zviozdnve-sobaki-belka-i-strelka.html

 

https://www.sefon.ru/mp3/%D0%90%D0%BD%D0%BD%D0%B0 %D0%A0%D0%B5%D0% B7%D0%BD%D0%B8%P0%BA%D0%BE%D0%B2%D0%B0/%P0%9F%D1%80%D0%BE%D1% 89%D0%B0%D0%BB%D1%8C%D0%BP%D1%8B%P1%85 %P1%81%P0%BB%P0%BE%D0% B2 %D0%BD%D0%B5 %D0%B3%D0%BE%D0%B2%D0%BE%D1%80%D0%B8

 

https://xxmuz.ru/shanson/3400-armeiskie-pesni-pod-gitaru-2-2010-bonus.html

 

https://uploder.ws/music/106027-armeiiskie-pesni-pod-gitaru-mp3.html

 

https://nvlq.com/index.php?newsid=947

https://tabulorasa.info/67546-bokovava-panel-d lva-xr-gadzhetv-sidebar-for.html

 

https://www.filmbom.ru/film_load/serial_load/16953-ne-rodis-krasivoy-vse-200-seriy-2005dvdrip788-gb.html

 

https://www.kino-line.biz/musik/10593-top-100-zaicevnet-2011.html

 

https://www.videoanons.ru/film/comedi/1775-bitidzhus-beetle-iuice-1988-dvdrip.html

 

https://sonic002.ucoz.ru/news/skachatbitldzhus 1988 bdrip besplatno/2011-01-05-24364

 

https://buenos.ru/176260-policeiiskaia-akademiia-police-academy-l-7-1984.html

 

https://www.fataH.org/6083-prikolnve-ringtonv-dlia-mobily..html

 

https://kinosovetnik.ru/index.php?do=tags&tag=%D4%EE%F0%Fl%E0%E6%205

 

Все приведённые страницы - спам (по любому запросу!), из-за наличия блоков с обманными ссылками. Дизайн блоков варьируется, но суть остаётся общей. Все такие страницы отправляются в спам.

 

В некоторых ситуациях, как в примере с книгой про метро 2033, нормальная ссылка и обманная могут выглядеть похожим образом. Если вы не уверены, спам перед вами или нормальная ссылка, проверьте её.

 


Поиск организаций

(Релевантность)

Рассматриваем запросы вида [название организации], [сайт организации].



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-09-06 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: