✅ Установлен протокол HTTPS
✅ Зеркала с WWW и без WWW корректно склеены
✅ Указание кодировки - (UTF-8)
❌ URL страниц настроены по стандарту ЧПУ
Обнаружены нарушения в структуре отдельных УРЛ:
Не допускается применение символов кириллицы в строке адреса страницы:
https://talan.ua/blog/подносок%2C%20металлносок%2C%20композитный%20носок
https://talan.ua/blog/акція%20на%20galaxy%20266
https://talan.ua/blog/захисне%20взуття
https://talan.ua/ru/blog/подносок%2C%20металлносок%2C%20композитный%20носок
https://talan.ua/ru/blog/акція%20на%20galaxy%20266
https://talan.ua/ru/blog/захисне%20взуття
https://talan.ua/blog/спецобувь
Также не допускается применение в строке адреса запрещенных символов:
https://talan.ua/ru/products/c0170%28red%29
https://talan.ua/ru/blog/continue%20its%20work
https://talan.ua/blog/expo%20protection%202108%2C%20%202018%2C%20france%2C%20paris%2C%20talan%20
https://talan.ua/ru/our%20history
https://talan.ua/blog/sawo%202018
https://talan.ua/about_us
https://talan.ua/blog/alek%20kislukhin
https://talan.ua/products/xbla433w%D0%B5-2
https://talan.ua/products/a4331w%D0%B5-2
https://talan.ua/products/a4331w%D0%B5-2
https://talan.ua/products/xbla433w%D0%B5-2
Рекомендуется: Изменить содержимое адресов УРЛ указанных страниц с применением транслитерации исключительно латинских символов нижнего регистра, соединяя слова пробелами в виде спецсимвола “-”. На все измененные адреса настроить постоянный 301-ый редирект на новые адреса и заменить их во всех внутренних ссылках на актуальные в рамках всего сайта.
✅ Корректная оптимизация работы адресов УРЛ
❌ Ошибки index.php
Анализ работы файлового расширения помог обнаружить ряд мусорных страниц в индексе поисковой системы, которые работают на поддомене https://magazin.talan.ua/:
Рекомендуется организовать корректную склейку всех подобных проявлений на основной домен, посредством настройки постоянного 301-го редиректа на страницы, которые соответствуют содержимому. Все проявления связи основного домена с выявленным поддоменам необходимо очистить в коде и внутренних страницах, если таковые имеются.
❌ Переменные?limit=
Для корректной передачи внутреннего ссылочного веса рекомендуется использовать ссылки для внутренней перелинковки в чистом виде, без применения переменных:
Рекомендация заменить в коде страниц ссылки с применением переменных на статические, чистые адреса.
❌ Файл robots.txt есть и соответствует базовым требованиям
Рекомендуется заменить содержимое файла на:
User-agent: *
Disallow: /*route=account/
Disallow: /*route=affiliate/
Disallow: /*route=checkout/
Disallow: /*route=product/search
Disallow: /index.php?route=product/product*&manufacturer_id=
Disallow: /admin
Disallow: /catalog
Disallow: /system
Disallow: /*?sort=
Disallow: /*&sort=
Disallow: /*?order=
Disallow: /*&order=
Disallow: /*?limit=
Disallow: /*&limit=
Disallow: /*?filter_name=
Disallow: /*&filter_name=
Disallow: /*?filter_sub_category=
Disallow: /*&filter_sub_category=
Disallow: /*?filter_description=
Disallow: /*&filter_description=
Disallow: /*?tracking=
Disallow: /*&tracking=
Disallow: /*compare-products
Disallow: /*search
Disallow: /*cart
Disallow: /*checkout
Disallow: /*login
Disallow: /*logout
Disallow: /*vouchers
Disallow: /*wishlist
Disallow: /*my-account
Disallow: /*order-history
Disallow: /*newsletter
Disallow: /*return-add
Disallow: /*forgot-password
Disallow: /*downloads
Disallow: /*returns
Disallow: /*transactions
Disallow: /*create-account
Disallow: /*recurring
Disallow: /*address-book
Disallow: /*reward-points
Disallow: /*affiliate-forgot-password
Disallow: /*create-affiliate-account
Disallow: /*affiliate-login
Disallow: /*affiliates
Disallow: /*?filter_tag=
Disallow: /*brands
Disallow: /*specials
Disallow: /*simpleregister
Disallow: /*simplecheckout
Disallow: *utm=
Allow: /catalog/view/javascript/
Allow: /catalog/view/theme/*/
User-agent: Yandex
Disallow: /*route=account/
Disallow: /*route=affiliate/
Disallow: /*route=checkout/
Disallow: /*route=product/search
Disallow: /index.php?route=product/product*&manufacturer_id=
Disallow: /admin
Disallow: /catalog
Disallow: /system
Disallow: /*?sort=
Disallow: /*&sort=
Disallow: /*?order=
Disallow: /*&order=
Disallow: /*?limit=
Disallow: /*&limit=
Disallow: /*?filter_name=
Disallow: /*&filter_name=
Disallow: /*?filter_sub_category=
Disallow: /*&filter_sub_category=
Disallow: /*?filter_description=
Disallow: /*&filter_description=
Disallow: /*compare-products
Disallow: /*search
Disallow: /*cart
Disallow: /*checkout
Disallow: /*login
Disallow: /*logout
Disallow: /*vouchers
Disallow: /*wishlist
Disallow: /*my-account
Disallow: /*order-history
Disallow: /*newsletter
Disallow: /*return-add
Disallow: /*forgot-password
Disallow: /*downloads
Disallow: /*returns
Disallow: /*transactions
Disallow: /*create-account
Disallow: /*recurring
Disallow: /*address-book
Disallow: /*reward-points
Disallow: /*affiliate-forgot-password
Disallow: /*create-affiliate-account
Disallow: /*affiliate-login
Disallow: /*affiliates
Disallow: /*?filter_tag=
Disallow: /*brands
Disallow: /*specials
Disallow: /*simpleregister
Disallow: /*simplecheckout
Disallow: *utm=
Allow: /catalog/view/javascript/
Allow: /catalog/view/theme/*/
Clean-Param: utm_source&utm_medium&utm_campaign talan.ua
Host: talan.ua
Sitemap: https://talan.ua/sitemap.xml
❌ Файл sitemap.xml есть, соответствует базовым требованиям
Файл карты сайты обнаружен https://talan.ua/sitemap.xml, но имеет ряд нарушений оптимизации:
Не правильно указаны директивы для частоты и последнего посещения поисковыми роботами страниц. В карте сайта присутствуют лишние страницы, которые не участвуют в ранжировании, такие как:
https://talan.ua/download
https://talan.ua/dna
https://talan.ua/fajli
https://talan.ua/certificates
https://talan.ua/reklamn-materali
https://talan.ua/finance
https://talan.ua/index.php?route=information/information&information_id=16
https://talan.ua/index.php?route=information/information&information_id=14
Указанные адреса необходимо удалить с карты сайта и более того, их следует сопроводить директивой <meta name=”robots” content=”noindex, nofollow”> в блоке <head>.
Рекомендуем:
Создать и внедрить единую карту сайта sitemap.xml придерживаясь следующих рекомендаций:
● Не должна содержать УРЛы, отдающие заголовки: 4хх, 3хх, 5хх;
● Не должна содержать УРЛы, закрытые от индексации файлом robots.txt,
● Не должна содержать УРЛы, закрытые от индексации мета-тегом <meta name="robots" content="NOINDEX, NOFOLLOW"/>;
● Не должна содержать УРЛы с переменными от результатов работы фильтра и пагинации (только статические страницы);
● Один файл sitemap должен содержать не более 50000 УРЛов.
Требуется настроить генерацию XML карты сайта на основе полей указанных ниже:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2019-04-12</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
В первой строке документа указывается версия xml и кодировка — UTF-8.
Также используются особенные теги XML:
● sitemapindex — родительский тег в начале и конце файла;
● sitemap — родительский тег для каждого файла sitemap, указанного в файле. При этом данный тег — дочерний относительно sitemapindex;
● url — блок, который содержит значение самого URL и прочие элементы;
● loc — непосредственно URL страницы;
● changefreq — как часто данная страница может изменяться. Возможные значения: always, hourly, daily, weekly, monthly, yearly, never;
● priority — приоритет структурных элементов, помогает определить, какие страницы более приоритетные для краулинга. Ему присваивается значение до единицы, например: 0.5. Главная страница - 1; Страницы категории - 0.8; Страницы подкатегории - 0.7; Страницы товаров - 0.6; Служебные страницы - 0.5;
● lastmod — время последнего обновления контента страницы, не обязательный параметр. Для сайтов со статическим контентом достаточно использовать changefreq.
Пример реализации карты сайта:
<?xml version=«1.0″ encoding=«UTF-8″?>
<urlset xmlns=«https://www.sitemaps.org/schemas/sitemap/0.9″>
<url> <loc>https://site.com/</loc>
<lastmod>2009-11-18T08:12:32+00:00</lastmod> <changefreq>weekly</changefreq>
<priority>1.0</priority> </url>
<url> <loc>https://site.com/other/standart-banners-sizes.html</loc>
<lastmod>2009-11-18T08:12:32+00:00</lastmod> <changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
<url> <loc>https://site.com/htmlcss/dataurl.html</loc>
<lastmod>2009-11-14T11:19:49+00:00</lastmod> <changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
<url> <loc>https://site.com/htmlcss/internet-shop-gallery.html</loc>
<lastmod>2009-11-13T14:38:43+00:00</lastmod> <changefreq>weekly</changefreq>
<priority>0.9</priority> </url>
</urlset>
Для изображений в следующем примере приведена запись для страницы https://example.com/sample.html, на которой размещены два графических файла:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="https://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>https://example.com/primer.html</loc>
<image:image>
<image:loc>https://example.com/kartinka.jpg</image:loc>
</image:image>
<image:image>
<image:loc>https://example.com/photo.jpg</image:loc>
</image:image>
</url>
</urlset>
Используя такой синтаксис, вы можете указать до 1000 изображений для каждой страницы. Данный синтаксис уже используется, но далеко не для всех страниц - следует это исправить.
Языковые версии страниц не указаны:
Сообщить Google о вариантах страницы можно с помощью файла Sitemap. Для этого добавьте в него элемент <loc>, указав в нем URL страницы, а в дочерних тегах <xhtml:link> – ссылки на все ее языковые и региональные варианты, включая саму страницу. Таким образом, если у вас есть три варианта страницы, в файле Sitemap будет три элемента с тремя идентичными дочерними тегами.
Правила для файлов Sitemap:
● Указывайте пространство имен xhtml следующим образом:
xmlns:xhtml="https://www.w3.org/1999/xhtml"
● Создавайте отдельный элемент <url> для каждого URL.
● В каждом элементе <URL> должен быть дочерний элемент <loc>, в котором указывается URL страницы.
● В каждом элементе <URL> должен быть дочерний элемент <xhtml:link rel="alternate" hreflang=" код языка ">, в котором перечисляются все варианты страницы, включая текущую. Порядок дочерних элементов <xhtml:link> не имеет значения, но вы можете придерживаться определенной последовательности, чтобы было проще отслеживать ошибки.
Ниже приведен пример для страницы на английском языке для англоговорящих пользователей со всего мира, имеющей два варианта для говорящих на немецком: для посетителей из Швейцарии и из других стран. Вот все URL, которые должны быть на сайте:
www.example.com/english/page.html – для англоговорящей аудитории;
www.example.com/deutsch/page.html – для тех, кто говорит на немецком;
www.example.com/schweiz-deutsch/page.html – для пользователей из Швейцарии, говорящих на немецком.
Ниже приведен файл Sitemap для этих трех страниц:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="https://www.w3.org/1999/xhtml">
<url>
<loc>https://www.example.com/english/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="https://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="https://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="https://www.example.com/english/page.html"/>
</url>
<url>
<loc>https://www.example.com/deutsch/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="https://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="https://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="https://www.example.com/english/page.html"/>
</url>
<url>
<loc>https://www.example.com/schweiz-deutsch/page.html</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="https://www.example.com/deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="de-ch"
href="https://www.example.com/schweiz-deutsch/page.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="https://www.example.com/english/page.html"/>
</url>
</urlset>