XML sitemap: секретный код успешной индексации
Введение
Приветствую всех SEO-специалистов и энтузиастов! Сегодня мы поговорим о таком важном инструменте, как XML sitemap, который при правильном использовании может значительно повысить рейтинг сайта в поисковых системах. Это означает, что игнорировать его нельзя. Итак, начнем!
Что такое карта сайта (sitemap)?
Карта сайта — это простой инструмент для веб-мастеров, который помогает поисковым системам лучше понять структуру и важность страниц на сайте. Основой карты сайта является XML-файл, в котором перечислены URL-адреса, а также дополнительные данные, такие как дата последнего обновления, частота изменений и уровень приоритета по отношению к другим страницам сайта.
Эта информация помогает поисковым системам эффективно просматривать все страницы сайта и обеспечивать их интеллектуальное индексирование. XML sitemaps предназначены не для людей, а исключительно для роботов поисковых систем.
История создания XML Sitemap
Идея и начало
На заре развития Интернета поисковые системы индексировали сайты исключительно с помощью роботов, которые обходили все страницы по ссылкам. Постоянно растущее количество сайтов в Интернете делало поиск новых страниц для поисковых систем очень ресурсоемкой задачей. При этом существовала вероятность того, что некоторые важные страницы не будут обнаружены роботом.
В этот момент возникла идея, что веб-мастера могут информировать поисковые системы в машиночитаемом формате о списке страниц своего сайта. Так родился проект Sitemaps.
2 июня 2005 года технический директор Google Шива Шивакумар (Shiva Shivakumar) объявил в своем блоге:
«Мы проводим эксперимент под названием Google Sitemaps, который либо провалится, либо превзойдет наши самые смелые мечты и сделает Интернет лучше как для вебмастеров, так и для пользователей. Это бета-версия ‘экосистемы’, которая поможет веб-мастерам решить две текущие задачи: информировать Google обо всех ваших новых веб-страницах или обновлениях и увеличить охват ваших веб-страниц в индексе Google».
Поддержка поисковых систем
16 ноября 2006 года Google, Yahoo! и Microsoft объявили о совместной поддержке Sitemaps 0.90.
Как подчеркнул Тим Майер, старший директор по управлению продуктами Yahoo Search:
«Запуск Sitemaps очень важен, поскольку он позволяет веб-сайтам использовать единый и простой способ предоставления содержимого и метаданных поисковым системам. Sitemaps помогают веб-мастерам отображать содержимое, которое обычно трудно обнаружить сканерам, обеспечивая более полный поиск для пользователей».
Дополнительные вехи и актуальность
Эта версия Sitemaps актуальна и сегодня.
11 апреля 2007 года Ask.com, Google, Microsoft Live Search и Yahoo! объявили о поддержке автоматического обнаружения файлов Sitemap с помощью файла robots.txt.
13 мая 2023 г. компания Bing объявила об удалении возможности анонимной отправки карты сайта с помощью HTTP-запроса. 26 июня 2023 года Google также отменил эту функцию. В обоих случаях было заявлено, что этой функцией злоупотребляют спамеры.
Когда необходим файл Sitemap?
Согласно официальной документации Google, файл Sitemap необходим в трех случаях:
- Если у вас большой сайт (более 500 страниц);
- Если сайт новый и/или имеет проблемы с внутренней перелинковкой и/или ссылочной массой;
- Если сайт фигурирует в новостях Google или содержит большое количество мультимедийного контента.
Однако, как показывает практика, нет никаких гарантий, что робот найдет все страницы сайта без файла Sitemap. Кроме того, наличие файла Sitemap облегчает роботу получение информации об изменениях, внесенных на сайт. Поэтому мы рекомендуем добавлять XML-карту для любого сайта: это не помешает в любом случае.
Структура файла Sitemap
Файл Sitemap должен быть создан в кодировке UTF-8. Вместо символов &, ‘, «, >, < следует использовать их маски. Порядок следования URL-адресов в файле Sitemap не имеет значения для поисковых систем.
Карта сайта может содержать XML-теги:
- urlset;
- url;
- loc;
- lastmod;
- changefreq;
- priority.
Рассмотрим их более подробно.
Обязательные теги:
- urlset — определяет пространство имен (стандарт протокола).
- url — родительский тег для каждой записи.
- loc — содержит полный URL страницы (включая префикс протокола). Не более 2048 символов.
Необязательные теги:
- lastmod — дата последней модификации в формате YYYY-MM-DD.
- changefreq — ожидаемая частота обновления. Возможные значения:
- всегда
- часно
- ежедневно
- еженедельно
- ежемесячно
- год
- никогда
- priority — относительный приоритет страницы от 0 до 1 (по умолчанию 0.5).
Пример карты сайта
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/</loc>
<lastmod>2023-10-04</lastmod>
<changefreq>weekly</changefreq>
<priority>1</priority>
</url>
<url>
<loc>https://www.example.com/page.html</loc>
<lastmod>2023-10-04</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Индексный файл карты сайта
Каждый файл Sitemap должен:
- Содержать не более 50 000 URL-адресов.
- Иметь размер не более 52 428 800 байт.
Если карта сайта превышает эти ограничения, создается несколько файлов и один индексный файл, который на них ссылается.
Индексный файл Sitemap может содержать:
- sitemapindex
- sitemap
- loc
- lastmod
Пример индексного файла:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap1.xml</loc>
<lastmod>2023-10-04</lastmod>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap2.xml</loc>
<lastmod>2023-10-04</lastmod>
</sitemap>
</sitemapindex>
Как сообщить поисковикам о файле Sitemap
Существует три способа:
- Через панель инструментов для веб-мастеров.
- Через файл robots.txt.
- С помощью HTTP-запроса (не рекомендуется).
Отправка через Google Search Console возможна только при подтвержденных правах на ресурс. Для этого нужно:
- Открыть отчет Sitemap
- Выбрать сайт
- Добавить URL Sitemap
- Убедиться, что Google имеет доступ к файлу
Вот обзорное видео от Google: «Карты Sitemap в Search Console — обучение Google Search Console»
Отправка Sitemap также возможна через панель инструментов Bing. Карту сайта можно отправить только для сайта, права на который подтверждены.
Отправка Sitemap в другие поисковые системы
Для отправки файла Sitemap в Baidu используйте панель инструментов для веб-мастеров Baidu Ziyuan. Только высококачественные сайты, соответствующие китайскому законодательству, имеющие хотя бы одну страницу на упрощенном китайском языке и прошедшие проверку, могут отправить карту сайта в Baidu.
Yahoo и Duckduckgo используют внутреннюю систему Bing для получения sitemap и обнаружения URL.
Через файл robots.txt
Чтобы сообщить поисковым системам о местонахождении карты сайта, необходимо добавить в файл robots.txt следующую директиву:
Sitemap: https://www.example.com/sitemap.xml
Здесь вместо www.example.com
указывается домен сайта, а вместо sitemap.xml
— местоположение карты сайта.
Устаревший способ через HTTP-запрос
Метод добавления карты сайта через HTTP-запрос является устаревшим. Он перестал действовать в Bing с 13 мая 2023 года, а в Google — с 26 июня 2023 года. Основной причиной отмены стало злоупотребление функцией спамерами.
Ранее строка запроса для Google выглядела так:
http://www.google.com/ping?sitemap=https://www.example.com/sitemap.xml
Из-за нагрузки на серверы поисковых систем этот метод больше не используется.
Sitemap и Google
В Google элементы changefreq
и priority
, указанные в файле Sitemap, не учитываются при индексации сайта. Если присутствует элемент lastmod
, он имеет приоритет над changefreq
.
Элемент priority
субъективен и не отражает реальную значимость страницы. Googlebot учитывает только корректно указанный lastmod
, а количество файлов Sitemap не влияет на индексацию: все URL обрабатываются вместе.
Дополнительные возможности Google Sitemap:
- Включение графических файлов в URL.
- Включение видеофайлов.
- Указание различных языковых версий через
hreflang
. - Использование новостного Sitemap для публикаций.
Sitemap и Bing
Главный менеджер программы генерации индексов Bing Фабрис Канель:
«Одной из ключевых стратегий поисковой оптимизации (SEO) сайтов является наличие высококачественных карт сайта, которые помогают поисковым системам обнаружить и получить доступ ко всему релевантному содержимому. Это простой способ поделиться информацией о содержании сайта без полной зависимости от сканеров.»
Он рекомендует:
- Избегать большого количества XML-файлов;
- Предпочитать один индексный файл sitemap с вложенными ссылками;
- Создавать карты сайта не реже одного раза в день;
- Для сайтов с миллионами URL — чередовать два набора sitemap ежедневно.
Sitemap и Baidu
Baidu предъявляет к картам сайта следующие требования:
- Размер не должен превышать 10 МБ;
- Не должны содержать китайских иероглифов;
- Должны быть расположены в корневой папке сайта.
Как создать XML sitemap?
Google предлагает список сторонних генераторов Sitemap, многие из которых до сих пор актуальны. Некоторые ссылки устарели, но функциональность сохранилась.
Популярные сервисы:
- Sitemap Writer Pro — генератор с поддержкой 7 типов sitemap (включая для изображений, видео, новостей, Geo и др.), встроенный краулер и FTP-загрузку.
- Генератор XML sitemap — бесплатная генерация до 500 страниц, версия Pro и PHP-скрипт.
- My Sitemap Generator — онлайн-сервис, создающий карту после сканирования сайта.
Плагины CMS:
- Drupal: Модуль XML Sitemap с подмодулями для меню, контента и профилей пользователей.
- WordPress: Google XML Sitemaps Generator — автоматическое создание XML и HTML карт сайта.
- IKSWEB XML Sitemap Generator — легкий плагин для генерации.
- Google XML News Sitemap — open-source плагин для Google News с поддержкой доступа и типов контента.
- Joomla: список доступен на официальном сайте CMS.
Другие форматы карты сайта
Помимо XML, поддерживаются и другие форматы:
- RSS / mRSS / Atom 1.0 — для блогов и публикаций. Поддерживаются Google и большинством блог-платформ.
- Текстовый файл Sitemap — простой .txt-файл, где каждый URL размещён на новой строке.
Заключение
XML Sitemap — это мощный инструмент SEO, который облегчает индексацию сайта поисковыми системами. Он помогает:
- Контролировать, какие страницы индексируются;
- Передавать информацию об обновлениях;
- Улучшать видимость сайта в поиске.
Карта сайта должна регулярно обновляться, чтобы оставаться эффективной. Это ключевой элемент стабильной SEO-стратегии.
Дорогие друзья! Спасибо, что прочитали и нашли время! Надеемся, что статья была интересной и полезной!