Как сэкономить время при продвижении сайта?
SEO Wiki / Sitemap.xml

Sitemap.xml

Москва г. Москва, ул. Нобеля 7, п. 56 +7 (800) 700-59-30
sitemap.xml

Приступая к изучению проекта, специалисты в сфере оптимизации всегда вводят в адресную строку надпись, состоящую из имени ресурса и sitemap.xml, для доступа к карте сайта. Полученная таким образом информация позволяет выявить причины отсутствия индексации того или иного контента. О том, как создать качественную XML-карту и грамотно её внедрить, и пойдет речь в нашей статье.

Понятие

Sitemap.xml представляет собой файл, содержащий необходимую для поисковиков информацию о страницах, подлежащих индексации. Это перечень всех доступных для поисковых роботов страниц сайта в формате XML. Следует учитывать, что такая карта отличается от обычной, которая размещена по ссылке http://site.com/sitemap/. XML-карта позволяет получить следующие данные.

  • Места расположения страниц.

  • Приоритетность (степень важности) каждой из них в общей структуре ресурса.

  • Периодичность (частота), с которой обновляется определённая страница, и её важность по отношению к остальным.

  • Время, когда страница обновлялась в последний раз.

Составляющие XML-карты

Документ начинается с указания версии, то есть XML, а также кодировки UTF-8. Кроме того, используются специальные теги:

  • sitemapindex – это родительский тег, который ставится в начале файла и в конце;

  • sitemap – дочерний по отношению к предыдущему. Он используется в качестве родительского для каждого из упомянутых в файле пунктов;

  • url – в этом блоке содержатся данные об адресе и некоторые другие элементы;

  • loc – URL определенной страницы;

  • changefreq – частота возможных изменений. Тег может иметь значения: never, yearly, monthly, weekly, daily, hourly, always;

  • priority – приоритетность составляющих. Позволяет установить, у каких из страниц выше приоритет для краулинга;

  • Lastmod – отображение времени, когда содержимое страницы обновлялось в последний раз.

Если сайт крупный, стоит создать не один, а сразу несколько файлов sitemap.xml.

XML-карты для видео

При наличии на сайте уникальных видеозаписей можно создать для них собственную карту. Любопытно, что в ней можно открывать ссылки в «Google.Видео» для поиска. При этом будет демонстрироваться результат в виде значка видеозаписи, который можно индивидуализировать, и другие данные, содержащиеся в карте. При помощи sitemap.xml можно отправить в поисковик такую информацию:

  • название видео;

  • его описание;

  • длительность видеозаписи;

  • миниатюра и т. д.

Обязательные теги для видео

В карту должны включаться следующие теги:

  1. loc – местонахождение видеозаписи (страница);

  2. :title – её название (не длиннее 100 символов);

  3. :player_loc – местонахождение видеоплеера;

  4. :content_loc – данные о размещении определённого видео;

  5. :thumbnail_loc – миниатюра (превью) видео размером как минимум 120 х 90 px;

  6. :video — контейнер, содержащий информацию о видео;

  7. :description — описание видеозаписи длиной не более 2 тысяч символов.

Дополнительные теги

Кроме перечисленных обязательных тегов, можно на собственное усмотрение использовать и дополнительные:

  • подписка (:requires_subscription) – отметка о необходимости подписки (платной или бесплатной) для просмотра. Возможные значения этого тега – yes или no;

  • длина (:duration) – продолжительность видеозаписи в секундах (не более 8 часов);

  • территориальная доступность (:restriction) – перечень стран, на территории которых можно или нельзя смотреть видео. Здесь указываются коды, присвоенные странам по ISO 3166. Каждая видеозапись может иметь только один такой тег. Если его нет, считается, что видео воспроизводится без ограничений по местонахождению зрителя;

  • цена (:price) – сумма с упоминанием валюты в соответствии со стандартом ISO 4217;

  • рейтинг (:rating) – рейтинговая позиция в диапазоне 0–5;

  • категория (:category) – тематика видео, например животные или автомобили;

  • дружелюбность (:family_friendly) – доступность видео для безопасного поиска;

  • платформы (:platform) – перечни тех площадок, на которых возможно воспроизведение видео и на которых такой возможности нет. Значения, которые здесь допустимы, – это tv, mobile и web. Если такого тега в файле карты нет, предполагается, что видео можно смотреть на любой платформе;

  • загрузчик (:uploader) – название компании, имя физического лица, добавившего видеофайл. Для одного видео может быть указано только одно такое название (имя);

  • срок действия (:expiration_date) – время и дата утраты видео своей актуальности;

  • прямой эфир (:live) – упоминание о том, представлена ли на видео live (прямая) трансляция. Здесь может быть одно из двух значений: yes или no;

  • дата публикации (:publication_date) – данные о том, когда размещено видео, в формате «год-месяц-дата» или с дополнительным указанием часов, минут, секунд и часового пояса;

  • теги (:tag);

  • местонахождение галереи (:gallery_loc) – ссылка на нее;

  • счётчик (:view_count) – число просмотров.

Допустимые расширения

В начале каждого из перечисленных тегов указывается слово video. Чтобы видео индексировалось Google, оно должно быть одного из поддерживаемых поисковиком форматов. Приводим допустимые расширения файлов:

  • *.flv;

  • *.mov;

  • *.rm, *.ram,*.ra;

  • *.avi, *.asf;

  • *.wmv;

  • *.m4v, *.mp4, *.mpeg, *.mpg.

XML-карты для изображений

Карты нередко создаются специально для изображений. Но следует учитывать, что только Google используется их для индексации. В Яндексе теги image не распознаются. Они помогают поисковикам находить контент, обнаружить который другим способом невозможно. Это, к примеру, изображения, загруженные при помощи JavaScript. Кроме того, так можно указать, что нужно индексировать и сканировать. При создании XML-карт для изображений в них используются следующие теги:

  • :image – в нем содержатся все сведения о конкретной картинке;

  • :loc – здесь указывается URL определенного изображения. В одном таком урле может содержаться до тысячи :image.

Это обязательные теги для карты изображений, но есть и другие.

Дополнительные теги

Есть и ряд дополнительных, которые можно использовать по желанию:

  • :caption – содержит подпись к изображению;

  • :geo_location – местонахождение локации, в которой происходила съемка (название страны, населенный пункт и т. д.);

  • :title – наименование картинки (фото);

  • :license – адрес (урл) лицензии такого объекта.

В начале каждого тега дополнительно прописывается слово image.

XML-карта для «Новостей» от Google

Если сайт новостной, может создаваться отдельный файл sitemap.xml, который будет обновляться каждый день и генерироваться динамически. Но важно помнить, что такие карты работают исключительно для новостников, которые попали в списки сервиса «Новости» от Google. Для включения в него можно обратиться с соответствующим запросом. В файле с XML-картой должны быть адреса (url) исключительно тех публикаций, которые размещались в течение последних 2 дней. Если после опубликования прошло больше времени, можно удалить такие статьи из файла. В индексе «Новостей» Google они останутся на 30 дней. Всего в карте новостника может быть максимум тысяча адресов. Если двухдневный приток публикаций более интенсивный, карт может быть несколько с файлом индекса.

Обязательные теги для новостей

В обязательном порядке в карте должны содержаться такие теги (с указанием перед знаком «:» слова news):

  • издание (:publication) – содержит общую информацию о публикации. В дополнение к нему в файл карты обязательно включаются следующие теги: - название – :name; - язык – :language. Указывается по стандарту ISO 639;

  • дата опубликования (publication_date). Указывается полностью по стандарту W3C до долей секунд;

  • название (:title). Оно должно соответствовать указанному на сайте.

Дополнительные теги

Кроме перечисленных обязательных тегов, если и дополнительные:

  • свойства новостной публикации (:genres).

Допускаются такие варианты значений этого тега:

  • мнение (opinion) – публикация, в которой выражена чья-либо личная позиция, не попавшая в редакторскую колонку. Это могут быть, к примеру, интервью или написанные колумнистами рецензии;

  • блог (blog) – публикация или статья в форме блога;

  • пресс-релиз (PressRelease) – должен иметь официальный характер;

  • пользовательский материал (UserGenerated) – статья пользователя, которая прошла правку у редактора;

  • личное мнение в колонке редактора (OpEd);

  • сатира (Satire) – публикация, в которой информация изложена в юмористической форме;

  • ключевые слова (keywords) – должны соответствовать тематике статьи;

  • финансовые символы (stock_tickers) – максимум 5. Этот тег подходит для публикаций, касающихся бизнеса. Символы обязательно сопровождаются упоминанием названия биржи.

XML-карты для мультиязычных ресурсов

При помощи sitemap.xml можно демонстрировать страницы сайта на определённом языке, и при этом адреса будут иметь соответствующую региональность. При этом необходимо указать диапазон имён следующим образом:

xmlns:xhtml="http://www.w3.org/1999/xhtml"

Кроме того, следует для всех адресов создать по собственному URL. И у каждого из таких элементов должны быть такие составляющие:

  • loc – это тег, указывающий на адреса;

  • xhtml:link rel="alternate" hreflang="XX" – элемент для каждой из версий определенной страницы.

Особые требования Яндекса

В этом поисковике поддерживается два таких формата карт сайтов:

  • XML – рекомендованный вариант;

  • файл в текстовом формате.

Кроме того, Яндекс предъявляет к картам следующие требования:

  • максимальный размер несжатого файла – 10 Мб;

  • распознавание пуникода (Punycode) и в оригинале, и после кодировки.

Особенности Google

Основные правила, установленные в этой поисковой системе:

  • размер несжатой карты не должен превышать 50 Мб;

  • максимальное количество ссылок на файл с картами – 50 тысяч.

Поддерживаемые форматы файлов:

  • XML;

  • текстовый – с расширением .txt;

  • собственный формат поисковика – при создании и подтверждении сайта с помощью инструментов «Google.Сайты» происходит автоматическое создание файла с картой. При наличии в подкаталоге более тысячи страниц есть риск некорректного отображения sitemap.

  • Atom 1.0, media RSS или RSS – форматы, подходящие для блогов с соответствующими фидами.

  • К картам в текстовом формате предъявляется ряд особых требований:

  • допустимая кодировка – исключительно UTF-8;

  • название файла может быть любым, но при выборе расширения необходимо останавливаться на .txt;

  • в файле должен быть только список адресов.

Внедрение XML-карты

  • Помещаем её в корень сайта.

  • Когда она не одна, создаем индекс, в котором перечисляются ссылки на все соответствующие файлы.

  • В robots.txt добавляем информацию о карте.

  • Прописываем в панелях поисковиков адрес файла:

    • в «Вебмастере» от Яндекса;

    • в Search Console от Google;

    • в «Кабинете вебмастера» от MailRu и т. д.

Когда поисковый робот индексирует сайт, он учитывает файлы с картами, но ни один из поисковиков не даёт гарантии, что проиндексируются все содержащиеся в файле адреса. Есть возможность автоматического создания XML-карты онлайн при помощи специальных генераторов (как платных, так и бесплатных), программного обеспечения или плагинов.

Поиск ошибок в sitemap.xml

Анализ в Яндекс.Вебмастере

Чтобы воспользоваться инструментами, которые предлагает для работы с картами Яндекс, нужно в «Вебмастере» выбрать пункт меню «Индексирование» и найти в нём подпункт «Файлы sitemap». Здесь есть возможность добавления ссылок на один или несколько файлов, отслеживания ошибок, числа ссылок и времени осуществления последней из загрузок. Кроме того, качество карты можно оценить через «Анализатор файлов sitemap», который расположен в «Инструментах». Доступные способы запуска проверки – прикрепление файла, отправка адреса или текста. В ответ система демонстрирует тип, размер, число ссылок, которые включены в карту, и ошибки.

Анализ в Google Search Console

Для работы с картами при помощи инструментов Google нужно в панели для веб-мастеров найти пункт «Сканирование», а в нем подпункт «Файлы sitemap». Откроется ряд возможностей:

  • добавлять файлы с картами или проводить их проверку;

  • узнавать, какие проблемы или ошибки есть;

  • отслеживать, сколько разнотипных страниц отправлено и проиндексировано;

  • повторно отправлять и удалять файлы.

Подведём итоги

Роботам поисковиков нужна карта, чтобы обнаружить все страницы сайта. В ней содержатся адреса и некоторая дополнительная информация о страницах, например важность и частота её обновлений. Есть возможность создавать отдельные карты для видеозаписей, картинок и фотоснимков, а также новостей. Браться за ручное создание XML-карты не стоит. Лучше воспользоваться специальным программным обеспечением или генератором. Для проверки файла с картой на наличие ошибок достаточно возможностей, которые дают панели веб-мастеров поисковиков.

(Голосов: 6, Рейтинг: 5)
Rookee — простой способ поднять сайт в ТОП поисковых систем
Вам подойдут следующие услуги