Что такое нормализация

Нормализация – это процесс выбора канонического URL вашей страницы, то есть URL, который будет представлять вашу страницу в результатах поиска. Следовательно, каноническим называется URL страницы, которую роботы Google считают главной среди нескольких ее вариантов на вашем сайте. Этот процесс, часто называемый дедупликацией, помогает Google показывать в результатах поиска только одну версию дублирующегося контента.

Дублирующийся контент может появляться на сайте по следующим причинам:

  • Версии сайта для разных регионов. Например, контент, предназначенный для пользователей из США и Великобритании, находится по разным URL, но фактически является одним и тем же контентом на одном и том же языке.
  • Версии сайта для разных типов устройств. Страницы для мобильных устройств и компьютеров могут иметь одинаковый контент.
  • Версии сайта с разными протоколами. Сайт может иметь как HTTP, так и HTTPS-версию.
  • Разные функции сайта. Например, могут быть показаны результаты сортировки и фильтрации страницы категории.
  • Прочие ошибки. Например, поисковым роботам будет по-прежнему доступна демоверсия сайта.

В некоторых случаях страницы с идентичным контентом не являются ошибкой и не нарушают правила Google в отношении спама. Однако доступ к одному и тому же контенту по разным URL может быть неудобным для пользователей (им может быть непонятно, какую страницу следует использовать и есть ли между ними разница), а также это может затруднить отслеживание эффективности вашего контента в результатах поиска.

Как Google выбирает канонический URL при индексировании

Во время индексирования страницы Google определяет основной контент на каждой странице. Если на сайте несколько одинаковых страниц или страниц с похожим контентом, робот выбирает в качестве канонической ту из них, контент которой он интерпретирует как наиболее полный и полезный на основе факторов или сигналов, полученных в процессе индексирования. Она будет сканироваться наиболее часто, а ее копии и варианты – реже. Это позволяет снизить нагрузку на сайты, связанную с индексированием.

Есть несколько факторов, влияющих на процесс нормализации страницы: обслуживается ли страница через протокол HTTP или HTTPS, выполняется ли переадресация, присутствуют ли в карте сайта URL и аннотации rel="canonical" link. Даже если вы укажете каноническую страницу самостоятельно, используя описанные в этой статье способы, мы по той или иной причине можем выбрать другую. Таким образом, вы можете указать предпочитаемую каноническую страницу, но делать это вовсе не обязательно.

Версии одной страницы на разных языках считаются копиями, только если основной контент написан на одном и том же языке. Иными словами, если переведены лишь колонтитулы и прочие незначительные текстовые элементы, такие страницы будут считаться копиями. Подробнее о том, как настраивать локализованные сайты, описано в документации по управлению многоязычными сайтами для разных регионов.

Google использует каноническую страницу в качестве основного ресурса для оценки качества контента и показывает в результатах поиска именно ее (за исключением случаев, когда другой вариант страницы в большей степени подходит для пользователя). Например, при поиске на мобильном устройстве пользователь, скорее всего, увидит в результатах мобильную страницу, даже если канонической является ее версия для компьютеров.

Подробнее о том, как указать предпочитаемую каноническую страницу и действительно ли это необходимо для вашего сайта