Гадкий Я(ндекс) и rel=canonical

Гадкий Я(ндекс) и rel=canonical

[Всего голосов: 0    Средний: 0/5]

Пост из серии хозяйке на заметку. Без выдающегося анализа и далеко идущих выводов 🙂

Предыстория

Жил был блог. Этот. За 8 лет его существования я написал 300 записей. Эта будет 301-ой. Не все из них достойны индекса. Более того, недавно я сам почистил блог от некоторого количества лытыдыбра.

С учётом всякой вспомогательной чешуи от вордпресса, всего образовалось около 1300 страниц. Это категории, архивы по годам, ссылки на которые я тоже решил удалить. И метки, которые я наоборот, решил завести. И умеренно их расставил. А главное, совсем уж мусорные страницы.

Например, каждый комментарий на странице порождает её дубликат с параметром вида replytocom=126675, который нормальному посетителю недоступен. Потому что это вспомогательная ссылка для ответа на предыдущий комментарий, а не на всю заметку. И при включенном JavaScript, перехода по ссылке не происходит.

История

Поисковикам иногда не хватает мозгов (они заняты более важными расчётами), чтобы среди нескольких дубликатов одного и того же документа выбрать главный. Из-за этого они тащат всяку каку в рот в индекс.

А поскольку я всё-равно уже установил плагин, который умеет расставлять на страницах вордпресса тэг с атрибутом rel = “canonical”, я решил помочь поисковикам и воспользовался данной возможностью плагина.

Закончился мой альтруизм в борьбе за чистоту индекса весьма непредсказуемо.

Результат

Гугль, пожалуй что и не заметил данной разметки. По крайней мере пока. А вот Яндекс прореагировал очень бурно.

Внезапно оказалось, что для Яндекса установка rel = “canonical” на странице является не мягким аналогом 301-го редиректа, а просто запретом на индексацию:

canonicalization

В результате, вместо неспешной замены неканонических версий документов на канонические, Яндекс тупо выплюнул все неканонические почти все документы c rel = “canonical” изо рта индекса:
drop_from_index

В итоге в индексе осталось 19 страниц по выдаче и 22 страницы по вебмастеру. Из примерно 200 страниц, которые ранее Яндекс считал нормальными.

При этом я, как автор, считаю, что примерно с десяток документов оставшихся в выдаче можно было бы и выкинуть (архивные вспомогательные страницы) без потери качества, а взамен разместить десяток статей, которые вызывали и вызывают реальный интерес у аудитории блога.

Вместо выводов

Маленькие дети,
ни за что на свете
не ходите Яндексу помогать.

Гадкий, нехороший, жадный Бармалей.

Поделиться Вконтакте
Плюсануть

9 комментариев к “Гадкий Я(ндекс) и rel=canonical

  1. АГС таки, у меня тоже много сайтов угодили под такую зачистку, но тег каноникал нигде не юзал

    1. АГС, конечно, полностью исключить нельзя, но он отшуршал ещё в октябре, а в ноябре о нём заявили публично. То есть если сайт не попал под АГС тогда, маловероятно, что он попал под него сейчас.

    2. Это не АГС. Ответили на удивление быстро:

      Мы проверили, сейчас никаких проблем с Вашим сайтом с нашей стороны нет, с ним все в порядке. В настоящее время невозможно выяснить, почему Ваш сайт отсутствовал в поиске, так как мы не храним подобную информацию. В ближайшее время он должен начать индексироваться и затем сможет появиться в поиске. Скорее всего, это произойдет в течение двух недель. Пожалуйста, дождитесь окончания указанного срока.

    1. Сергей, вероятность конечно есть, но очень небольшая. Просто плагин, который расставляет их имеет очень высокую популярность. И в это время в Гугле был только рост количества проиндексированных документов.

      Мой вариант развития событий такой:

      1. Для яндекса rel=canonical на не канонической странице является жёстким запретом для индексирования. Причём яндексом это воспринимается как ошибка, по аналогии с 404.
      2. После установки мной rel=canonical индексатор стал обнаруживать большое количество “ошибок”.
      3. Как только количество “ошибок” превысило количество страниц в индексе – 188 против 187, сработал триггер принудительного сброса индекса с последующей переиндексацией. Потому что большое количество ошибок относительно нормальных документов обычно возникает при кардинальной смене структуры сайта.

      Как-то так.

  2. А мне кажется, что не в canonical дело, у меня тоже белый проект с отличными поведенческими (глубина просмотра 3, показатель отказов около 5%, закладочный траффик, ссылки никогда не продавал, принят в РСЯ) вчера ушел под АГС-40. Пока что саппорт не ответил, но сдается мне, что они переборщили с алгоритмами. Досадно, особенно учитывая праздники, на долго эта тягомотина вся.

  3. Это не агс. Это реакция яндекса на Cаnonical. Поставил на старых сайтах новые шаблоны с этим тегом и со всех стали вылетать страницы из индекса.

    Он вообще нормальный?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *