Как использовать Noindex и Nofollow

Как использовать noindex и nofollow

Noindex и nofollow — разные по функционалу элементы. Их часто путают, и как только не называют: тегами, метатегами, атрибутами. Расставим все точки над «i» и расскажем, чем отличается noindex от nofollow и в каких случаях их целесообразно использовать.

1. Задать правила индексации страницы и ссылок на ней

Mundarija скрыть

1. Задать правила индексации страницы и ссылок на ней

В чем отличие директив noindex и nofollow от запрета в robots.txt

2. Скрыть неуникальный или повторяющийся текст от Яндекса

3. Скрыть от роботов исходящие ссылки

Как не нужно закрывать ссылки от индексации: две распространенные ошибки

Нельзя закрыть ссылку тегом

Не стоит закрывать ссылку тегом

Какие дополнительные возможности есть в Google

4. Закрыть от индексации счетчики и блоки подписки

Простые решения для WordPress

Как проверить наличие и правильность употребления noindex и nofollow

Расширение RDS Bar

Проверка в SEO-модуле PromoPult

Совет напоследок

Прежде всего, noindex и nofollow (наряду с index и follow) — это указания для поисковых роботов в метатегах секции

. Их понимают все без исключения поисковики. Указания index или noindex разрешают или запрещают роботу индексировать содержимое страницы, а follow и nofollow — переходить по ссылкам на странице.

Возможны такие варианты:

— в этом случае разрешена индексация страницы и ссылок.

— запрещена индексация содержимого страницы, но разрешен переход по ссылкам.

— разрешена индексация, но запрещен переход по ссылкам.

— запрещается и индексация, и переход по ссылкам.

От индексации следует закрывать служебные страницы (вход в административную панель, логи сервера) а также дублированный контент (страницы архивов, тегов, результаты поиска по сайту, в некоторых случаях — пагинацию).

Если вы хотите оставить указания только для какого-то конкретного робота, нужно указать его идентификатор в метатеге. Например, для бота Google:

Если не задать указания для робота, то он по умолчанию принимает значения index и follow.

Перечень метатегов, которые учитывает Яндекс, найдете в Справке Вебмастера, Google — в документации Центра Google поиска.

Офлайн семинары по интернет-маркетингу в Москве

CyberMarketing запускает новый сезон бесплатных офлайн семинаров. Ждем всех, кто уже продает или только собирается настроить продажи из интернета.

Узнаете, как продвинуть сайт в Яндексе и Google, получить продажи из ВКонтакте и Яндекс Директа, выйти в топ маркетплейсов. Пообщаетесь со спикером и обсудите, как эффективно рекламировать свой бизнес.

Встречаемся в офисе PromoPult: м. Сходненская, ул. Свободы, д. 50 с.2.

Регистрируюсь

В чем отличие директив noindex и nofollow от запрета в robots.txt

Запретить поисковым роботам индексировать страницу можно несколькими способами. Самых популярных два:

Добавить в секцию HTML-кода страницы директивы noindex и nofollow:

Запретить страницу для индексации при помощи директивы Disallow в файле robots.txt:

Disallow: /page1.html

В чем же принципиальная разница между этими двумя методами?

Для страниц, которые еще не проиндексированы роботами, особой разницы нет — можно использовать оба способа.

Страницы, которые уже есть в индексе, лучше закрывать директивами noindex и nofollow в meta robots. В этом случае поисковики быстрее исключат страницу их индекса и больше не проиндексируют ее.

Важно! Чтобы робот правильно интерпретировал директивы noindex и nofollow и не добавил страницу в индекс, нельзя одновременно закрывать доступ к ней в файле robots.txt при помощи директивы Disallow. Робот не получает доступа к странице и не видит запрещающих директив. А если на страницу стоит ссылка с другого сайта, краулер перейдет по ней и добавит страницу в индекс.

Еще один вариант полного запрета индексации страницы — настроить HTTP-ответ с заголовком X-Robots-Tag и значением noindex или none. Пример такого заголовка в коде:

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
X-Robots-Tag: noindex

2. Скрыть неуникальный или повторяющийся текст от Яндекса

Для того чтобы закрыть не всю страницу, а только ее часть от индексации, используется тег . Причем это «ноу-хау» Яндекса. Google тег не понимает и считает его невалидным. Синтаксис выглядит так:

текст, который следует скрыть от индексации

Проблема в том, что при такой конструкции во время валидации кода будут ошибки. Если вы хотите сделать код валидным, используйте такой синтаксис:

текст, который следует скрыть от индексации

Альтернативный способ закрыть от индексации часть текста на странице — добавить тег

Тег

Скрывать от индексации есть смысл:

дословные цитаты других авторов;

выдержки из законодательства;

регулярно повторяющийся одинаковый текст (например, в сквозных блоках на сайте с описаниями преимуществ компании);

служебный текст.

По поводу тега есть заблуждение. Считается, что текст, помещенный в него, Яндекс вообще не учитывает. Это не так. Яндекс читает его и принимает во внимание при определении релевантности страницы и ее уникальности, просто он не добавляет его в индексную базу.

3. Скрыть от роботов исходящие ссылкиИзначально nofollow использовали только в метатеге на уровне страницы. Но со временем возникла острая необходимость закрывать не все ссылки на странице от индексации, а только некоторые из них. Так появился атрибут rel=»nofollow» тега . Он относится только к ссылке, для которой указан. Синтаксис выглядит так:Перейти

Чтобы запретить поисковым роботам переходить по всем ссылкам (и внешним, и внутренним) на уровне страницы, используйте директиву «nofollow» в meta robots.

Как не нужно закрывать ссылки от индексации: две распространенные ошибкиНельзя закрыть ссылку тегом Некоторые пытаются закрывать ссылки от индексации, используя тег . Выглядит это таким образом:ПерейтиЭто неверно.

Запомните, что тега для того, чтобы закрыть от индексации ссылку, не существует — только атрибут rel или директива в meta robots со значением nofollow.

Не стоит закрывать ссылку тегом Более распространенная ошибка — попытка закрыть ссылку от индексации с помощью тега . В этом случае будет закрыт только анкор и только для Яндекса. По ссылке же роботы смогут переходить.Закрывают ссылки атрибутом nofollow в таких случаях:

Ненадежный контент. Если вы не можете или не желаете поручиться за содержание страниц, на которые ведут ссылки, то лучше скрыть их от роботов. Например, атрибутом nofollow часто закрывают ссылки из комментариев в блогах или сообщений на форумах.

Платные ссылки. Если вы размещаете рекламные статьи, новости, обзоры, то закрытие ссылок атрибутом nofollow убережет вас от возможных санкций со стороны поисковых систем. Хотя, конечно, далеко не каждый рекламодатель захочет получать именно такую ссылку, поэтому этот подход практикуют лишь топовые площадки, и то не все.

Приоритизация сканирования. Роботам ни к чему переходить, например, по ссылкам на форму регистрации или личный кабинет. Использование атрибута nofollow позволит направить роботов в нужное русло и не тратить ресурс на бесполезное сканирование.

Много внешних ссылок. Если со страницы идет много внешних dofollow ссылок, то лучше закрыть некоторые из них. В противном случае страница будет терять вес.

Перераспределение веса. С помощью nofollow можно перераспределить вес между внутренними страницами сайта. Но для этого нужно хорошо понимать, что именно и как делать. Важно не допустить, чтобы некоторые страницы выпали из общей логики внутренней перелинковки.

Какие дополнительные возможности есть в GoogleGoogle предоставляет вебмастерам возможность более точно описать ссылки, которые содержатся на странице. Сделать это можно при помощи таких значений атрибута rel:

rel=»sponsored» — поисковик настаивает, чтобы все платные ссылки отмечались именно этим атрибутом, а не «nofollow».

rel=»ugc» — так можно помечать ссылки, которые пользователи употребляют в комментариях или записях на форумах. Впрочем, если вы уверены, что на вашем сайте пользователи оставляют только полезные ссылки и не спамят, можно не добавлять это значение.

комбинация нескольких значений (нужно разделить их пробелами или запятыми). В коде это может выглядеть так:

Перейти4. Закрыть от индексации счетчики и блоки подпискиНа страницах сайта зачастую расположено много служебных элементов, которые нет смысла индексировать. Их закрывают с помощью тега . Прежде всего, это счетчики (Liveinternet, Яндекс.Метрика, Google Аналитика и т. п.), различные информеры, блоки оформления подписки и т. п.Пример в коде сайта Wildberries:А вот блоки рекламы (например, от РСЯ) закрывать не нужно.Простые решения для WordPressДля сайтов на системе управления WordPress большинство задач по закрытию от индексации отдельных страниц или их типов можно решить при помощи плагинов.Самые популярные:

Yoast SEO

All in One SEO Pack

В разделе «Общие настройки» плагина All in One SEO Pack есть возможность закрыть от индексации служебные и не нужные в индексе страницы:А также — рубрики, архивы, страницу поиска и 404:А еще — категории, метки, теги, рубрики и при необходимости страницы с пагинацией:Эти настройки позволяют гибко управлять сканированием сайта, не расходовать краулинговый бюджет и избегать дублей и «мусорных» страниц в индексе.