Banco de dúvidas

Impedindo indexação de partes de uma página HTML

A indexação por sites de busca, como o Google, é essencial para sua visibilidade online. No entanto, pode haver conteúdo dentro de uma página HTML que você não deseje que o Google indexe ou apresente em resultados de busca.

NOTA: se precisa desativar a indexação de uma página toda ou partes inteiras de um site, é preferível usar o arquivo robots.txt.

Que tipo de conteúdo posso querer não indexar?

Para otimizar SEO, pode ser útil não indexar informações irrelevantes, repetitivas ou sensíveis, como comentários de blogs, anúncios que mudam de forma aleatória, dados pessoais, alguns conteúdos gerados dinamicamente (citações, listas de artigos ou posts recentes, etc.)

Como impedir a indexação de uma parte apenas do HTML?

Basta usar as tags googleon e googleoff, elas permitem ao desenvolvedor especificar seções de uma página da web que o Googlebot deverá ignorar durante a indexação. As tags são inseridas dentro de comentários HTML, assim:

<html>
<head>
<title>Meu Blog Super Fantástico</title>
</head>
  <body>
    <h1>Meu Primeiro Post, Uau!</h1>
    <p>Este é o conteúdo do meu post. Este texto será indexado pelo Google.</p>
<!--googleoff: index-->
    <section id="comentarios">
      <h2>Comentários</h2>
      <p>Comentário 1: puxa, é um ótimo post!</p>
      <p>Comentário 2: realmente gostei, nem parece um exemplo tosco!</p>
    </section>
<!--googleon: index-->
  </body>
</html>

No exemplo, a seção de comentários do blog está entre as tags googleoff: index e googleon: index. Isso instruirá o Googlebot a ignorar a seção de comentários durante a indexação.

Opções do googleon/googleoff

As tags googleon e googleoff podem ser seguidas pelas opções index, anchor, snippet ou all, elas definem o tipo de conteúdo que o Googlebot deve ignorar:

  • index: impedirá que o Googlebot indexe a parte específica;
  • anchor: instruirá o Googlebot a não considerar os textos âncora dos links para descrever os URLs na parte especificada;
  • snippet: instruirá o Googlebot a nunca usar a parte especificada para apresentar em snippets de páginas de resultados;
  • all: combina os três atributos acima, instruindo o Googlebot a ignorar completamente a parte especificada.

Considerações finais

O uso das tags googleon e googleoff deve ser feito com cautela. Embora possam ser úteis para impedir que informações sensíveis ou irrelevantes sejam indexadas, o uso excessivo pode resultar em páginas mal indexadas, o que pode afetar negativamente a sua visibilidade em sites de busca. Como sempre, o equilíbrio é a chave para boas práticas de SEO.

Este artigo foi útil para você?