Os erros 404 prejudicam meu site?

Segunda-feira, 2 de maio de 2011

Imagine que você está usando as Ferramentas do Google para webmasters só para ver como seu site é incrível, quando de repente… A página Erros de rastreamento está cheia de erros 404 (Not found). Está tudo perdido?

O recurso "Erros de rastreamento" nas Ferramentas do Google para webmasters

Não tenha medo, jovem padawan. Vamos analisar os erros 404 e como eles afetam ou não seu site:

P: Os erros 404 informados nas Ferramentas do Google para webmasters afetam a classificação do meu site?
R: Os erros 404 são uma parte perfeitamente normal da Web. A Internet está sempre mudando, conteúdo novo nasce, conteúdo antigo morre e, quando morre, retorna (idealmente) um código de resposta HTTP 404. Os mecanismos de pesquisa estão cientes disso. Há erros 404 nos nossos sites, como é possível ver acima, e os encontramos em toda a Web. Na verdade, nós preferimos que, ao se livrar de uma página do seu site, você garanta que ela retorne uma resposta 404 ou 410 adequada (em vez de soft 404). Lembre-se de que, para que nosso rastreador veja o código de resposta HTTP de um URL, ele precisa ser capaz de rastreá-lo. Se o URL estiver bloqueado pelo arquivo robots.txt, não vai ser possível rastrear e ver o código de resposta. O fato de alguns URLs do site não existirem mais ou retornarem erros 404 não afeta o desempenho dos outros URLs do site (aqueles que retornam códigos de status 200 (Success)) nos resultados da pesquisa.

P: Os erros 404 não prejudicam meu site?
R: Se alguns URLs do seu site tiverem erros 404, você não será prejudicado nos resultados da pesquisa do Google. No entanto, pode haver outros motivos para você querer resolver determinados tipos de erros 404. Por exemplo, se algumas das páginas com erros 404 são realmente importantes, analise por que estamos vendo erros 404 ao rastreá-las. Caso você veja um erro ortográfico de um URL legítimo (www.example.com/awsome em vez de www.example.com/awesome), é provável que alguém tenha tentado criar um link para você e simplesmente cometeu um erro de digitação. Em vez de retornar um erro 404, você pode fazer o redirecionamento 301 do URL com erro de ortografia ao URL correto e capturar o tráfego pretendido desse link. Também é possível garantir que, quando os usuários acessarem a página 404 do seu site, você os ajude a encontrar o que estavam procurando em vez de apenas dizer "404 Não encontrado".

P: Mais informações sobre os "erros soft 404".
R: Um soft 404 ocorre quando um servidor da Web retorna um código de resposta diferente de 404 (ou 410) para um URL que não existe. Um exemplo comum é quando o proprietário de um site quer retornar uma página 404 bonita com informações úteis para os usuários e acha que, para veicular conteúdo aos usuários, é preciso retornar um código de resposta 200. Mas isso não é verdade. É possível retornar um código de resposta 404 enquanto exibe o conteúdo que você quiser. Outro exemplo é quando um site redireciona URLs desconhecidos para a página inicial dele em vez de retornar erros 404. Ambos os casos podem ter efeitos negativos na compreensão e na indexação do site. Portanto, recomendamos que você confira se o servidor retorna os códigos de resposta adequados para conteúdo inexistente. Lembre-se de quesó porque uma páginadiz "404 Not Found", não significa que ela retorne um 404 Código de resposta HTTP: use o Buscar como o Googlebot nas Ferramentas do Google para webmasters para verificar novamente. Se você não souber como configurar o servidor para retornar os códigos de resposta corretos, consulte a documentação de ajuda do seu host da Web.

Pergunta: como saber se um URL precisa ser 404, 301 ou 410?
Resposta: quando você remover uma página do site, analise se esse conteúdo está sendo movido para outro lugar ou se você não quer mais ter esse tipo de conteúdo no site. Se o conteúdo for movido para um novo URL, redirecione com 301 o URL antigo para o novo. Assim, quando os usuários acessarem o URL antigo procurando pelo conteúdo, eles vão ser automaticamente redirecionados para um conteúdo relevante em relação ao que procuravam. Se você está descartando todo o conteúdo e não tem nada no site que preencha a mesma necessidade do usuário, o URL antigo deve retornar um erro 404 ou 410. Atualmente, o Google trata 410 (Gone) da mesma forma que 404 (Not found). Por isso, não é relevante para nós qual você retorne.

Pergunta: a maioria dos erros 404 são de URLs bizarros que nunca existiram no meu site. O que está acontecendo? De onde eles vieram?
Resposta: se o Google encontrar um link em algum lugar da Web que aponte para um URL no seu domínio, talvez ele tente rastrear esse link, independentemente do seu conteúdo existir ou não. Quando isso acontece, o servidor precisa retornar um 404 se não houver nada para encontrar. Esses links podem ser causados por alguém que cometeu um erro de digitação ao vincular você, algum tipo de erro de configuração (se os links forem gerados automaticamente, por exemplo, por um CMS) ou pelas iniciativas crescentes do Google em reconhecer e rastrear links incorporados em JavaScript ou outro conteúdo incorporado ou ainda podem fazer parte de uma rápida verificação para saber como o servidor lida com URLs desconhecidos, entre outros. Ignore os erros 404 encontrados nas Ferramentas do Google para webmasters em URLs que não existem no seu site. Não sabemos quais URLs são importantes para você e quais precisam ser 404. Por isso, mostramos todos os erros 404 encontrados no seu site e deixamos você decidir o que exige atenção.

P: alguém copiou meu site e causou muitos erros 404 no processo. Todos são URLs "reais" com outros códigos adicionados, como https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/> Isso vai prejudicar meu site?
R: Geralmente, não é preciso se preocupar com links corrompidos como esses prejudicando seu site. Entendemos que os proprietários de sites têm pouco ou nenhum controle sobre as pessoas que copiam seu site ou vinculam a eles de maneiras estranhas. Se você tiver um bom senso de regex, considere redirecionar esses URLs, mas geralmente não vale a pena se preocupar com isso. Também é possível enviar um pedido de remoção quando você acreditar que alguém está roubando conteúdo original do seu site.

P: Na semana passada, corrigimos todos os erros 404 informados pelas Ferramentas do Google para webmasters, mas eles ainda aparecem na minha conta. Isso significa que não corrigi os problemas corretamente? Quanto tempo levará para que eles desapareçam?
R: Consulte a coluna "Detectados" na página de erros de rastreamento. Essa é a data mais recente em que detectamos cada erro. Se as datas nessa coluna forem anteriores ao momento em que você corrigiu os erros, isso significa que esses erros não foram encontrados desde essa data. Se as datas forem mais recentes, isso significa que continuamos encontrando esses erros 404 durante o rastreamento.

Após a implementação de uma correção, é possível verificar se nosso rastreador está vendo o novo código de resposta usando a ferramenta Buscar como o Googlebot. Teste alguns URLs e, se eles estiverem bons, esses erros começarão a desaparecer da lista de erros de rastreamento.

Pergunta: posso usar a ferramenta de remoção de URL do Google para fazer com que os erros 404 desapareçam da minha conta mais rápido?
Resposta: não. A Ferramenta de remoção de URL remove URLs dos resultados da pesquisa do Google, e não da sua conta das Ferramentas do Google para webmasters. Ela foi projetada somente para solicitações de remoção urgentes, e o uso não é necessário quando um URL já retorna um erro 404. O URL vai sair dos nossos resultados da pesquisa naturalmente ao longo do tempo. Veja na parte inferior desta postagem do blog mais detalhes sobre o que a Ferramenta de remoção de URL pode e não pode fazer por você.

Ainda quer saber mais sobre os erros 404? Confira 404 semanal no nosso blog ou acesse nosso Fórum de Ajuda para webmasters.