Corrigir a invasão de palavras-chave japonesas

Este guia foi criado especificamente para um tipo de invasão que cria texto em japonês gerado automaticamente no seu site, que chamaremos de ataque da palavra-chave japonesa. Ele foi projetado para usuários dos Sistemas de gerenciamento de conteúdo (CMSs, na sigla em inglês) mais conhecidos, mas será útil mesmo se você não usar um CMS.

Queremos ter certeza de que este guia será realmente útil para você. Deixe seu feedback para nos ajudar a melhorar.

Identifique esse tipo de invasão

A invasão com palavras-chave japonesas normalmente cria novas páginas com texto em japonês gerado automaticamente no seu site em nomes de diretórios gerados aleatoriamente (por exemplo, http://example.com/ltjmnjp/341.html). Essas páginas são monetizadas usando links de afiliados para lojas que vendem produtos de marcas falsas e são exibidas na Pesquisa Google. Veja um exemplo de como uma dessas páginas seria:

Um exemplo de página com a palavra-chave japonesa "hack".
Uma página de texto gerada pela palavra-chave japonesa "hack".

Com esse tipo de invasão, o hacker normalmente se adiciona como proprietário no Search Console para aumentar os lucros, manipulando as configurações do site, como segmentação geográfica ou sitemaps. Se você recebeu uma notificação de que alguém desconhecido verificou seu site no Search Console, há uma grande possibilidade de que ele tenha sido invadido.

Comece verificando a ferramenta Problemas de segurança no Search Console para ver se o Google descobriu alguma dessas páginas invadidas no seu site. Às vezes, você também pode descobrir páginas como essa abrindo uma janela da Pesquisa Google e digitando site:_your site url_, com o URL do nível raiz do seu site. Isso vai mostrar as páginas do seu site que o Google indexou, incluindo as páginas invadidas. Confira algumas páginas dos resultados da pesquisa para ver se você consegue identificar URLs incomuns. Caso não encontre conteúdo invadido na Pesquisa Google, use os mesmos termos de pesquisa com um mecanismo de pesquisa diferente. Veja um exemplo de como isso ficaria:

Um exemplo de site invadido na pesquisa.
As páginas invadidas aparecem nos resultados da Pesquisa Google.

Normalmente, ao clicar em um link para uma página invadida, você é redirecionado para outro site ou vê uma página cheia de conteúdo sem sentido. No entanto, talvez você também veja uma mensagem sugerindo que a página não existe (por exemplo, um erro 404). Não se deixe enganar! Eles fazem isso com técnicas de cloaking de conteúdo. Verifique se há técnicas de cloaking inserindo os URLs do site na Ferramenta de inspeção de URL. A ferramenta Buscar como o Google permite que você veja o conteúdo oculto subjacente.

Se você encontrar esses problemas, seu site provavelmente foi afetado por esse tipo de invasão.

Corrija a invasão

Antes de começar, faça uma cópia off-line dos arquivos antes de removê-los, caso precise restaurá-los mais tarde. Ou melhor, faça backup de todo o site antes de iniciar o processo de limpeza. Para isso, salve todos os arquivos que estão no servidor em um local fora dele ou pesquise as melhores opções de backup para seu sistema de gerenciamento de conteúdo (CMS, na sigla em inglês). Se estiver usando um CMS, faça backup do banco de dados também.

Remover as novas contas criadas no Search Console

Se um novo proprietário que você não reconhece tiver sido adicionado à sua conta do Search Console, revogue o acesso dele o mais rápido possível. É possível conferir quais usuários foram verificados para o site na página de verificação do Search Console. Clique em "Detalhes da verificação" do site para visualizar todos os usuários verificados.

Para remover um proprietário do Search Console, consulte a seção "Remover proprietário" na Central de Ajuda sobre gerenciamento de usuários, proprietários e permissões. Remova o token de verificação associado, que normalmente é um arquivo HTML na raiz do seu site ou um arquivo .htaccess gerado dinamicamente que imita um arquivo HTML.

Se você não conseguir encontrar um token de verificação HTML no seu site, procure uma regra de substituição no arquivo .htaccess. A regra de reescrita será semelhante a esta:

RewriteEngine On
RewriteRule ^google(.*)\.html$ dir/file.php?google=$1 [L]

Para remover o token de verificação gerado dinamicamente do arquivo .htaccess, siga estas etapas:

Verificar o arquivo .htaccess (2 etapas)

Além de usar um arquivo .htaccess para criar tokens de verificação gerados dinamicamente, os hackers geralmente usam regras .htaccess para redirecionar usuários ou criar páginas com spam sem sentido. A menos que você tenha regras .htaccess personalizadas, considere substituir .htaccess por uma cópia completamente nova.

Etapa 1

Localize o arquivo .htaccess no seu site. Se você não tiver certeza de onde encontrá-lo e estiver usando um CMS, como WordPress, Joomla ou Drupal, pesquise "Local file file" em um mecanismo de pesquisa junto com o nome do CMS. Dependendo do site, você talvez encontre vários arquivos .htaccess. Faça uma lista de todos os locais de arquivo .htaccess.

Etapa 2

Substitua todos os arquivos .htaccess por uma versão limpa ou padrão do arquivo .htaccess. Geralmente, é possível encontrar a versão padrão de um arquivo .htaccess pesquisando por "arquivo .htaccess padrão" e o nome do seu CMS. Para sites com vários arquivos .htaccess, encontre uma versão limpa de cada um e substitua-os.

Se não houver .htaccess padrão e você nunca tiver configurado um arquivo .htaccess no site, é provável que o arquivo .htaccess encontrado nele seja malicioso. Salve uma cópia dos arquivos .htaccess off-line, por precaução, e exclua o arquivo .htaccess do seu site.

Remover todos os arquivos e scripts maliciosos (4 etapas)

Identificar arquivos maliciosos pode ser complicado e demorado. Leve o tempo que precisar para verificar os arquivos. Este é um bom momento para fazer backup dos arquivos do site, caso ainda não tenha feito isso. Pesquise no Google "backup de site" e o nome do CMS para encontrar instruções sobre como fazer isso.

Etapa 1

Se você usar um CMS, reinstale todos os arquivos principais (padrão) que vêm na distribuição padrão do CMS, bem como tudo o que você adicionou, como temas, módulos ou plug-ins. Isso ajuda a garantir que esses arquivos não tenham conteúdo invadido. Pesquise no Google por "reinstalação" e o nome do seu CMS para encontrar instruções de reinstalação. Se você tiver plug-ins, módulos, extensões ou temas, reinstale-os também.

Etapa 2

Os hackers geralmente modificam seu sitemap ou adicionam novos sitemaps para ajudar a indexar os URLs mais rapidamente. Se você já tinha um arquivo de sitemap, verifique se há links suspeitos nele e remova-os do sitemap. Se houver algum arquivo de sitemap que você não se lembre de ter adicionado ao seu site, verifique-o e remova-o caso ele contenha apenas URLs com spam.

Etapa 3

Procure outros arquivos maliciosos ou comprometidos. Talvez você já tenha removido todos os arquivos maliciosos nas duas etapas anteriores, mas é melhor seguir as próximas etapas caso haja mais arquivos comprometidos no seu site.

Não se preocupe achando que precisa abrir e examinar todos os arquivos PHP. Comece criando uma lista de arquivos PHP suspeitos que você quer investigar. Aqui estão algumas maneiras de determinar quais arquivos PHP são suspeitos:

  • Se você já atualizou os arquivos do CMS, verifique somente os arquivos que não fazem parte dos arquivos ou pastas padrão do CMS. Isso eliminará muitos arquivos PHP e deixará você com menos arquivos a serem examinados.
  • Classifique os arquivos do site por data da última modificação. Procure arquivos que foram modificados nos meses anteriores ao momento em que você descobriu pela primeira vez que seu site foi invadido.
  • Classifique os arquivos do site por tamanho. Procure os arquivos muito grandes.

Etapa 4

Depois de ter uma lista de arquivos PHP suspeitos, verifique se há conteúdo malicioso. Se você não estiver familiarizado com PHP, esse processo pode ser mais demorado. Por isso, recomendamos consultar a documentação sobre PHP. Se não tiver muito conhecimento sobre programação, recomendamos que você procure ajuda. Enquanto isso, existem alguns padrões básicos que você pode procurar para identificar arquivos maliciosos.

Se você usa um CMS e não tem o hábito de editar os arquivos PHP diretamente, compare os arquivos no seu servidor com uma lista dos arquivos padrão empacotados com o CMS e plug-ins e temas. Procure arquivos que não pertencem a eles e arquivos maiores que a versão padrão deles.

Examine os arquivos suspeitos que você já identificou para procurar blocos de código ofuscados. Isso pode parecer uma combinação de letras e números aparentemente confusos, geralmente precedida por uma combinação de funções PHP, como base64_decode, rot13, eval, strrev ou gzinflate. Aqui está um exemplo de como o bloco de código pode ser. Às vezes, todo esse código é empilhado em uma longa linha de texto, fazendo com que pareça menor do que realmente é.

$O_O0O_O0_0=urldecode("%6E1%7A%62%2F%6D%615%5C%76%740%6928%2D%70
%78%75%71%79%2A6%6C%72%6B%64%679%5F%65%68%63%73%77%6F4%2B%6637%6A");
$OO0_0OO0__=$O_O0O_O0_0{26}.$O_O0O_O0_0{6}.$O_O0O_O0_0{10}.$O_O0O_O0_0{30}

Verificar se o site está limpo

Ao terminar de se livrar dos arquivos hackeados, verifique se seu trabalho trabalhou duro. Lembra-se das páginas sem sentido identificadas anteriormente? Use a ferramenta Fetch as Google novamente para ver se elas ainda existem. Se a resposta do Buscar como o Google for "Não encontrado", você provavelmente está em boas condições e pode prosseguir para a correção das vulnerabilidades do seu site.

Como evitar ser invadido novamente?

A correção de vulnerabilidades é uma etapa final essencial para a correção do site. Um estudo recente descobriu que 20% dos sites invadidos são invadidos novamente dentro de um dia. É importante saber exatamente como o site foi invadido. Leia o guia Formas mais comuns de invasão de sites por criadores de spam para começar sua investigação. No entanto, se você não conseguir descobrir como seu site foi invadido, veja a seguir uma lista de verificação do que você pode fazer para reduzir as vulnerabilidades.

  • Faça uma varredura regularmente no seu computador: use um programa antivírus conhecido para verificar a presença de vírus ou vulnerabilidades.
  • Troque suas senhas regularmente:trocar regularmente as senhas de todas as contas do seu site, como o provedor de hospedagem, o FTP e o CMS, pode impedir o acesso não autorizado ao site. É importante criar uma senha forte e exclusiva para cada conta.
  • Use a autenticação de dois fatores (2FA):considere ativar a 2FA em qualquer serviço que exija login. A 2FA dificulta o login de hackers, mesmo que eles roubem sua senha.
  • Atualize o CMS, os plug-ins, as extensões e os módulos regularmente: Espero que você já tenha concluído esta etapa. Muitos sites são invadidos por executar software desatualizado. Alguns CMSs são compatíveis com a atualização automática.
  • Considere se inscrever em um serviço de segurança para monitorar seu site: Há muitos serviços excelentes que podem ajudar você no monitoramento do site por uma pequena taxa. Recomendamos que você faça registro em um deles para manter o site seguro.

Outros recursos

Se você ainda estiver com problemas para corrigir o site, há mais alguns recursos que podem ajudar.

Estas ferramentas fazem a varredura do site e podem encontrar conteúdos problemáticos. O Google não desenvolve nem oferece suporte para elas, a não ser a VirusTotal.

Essas são apenas algumas ferramentas que podem verificar seu site em busca de conteúdo problemático. Lembre-se de que esses scanners não podem garantir a identificação de todos os tipos de conteúdo problemático.

Veja outros recursos do Google que podem ajudar você: