Um guia sobre os sistemas de classificação da Pesquisa Google

O Google usa sistemas de classificação automatizados que analisam muitos fatores e indicadores de centenas de bilhões de páginas da Web e outros conteúdos no índice da Pesquisa para mostrar os resultados mais relevantes e úteis, tudo isso em uma fração de segundo.

Aprimoramos esses sistemas regularmente com testes e avaliações rigorosos e enviamos notificações sobre atualizações nos nossos sistemas de classificação quando elas são úteis para os criadores de conteúdo e outros usuários.

Esta página é um guia para entender alguns dos nossos sistemas de classificação mais importantes. Ela abrange alguns sistemas que fazem parte dos nossos principais sistemas de classificação, que são as tecnologias subjacentes que produzem resultados da pesquisa para consultas. Ela também abrange alguns sistemas envolvidos em necessidades específicas de classificação.

Acesse também nosso site sobre Como funciona a Pesquisa para entender como nossos sistemas de classificação, combinados com outros processos, trabalham juntos para que a Pesquisa Google atenda à nossa missão de organizar as informações do mundo para que sejam úteis e universalmente acessíveis.

BERT

As representações de codificadores bidirecionais de transformadores (BERT, na sigla em inglês) são um sistema de IA que o Google usa, para entender como as combinações de palavras expressam diferentes significados e intenções.

Sistemas de informação de crises

O Google desenvolveu sistemas para exibir informações úteis e oportunas em períodos de crise, sejam situações de crise pessoal, desastres naturais ou outras crises generalizadas:

  • Crise pessoal: nossos sistemas trabalham para entender quando as pessoas estão buscando informações sobre situações de crise pessoal para exibir linhas diretas e conteúdo de organizações confiáveis em determinadas consultas relacionadas a suicídio, assédio sexual, ingestão de veneno, violência de gênero ou dependência química. Saiba mais sobre como informações de crises pessoais são exibidas na Pesquisa Google.
  • Alertas de SOS: em momentos de desastres naturais ou situações de crise generalizadas, nosso sistema de Alertas de SOS mostra atualizações de autoridades locais, nacionais ou internacionais. Elas podem incluir sites e números de telefone de emergência, mapas, traduções de frases úteis, oportunidades de doação e muito mais. Saiba mais sobre como os Alertas de SOS funcionam e como eles fazem parte dos alertas de crise do Google, que ajudam em inundações, incêndios, terremotos, furacões e outros desastres.

Sistemas de eliminação de duplicação

As pesquisas no Google podem encontrar milhares ou até milhões de páginas da Web correspondentes. Algumas delas podem ser muito semelhantes. Nesses casos, nossos sistemas mostram apenas os resultados mais relevantes para evitar duplicações desnecessárias. Saiba mais sobre como funciona a eliminação de duplicação e como ver resultados omitidos, se você quiser, quando isso acontecer.

A eliminação de duplicação também acontece com os trechos em destaque. Se uma página da Web for elevada a um trecho em destaque, não a repetiremos mais tarde na primeira página de resultados. Isso organiza os resultados e ajuda as pessoas a localizar informações relevantes com mais facilidade.

Sistema de domínio de correspondência exata

Nossos sistemas de classificação consideram as palavras em nomes de domínio como um dos vários fatores para determinar se o conteúdo é relevante para uma pesquisa. No entanto, nosso sistema de domínio de correspondência exata garante que não seja dado muito crédito para conteúdo hospedado em domínios feitos para corresponder exatamente a consultas específicas. Por exemplo, alguém pode criar um nome de domínio que contenha as palavras "melhores lugares-para-almoçar" esperando que todas aquelas palavras no nome de domínio gerem uma classificação mais alta do conteúdo. Nosso sistema se ajusta a isso.

Sistemas de atualização

Temos vários sistemas de consultas que exigem atualização criados para mostrar conteúdo mais atualizado em consultas relevantes. Por exemplo, se alguém pesquisar sobre um filme que acabou de ser lançado, provavelmente quer receber avaliações recentes, e não artigos mais antigos, de quando a produção começou. Outro exemplo: geralmente uma pesquisa por "terremoto" pode mostrar materiais sobre preparação e recursos. No entanto, se um terremoto tiver ocorrido recentemente, talvez sejam exibidos artigos de notícias e conteúdo mais atualizado.

Sistema de conteúdo útil

Nosso sistema de conteúdo útil foi criado para garantir que os usuários vejam conteúdo original e útil escrito por pessoas e para pessoas nos resultados da pesquisa, em vez de conteúdo criado principalmente para gerar tráfego do mecanismo de pesquisa.

Temos vários sistemas que entendem como as páginas são vinculadas entre si para determinar o conteúdo delas e indicar quais são mais úteis para uma consulta. Dentre eles, está o PageRank, um dos nossos principais sistemas de classificação usado desde o lançamento do Google. Para saber mais, leia o artigo de pesquisa original do PageRank e a patente. A maneira como o PageRank funciona evoluiu muito desde então e continua fazendo parte dos nossos principais sistemas de classificação.

Sistemas de notícias locais

Temos sistemas que identificam e exibem fontes de notícias locais sempre que forem relevantes, como os recursos "Principais notícias" e "Notícias locais".

MUM

O modelo unificado multitarefas (MUM, na sigla em inglês) é um sistema de IA capaz de entender e gerar linguagem. No momento, ele não é usado na classificação geral da Pesquisa, apenas para algumas aplicações específicas, como melhorar pesquisas em informações sobre vacinas contra a COVID-19 e melhorar as chamadas de trechos em destaque que mostramos.

Correspondência neural

A correspondência neural é um sistema de IA que o Google usa para entender representações de conceitos em consultas e páginas e fazer a correspondência entre elas.

Sistemas de conteúdo originais

Temos sistemas que ajudam a garantir que conteúdo original apareça em destaque nos resultados da pesquisa, incluindo o relatório de originalidade, antes de páginas que apenas fazem citações. Isso inclui o suporte a uma marcação canônica especial que os criadores de conteúdo podem usar para nos ajudar a entender melhor a página principal, se ela estiver duplicada em vários lugares.

Sistemas de rebaixamento baseado em remoção

O Google tem políticas que permitem a remoção de determinados tipos de conteúdo. Se processarmos um alto volume dessas remoções envolvendo um site específico, usaremos isso como um indicador para melhorar nossos resultados. Especificamente:

  • Remoções de ordem jurídica: quando recebemos um grande volume de solicitações válidas de remoção por direitos autorais envolvendo um determinado site, podemos usar isso para rebaixar outros conteúdos do site nos nossos resultados. Dessa forma, se houver outro conteúdo com violação, é menos provável que ele seja encontrado pelas pessoas em vez do conteúdo original. Aplicamos indicadores de rebaixamento semelhantes às reclamações que envolvem difamação, produtos falsificados e remoções com mandados.
  • Remoções de informações pessoais: se processarmos um alto volume de remoções de informações pessoais que envolvam um site com práticas abusivas de remoção de conteúdo, rebaixaremos outros conteúdos do site em nossos resultados. Também observamos se o mesmo padrão de comportamento está acontecendo com outros sites e, em caso afirmativo, aplicamos rebaixamentos ao conteúdo desses sites. Podemos aplicar práticas de rebaixamento semelhantes para sites que recebem um alto volume de remoções de conteúdo por doxxing. Além disso, temos proteções automáticas criadas para impedir que imagens pessoais explícitas não consensuais tenham uma classificação alta em consultas envolvendo nomes.

Sistema de experiência na página

As pessoas preferem sites que oferecem uma ótima experiência na página. Por isso, temos um sistema de experiência na página que avalia vários critérios, como a velocidade de carregamento das páginas, a compatibilidade com dispositivos móveis, se as páginas não têm intersticiais intrusivos e se as páginas são veiculadas de forma segura. Em situações em que há muitas correspondências possíveis com relevância relativamente igual, o sistema ajuda a priorizar o conteúdo com uma experiência melhor na página.

Sistema de classificação de trecho

A classificação de trecho é um sistema de IA que usamos para identificar seções individuais ou "trechos" de uma página da Web para entender melhor a relevância dela para uma pesquisa.

Sistema de avaliações do produto

O objetivo do sistema de avaliações de produtos é melhorar a recompensa de avaliações de produtos de alta qualidade, conteúdo que oferece análises relevantes e pesquisas originais, além de ser escrito por especialistas ou entusiastas que conhecem bem o assunto.

RankBrain

O RankBrain é um sistema de IA que nos ajuda a entender como as palavras se relacionam a conceitos. Assim, podemos retornar conteúdo mais relevante mesmo que ele não tenham todas as palavras exatas usadas na pesquisa, entendendo que o conteúdo está relacionado a outras palavras e conceitos.

Sistemas de informações confiáveis

Vários sistemas funcionam de diversas maneiras para mostrar as informações mais confiáveis possíveis, ajudar a exibir mais páginas confiáveis, rebaixar conteúdo de baixa qualidade e dar destaque ao jornalismo de qualidade. Quando faltam informações confiáveis, nossos sistemas exibem automaticamente avisos de conteúdo sobre temas em constante mudança ou quando nossos sistemas não confiam muito na qualidade geral dos resultados disponíveis para a pesquisa. Eles oferecem dicas sobre como pesquisar de maneiras que podem levar a resultados mais úteis. Saiba mais sobre nossa abordagem para fornecer informações de alta qualidade na Pesquisa.

Sistema de diversidade de sites

Nosso sistema de diversidade de sites funciona para que, geralmente, não sejam mostradas mais de duas páginas da Web do mesmo site nos nossos resultados principais, de modo que nenhum site domine todos os principais resultados. No entanto, é possível que mais de duas páginas sejam exibidas quando nossos sistemas determinam que é especialmente relevante para uma pesquisa específica. A diversidade de sites geralmente trata subdomínios como parte de um domínio raiz. Por exemplo, as páginas de um subdomínio (subdomain.example.com) e domínio raiz (example.com) serão consideradas do mesmo site. No entanto, às vezes os subdomínios são tratados como sites separados por motivos de diversidade, quando considerados relevantes para isso.

Sistemas de detecção de spam

Ninguém quer uma caixa de entrada cheia de spam, por isso os filtros de spam são tão úteis. A Pesquisa enfrenta um desafio semelhante, porque a Internet inclui uma grande quantidade de spam que, se não tratada, impede a exibição dos resultados mais úteis e relevantes. Usamos uma variedade de sistemas de detecção de spam, incluindo o SpamBrain, para lidar com conteúdos e comportamentos que violam as políticas de spam. Esses sistemas são atualizados constantemente para acompanhar a evolução das ameaças de spam.

Sistemas desativados

Os sistemas abaixo são incluídos para fins históricos. Eles foram incorporados a sistemas sucessores ou fizeram parte dos nossos principais sistemas de classificação.

Hummingbird

Essa foi uma grande melhoria em nossos sistemas gerais de classificação, feita em agosto de 2013. Nossos sistemas de classificação continuaram evoluindo desde então, assim como antes.

Sistema de classificação de compatibilidade com dispositivos móveis

Quando há muitas correspondências possíveis com relevância relativamente igual, o sistema de classificação de compatibilidade com dispositivos móveis dá preferência ao conteúdo que é melhor renderizado em dispositivos móveis, já que o conteúdo compatível com dispositivos móveis é mais útil para as pessoas que pesquisam nesses dispositivos. Desde então, o sistema foi incorporado ao nosso sistema de experiência na página.

Sistema de velocidade da página

Esse sistema, anunciado em 2018 originalmente como "atualização de velocidade", fazia com que, quando tudo era igual, o conteúdo que carregava mais rápido para usuários de dispositivos móveis tivesse um desempenho melhor nos resultados da pesquisa para esses dispositivos. Desde então, ele passou a fazer parte do nosso sistema de experiência na página.

Sistema Panda

Esse sistema foi criado para garantir a exibição de conteúdo original e de alta qualidade nos nossos resultados da pesquisa. Anunciado em 2011 com o apelido de "Panda", ele evoluiu e se tornou parte dos nossos principais sistemas de classificação em 2015.

Sistema Penguin

Esse sistema foi criado para combater o spam por links. Anunciado em 2012 com o apelido de "Atualização Penguin", ele foi integrado aos nossos principais sistemas de classificação em 2016.

Sistema de sites seguros

Esse sistema, anunciado em 2014, fazia com que, quando tudo era igual, os sites protegidos por HTTPS tivessem um desempenho melhor nos nossos sistemas de classificação. Ele ajudou a incentivar o crescimento de sites seguros quando o uso de HTTPS ainda era incomum. Desde então, ele passou a fazer parte do nosso sistema de experiência na página.