Referência da API XML

Esta página se refere à versão XML da API Custom Search JSON, que está disponível apenas para clientes do Google Site Search.

  1. Visão geral
  2. Formato de solicitação do Mecanismo de Pesquisa Programável
    1. Visão geral da solicitação
    2. Termos de consulta
    3. Parâmetros da solicitação
      1. Exemplos de consultas do WebSearch
      2. Definições de parâmetro de consulta do WebSearch
      3. Pesquisa avançada
      4. Parâmetros de consulta de pesquisa avançados
      5. Termos de consulta especiais
      6. Exemplos de consultas de imagens
      7. Parâmetros de consulta da pesquisa de imagens
      8. Limites de solicitação
    4. Internacionalização da apresentação de consultas e resultados (em inglês)
      1. Codificação de caracteres
      2. Idiomas de interface
      3. Pesquisa em chinês simplificado e tradicional
    5. Como filtrar resultados
      1. Filtragem automática de resultados da pesquisa
      2. Filtragem de idioma e país
      3. Filtrar conteúdo adulto com o SafeSearch
  3. Resultados em XML
    1. DTD de resultados de XML do Google
    2. Sobre a resposta XML
    3. Resultados em XML para consultas de pesquisa comuns, avançadas e de imagem
      1. Pesquisa normal/avançada: exemplo de consulta e resultado em XML
      2. Pesquisa normal/avançada: tags XML
      3. Resultados em XML para consultas de pesquisa de imagens
      4. Pesquisa de imagens: exemplo de consulta e resultado de XML
      5. Pesquisa de imagens: tags XML

Visão geral

O serviço Google WebSearch permite que os clientes do Google Site Search exibam os resultados da pesquisa do Google nos próprios sites. O serviço WebSearch usa um protocolo baseado em HTTP simples para exibir os resultados da pesquisa. Os administradores da pesquisa têm controle total sobre a forma como solicitam resultados da pesquisa e como apresentam esses resultados ao usuário final. Este documento descreve os detalhes técnicos dos formatos de solicitação de pesquisa do Google e de resultados.

Para recuperar resultados da Pesquisa Google na Web, seu aplicativo envia ao Google uma solicitação HTTP simples. Depois, o Google retornará os resultados da pesquisa no formato XML. Os resultados formatados em XML permitem personalizar a exibição dos resultados da pesquisa.

Formato da solicitação do WebSearch

Visão geral da solicitação

A solicitação da Pesquisa Google é um comando HTTP GET padrão. Ele inclui um conjunto de parâmetros relevantes para suas consultas. Esses parâmetros estão incluídos no URL da solicitação como pares de nome=valor separados por caracteres de "e" comercial (&). Os parâmetros incluem dados como a consulta de pesquisa e um ID exclusivo do mecanismo (cx) que identifica o mecanismo que está fazendo a solicitação HTTP. O serviço WebSearch ou Image Search retorna resultados em XML em resposta às suas solicitações HTTP.

Termos de consulta

A maioria das solicitações de pesquisa inclui um ou mais termos de consulta. Um termo de consulta aparece como o valor de um parâmetro na solicitação de pesquisa.

Os termos de consulta podem especificar vários tipos de informações para filtrar e organizar os resultados da pesquisa retornados pelo Google. As consultas podem especificar:

  • Palavras ou frases que serão incluídas ou excluídas
    • Todas as palavras em uma consulta de pesquisa (padrão)
    • Uma frase exata na consulta de pesquisa
    • Qualquer palavra ou frase de uma consulta de pesquisa
  • Onde no documento para procurar os termos de pesquisa
    • Em qualquer parte do documento (padrão)
    • Apenas no corpo do documento
    • Somente no título do documento
    • Somente no URL do documento
    • Somente em links no documento
  • Restrições aos próprios documentos
    • Incluir ou excluir documentos de determinados tipos de arquivo, como PDF ou documentos do Word
  • Consultas de URL especiais que retornam informações sobre um determinado URL, em vez de fazer uma pesquisa
    • Consultas que retornam informações gerais sobre um URL, como a categoria, o snippet ou o idioma do Open Directory
    • Consultas que retornam o conjunto de páginas da Web vinculadas a um URL
    • Consultas que retornam um conjunto de páginas da Web semelhantes a um determinado URL

Pesquisa padrão

Os valores de parâmetro da consulta de pesquisa devem ter escape de URL. É necessário substituir o sinal de adição ("+") por qualquer sequência de espaços em branco na consulta de pesquisa. Isso é discutido em mais detalhes na seção Uso de escape de URL deste documento.

O termo de consulta de pesquisa é enviado ao serviço WebSearch usando o parâmetro q. Um exemplo de termo de consulta de pesquisa é:

q=horses+cows+pigs

Por padrão, o serviço do Google WebSearch retorna apenas documentos que incluem todos os termos da consulta de pesquisa.

Parâmetros de solicitação

Nesta seção, listamos os parâmetros que podem ser usados ao fazer uma solicitação de pesquisa. Os parâmetros são divididos em duas listas. A primeira lista contém parâmetros relevantes para todas as solicitações de pesquisa. A segunda lista contém parâmetros que são relevantes apenas para solicitações de pesquisa avançada.

Três parâmetros de solicitação são obrigatórios:

  • O parâmetro client precisa ser definido como google-csbe.
  • O parâmetro output especifica o formato dos resultados XML retornados. Os resultados podem ser retornados com (xml) ou sem (xml_no_dtd) uma referência ao DTD do Google. Recomendamos definir esse valor como xml_no_dtd. Observação:se você não especificar esse parâmetro, os resultados serão retornados em HTML em vez de XML.
  • O parâmetro cx, que representa o ID exclusivo do mecanismo.

Além dos parâmetros de solicitação mencionados acima, os parâmetros de solicitação mais usados são os seguintes:

  • num: o número solicitado de resultados da pesquisa
  • q: os termos de pesquisa
  • start: o índice inicial dos resultados

Exemplos de consultas do WebSearch

Os exemplos abaixo mostram algumas solicitações HTTP do WebSearch para ilustrar como parâmetros de consulta diferentes são usados. As definições dos diferentes parâmetros de consulta são fornecidas nas seções Definições de parâmetros de consulta do WebSearch e Parâmetros de consulta de pesquisa avançados deste documento.

Essa solicitação solicita os 10 primeiros resultados (start=0&num=10) para o termo de consulta "red sox" (q=red+sox). A consulta também especifica que os resultados devem vir de sites do Canadá (cr=countryCA) e ser escritos em francês (lr=lang_fr). Por fim, a consulta especifica valores para os parâmetros client, output e cx, que são obrigatórios.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Este exemplo usa alguns dos parâmetros de consulta de pesquisa avançada para personalizar ainda mais a consulta de pesquisa. Essa solicitação usa o parâmetro as_q (as_q=red+sox) em vez do parâmetro q. Ele também usa o parâmetro as_eq para excluir todos os documentos que contenham a palavra "Yankees" dos resultados da pesquisa (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Definições de parâmetro de consulta do WebSearch

c2coff
Descrição

Opcional: O parâmetro c2coff ativa ou desativa o recurso Pesquisa em chinês tradicional e simplificado.

O valor padrão desse parâmetro é 0 (zero), o que significa que o recurso está ativado. Os valores do parâmetro c2coff são:

Valor Ação
1 Desativado
0 Ativado
Exemplos q=google&c2coff=1

cliente
Descrição

Obrigatório. O parâmetro client precisa ser definido como google-csbe.

Exemplos q=google&client=google-csbe

cr
Descrição

Opcional: O parâmetro cr restringe os resultados da pesquisa a documentos originados em um determinado país. É possível usar operadores booleanos no valor do parâmetro cr.

O Google WebSearch determina o país de um documento analisando o seguinte:

  • o domínio de nível superior (TLD) do URL do documento
  • a localização geográfica do endereço IP do servidor da Web

Consulte a seção Valores de parâmetro de país (cr) para ver uma lista de valores válidos para esse parâmetro.

Exemplos q=Frodo&cr=countryNZ

cx
Descrição

Obrigatório. O parâmetro cx especifica um código exclusivo que identifica um mecanismo de pesquisa personalizado. É necessário especificar um Mecanismo de Pesquisa Programável usando o parâmetro cx para extrair os resultados da pesquisa desse mecanismo.

Para encontrar o valor do parâmetro cx, acesse "Painel de controle > guia "Códigos" do mecanismo. Ele estará na área de texto em "Cole este código na página em que você quer exibir a caixa de pesquisa". Os resultados da pesquisa serão exibidos em uma página hospedada no Google.

Exemplos q=Frodo&cx=00255077836266642015:u-scht7a-8i

Função filter
Descrição

Opcional: O parâmetro filter ativa ou desativa a filtragem automática dos resultados da pesquisa do Google. Consulte a seção Filtragem automática deste documento para saber mais sobre os filtros de resultados da pesquisa do Google.

O valor padrão para o parâmetro filter é 1, o que indica que o recurso está ativado. Estes são os valores válidos para esse parâmetro:

Valor Ação
1 Desativado
0 Ativado

Observação:por padrão, o Google aplica filtros a todos os resultados da pesquisa para melhorar a qualidade deles.

Exemplos q=google&filter=0

gl
Descrição

Opcional: O valor do parâmetro gl é um código do país de duas letras. Para resultados do WebSearch, o parâmetro gl impulsiona os resultados da pesquisa cujo país de origem corresponde ao valor do parâmetro. Consulte a seção Códigos de país para ver uma lista de valores válidos.

A especificação de um valor de parâmetro gl nas solicitações do WebSearch melhora a relevância dos resultados. Isso é válido principalmente para clientes internacionais e, de maneira ainda mais específica, com clientes em países de idioma que não sejam os Estados Unidos.

Exemplos

Esta solicitação impulsiona documentos escritos no Reino Unido nos resultados do WebSearch:
q=pizza&gl=uk


hl
Descrição

Opcional: O parâmetro hl especifica o idioma da interface (idioma do host) da sua interface do usuário. Para melhorar o desempenho e a qualidade dos resultados da pesquisa, recomendamos que você defina esse parâmetro explicitamente.

Consulte a seção Idiomas de interface de Internacionalização de consultas e apresentação de resultados para mais informações e os Idiomas de interface compatíveis para uma lista dos idiomas aceitos.

Exemplos

Esta solicitação segmenta anúncios de vinho em francês. Vin é o termo francês para vinho.

q=vin&ip=10.10.10.10&ad=w5&hl=fr

hq
Descrição

Opcional: O parâmetro hq anexa os termos de consulta especificados à consulta, como se eles fossem combinados com um operador lógico AND.

Exemplos

Essa solicitação procura por "pizza" E "queijo". A expressão é igual a q=pizza+cheese.

q=pizza&hq=cheese


ie
Descrição

Opcional: O parâmetro ie define o esquema de codificação de caracteres que precisa ser usado para interpretar a string de consulta. O valor padrão de ie é latin1.

Consulte a seção Codificação de caracteres para uma discussão sobre quando pode ser necessário usar esse parâmetro.

Consulte a seção Esquemas de codificação de caracteres para ver a lista de possíveis valores ie.

Exemplos q=google&ie=utf8&oe=utf8
lr
Descrição

Opcional: O parâmetro lr (restrição de idioma) restringe os resultados da pesquisa a documentos escritos em um idioma específico.

O Google WebSearch determina o idioma de um documento analisando o seguinte:

  • o domínio de nível superior (TLD) do URL do documento
  • metatags de idioma no documento
  • o idioma principal usado no corpo do documento
  • idiomas secundários, se houver, usados no corpo do documento

Consulte a seção Valores de conjuntos de idiomas (lr) para ver uma lista de valores válidos para esse parâmetro.

Exemplos q=Frodo&lr=lang_en

num
Descrição

Opcional: O parâmetro num identifica o número de resultados da pesquisa a serem retornados.

O valor padrão de num é 10, e o valor máximo é 20. Se você solicitar mais de 20 resultados, apenas 20 serão retornados.

Observação:se o número total de resultados da pesquisa for menor que o número solicitado, todos os resultados da pesquisa disponíveis serão retornados.

Exemplos q=google&num=10

oe
Descrição

Opcional: O parâmetro oe define o esquema de codificação de caracteres que precisa ser usado para decodificar o resultado XML. O valor padrão de oe é latin1.

Consulte a seção Codificação de caracteres para uma discussão sobre quando pode ser necessário usar esse parâmetro.

Consulte a seção Esquemas de codificação de caracteres para ver a lista de possíveis valores oe.

Exemplos q=google&ie=utf8&oe=utf8

saída
Descrição

Obrigatório. O parâmetro output especifica o formato dos resultados XML. Os únicos valores válidos para esse parâmetro são xml e xml_no_dtd. A tabela abaixo explica as diferenças entre esses valores de parâmetro.

Valor Formato da saída
xml_no_dtd Os resultados XML não incluirão uma instrução !DOCTYPE. (Recomendado)
xml Os resultados XML contêm uma referência de DTD do Google. A segunda linha do resultado identificará o tipo de definição de documento (DTD) que os resultados usam:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Exemplos output=xml_no_dtd
output=xml

q
Descrição

Opcional: O parâmetro q especifica a consulta de pesquisa inserida pelo usuário. Embora esse parâmetro seja opcional, você precisa especificar um valor para pelo menos um dos parâmetros de consulta (as_epq, as_lq, as_oq, as_q) para receber os resultados da pesquisa.

Há também uma série de termos de consulta especiais que podem ser usados como parte do valor do parâmetro q. Consulte Termos de consulta especiais para ver uma lista e as definições desses termos.

O painel de controle da Pesquisa Google inclui um relatório das principais consultas enviadas usando o parâmetro q.

Observação: o valor especificado para o parâmetro q precisa de escape para URL.

Exemplos q=vacation&as_oq=london+paris

seguro
Descrição

Opcional: O parâmetro safe indica como os resultados da pesquisa precisam ser filtrados para incluir conteúdo adulto e pornográfico. O valor padrão para o parâmetro safe é off. Estes são os valores de parâmetro válidos:

Valor Ação
off Desativar o SafeSearch
medium Ativar o SafeSearch
high Ativar uma versão mais rigorosa do SafeSearch

Consulte a seção Filtrar conteúdo adulto com o SafeSearch para saber mais sobre esse recurso.

Exemplos q=adult&safe=high

start
Descrição

Opcional: O parâmetro start indica o primeiro resultado correspondente que precisa ser incluído nos resultados da pesquisa. O parâmetro start usa um índice baseado em zero, o que significa que o primeiro resultado é 0, o segundo resultado é 1 e assim por diante.

O parâmetro start funciona em conjunto com o parâmetro num para determinar quais resultados da pesquisa retornar. Não serão retornados mais de 1.000 resultados para uma consulta, mesmo que mais de 1.000 documentos correspondam a ela. Portanto, definir um início como 1.000 ou mais não produzirá resultados.

Exemplos start=10

sort
Descrição

Opcional: O parâmetro sort especifica que os resultados sejam classificados de acordo com a expressão especificada. Por exemplo, classificar por data.

Exemplos

sort=date


UD
Descrição

Opcional: O parâmetro ud indica se a resposta XML precisa incluir o URL codificado por IDN do resultado da pesquisa. A codificação de nome de domínio internacional (IDN, na sigla em inglês) permite que os domínios sejam exibidos usando idiomas locais, por exemplo:

http://www.花井鮨.com

Os valores válidos para esse parâmetro são 1 (padrão), o que significa que o resultado XML precisa incluir URLs codificados por IDN, e 0, ou seja, o resultado XML não pode incluir URLs codificados por IDN. Se o parâmetro ud for definido como 1, o URL codificado por IDN vai aparecer na tag UD nos resultados XML.

Se o parâmetro ud for definido como 0, o URL no exemplo acima será exibido como:

http://www.xn--elq438j.com.

Observação:este é um recurso Beta.

Exemplos q=google&ud=1

Os parâmetros de consulta adicionais listados abaixo da imagem são relevantes para consultas de pesquisa avançadas. Quando você envia uma pesquisa avançada, os valores de vários parâmetros (por exemplo, as_eq, as_epq, as_oq etc.) são fatorados nos termos de consulta da pesquisa. A imagem mostra a página de pesquisa avançada do Google. Na imagem, o nome de cada parâmetro de pesquisa avançada é escrito em texto red dentro ou ao lado do campo na página a que esse parâmetro corresponde.



Parâmetros de consulta de pesquisa avançada

as_dt
Descrição

Opcional: O parâmetro as_dt controla a inclusão ou exclusão dos resultados do site nomeado no parâmetro as_sitesearch. Os valores i e e indicam inclusão e exclusão, respectivamente.

Exemplos as_dt=i,as_dt=e

as_epq
Descrição

Opcional: O parâmetro as_epq identifica uma frase que todos os documentos nos resultados da pesquisa precisam conter. Também é possível usar o termo de consulta pesquisa de frase para procurar uma frase.

Exemplos as_epq=abraham+lincoln

as_eq
Descrição

Opcional: O parâmetro as_eq identifica uma palavra ou frase que não deve aparecer nos documentos nos resultados da pesquisa. Também é possível usar o termo de consulta excluir para garantir que uma palavra ou frase específica não apareça nos documentos em um conjunto de resultados da pesquisa.

Exemplos

q=bass&as_eq=music.


as_lq
Descrição

Opcional: O parâmetro as_lq especifica que todos os resultados da pesquisa precisam conter um link para um URL específico. Também é possível usar o termo de consulta link: para esse tipo de consulta.

Exemplos

as_lq=www.google.com


as_nlo
Descrição

Opcional: O parâmetro as_nlo especifica o valor inicial de um intervalo de pesquisa. Use as_nlo e as_nhi para anexar um intervalo de pesquisa inclusivo de as_nlo...as_nhi à consulta.

Exemplos

A fórmula a seguir define um intervalo de pesquisa de 5 a 10, inclusivo:

as_nlo=5&as_nhi=10

as_nhi
Descrição

Opcional: O parâmetro as_nhi especifica o valor final de um intervalo de pesquisa. Use as_nlo e as_nhi para anexar um intervalo de pesquisa inclusivo de as_nlo...as_nhi à consulta.

Exemplos

A fórmula a seguir define um intervalo de pesquisa de 5 a 10, inclusivo:

as_nlo=5&as_nhi=10

as_oq
Descrição

Opcional: O parâmetro as_oq fornece outros termos de pesquisa a serem verificados em um documento, em que cada documento nos resultados da pesquisa precisa conter pelo menos um dos outros termos de pesquisa. Você também pode usar o termo de consulta OU booleano para esse tipo de consulta.

Exemplos

q=vacation&as_oq=London+Paris


as_q
Descrição

Opcional: O parâmetro as_q fornece termos de pesquisa a serem verificados em um documento. Esse parâmetro também é muito usado para permitir que os usuários especifiquem outros termos a serem pesquisados em um conjunto de resultados da pesquisa.

Exemplos

q=president&as_q=John+Adams


as_qdr
Descrição

Opcional: O parâmetro as_qdr solicita resultados da pesquisa de um período específico (período rápido). Os valores a seguir são compatíveis:

d[number] solicita resultados do número especificado de dias anteriores.
w[number] solicita resultados do número especificado de semanas anteriores.
m[number] solicitações são resultados do número especificado de meses anteriores.
y[number] solicitações são resultados do número especificado de anos anteriores.

Exemplos

Este exemplo solicita resultados do ano passado:

as_qdr=y

Este exemplo solicita resultados dos últimos 10 dias:

as_qdr=d10

as_sitesearch
Descrição

Opcional: O parâmetro as_sitesearch permite especificar que todos os resultados da pesquisa precisam ser páginas de um determinado site. Ao definir o parâmetro as_dt, você também pode usá-lo para excluir páginas de um determinado site dos seus resultados de pesquisa.

Exemplos

q=vacation&as_sitesearch=www.google.com


Termos de consulta especiais

O Google WebSearch permite o uso de vários termos de consulta especiais que acessam recursos adicionais do mecanismo de pesquisa do Google. Esses termos de consulta especiais precisam ser incluídos no valor do parâmetro de solicitação q. Como outros termos de consulta, os termos da consulta especial precisam ter escape de URL. Um número dos termos de consulta especiais contém dois-pontos (:). Esse caractere também precisa ter escape de URL. O valor de escape de URL é %3A.

Links de retorno [link:]
Descrição

O termo de consulta link: recupera o conjunto de páginas da Web vinculadas a um URL específico. A consulta de pesquisa precisa ser formatada como link:URL, sem espaço entre o termo de consulta link: e o URL.

A versão com escape de URL de link: é link%3A.

Também é possível usar o parâmetro de solicitação as_lq para enviar uma solicitação link:.

Observação: não é possível especificar outros termos de consulta ao usar link:.

Exemplos

http://www.google.com/search?q=link%3Awww.example.com


Booleano OR Pesquisa [ OR ]
Descrição

O termo de consulta OR recupera documentos que incluem um de uma série de (dois ou mais) termos de consulta. Para usar o termo de consulta OR, insira o termo de pesquisa OR, em letras maiúsculas, entre cada termo da série.

Você também pode usar o parâmetro de solicitação as_oq para enviar uma pesquisa por qualquer termo em um conjunto de termos.

Observação:se uma solicitação de pesquisa especificar a consulta "Londres+OR+Paris", os resultados da pesquisa incluirão documentos que contenham pelo menos uma dessas duas palavras. Em alguns casos, os documentos nos resultados da pesquisa podem conter as duas palavras.

Exemplos

Pesquisar Londres ou Paris:

Entrada do usuário:london OR paris Termo de consulta:q=london+OR+paris

Pesquise férias e Londres ou Paris:

Termo de consulta:q=vacation+london+OR+paris

Pesquise férias e outra cidade de Londres, Paris ou chocolates:

Termo de consulta:  q=vacation+london+OR+paris+OR+chocolates

Pesquise férias e chocolates e Londres ou Paris, com o menor peso dado aos chocolates:

Termo de consulta:  q=vacation+london+OR+paris+chocolates

Pesquise férias, chocolates e flores em documentos que também contenham Londres ou Paris:

Termo de consulta:  q=vacation+london+OR+paris+chocolates+flowers

Pesquise férias e Londres ou Paris e também pesquise chocolates ou flores:

Termo de consulta:  q=vacation+london+OR+paris+chocolates+OR+flowers

Excluir termo de consulta [-]
Descrição

O termo de consulta de exclusão (-) restringe os resultados de uma solicitação de pesquisa específica a documentos que não contêm uma palavra ou frase específica. Para usar o termo de consulta de exclusão, use "-" (um sinal de menos) antes da palavra ou frase a ser excluída dos documentos correspondentes.

A versão com escape de URL de - é %2D.

O termo de consulta de exclusão é útil quando um termo de pesquisa tem mais de um significado. Por exemplo, a palavra "baixo" pode retornar resultados sobre peixes ou música. Se você estiver procurando documentos sobre peixes, poderá excluir documentos sobre música dos resultados da pesquisa usando o termo de consulta de exclusão.

Também é possível usar o parâmetro de solicitação as_eq para excluir dos resultados da pesquisa documentos que correspondam a uma palavra ou frase específica.

Exemplos Entrada do usuário: bass -music
Termo de consulta: q=bass+%2Dmusic

Exclusão do tipo de arquivo [ -filetype: ]
Descrição

O termo de consulta -filetype: exclui dos resultados da pesquisa os documentos com uma extensão de arquivo específica, como ".pdf" ou ".doc. A consulta de pesquisa precisa ser formatada como -filetype:EXTENSION, sem espaço entre o termo de consulta -filetype: e a extensão especificada.

A versão com escape de URL de -filetype: é %2Dfiletype%3A.

Observação:é possível excluir vários tipos de arquivo dos resultados da pesquisa adicionando mais termos de consulta -filetype: à consulta. Você precisa ter um termo de consulta -filetype: na consulta de pesquisa para cada extensão de arquivo a ser excluída dos resultados da pesquisa.

Os tipos de arquivo aceitos pelo Google incluem:

  • Formato de documento portátil da Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (semana 1, s2, sem.3, sem.4, sem.5, wki, semanas, wku)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (documento)
  • Microsoft Works (semanas, wps, wdb)
  • Microsoft Write (gravação)
  • Rich Text Format (rtf)
  • Shockwave Flash (swf)
  • Texto (ans, txt).

Outros tipos de arquivo podem ser adicionados no futuro. É possível encontrar uma lista atualizada nas perguntas frequentes sobre tipos de arquivos do Google.

Exemplos

Este exemplo retorna documentos que mencionam "Google", mas que não são PDF:
q=Google+%2Dfiletype%3Apdf

Este exemplo retorna documentos que mencionam "Google", mas exclui documentos PDF e do Word:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Filtragem por tipo de arquivo [ filetype: ]
Descrição

O termo de consulta filetype: restringe os resultados da pesquisa a documentos com uma extensão de arquivo específica, como ".pdf" ou ".doc". A consulta de pesquisa deve ser formatada como filetype:EXTENSION sem espaço entre o termo de consulta filetype: e a extensão especificada.

A versão com escape de URL de filetype: é filetype%3A.

É possível restringir os resultados da pesquisa a documentos que correspondam a uma das várias extensões de arquivo adicionando mais termos de consulta filetype: à consulta. Você precisa ter um termo de consulta filetype: na consulta de pesquisa para cada extensão de arquivo a ser incluída nos resultados da pesquisa. Vários termos de consulta filetype: precisam ser separados usando o termo OR.

Por padrão, os resultados da pesquisa incluem documentos com qualquer extensão de arquivo.

Os tipos de arquivo aceitos pelo Google incluem:

  • Formato de documento portátil da Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (semana 1, s2, sem.3, sem.4, sem.5, wki, semanas, wku)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (documento)
  • Microsoft Works (semanas, wps, wdb)
  • Microsoft Write (gravação)
  • Rich Text Format (rtf)
  • Shockwave Flash (swf)
  • Texto (ans, txt).

Outros tipos de arquivo podem ser adicionados no futuro. É possível encontrar uma lista atualizada nas perguntas frequentes sobre tipos de arquivos do Google.

Exemplos

Este exemplo retorna documentos PDF que mencionam "Google":
q=Google+filetype%3Apdf

Este exemplo retorna documentos PDF e Word que mencionam "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


Incluir termo da consulta [+]
Descrição

O termo de consulta include (+) especifica que uma palavra ou frase precisa ocorrer em todos os documentos incluídos nos resultados da pesquisa. Para usar o termo de consulta de inclusão, inclua a palavra ou frase que precisa ser incluída em todos os resultados da pesquisa usando "+" (um sinal de mais).

A versão com escape de URL de + (um sinal de mais) é %2B.

Use + antes de uma palavra comum que o Google normalmente descarta antes de identificar os resultados da pesquisa.

Exemplos Entrada do usuário: Star Wars Episode +I
Termo de consulta: q=Star+Wars+Episode+%2BI

Pesquisa apenas para links, todos os termos [ allinlinks: ]
Descrição

O termo de consulta allinlinks: exige que os documentos nos resultados da pesquisa contenham todas as palavras da consulta em links de URL. A consulta de pesquisa precisa ser formatada como allinlinks: seguido pelas palavras da consulta.

Se a consulta de pesquisa incluir o termo de consulta allinlinks:, o Google verificará apenas os links de URL nos documentos quanto às palavras na consulta, ignorando outros textos nos documentos, os títulos e os URLs de cada documento. O URL do documento é diferente dos links de URL contidos no documento.

A versão com escape de URL de allinlinks: é allinlinks%3A.

Exemplos Entrada do usuário:allinlinks: Google search
Termo de consulta:q=allinlinks%3A+Google+search

Pesquisa de frases
Descrição

O termo de consulta de pesquisa por frase (") permite pesquisar frases completas colocando as frases entre aspas ou conectando-as com hifens.

A versão com escape de URL de " (aspas) é %22.

As pesquisas de frase são particularmente úteis quando você está procurando citações famosas ou nomes próprios.

Você também pode usar o parâmetro de solicitação as_epq para enviar uma pesquisa de frase.

Exemplos Entrada do usuário:"Abraham Lincoln"
Termo de consulta: q=%22Abraham+Lincoln%22

Pesquisa apenas com texto, todos os termos [allintext:]
Descrição

O termo de consulta allintext: exige que cada documento nos resultados da pesquisa contenha todas as palavras da consulta de pesquisa no corpo do documento. A consulta precisa ser formatada como allintext: seguido pelas palavras da consulta de pesquisa.

Se a consulta de pesquisa incluir o termo de consulta allintext:, o Google vai verificar apenas o texto do corpo dos documentos para as palavras na consulta, ignorando os links nesses documentos, títulos de documentos e URLs de documentos.

A versão com escape de URL de allintext: é allintext%3A.

Exemplos Este exemplo especifica que as palavras "Google" e "pesquisa" precisam aparecer no corpo de todos os documentos incluídos nos resultados da pesquisa:
Entrada do usuário:allintext:Google search
Termo de consulta:q=allintext%3AGoogle+search

Pesquisa de título, termo único [intitle:]
Descrição

O termo de consulta intitle: restringe os resultados da pesquisa a documentos que contenham uma palavra específica no título. A consulta de pesquisa precisa ser formatada como intitle:word sem espaço entre o termo de consulta intitle: e a palavra seguinte.

Observação:para especificar mais de uma palavra a ser incluída no título do documento, coloque o termo de consulta intitle: na frente de cada palavra. Também é possível usar o termo de consulta allintitle: para especificar que todas as palavras de consulta precisam ser incluídas nos títulos dos documentos que estão nos resultados da pesquisa.

A versão com escape de URL de intitle: é intitle%3A.

Exemplos

Este exemplo especifica que a palavra "Google" precisa aparecer nos títulos de qualquer documento nos resultados da pesquisa, e a palavra "pesquisa" precisa aparecer em qualquer parte dos títulos, URLs, links ou texto do corpo desses documentos:
Entrada do usuário:intitle:Google search
Termo de consulta:q=intitle%3AGoogle+search


Pesquisa de título, todos os termos [allintitle:]
Descrição

O termo de consulta allintitle: restringe os resultados da pesquisa a documentos que contenham todas as palavras de consulta no título do documento. Para usar o termo de consulta allintitle:, inclua "allintitle:" no início da consulta de pesquisa.

Observação:inserir allintitle: no início de uma consulta de pesquisa é equivalente a colocar intitle: na frente de cada palavra da consulta.

A versão com escape de URL de allintitle: é allintitle%3A.

Exemplos

Este exemplo especifica que as palavras "Google" e "pesquisa" precisam aparecer nos títulos de qualquer documento nos resultados da pesquisa:
Entrada do usuário: allintitle: Google search
Termo de consulta: q=allintitle%3A+Google+search


Pesquisa de URL, termo único [inurl:]
Descrição

O termo de consulta inurl: restringe os resultados da pesquisa a documentos que contenham uma palavra específica no URL do documento. A consulta de pesquisa precisa ser formatada como inurl:word sem espaço entre o termo de consulta inurl: e a palavra seguinte.

O termo de consulta inurl: ignora a pontuação e usa apenas a primeira palavra após o operador inurl:. Para especificar mais de uma palavra que precisa ser incluída no URL do documento, coloque o termo de consulta inurl: na frente de cada palavra. Também é possível usar o termo de consulta allinurl: para especificar que todas as palavras de consulta precisam ser incluídas nos URLs de documentos que estão nos resultados da pesquisa.

A versão com escape de URL de inurl: é inurl%3A.

Exemplos

Este exemplo especifica que a palavra "Google" precisa aparecer nos URLs de qualquer documento nos resultados da pesquisa, e a palavra "pesquisa" precisa aparecer em qualquer parte dos títulos, URLs, links ou texto do corpo desses documentos:
Entrada do usuário: inurl:Google search
Termo de consulta: q=inurl%3AGoogle+search


Pesquisa de URL, todos os termos [allinurl:]
Descrição

O termo de consulta allinurl: restringe os resultados da pesquisa a documentos que contenham todas as palavras da consulta no URL do documento. Para usar o termo de consulta allinurl:, inclua allinurl: no início da consulta de pesquisa.

O termo de consulta allinurl: ignora a pontuação. Portanto, ele funciona apenas em palavras, não em componentes de URL. Por exemplo, allinurl: uk/scotland restringirá os resultados a documentos que contenham as palavras "uk" e "scotland" nos URLs, mas não exigirá que essas duas palavras apareçam em qualquer ordem específica ou que sejam separadas por uma barra.

A versão com escape de URL de allinurl: é allinurl%3A.

Exemplos

Este exemplo especifica que as palavras "Google" e "pesquisa" precisam aparecer nos URLs de qualquer documento nos resultados da pesquisa:
Entrada do usuário: allinurl: Google search
Termo de consulta: q=allinurl%3A+Google+search



Informações do documento da Web [info:]
Descrição

O termo de consulta info: recupera informações gerais sobre um URL, desde que esse URL esteja incluído no índice de pesquisa do Google. A consulta de pesquisa precisa ser formatada como info:URL, sem espaço entre o termo de consulta info: e o URL.

A versão com escape de URL de info: é info%3A.

Observação: não é possível especificar outros termos de consulta ao usar info:.

Exemplos Entrada do usuário: info:www.google.com
Termo de consulta: q=info%3Awww.google.com

Consultas de imagem de exemplo

Os exemplos abaixo mostram algumas solicitações HTTP de imagem para ilustrar como parâmetros de consulta diferentes são usados. As definições dos diferentes parâmetros de consulta são fornecidas nas seções "Definições de parâmetros de consulta de imagens" deste documento.

Esta solicitação solicita os cinco primeiros resultados (start=0&num=5) para o termo de consulta "macaco" (q=monkey) do tipo de arquivo .png. Por fim, a consulta especifica valores para os parâmetros client, output e cx, que são obrigatórios.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Parâmetros de consulta da pesquisa de imagens

as_filetype
Descrição

Opcional: Retorna imagens de um tipo especificado. Os valores permitidos são: bmp, gif, png, jpg e svg.

Exemplos q=google&as_filetype=png

imgsz
Descrição

Opcional: Retorna imagens de um tamanho especificado, em que o tamanho pode ser:

  • icon (pequena)
  • small|medium|large|xlarge (médio)
  • xxlarge (grande)
  • huge (extra grande)

Exemplos q=google&as_filetype=png&imgsz=icon

Tipo de img
Descrição

Opcional: Retorna imagens de um tipo, que pode ser:

  • clipart (clipart)
  • face (rosto)
  • lineart (linear)
  • news (notícias)
  • photo (foto)

Exemplos q=google&as_filetype=png&imgtype=photo

imgc
Descrição

Opcional: Retorna imagens em preto e branco, em escala de cinza ou coloridas:

  • mono (preto e branco)
  • gray (escala de cinza)
  • color (cor)

Exemplos q=google&as_filetype=png&imgc=gray

imgcolor
Descrição

Opcional: Retorna imagens de uma cor dominante específica:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Exemplos q=google&as_filetype=png&imgcolor=yellow

as_rights
Descrição

Opcional: Filtros com base no licenciamento. Os valores aceitos são:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Exemplos q=cats&as_filetype=png&as_rights=cc_attribute

Limites de solicitações

A tabela abaixo lista as limitações nas solicitações de pesquisa que você envia ao Google:

Componente Limite Comentar
Tamanho da solicitação de pesquisa 2.048 bytes  
Número de termos de consulta 10 inclui termos nos seguintes parâmetros: q, as_epq, as_eq, as_lq, as_oq e as_q
Número de resultados 20 Se você definir o parâmetro num como um número maior que 20, apenas 20 resultados serão retornados. Para ter mais resultados, você precisaria enviar várias solicitações e incrementar o valor do parâmetro start a cada solicitação.

Internacionalização de consultas e apresentação de resultados

O serviço Google WebSearch permite pesquisar documentos em vários idiomas. É possível especificar a codificação de caracteres que precisa ser usada para interpretar a solicitação HTTP e codificar a resposta XML (usando os parâmetros de pesquisa ie e oe). Também é possível filtrar os resultados para incluir apenas documentos escritos em determinados idiomas.

As seções a seguir discutem problemas relacionados à pesquisa em vários idiomas:

Codificação de caracteres

Os servidores enviam dados, como páginas da Web, para user agents, como navegadores, como uma sequência de bytes codificados. Em seguida, o user agent decodifica os bytes em uma sequência de caracteres. Ao enviar solicitações para o serviço WebSearch, você pode especificar os esquemas de codificação para sua consulta de pesquisa e para a resposta XML que receber.

Você pode usar o parâmetro de solicitação ie para especificar o mecanismo de codificação para os caracteres em sua solicitação HTTP. Você também pode usar o parâmetro oe para especificar o esquema de codificação que o Google deve usar para codificar sua resposta XML. Se estiver usando um esquema de codificação diferente de ISO-8859-1 (ou latin1), especifique os valores corretos para os parâmetros ie e oe.

Observação:se você oferece funcionalidade de pesquisa para vários idiomas, recomendamos usar o valor de codificação utf8 (UTF-8) para os parâmetros ie e oe.

Consulte o apêndice Esquemas de codificação de caracteres para conferir uma lista completa dos valores que podem ser usados para os parâmetros ie e oe.

Para informações mais gerais sobre a codificação de caracteres, consulte http://www.w3.org/TR/REC-html40/charset.html (em inglês).

Idiomas da interface

Você pode usar o parâmetro de solicitação hl para identificar o idioma da sua interface gráfica. O valor do parâmetro hl pode afetar os resultados da pesquisa XML, especialmente em consultas internacionais quando a restrição de idioma (usando o parâmetro lr) não está explicitamente especificada. Nesses casos, o parâmetro hl pode promover resultados da pesquisa no mesmo idioma do idioma de entrada do usuário.

Sugerimos que você defina explicitamente o parâmetro hl nos resultados da pesquisa para garantir que o Google selecione os resultados da mais alta qualidade para cada consulta.

Consulte a seção Idiomas compatíveis com a interface para ver uma lista completa dos valores válidos para o parâmetro hl.

Como pesquisar documentos escritos em idiomas específicos

É possível usar o parâmetro de solicitação lr para restringir os resultados da pesquisa a documentos escritos em um idioma específico ou em um conjunto de idiomas.

O parâmetro lr é compatível com operadores booleanos, para permitir a especificação de vários idiomas que devem ser incluídos (ou excluídos) dos resultados da pesquisa.

Nos exemplos a seguir, mostramos como usar operadores booleanos para solicitar documentos em diferentes idiomas.

Para documentos escritos em japonês:

lr=lang_jp

Para documentos escritos em italiano ou alemão:

lr=lang_it|lang_de

Para documentos não escritos em húngaro ou tcheco:

lr=(-lang_hu).(-lang_cs)

Consulte a seção Valores de coleta de idiomas para ver uma lista completa dos valores possíveis para o parâmetro lr e a seção Operadores booleanos para ver uma discussão completa sobre o uso desses operadores.

O chinês simplificado e o tradicional são duas variantes de escrita do idioma chinês. O mesmo conceito pode ser escrito de maneira diferente em cada variante. Dada uma consulta em uma das variantes, o serviço do Google WebSearch pode retornar resultados que incluam páginas em ambas as variantes.

Para usar este recurso, siga estas etapas:

  1. Defina o parâmetro de solicitação c2coff como 0
    e
  2. Escolha uma destas opções:
    • Não defina o parâmetro de solicitação lr
      ou
    • Defina o parâmetro de solicitação lr como lr=lang_zh-TW|lang_zh-CN

O exemplo a seguir mostra os parâmetros de consulta que você incluiria em uma solicitação de resultados em chinês simplificado e tradicional. Informações adicionais obrigatórias, como o cliente, não estão incluídas no exemplo.

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Como filtrar resultados

O Google WebSearch oferece várias maneiras de filtrar os resultados da pesquisa:

Filtragem automática de resultados da pesquisa

Para oferecer os melhores resultados possíveis, o Google usa duas técnicas para filtrar automaticamente os resultados que geralmente são considerados indesejáveis:

  • Conteúdo duplicado: quando vários documentos contêm as mesmas informações, apenas o documento mais relevante desse conjunto é incluído nos resultados da pesquisa.

  • Host Crowding (aglomeração de hosts): se houver muitos resultados da pesquisa do mesmo site, o Google talvez não mostre todos os resultados dele ou mostre os resultados com uma
    classificação mais baixa do que de outra forma.

Recomendamos que você deixe esses filtros ativados para solicitações de pesquisa típicas, porque eles melhoram significativamente a qualidade da maioria dos resultados da pesquisa. No entanto, é possível ignorar esses filtros automáticos definindo o parâmetro de consulta filter como 0 na solicitação de pesquisa.

Filtragem de idioma e país

O serviço do Google WebSearch retorna resultados de um índice mestre de todos os documentos da Web. O índice mestre contém subcoleções de documentos agrupados por atributos específicos, incluindo idioma e país de origem.

É possível usar os parâmetros de solicitação lr e cr para restringir os resultados da pesquisa a subcoleções de documentos escritos em idiomas específicos ou provenientes de países específicos, respectivamente.

O Google WebSearch determina o idioma de um documento analisando o seguinte:

  • o domínio de nível superior (TLD) do URL do documento
  • metatags de idioma no documento
  • o idioma principal usado no corpo do documento


Consulte também a definição do parâmetro lr, a seção sobre Como pesquisar documentos escritos em idiomas específicos e os Valores de coleta de idiomas, que podem ser usados como valores para o parâmetro lr para mais informações sobre como restringir resultados com base no idioma.

O Google WebSearch determina o país de um documento analisando o seguinte:

  • o domínio de nível superior (TLD) do URL do documento
  • a localização geográfica do endereço IP do servidor da Web

Consulte também a definição do parâmetro cr e os Valores de coleta de países que podem ser usados como valores para o parâmetro cr para mais informações sobre como restringir resultados por país de origem.

Observação:você pode combinar valores de idioma e de país para personalizar os resultados da pesquisa. Por exemplo, é possível solicitar documentos escritos em francês e provenientes da França ou do Canadá ou que sejam da Holanda e não escritos em inglês. Os parâmetros lr e cr são compatíveis com Operadores booleanos.

Filtrar conteúdo adulto com o SafeSearch

Muitos clientes do Google não querem mostrar resultados da pesquisa para sites que tenham conteúdo adulto. Com o filtro SafeSearch, é possível filtrar resultados da pesquisa que tenham conteúdo adulto e eliminá-los. Os filtros do Google usam tecnologia reservada para verificar palavras-chave, frases e URLs. Embora nenhum filtro seja 100% preciso, o SafeSearch removerá a grande maioria do conteúdo adulto dos resultados da pesquisa.

O Google se esforça para manter o SafeSearch o mais atual e abrangente possível, rastreando continuamente a Web e incorporando atualizações de sugestões dos usuários.

O SafeSearch está disponível nos seguintes idiomas:

Holandês
Inglês
Francês
Alemão
Italiano
Português (Brasil)
Espanhol
Chinês tradicional

Você pode ajustar o grau de filtragem do Google nos resultados de conteúdo adulto usando o parâmetro de consulta safe. A tabela a seguir explica as configurações do SafeSearch do Google e como elas afetam seus resultados da pesquisa:

Nível do SafeSearch Descrição
high Ativa uma versão mais rigorosa da pesquisa segura.
medium Bloqueia páginas da Web que contêm pornografia e outros tipos de conteúdo sexual explícito.
desativado Não filtra conteúdo adulto dos resultados da pesquisa.

* A configuração padrão do SafeSearch fica desativada.

Se você tiver o SafeSearch ativado e encontrar sites com conteúdo ofensivo nos seus resultados, envie um e-mail com o URL do site para safesearch@google.com, e investigaremos o site.

Resultados em XML

DTD de resultados de XML do Google

O Google usa o mesmo DTD para descrever o formato XML para todos os tipos de resultados da pesquisa. Muitas tags e atributos são aplicáveis a todos os tipos de pesquisa. No entanto, algumas tags são aplicáveis somente a determinados tipos de pesquisa. Consequentemente, as definições na DTD podem ser menos restritivas do que as fornecidas neste documento.

Este documento descreve os aspectos do DTD que são relevantes para o WebSearch. Ao observar o DTD, se você estiver trabalhando no WebSearch, poderá ignorar com segurança as tags e atributos que não estão documentados aqui. Se a definição for diferente entre o DTD e a documentação, isso será observado neste documento.

O Google pode retornar resultados XML com ou sem uma referência ao DTD mais recente. O DTD é um guia para ajudar os administradores de pesquisa e os analisadores de XML a entender os resultados XML do Google. Como a gramática XML do Google pode mudar de tempos em tempos, não configure seu analisador para usar o DTD para validar cada resultado XML.

Além disso, não configure o analisador XML para buscar o DTD sempre que enviar uma solicitação de pesquisa. O Google atualiza o DTD com pouca frequência, e essas solicitações criam requisitos desnecessários de atraso e largura de banda.

O Google recomenda que você use o formato de saída xml_no_dtd para receber resultados XML. Se você especificar o formato de output xml em sua solicitação de pesquisa, a única diferença será a inclusão da seguinte linha nos resultados XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

Você pode acessar o DTD mais recente em http://www.google.com/google.dtd.

Nem todos os recursos do DTD podem estar disponíveis ou ser suportados no momento.

Sobre a resposta XML

  • Todos os valores de elementos são HTML válidos e adequados para exibição, a menos que indicado de outra forma nas definições da tag XML.
  • Alguns valores de elementos são URLs que precisam ser codificados em HTML antes de serem exibidos.
  • Seu analisador de XML deve ignorar atributos e tags sem documentação. Isso permite que seu aplicativo continue funcionando sem modificações se o Google adicionar mais recursos à saída XML.
  • Alguns caracteres precisam de escape quando incluídos como valores nas tags XML. O processador de XML precisa converter essas entidades de volta nos caracteres apropriados. Se você não converter entidades corretamente, o navegador poderá, por exemplo, renderizar o caractere & como "&amp;". O padrão XML documenta esses caracteres. Eles são reproduzidos na tabela abaixo:

    com caracteres Formas de escape Entidade Código de caractere
    E comercial & &amp; &#38;
    Aspas simples ' &apos; &#39;
    Aspas duplas " &quot; &#34;
    Maior que > &gt; &#62;
    Menor que < &lt; &#60;

Resultados XML para consultas de pesquisa regulares e avançadas

Pesquisa normal/avançada: exemplo de consulta e resultado XML

Este exemplo de solicitação do WebSearch solicita 10 resultados (num=10) sobre o termo de pesquisa "futebol" (q=socer), que é a palavra "futebol" escrita intencionalmente incorretamente para este exemplo.

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

Essa solicitação gera o resultado XML abaixo. Há vários comentários no resultado XML para indicar onde apareceriam determinadas tags não incluídas no resultado.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

Pesquisa normal/avançada: tags XML

As respostas XML para solicitações de pesquisa regulares e avançadas usam o mesmo conjunto de tags XML. Essas tags XML são mostradas no exemplo de XML acima e explicadas nas tabelas abaixo.

As tags XML abaixo estão listadas em ordem alfabética por nome de tag, e cada definição contém uma descrição da tag, um exemplo que mostra como a tag apareceria em um resultado XML e o formato do conteúdo da tag. Se a tag for uma subtag de outra tag XML ou se a tag tiver subtags ou atributos próprios, essa informação também será fornecida na tabela de definição da tag.

Alguns símbolos podem ser exibidos ao lado de algumas subtags nas definições abaixo. Esses símbolos e seus significados são:

? = subtag opcional
* = zero ou mais instâncias da subtag
+ = uma ou mais instâncias da subtag
A B C D S G A I D (link em inglês) M N F P R S T U X

anchor_text
Definição

A tag <anchor_text> especifica o texto a ser exibido aos usuários para identificar um rótulo de refinamento associado a um conjunto de resultados da pesquisa. Como os rótulos de refinamento substituem caracteres não alfanuméricos por sublinhados, não exiba o valor da tag <label> na interface do usuário. Em vez disso, você precisa exibir o valor da tag <anchor_text>.

Exemplo <anchor_text>campos de golfe</anchor_text>
Subtag de FacetItem
Formato do conteúdo Texto

BLOQUEAR
Definição

Essa tag encapsula o conteúdo de um bloco na linha do corpo do resultado de uma promoção. Cada bloco tem as subtags T, U e L. Uma tag T não vazia indica que o bloco contém texto. As tags U e L não vazias indicam que o bloco contém um link (com URL fornecido na subtag U e texto âncora na subtag L).

Subtags T, U e L
Subtag de BODY_LINE
Formato do conteúdo Vazio

BODY_LINE
Definição

Essa tag encapsula o conteúdo de uma linha no corpo do resultado promovido. Cada linha do corpo consiste em várias tags BLOCK, que contêm texto ou um link com URL e texto âncora.

Subtags BLOQUEIO*
Subtag de SL_MAIN
Formato do conteúdo Vazio

C
Definição

A tag <C> indica que o serviço WebSearch pode recuperar uma versão em cache desse URL do resultado da pesquisa. Não é possível recuperar páginas em cache por meio da API XML, mas você pode redirecionar os usuários para www.google.com para esse conteúdo.

Attributes
Nome Formato Descrição
SZ Texto (número inteiro + "k") Informa o tamanho da versão em cache do resultado da pesquisa em kilobytes ("k").
CID Texto Identifica um documento no cache do Google. Para buscar o documento no cache, envie um termo de pesquisa criado desta forma:
cache:CIDtext:EscapeURL

O URL com escape está disponível na tag UE.

Exemplo <C SZ="6k" CID="kvOXK_cYSSgJ" />
Subtag de HAS
Formato do conteúdo Vazio

C2C
Definição A tag <C2C> indica que o resultado se refere a uma página em chinês tradicional. Essa tag só aparece quando a Pesquisa em chinês tradicional e simplificado está ativada. Consulte a definição do parâmetro de consulta c2coff para mais informações sobre como ativar e desativar esse recurso.
Formato do conteúdo Texto

Contexto
Definição

A tag <Context> encapsula uma lista de marcadores de refinamento associados a um conjunto de resultados de pesquisa.

Exemplo <Context>
Subtags title, Facet+
Formato do conteúdo Contêiner

DATA DE RASTREAMENTO
Definição

A tag <CRAWLDATE> identifica a data do último rastreamento da página. CRAWLDATE não é retornado para cada página de resultados da pesquisa.

Exemplo <CRAWLDATE>21 de maio de 2005</CRAWLDATE>
Subtag de R
Formato do conteúdo Texto

DI
Definição

A tag <DI> encapsula as informações de categoria do Open Directory Project (ODP) para um único resultado da pesquisa.

Exemplo <DI>
Subtags DT?, DS?
Subtag de HAS
Formato do conteúdo Vazio

DS
Definição

A tag <DS> fornece o resumo listado para uma única categoria no diretório ODP.

Exemplo <DS>Publique seu currículo &lt;b&gt;futebol&lt;/b&gt; diretamente na Internet.</DS>
Subtag de DI
Formato do conteúdo Texto (pode conter HTML)

DT
Definição

A tag <DT> fornece o título para uma única categoria listada no diretório ODP.

Exemplo <DT>FutebolConnection.net</DT>
Subtag de DI
Formato do conteúdo Texto (pode conter HTML)

Atributo
Definição

A tag <Facet> contém um agrupamento lógico de tags <FacetItem>. Para criar esses agrupamentos, use o formato da Especificação XML do Mecanismo de Pesquisa Programável. Se você não criar esses agrupamentos, a tag results_xml_tag_Context><Context> conterá até quatro tags <Facet>. Os itens em cada tag <Facet> serão agrupados para fins de exibição, mas podem não ter uma relação lógica.

Exemplo <Facet>
Subtags FacetItem+, title+
Subtag de Contexto
Formato do conteúdo Contêiner

FacetItem
Definição

A tag <FacetItem> encapsula informações sobre um rótulo de refinamento associado a um conjunto de resultados da pesquisa.

Exemplo <FacetItem>
Subtags label, anchor_text+
Subtag de Atributo
Formato do conteúdo FacetItem

FI
Definição A tag <FI> serve como um sinalizador que indica se a filtragem de documentos foi realizada na pesquisa. Consulte a seção Filtragem automática deste documento para saber mais sobre os filtros de resultados da pesquisa do Google.
Exemplo <FI />
Subtag de RES (link em inglês)
Formato do conteúdo Vazio

GSP
Definição

A tag <GSP> encapsula todos os dados retornados nos resultados da pesquisa do Google XML. "GSP" é uma abreviação para "Protocolo de Pesquisa Google".

Attributes
Nome Formato Descrição
VER Texto (número inteiro) O atributo VER especifica a versão da saída dos resultados da pesquisa. A versão de saída atual é "3.2".
Exemplo <GSP VER="3,2">
Subtags PARAM+, Q, RES?, TM (em inglês)
Formato do conteúdo Vazio

HAS
Definição A tag <HAS> encapsula informações sobre todos os parâmetros de solicitação de pesquisa especial compatíveis com um URL específico.

Observação:a definição de <HAS> para WebSearch é mais restritiva do que no DTD.

Subtags DI?, L?, C?, RT?
Subtag de R

ISURL
Definição O Google retornará a tag <ISURL> se a consulta de pesquisa associada for um URL.
Subtag de GSP (em inglês)
Formato do conteúdo Vazio

L
Definição A presença da tag <L> indica que o serviço WebSearch pode encontrar outros sites que direcionam para esse URL do resultado da pesquisa. Para encontrar esses sites, use o termo de consulta especial link:.
Subtag de HAS
Formato do conteúdo Vazio

Identificador
Definição

A tag <label> especifica um marcador de refinamento que você pode usar para filtrar os resultados da pesquisa que receber. Para usar um rótulo de refinamento, adicione a string more:[[label tag value]] ao valor do parâmetro q na sua solicitação HTTP para o Google, conforme mostrado no exemplo a seguir. Esse valor precisa ter escape de URL antes de enviar a consulta ao Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

Observação:a tag <label> não é igual à <Label>, que identifica um rótulo de refinamento associado a um URL específico nos resultados da pesquisa.

Exemplo <label>cursos_de_golfe</label>
Subtag de FacetItem
Formato do conteúdo Texto

ÍNDICE
Definição

A tag <LANG> contém o melhor palpite do Google para o idioma do resultado da pesquisa.

Exemplo <LANG>en</LANG>
Subtag de R
Formato do conteúdo Texto

M
Definição

A tag <M> identifica o número total estimado de resultados para a pesquisa.

Observação : essa estimativa pode não ser precisa.

Exemplo <M>16200000</M>
Subtag de RES (link em inglês)
Formato do conteúdo Texto

RN
Definição

A tag <NB> encapsula as informações de navegação (links para a próxima página ou a anterior de resultados da pesquisa) do conjunto de resultados.

Observação:essa tag só vai estar presente se mais resultados estiverem disponíveis.

Exemplo <NB>
Subtags NU?, UF?
Subtag de RES (link em inglês)
Formato do conteúdo Vazio

NU
Definição

A tag <NU> contém um link relativo para a próxima página de resultados da pesquisa.

Exemplo <NU>/search?q=flowers&num=10&hl=pt-BR&ie=UTF-8
&output=xml&client=test&start=10</NU>
Subtag de NB (em inglês)
Formato do conteúdo Texto (URL relativo)

PARAM
Definição

A tag <PARAM> identifica um parâmetro de entrada enviado na solicitação HTTP associada ao resultado XML. As informações sobre o parâmetro estão contidas nos atributos da tag (name, value, original_value), e haverá uma tag PARAM para cada parâmetro enviado na solicitação HTTP.

Attributes
Nome Formato Descrição
name Texto Nome do parâmetro de entrada.
value HTML Versão formatada em HTML do valor do parâmetro de entrada.
original_value Texto Versão original com escape de URL do valor do parâmetro de entrada.
Exemplo <PARAM name="cr" value="countryNZ" original_value="countryNZ" />
Subtag de GSP (em inglês)
Formato do conteúdo Complexo

Unidade de processamento
Definição

A tag <PU> fornece um link relativo para a página anterior de resultados da pesquisa.

Exemplo <PU>/search?q=flowers&num=10&hl=pt-BR&output=xml
&client=test&start=10</PU>
Subtag de NB (em inglês)
Formato do conteúdo Texto (URL relativo)

P
Definição

A tag <Q> identifica a consulta de pesquisa enviada na solicitação HTTP associada ao resultado XML.

Exemplo

<Q>pizza</Q>

Subtag de GSP (em inglês)
Formato do conteúdo Texto

R
Definição

A tag <R> encapsula os detalhes de um resultado da pesquisa individual.

Observação:a definição da tag <R> para WebSearch é mais restrita do que no DTD.

Attributes
Nome Formato Descrição
N Texto (número inteiro) Indica o índice (com base em 1) desse resultado da pesquisa.
MIME Texto Indica o tipo MIME do resultado da pesquisa.
Subtags U, UE, T?, CRAWLDATE, S?, {/0}?, HAS
Subtag de RES (link em inglês)

RES
Definição

A tag <RES> encapsula o conjunto de resultados da pesquisa individuais e detalhes sobre esses resultados.

Attributes
Nome Formato Descrição
SN Texto (número inteiro) Indica o índice (baseado em 1) do primeiro resultado da pesquisa retornado nesse conjunto de resultados.
PT-BR Texto (número inteiro) Indica o índice (com base em 1) do último resultado da pesquisa retornado nesse conjunto de resultados.
Exemplo <RES SN="1" EN="10">
Subtags M e FI?, XT?, NB?, R*
Subtag de GSP (em inglês)
Formato do conteúdo Vazio

S
Definição

A tag <S> contém um trecho de um resultado da pesquisa que mostra os termos de consulta destacados em negrito. Quebras de linha estão incluídas no trecho para ajuste de texto adequado.

Exemplo <S>Washington (CNN) -- Uma oferta para encerrar o impasse no Senado contra o presidente &lt;b&gt;Bush&#39;s&lt;/b&gt; permitiria que cinco candidatos avançassem para uma votação final, preservando a &lt;b&gt;...&lt;b&gt;...&lt;/b&gt;
Subtag de R
Formato do conteúdo Texto (HTML)

SL_MAIN
Definição

Esta tag encapsula o conteúdo de um resultado de promoção. Use para analisar promoções. O texto âncora e o URL do link de título estão contidos nas subtags T e U, respectivamente. As linhas do corpo do texto e dos links estão contidas nas subtags BODY_LINE.

Subtags BODY_LINE*, T e U
Subtag de SL_RESULTS
Formato do conteúdo Vazio

SL_RESULTS
Definição

Tag de contêiner para os resultados promovidos. Um deles vai aparecer sempre que você tiver uma promoção nos resultados da pesquisa. A subtag SL_MAIN contém os principais dados do resultado.

Subtags SL_MAIN*
Subtag de R
Formato do conteúdo Vazio

Ortografia
Definição

A tag <Spelling> encapsula uma sugestão de ortografia alternativa para a consulta enviada. Essa tag só aparece na primeira página dos resultados da pesquisa. As sugestões de ortografia estão disponíveis em chinês, coreano, inglês e japonês.

Observação:o Google só retorna sugestões de ortografia para consultas em que o valor do parâmetro gl está em letras minúsculas.

Exemplo <Spelling>
Subtags Sugestão
Subtag de GSP (em inglês)
Formato do conteúdo Vazio

Sugestão
Definição A tag <Suggestion> contém uma sugestão de ortografia alternativa para a consulta enviada. Você pode usar o conteúdo da tag para sugerir a grafia alternativa ao usuário da pesquisa. O valor do atributo q é a sugestão de ortografia com escape de URL que você pode usar como termo de consulta.
Attributes
Nome Formato Descrição
q Texto O atributo q especifica a versão com escape do URL da sugestão de ortografia.
Exemplo <Suggestion q="soccer">&lt;b&gt;&lt;i&gt;futebol&lt;/i&gt;&lt;/b&gt;</Suggestion>
Subtag de Ortografia
Formato do conteúdo Texto (HTML)

T
Definição A tag <T> contém o título do resultado.
Exemplo <T>Pizzaria da Costa Leste de Amici</T>
Subtag de R
Formato do conteúdo Texto (HTML)

título
Definição

Como filha de <Context>, a tag <title> contém o nome do seu Mecanismo de Pesquisa Programável.

Como filho de <Facet>, a tag <title> fornece um título para um conjunto de atributos.

Exemplo

Como filho de <Context>: <title>Meu mecanismo de pesquisa</title>

Como filho de <Facet>: <title>título do atributo</title>

Subtag de Context, Facet (em inglês)
Formato do conteúdo Texto

TM
Definição

A tag <TM> identifica o tempo total do servidor necessário para retornar resultados da pesquisa, medido em segundos.

Exemplo <TM>0,100445</TM>
Subtag de GSP (em inglês)
Formato do conteúdo Texto (número de ponto flutuante)

TT
Definição A tag <TT> oferece uma dica de pesquisa.
Exemplo <TT>&lt;i&gt;Dica: na maioria dos navegadores, pressionar a tecla "Enter" produz os mesmos resultados que clicar no botão "Pesquisar".&lt;/i&gt;</TT>
Subtag de GSP (em inglês)

U
Definição A tag <U> fornece o URL do resultado da pesquisa.
Exemplo <U>http://www.dominos.com/</U>
Subtag de R
Formato do conteúdo Texto (URL absoluto)

UD
Definição

A tag <UD> fornece o URL codificado por IDN (nome de domínio internacional) para o resultado da pesquisa. O valor permite que os domínios sejam exibidos usando idiomas locais. Por exemplo, o URL codificado com IDN http://www.%E8%8A%B1%E4%BA%95.com pode ser decodificado e exibido como http://www.花井鮨.com. Essa tag <UD> só será incluída nos resultados da pesquisa para solicitações que incluíram o parâmetro ud.

Observação:este é um recurso Beta.

Exemplo <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
Subtag de R
Formato do conteúdo Texto (URL codificado de IDN)

UE
Definição A tag <UE> fornece o URL do resultado da pesquisa. O valor tem escape de URL para que seja adequado para transmissão como um parâmetro de consulta em um URL.
Exemplo <UE>http://www.dominos.com/</UE>
Subtag de R
Formato do conteúdo Texto (URL com escape de URL)

PP
Definição A tag <XT> indica que o número total estimado de resultados, conforme especificado pela tag M, realmente representa o número total exato de resultados. Consulte a seção Filtragem automática deste documento para saber mais.
Exemplo <XT />
Subtag de RES (link em inglês)
Formato do conteúdo Vazio


Resultados XML para consultas de pesquisa de imagens

Este exemplo de solicitação de imagem solicita cinco resultados (num=5) sobre o termo de pesquisa "macaco" (q=macaco).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Essa solicitação gera o resultado XML abaixo.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Pesquisa de imagens: tags XML

A tabela abaixo mostra outras tags XML usadas em respostas XML para consultas de pesquisa de imagem.

Alguns símbolos podem ser exibidos ao lado de algumas subtags nas definições abaixo. Esses símbolos e seus significados são:

? = subtag opcional
* = zero ou mais instâncias da subtag
+ = uma ou mais instâncias da subtag

RG
Definição

A tag <RG> delimita os detalhes de um resultado da pesquisa de imagem individual.

Attributes
Nome Formato Descrição
N Texto (número inteiro) Indica o índice (com base em 1) desse resultado da pesquisa.
MIME Texto Indica o tipo MIME do resultado da pesquisa.
Subtag de RES (link em inglês)
RU
Definição

A tag <RU tag> inclui detalhes de cada resultado da pesquisa de imagens.

Subtag de R