Como criar um Mecanismo de Pesquisa Programável com arquivos de configuração

Nesta página, apresentamos os conceitos básicos dos arquivos de configuração do Mecanismo de Pesquisa Programável.

  1. Visão geral
  2. O que há em um Mecanismo de Pesquisa Programável
  3. Como os componentes funcionam juntos
  4. Criar um mecanismo de pesquisa
  5. Como editar os arquivos do Mecanismo de Pesquisa Programável
  6. Como escolher o formato certo

Informações gerais

Se o Painel de Controle não oferecer o nível de personalização de que você precisa, considere usar o formato XML da Pesquisa Programável, que oferece mais controle, flexibilidade e acesso a recursos mais avançados.

Para usar os arquivos de configuração do Mecanismo de Pesquisa Programável, comece criando um mecanismo de pesquisa básico no Painel de controle do Mecanismo de Pesquisa Programável. Depois de criar o mecanismo de pesquisa, é possível fazer o download das anotações e dos arquivos XML de contexto na página Visão geral do painel de controle.

Conceitos básicos de XML

A Extensible Markup Language ou XML é uma linguagem de marcação para fins gerais. É um texto com tags que você pode ler. Por exemplo, o formato XML da Pesquisa programável inclui as seguintes tags: <Context> </Context> e <LookAndFeel> </LookAndFeel>.

Como acontece com qualquer arquivo XML, as especificações do Mecanismo de Pesquisa Programável precisam seguir a sintaxe XML (<element attribute="value">content</element>) e ser bem formadas. O XML tem as seguintes regras:

  • O XML exige que você inclua uma declaração XML (<?xml version="1.0"?>) antes das tags de nível superior, mas o arquivo de configuração do Mecanismo de Pesquisa Programável não exige isso.
  • Todos os elementos precisam ter uma tag de abertura (<tag>) e uma tag de fechamento (</tag>).
  • Todas as tags precisam ser aninhadas corretamente. Não é possível ter um código XML como este: <sandwich><filling> peanut butter</sandwich></filling>. Em vez disso, ele vai ser semelhante a: <sandwich><filling> peanut butter</filling></sandwich>.
  • O XML diferencia maiúsculas de minúsculas. Por isso, siga atentamente as letras maiúsculas e minúsculas e a ortografia das tags nas instruções.
  • Todos os valores de atributo precisam estar entre aspas duplas (<element attribute="value">).
  • Todos os atributos precisam ser definidos na tag de abertura (<element attribute="value">), e não na tag de fechamento ( </element>).

É possível escrever notas usando tags de comentário (<!-- your comment here -->), e o Mecanismo de Pesquisa Programável não vai analisar essa linha de texto como código XML. Além de escrever lembretes ou descrições, você pode usar os comentários para temporariamente retirar algum código XML (talvez para testar certos efeitos ou para resolver problemas). No entanto, esses comentários não são preservados nos arquivos baixados pelo painel de controle. Se quiser manter os comentários, mantenha uma cópia dos arquivos XML comentados mesmo depois de enviá-los ao Painel de controle.

Você pode usar um editor de texto simples para criar e editar arquivos XML. Basta salvar o arquivo de texto com a extensão .xml (por exemplo, cse_badminton.xml).

Voltar ao início

O que há em um Mecanismo de Pesquisa Programável

Um Mecanismo de Pesquisa Programável tem dois componentes principais, e cada um deles é controlado por um arquivo XML:

  • Contexto: o arquivo XML de contexto descreve os recursos básicos de um mecanismo de pesquisa. Ela especifica as configurações globais do mecanismo de pesquisa, como a ativação da pesquisa por imagens ou das promoções. Cada mecanismo de pesquisa tem seu próprio arquivo de contexto. Mais informações sobre o arquivo XML de contexto. Para saber mais sobre como selecionar o formato de arquivo mais adequado para seu mecanismo de pesquisa, consulte Escolher o formato certo para o mecanismo de pesquisa.
  • Anotações: o arquivo XML de anotações lista as páginas da Web ou os sites que o mecanismo de pesquisa deve cobrir e indica as preferências que você tem sobre como esses sites devem ser classificados nos resultados da pesquisa. Cada site e as informações associadas a ele são chamados de anotação. Mais informações sobre o arquivo XML de anotações.

Não recomendamos criar esses arquivos do zero. Em vez disso, faça o download deles na página Visão geral do painel de controle.

Além desses componentes principais, um mecanismo de pesquisa também pode ter os seguintes arquivos auxiliares:

  • Promoções: o arquivo XML de promoções lista uma série de resultados personalizados acionados por um conjunto predefinido de termos de consulta. Quando um usuário digita uma pesquisa que corresponde exatamente a um dos termos da sua consulta, a promoção aparece na parte superior da página. Você pode usar promoções para responder diretamente às consultas de seus usuários, levá-los a informações importantes ou direcioná-los para páginas da web que não estão no topo da página de resultados, mas são especialmente relevantes. No Painel de controle, as promoções são definidas na guia Promoções. Saiba mais sobre promoções.
  • Sinônimos: o arquivo XML de sinônimos expande as consultas dos usuários para incluir variantes do termo de pesquisa. Por exemplo, se o usuário pesquisar "símio", o mecanismo de pesquisa também vai buscar "macaco" e "macaco". No painel de controle, os sinônimos são definidos na guia Sinônimos. Mais informações sobre sinônimos.

Como os componentes funcionam juntos

O arquivo XML de contexto não especifica o arquivo de anotações a ser usado, e o XML de anotações não faz referência ao arquivo de contexto. O Mecanismo de Pesquisa Programável usa rótulos para associar contexto e anotações. O arquivo XML de contexto inclui marcadores que identificam o mecanismo de pesquisa, e cada anotação listada no XML de anotações é marcada com um ou mais marcadores identificando os mecanismos de pesquisa aos quais pertence.Se você alterar o nome do marcador no arquivo de contexto, terá que alterar todas as anotações marcadas com esse marcador.

Embora seja possível fazer upload de vários arquivos de anotações, quando você faz o download deles pelo painel de controle, o Mecanismo de Pesquisa Programável mescla todos os arquivos de anotações em um único arquivo. Os arquivos de anotações oferecem a flexibilidade de personalizar o mesmo site para vários mecanismos de pesquisa. Por exemplo, um mecanismo de busca poderia restringir sua pesquisa a alguns sites, outro poderia eliminá-los e ainda outro poderia promovê-los.

context.xml

Veja um exemplo de um arquivo context.xml que contém marcadores que identificam o mecanismo de pesquisa ao qual ele se aplica:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Este é um exemplo de um arquivo de anotações que mostra como cada site (anotação) está associado a um rótulo:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Voltar ao início

Como criar Mecanismos de Pesquisa Programável avançados

A criação de mecanismos avançados envolve as seguintes etapas:

  1. Determine o formato apropriado para suas necessidades.
  2. Defina as especificações do seu mecanismo de pesquisa.
  3. Informe ao Mecanismo de Pesquisa Programável quais sites pesquisar.
  4. Informar ao Mecanismo de Pesquisa Programável como classificar os resultados da pesquisa.

Como editar os arquivos do Mecanismo de Pesquisa Programável

Para trabalhar em um arquivo XML, faça o download da especificação XML na página Visão geral do Painel de controle. Não crie um arquivo do zero. Faça o seguinte:

  1. Faça o download do arquivo de contexto ou de anotações na página Visão geral do painel de controle. Clique no botão Fazer o download na seção Recursos de pesquisa.
  2. Use um editor de texto que possa lidar com terminações de linha no estilo UNIX (o WordPad, o Emacs e o TextMate funcionam, o Bloco de Notas não funciona). O arquivo pode ser salvo com a extensão .xml (por exemplo, cx_global.xml).
  3. Faça uma cópia de backup do arquivo transferido por download caso a versão editada não funcione como esperado e você precise reverter para a versão anterior.

    Se você não fizer uma cópia e a versão editada não funcionar corretamente, você precisará depurar o arquivo ou recriar o mecanismo de pesquisa novamente. Não foi divertido.

  4. Edite e salve o arquivo XML. Verifique se o editor de texto está salvando o arquivo como um documento de texto Unicode, e não como algum outro formato de arquivo.
  5. Faça o upload do arquivo na seção Recursos de pesquisa da página Visão geral.

Como escolher o formato certo

Antes de começar a criar seu Mecanismo de Pesquisa Programável, determine qual formato atende melhor às suas necessidades. Você não quer selecionar um formato mais poderoso e complexo do que o necessário nem usar um que se destaque rapidamente.

Use a tabela a seguir para escolher o formato apropriado.

Para criar Usar Devido Limitações Mais informações
Um ou poucos mecanismos de pesquisa com um pequeno número de sites. Painel de controle É possível criar rapidamente o Mecanismo de Pesquisa Programável preenchendo caixas de texto em vez de criar arquivos com um editor de texto e fazer upload dos arquivos. O Painel de Controle é útil principalmente para você se familiarizar com o Mecanismo de Pesquisa Programável e criar mecanismos de pesquisa com poucos sites. Primeiros passos
Mecanismos de pesquisa complexos que usam muitos sites e usam feeds. Arquivo de contexto e arquivos de anotações

Os arquivos do Mecanismo de Pesquisa Programável oferecem um controle maior sobre os mecanismos de pesquisa e facilitam muito as tarefas de definição e gerenciamento de sites.

Mesmo que você pretenda criar seu mecanismo de pesquisa usando arquivos de contexto e anotações, ainda é uma boa ideia se familiarizar com o Painel de controle.

Quanto mais você personaliza seu mecanismo de pesquisa, mais complexo ele se torna. Você precisa aprender os Elementos e atributos de Pesquisa Programável, que são fáceis de entender, mas exigem um pouco de tempo.

Você terá que ler o restante do guia do desenvolvedor, que, infelizmente, não é o material de leitura mais empolgante.

Contexto: como definir as especificações de um mecanismo de pesquisa e Anotações: seleção de sites

Voltar ao início