Manter uma estrutura de URL simples

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Uma estrutura de URL de um site deve ser a mais simples possível. Organize seu conteúdo de modo que os URLs sejam de fácil compreensão e elaborados de maneira lógica.

Quando possível, use palavras legíveis em vez de longos números de ID nos URLs.

Recomendado — palavras simples e descritivas no URL:

http://en.wikipedia.org/wiki/Aviation

Recomendado: palavras localizadas no URL, se aplicável.

https://www.example.com/lebensmittel/pfefferminz

Recomendado: use a codificação UTF-8 conforme necessário. O exemplo a seguir usa a codificação UTF-8 para caracteres árabes no URL:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

O exemplo a seguir usa a codificação UTF-8 para caracteres chineses no URL:

example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

O exemplo a seguir usa a codificação UTF-8 para o umlaut no URL:

https://www.example.com/gem%C3%BCse

O exemplo a seguir usa a codificação UTF-8 para emojis no URL:

example.com/%F0%9F%A6%99%E2%9C%A8

Não recomendado: usar caracteres não ASCII no URL:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

Não recomendado: números de ID longos e ilegíveis no URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Caso seu site seja multirregional, considere usar uma estrutura de URL que facilite a segmentação geográfica dele. Para ver mais exemplos de como estruturar os URLs, consulte Usar URLs específicos à localidade.

Recomendado — domínio específico a cada país:

example.de

Recomendado — subdiretório específico a cada país com gTLD:

example.com/de/

Use hifens para separar palavras nos URLs, porque isso ajuda os usuários e mecanismos de pesquisa a identificar conceitos com mais facilidade. Recomendamos que você use hifens (-) em vez de sublinhados (_) nos URLs.

Recomendado — hifens (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

Não recomendado — sublinhados (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

Não recomendado — palavras-chave unidas no URL:

https://www.example.com/greendress

URLs muito complexos, especialmente os que têm vários parâmetros, podem causar problemas para os rastreadores, criando números muito altos de URLs que apontam para um conteúdo idêntico ou semelhante no site. Como resultado, o Googlebot pode consumir mais largura de banda do que o necessário ou não indexar completamente o conteúdo do site.

Causas comuns desse problema

Um número desnecessariamente alto de URLs pode ser causado por vários problemas. Veja alguns deles:

  • Filtragem aditiva de um conjunto de itens. Vários sites oferecem diferentes modos de exibição dos mesmos conjuntos de itens ou resultados de pesquisa e muitas vezes permitem que o usuário filtre esse conjunto usando um critério definido (por exemplo: mostrar hotéis na praia). Quando os filtros podem ser combinados de maneira aditiva (por exemplo: hotéis na praia e com academia), o número de URLs (modos de visualização de dados) nos sites aumenta drasticamente. Criar muitas listas de hotéis com diferenças sutis é redundante, porque o Googlebot só precisa ver um número pequeno de listas para acessar a página de cada hotel. Por exemplo:
      .
    • Hotéis com tarifas promocionais:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hotéis com tarifas promocionais na praia:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hotéis com tarifas promocionais na praia e com academia:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Geração dinâmica de documentos. Isso pode resultar em pequenas mudanças por causa dos contadores, dos carimbos de data/hora ou dos anúncios.
  • Parâmetros problemáticos no URL. Os IDs de sessão, por exemplo, podem criar uma imensa quantidade de duplicação e um número maior ainda de URLs.
  • Parâmetros de classificação. Alguns grandes sites de compras oferecem várias maneiras de classificar os mesmos itens, o que resulta em um número muito maior de URLs. Por exemplo:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parâmetros irrelevantes no URL, como os de referência. Exemplo:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas de agenda. Uma agenda gerada de maneira dinâmica pode criar links para datas passadas e futuras sem restrições de início nem término. Exemplo:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Links relativos corrompidos. Eles costumam causar espaços infinitos. Geralmente, esse problema ocorre devido a elementos de caminhos repetitivos. Exemplo:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Resolver esse problema

Para evitar possíveis problemas com a estrutura do URL, é recomendável fazer o seguinte:

  • Considere o uso de um arquivo robots.txt para bloquear o acesso do Googlebot a URLs problemáticos. Normalmente, é recomendável bloquear URLs dinâmicos, como URLs que geram resultados de pesquisa ou URLs que podem criar espaços infinitos, como agendas. Usar expressões comuns no arquivo robots.txt permite bloquear um grande número de URLs com facilidade.
  • Sempre que possível, evite o uso de IDs de sessão nos URLs. Em vez disso, considere os cookies. Consulte as diretrizes para webmasters para ver mais informações.
  • Sempre que possível, abrevie URLs removendo parâmetros desnecessários.
  • Caso o site tenha uma agenda infinita, inclua um atributo nofollow aos links para as futuras páginas de agenda criadas dinamicamente.
  • Veja se há links relativos corrompidos no site.