Semplificare il più possibile la struttura degli URL

La struttura dell'URL di un sito deve essere il più semplice possibile. Organizza i contenuti in modo che gli URL abbiano una struttura logica e comprensibile per le persone.

Se possibile, utilizza negli URL parole di senso compiuto anziché lunghi ID numerici.

Consigliato. Utilizzo di URL semplici e descrittivi:

http://en.wikipedia.org/wiki/Aviation

Sconsigliato. Utilizzo di URL complessi e non descrittivi:

http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Ti consigliamo di utilizzare la punteggiatura negli URL, poiché consente a utenti e motori di ricerca di identificare più facilmente i concetti contenuti nell'URL.

Consigliato. Utilizzo di parole chiave nell'URL separate da segni di punteggiatura:

http://www.example.com/green-dress.html

Sconsigliato. Utilizzo di parole chiave nell'URL scritte come un'unica parola:

http://www.example.com/greendress.html

Ti consigliamo di utilizzare i trattini - invece dei trattini bassi _ negli URL.

Consigliato. Utilizzo dei trattini (-):

http://www.example.com/summer-clothing/filter?color-profile=dark-grey

Sconsigliato. Utilizzo dei trattini bassi (_):

http://www.example.com/summer_clothing/filter?color_profile=dark_grey

Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario o non essere in grado di indicizzare completamente tutti i contenuti del sito.

Cause comuni del problema

Un numero molto elevato e ingiustificato di URL può avere molteplici cause, ad esempio:

  • Filtri aggiuntivi di un gruppo di elementi: molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, "mostrami hotel vicino alla spiaggia"). Quando i filtri possono essere combinati per addizione (ad esempio, "hotel vicino alla spiaggia e con centro fitness"), il numero di URL (visualizzazioni di dati) nei siti aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel con lievi differenze è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:
    • Proprietà alberghiere a "tariffe vantaggiose":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generazione dinamica dei documenti: questa operazione può comportare leggere modifiche, a causa di contatori, timestamp o presenza di pubblicità.
  • Parametri problematici nell'URL: gli ID di sessione, ad esempio, possono creare enormi quantità di duplicati e un numero molto elevato di URL.
  • Parametri di ordinamento: alcuni siti di shopping di grandi dimensioni forniscono più modalità di ordinamento degli stessi articoli e ciò comporta un notevole aumento del numero di URL. Ad esempio:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parametri irrilevanti nell'URL, tipo parametri di referral. Ad esempio:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemi del calendario: un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Link relativi inaccessibili: i link relativi inaccessibili sono spesso causa di spazi infiniti. Questo problema si verifica soprattutto quando ci sono elementi del percorso ripetuti. Ad esempio:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Risolvere il problema

Per evitare potenziali problemi relativi alla struttura degli URL, consigliamo di procedere come riportato di seguito:

  • Valuta l'utilizzo di un file robots.txt per bloccare l'accesso di Googlebot a URL che presentano problemi. In genere, valuta la possibilità di bloccare gli URL dinamici, come quelli che generano i risultati di ricerca, o gli URL che possono creare spazi infiniti, come i calendari. L'utilizzo di espressioni regolari nel file robots.txt ti consente di bloccare facilmente un numero elevato di URL.
  • Dove possibile cerca di non utilizzare ID sessione negli URL. Sostituiscili con i cookie. Per maggiori informazioni, consulta le Istruzioni per i webmaster.
  • Cerca di ridurre la lunghezza degli URL, se possibile, eliminando i parametri non necessari.
  • Se il tuo sito include un calendario infinito, aggiungi un attributo nofollow ai link che rimandano a pagine future del calendario create dinamicamente.
  • Verifica l'eventuale presenza di link relativi inaccessibili nel sito.