Semplificare il più possibile la struttura degli URL

La struttura degli URL di un sito deve essere il più semplice possibile. Organizza i contenuti in modo che gli URL abbiano una struttura logica e comprensibile per le persone.

Se possibile, utilizza negli URL parole di senso compiuto anziché lunghi ID numerici.

Consigliato. Parole semplici e descrittive nell'URL:

http://en.wikipedia.org/wiki/Aviation

Consigliato. Parole localizzate nell'URL, se applicabile:

example.com/lebensmittel/pfefferminz

Sconsigliato. Numeri ID lunghi e illeggibili nell'URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Se il tuo sito è multiregionale, potresti utilizzare una struttura di URL che semplifichi il targeting geografico. Per ulteriori esempi su come strutturare gli URL, consulta la pagina Usare URL specifici delle aree geografiche.

Consigliato. Dominio specifico del paese:

example.de

Consigliato. Sottodirectory specifica del paese con gTLD:

example.com/de/

Ti consigliamo di utilizzare i trattini negli URL, poiché consentono a utenti e motori di ricerca di identificare più facilmente i concetti contenuti nell'URL.

Consigliato. Utilizzo di parole chiave nell'URL separate da un trattino:

https://www.example.com/green-dress

Sconsigliato. Utilizzo di parole chiave negli URL scritte come un'unica parola:

https://www.example.com/greendress

Ti consigliamo di utilizzare i trattini (-) invece dei trattini bassi (_) negli URL.

Consigliato. Utilizzo di trattini (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

Sconsigliato. Utilizzo di trattini bassi (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario o non essere in grado di indicizzare completamente tutti i contenuti del sito.

Cause comuni del problema

Un numero molto elevato e ingiustificato di URL può avere molteplici cause, ad esempio:

  • Filtri aggiuntivi di un gruppo di elementi: molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, "mostrami hotel vicino alla spiaggia"). Quando i filtri possono essere combinati per addizione (ad esempio, "hotel vicino alla spiaggia e con centro fitness"), il numero di URL (visualizzazioni di dati) nei siti aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel con lievi differenze è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:
    • Proprietà alberghiere a "tariffe vantaggiose":
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generazione dinamica dei documenti: questa operazione può comportare leggere modifiche, a causa di contatori, timestamp o presenza di pubblicità.
  • Parametri problematici nell'URL: gli ID di sessione, ad esempio, possono creare enormi quantità di duplicati e un numero molto elevato di URL.
  • Parametri di ordinamento: alcuni siti di shopping di grandi dimensioni forniscono più modalità di ordinamento degli stessi articoli e ciò comporta un notevole aumento del numero di URL. Ad esempio:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parametri irrilevanti nell'URL, ad esempio parametri di referral. Ad esempio:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemi del calendario: un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Link relativi inaccessibili: i link relativi inaccessibili sono spesso causa di spazi infiniti. Questo problema si verifica soprattutto quando ci sono elementi del percorso ripetuti. Ad esempio:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Risolvere il problema

Per evitare potenziali problemi relativi alla struttura degli URL, consigliamo di procedere come riportato di seguito:

  • Valuta l'utilizzo di un file robots.txt per bloccare l'accesso di Googlebot a URL che presentano problemi. In genere, valuta la possibilità di bloccare gli URL dinamici, come quelli che generano i risultati di ricerca, o gli URL che possono creare spazi infiniti, come i calendari. L'utilizzo di espressioni regolari nel file robots.txt ti consente di bloccare facilmente un numero elevato di URL.
  • Dove possibile cerca di non utilizzare ID sessione negli URL. Sostituiscili con i cookie. Per maggiori informazioni, consulta le istruzioni per i webmaster.
  • Cerca di ridurre la lunghezza degli URL, se possibile, eliminando i parametri non necessari.
  • Se il tuo sito include un calendario infinito, aggiungi un attributo nofollow ai link che rimandano a pagine future del calendario create dinamicamente.
  • Verifica l'eventuale presenza di link relativi inaccessibili nel sito.