Best practice per la struttura degli URL per la Ricerca Google

Per assicurarti che la Ricerca Google possa eseguire la scansione del tuo sito in modo efficace, utilizza una struttura degli URL scansionabile che soddisfi i seguenti requisiti. Se i tuoi URL non soddisfano i criteri di seguito, la Ricerca Google probabilmente eseguirà la scansione del tuo sito in modo inefficiente, ad esempio con frequenze di scansione estremamente elevate o senza eseguire alcuna scansione.

Requisiti per una struttura di URL scansionabile

Segui lo standard IETF STD 66

La Ricerca Google supporta gli URL definiti dallo standard IETF STD 66. I caratteri definiti dallo standard come prenotati devono essere codificati in percentuale.

Non utilizzare i frammenti di URL per modificare i contenuti

Non utilizzare i frammenti per modificare i contenuti di una pagina, dato che in genere la Ricerca Google non supporta i frammenti di URL. Ecco un esempio di un frammento di URL:

https://example.com/#/potatoes

Se utilizzi JavaScript per modificare i contenuti, utilizza invece l'API History.

Utilizza una codifica comune per i parametri URL

Quando specifichi i parametri URL, utilizza la seguente codifica comune: un segno di uguale (=) per separare le coppie chiave/valore e aggiungi parametri aggiuntivi con una e commerciale (&). Per elencare più valori per la stessa chiave all'interno di una coppia chiave/valore, puoi utilizzare qualsiasi carattere che non entri in conflitto con lo standard IETF STD 66, ad esempio una virgola (,).

Consigliato Non consigliato
Utilizzo di un segno uguale (=) per separare le coppie chiave/valore e una e commerciale (&) per aggiungere parametri aggiuntivi:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Utilizzo di due punti (:) per separare le coppie chiave/valore e le parentesi quadre ([ ]) per aggiungere parametri aggiuntivi:
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Utilizzo di una virgola (,) per elencare più valori per la stessa chiave, un segno di uguale (=) per separare le coppie chiave-valore e una e commerciale (&) per aggiungere parametri aggiuntivi:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Utilizzo di una singola virgola (,) per separare le coppie chiave/valore e virgole doppie (,,) per aggiungere parametri aggiuntivi:
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789

Semplifica la struttura degli URL

Per aiutare la Ricerca Google (e i tuoi utenti) a comprendere meglio il tuo sito, ti consigliamo di creare una struttura degli URL semplice, applicando le seguenti best practice, se possibile.

Best practice

Utilizza URL descrittivi

Se possibile, utilizza negli URL parole di senso compiuto anziché lunghi ID numerici.

Consigliato (parole semplici e descrittive) Non consigliato (numeri ID lunghi e illeggibili)
https://example.com/wiki/Aviation
https://example.com/index.php?topic=42&area=3a5ebc944f41daa6f849f730f1

Utilizza la lingua del tuo pubblico

Utilizza nell'URL parole nella lingua del tuo pubblico (e, se applicabile, parole traslitterate). Ad esempio, se il tuo pubblico effettua ricerche in tedesco, utilizza parole tedesche nell'URL:

https://example.com/lebensmittel/pfefferminz

In alternativa, se il tuo pubblico effettua ricerche in giapponese, utilizza parole in giapponese nell'URL:

https://example.com/ペパーミント

Utilizza la codifica UTF-8 in base alle necessità

Quando crei link alle pagine del tuo sito, utilizza la codifica UTF-8 negli attributi href dei link, se necessario. I caratteri ASCII non prenotati possono essere lasciati nel formato non codificato. Inoltre, i caratteri nell'intervallo non ASCII devono avere una codifica UTF-8. Ad esempio:

Consigliato (codifica UTF-8) Sconsigliato (caratteri non ASCII)
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
https://example.com/نعناع
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
https://example.com/杂货/薄荷
https://example.com/gem%C3%BCse
https://example.com/gemüse
https://example.com/%F0%9F%A6%99%E2%9C%A8
https://example.com/🦙✨

Utilizza i trattini per separare le parole

Ti consigliamo di separare le parole negli URL, se possibile. In particolare, ti consigliamo di utilizzare i trattini (-) anziché i trattini bassi (_) per separare le parole negli URL, in quanto consentono agli utenti e ai motori di ricerca di identificare meglio i concetti contenuti nell'URL. Per motivi storici, sconsigliamo di utilizzare i trattini bassi, poiché questo stile è già ampiamente utilizzato per indicare concetti che dovrebbero essere tenuti insieme, ad esempio da vari linguaggi di programmazione per assegnare un nome alle funzioni (come format_date).

Consigliato Non consigliato

Utilizzo di trattini (-) per separare le parole:

https://example.com/summer-clothing/filter?color-profile=dark-grey

Utilizzo di trattini bassi (_) per separare le parole:

https://example.com/summer_clothing/filter?color_profile=dark_grey

Unione di parole nell'URL:

https://example.com/greendress

Utilizza il minor numero possibile di parametri

Se possibile, cerca di ridurre la lunghezza degli URL eliminando i parametri non necessari (ovvero quelli che non modificano i contenuti).

Tieni presente che gli URL sono sensibili alle maiuscole

Come qualsiasi altro client HTTP che segue lo standard IETF 66, la gestione degli URL della Ricerca Google è sensibile alle maiuscole (ad esempio, Google tratta sia /APPLE che /apple come URL distinti con i propri contenuti). Se il testo in maiuscolo e minuscolo di un URL viene trattato nello stesso modo dal tuo server web, converti tutto il testo in modo che abbia la stessa combinazione di maiuscole e minuscole. Sarà quindi più facile per Google stabilire che gli URL fanno riferimento alla stessa pagina.

Per i siti multiregionali

Se il tuo sito è multiregionale, potresti utilizzare una struttura di URL che semplifichi il targeting geografico del sito. Per ulteriori esempi su come strutturare gli URL, consulta Usa URL specifici delle regioni.

Consigliato (utilizzo di un dominio specifico per il paese):

https://example.de

Consigliato (utilizzo di una sottodirectory specifica per il paese con gTLD):

https://example.com/de/

Evita i problemi comuni correlati agli URL

Gli URL estremamente complessi, in particolare quelli contenenti più parametri, possono causare problemi ai crawler creando numeri eccessivamente elevati di URL che puntano a contenuti identici o simili sul tuo sito. Di conseguenza, Googlebot potrebbe utilizzare molta più larghezza di banda del necessario; oppure, la Ricerca Google potrebbe non essere in grado di indicizzare completamente tutti i contenuti del sito.

Un numero molto elevato e ingiustificato di URL può avere molteplici cause. Tra queste, segnaliamo ad esempio:

Problemi comuni

Filtri aggiuntivi di un gruppo di elementi

Molti siti forniscono visualizzazioni diverse dello stesso gruppo di elementi o risultati di ricerca. Spesso, infatti, consentono all'utente di filtrare il gruppo in base a criteri definiti (ad esempio, "mostrami hotel vicino alla spiaggia"). Quando i filtri possono essere combinati per addizione (ad esempio, "hotel vicino alla spiaggia e con centro fitness"), il numero di URL (visualizzazioni di dati) nei siti aumenta a dismisura. La creazione di un numero elevato di elenchi di hotel con lievi differenze è ridondante, in quanto Googlebot ha bisogno di vedere solo pochi elenchi per raggiungere la pagina di ciascun hotel. Ad esempio:

  • Proprietà alberghiere a "tariffe vantaggiose":
    https://example.com/hotel-search-results.jsp?Ne=292&N=461
  • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
  • Proprietà alberghiere a "tariffe vantaggiose" vicino alla spiaggia e con un centro fitness:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

Parametri irrilevanti

I parametri irrilevanti nell'URL possono causare un numero elevato di URL, ad esempio:

  • Parametri di referral:
    https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
  • Parametri di ordinamento di Shopping:
    https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • ID sessione:
    https://example.com/search/noheaders?sessionid=6EE2BF1AF6A3D705D5561B7C3564D9C2

Valuta la possibilità di usare un file robots.txt per bloccare l'accesso di Googlebot a questi URL problematici.

Problemi di calendario

Un calendario generato dinamicamente può creare link a date passate e future senza restrizioni sulle date di inizio e di fine. Ad esempio:

https://example.com/calendar.php?d=13&m=8&y=2011

Se il tuo sito include un calendario infinito, aggiungi un attributo nofollow ai link che rimandano a pagine future del calendario create dinamicamente.

Se inserisci un link relativo alla directory superiore nella pagina sbagliata, potresti creare spazi infiniti se il server non risponde con il codice di stato HTTP corretto per le pagine inesistenti. Ad esempio, un link relativo alla directory superiore come <a href="../../category/stuff">...</a> su https://example.com/category/community/070413/html/FAQ.htm può portare a URL falsi come https://example.com/category/community/category/stuff. Per risolvere il problema, utilizza URL relativi alla root directory nei link (anziché relativi alla directory superiore).

Risolvi i problemi di scansione relativi alla struttura degli URL

Se noti che la Ricerca Google esegue la scansione di questi URL problematici, ti consigliamo di procedere nel seguente modo: