Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Evitare la creazione di contenuti duplicati

Il termine "contenuti duplicati" si riferisce in genere a blocchi considerevoli di contenuti che sono identici oppure molto simili ad altri contenuti nella stessa lingua all'interno dello stesso dominio o in domini diversi. In genere questa pratica non è all'origine ingannevole. Ecco alcuni esempi di contenuti duplicati non dannosi:

  • Forum di discussione che possono generare sia pagine standard sia versioni "essenziali" delle pagine pensate per i dispositivi mobili
  • Più URL distinti che visualizzano o rimandano agli stessi articoli di un negozio online
  • Versioni di pagine web disponibili solo per la stampa

Se il tuo sito contiene più pagine con contenuti quasi identici, esistono vari modi per indicare il tuo URL preferito a Google. Questa pratica è chiamata "canonicalizzazione". Scopri di più sulla canonicalizzazione.

In alcuni casi, tuttavia, i contenuti vengono deliberatamente duplicati tra i domini nel tentativo di controllare il ranking nei motori di ricerca o acquisire un traffico maggiore. Pratiche ingannevoli come questa possono causare un'esperienza utente non soddisfacente, perché i visitatori vedono sempre gli stessi contenuti ripetuti in un insieme di risultati di ricerca.

Google cerca di indicizzare e visualizzare pagine contenenti informazioni distinte. Ciò significa, ad esempio, che se sul tuo sito è disponibile per ogni articolo una versione "standard" e una versione "per la stampa" e nessuna delle due è bloccata con un tag noindex, verrà scelta solo una delle due. Nei rari casi in cui ci accorgiamo che i contenuti duplicati potrebbero essere visualizzati con l'intento di manipolare i nostri ranking e ingannare i nostri utenti, apportiamo le necessarie modifiche all'indicizzazione e al ranking dei siti interessati. Di conseguenza, il ranking dei siti potrebbe peggiorare oppure i siti potrebbero essere rimossi completamente dall'Indice Google e non compariranno più nei risultati di ricerca.

Di seguito riportiamo le operazioni da eseguire per risolvere in modo proattivo i problemi dei contenuti duplicati ed essere sicuri che i visitatori visualizzino i contenuti a loro destinati.

  • Utilizza reindirizzamenti 301: se hai ristrutturato il tuo sito, utilizza reindirizzamenti 301 ("RedirectPermanent") nel file .htaccess per reindirizzare gli utenti, Googlebot e altri spider in modo intelligente. In Apache, puoi eseguire questa operazione con un file .htaccess, mentre in IIS (Internet Information Server) puoi utilizzare la console di amministrazione.
  • Mantieni la coerenza: cerca di mantenere coerenti i link interni. Ad esempio, non inserire collegamenti a http://www.example.com/page/, http://www.example.com/page e http://www.example.com/page/index.htm.
  • Utilizza domini di primo livello: per consentirci di visualizzare la versione più appropriata di un documento, utilizza domini di primo livello, ove possibile, per gestire contenuti specifici per paese. È più probabile che ci accorgiamo che il sito http://www.example.de include contenuti specifici per la Germania rispetto, ad esempio, a http://www.example.com/de o http://de.example.com.
  • Presta particolare attenzione ai contenuti in syndication: se pubblichi i tuoi contenuti su altri siti in syndication, Google visualizzerà sempre la versione ritenuta più appropriata per gli utenti in ciascuna ricerca. Tale versione può essere o meno quella da te preferita. È utile accertarsi, tuttavia, che ogni sito su cui i contenuti sono distribuiti in syndication includa un link che rimandi all'articolo originale. Puoi anche chiedere a chi utilizza il tuo materiale distribuito in syndication di utilizzare il tag noindex per impedire ai motori di ricerca di indicizzare la versione dei contenuti di tali utenti.
  • Riduci al minimo la ripetizione di testo boilerplate: ad esempio, anziché inserire un lungo testo relativo al copyright nella parte inferiore di ogni pagina, includi un breve riepilogo, quindi inserisci un link a una pagina contenente ulteriori dettagli.
  • Evita la pubblicazione di stub: gli utenti non amano visualizzare pagine "vuote" pertanto, se possibile, evita l'utilizzo di segnaposto. Ad esempio, non pubblicare pagine per le quali non disponi ancora di contenuti effettivi. Se decidi comunque di creare pagine segnaposto, utilizza il tag noindex per evitare che vengano indicizzate.
  • Acquisisci familiarità con il tuo sistema di gestione dei contenuti: accertati di conoscere bene le modalità di visualizzazione dei contenuti sul tuo sito web. Blog, forum e sistemi correlati mostrano spesso gli stessi contenuti in diversi formati. Ad esempio, il post di un blog può comparire con la stessa etichetta nella home page di un blog, in una pagina di archivio e in una pagina di altri post.
  • Riduci al minimo i contenuti simili: se disponi di molte pagine simili, prova a espandere ciascuna di esse o a consolidarle tutte in una sola pagina. Ad esempio, se il tuo sito di viaggi contiene pagine distinte per due città ma le informazioni sono le stesse su entrambe le pagine, potresti unire le due pagine in una sola pagina riguardante entrambe le città o espandere ciascuna di esse in modo che presenti contenuti unici su ciascuna città.

Google sconsiglia di bloccare l'accesso del crawler ai contenuti duplicati nel tuo sito web, sia con un file robots.txt sia con altri metodi. Se i motori di ricerca non riescono a eseguire la scansione delle pagine con contenuti duplicati, non potranno rilevare automaticamente che questi URL rimandano agli stessi contenuti e pertanto dovranno di fatto considerare queste pagine come pagine univoche e distinte. La soluzione migliore è consentire ai motori di ricerca di eseguire la scansione di questi URL, ma contrassegnarli come duplicati utilizzando l'elemento link rel="canonical" o i reindirizzamenti 301. Nel caso in cui i contenuti duplicati dovessero causare un'eccessiva scansione del tuo sito web, puoi modificare l'impostazione relativa alla frequenza di scansione in Search Console.

La presenza di contenuti duplicati su un sito non giustifica l'adozione di misure particolari, a meno che l'intento non sia tranne in inganno e manipolare i risultati dei motori di ricerca. Se sul tuo sito sono presenti contenuti duplicati e tu non segui i consigli riportati in questo documento, noi provvediamo a scegliere una versione dei contenuti da visualizzare nei nostri risultati di ricerca.

Tuttavia, se con la nostra verifica abbiamo rilevato l'uso di pratiche ingannevoli e il tuo sito è stato rimosso dai nostri risultati di ricerca, esamina attentamente il tuo sito. Se il tuo sito è stato rimosso dai nostri risultati di ricerca, consulta le istruzioni per i webmaster per ulteriori informazioni. Dopo aver apportato le modifiche e aver controllato che il sito non sia più in violazione delle nostre linee guida, invia il sito per la riconsiderazione.

In rari casi, il nostro algoritmo potrebbe selezionare un URL da un sito esterno che ospita i tuoi contenuti senza la tua autorizzazione. Se ritieni che un altro sito abbia duplicato i tuoi contenuti violando la legge sul copyright, puoi contattare l'host del sito per richiedere la rimozione. Puoi anche chiedere a Google di rimuovere la pagina in violazione dai risultati di ricerca presentando una richiesta debitamente compilata ai sensi del Digital Millennium Copyright Act (Legge statunitense sul copyright).