Come abbiamo combattuto lo spam nella Ricerca Google nel 2020

Giovedì 29 aprile 2021

Googlebot e l'amico spider leggono il report sullo spam web del 2020

La Ricerca Google è uno strumento potente che vi aiuta a trovare informazioni utili sul Web aperto. Purtroppo, non tutte le pagine web vengono create con buone intenzioni: molte vengono realizzate espressamente allo scopo di ingannare le persone e questo è un fenomeno che combattiamo ogni giorno. Per garantire la vostra sicurezza e proteggere l'esperienza di ricerca da contenuti deleteri e comportamenti dannosi, la Ricerca ha investito in molte innovazioni nel 2020.

Combattere lo spam in modo più intelligente

Sebbene combattiamo lo spam sin dagli inizi della Ricerca, i recenti progressi dell'intelligenza artificiale (AI) offrono un potenziale senza precedenti per rivoluzionare il nostro approccio.

L'unione tra una profonda conoscenza dello spam e l'AI ci ha consentito l'anno scorso di creare un sistema di AI di lotta allo spam tutto nostro, che è incredibilmente efficace nell'individuare sia le tendenze note che quelle nuove relative allo spam. Ad esempio, rispetto a qualche anno fa, abbiamo ridotto di oltre l'80% i siti con contenuti generati automaticamente e con contenuti di altri siti.

Nonostante abbiamo migliorato la nostra capacità di rilevamento di oltre il 50% e abbiamo rimosso la maggior parte delle compromissioni tramite spam dai risultati di ricerca, nel 2020 questo tipo di compromissioni ha continuato a crescere a causa del numero molto elevato di siti web ancora vulnerabili.

Questo è un problema che non possiamo risolvere da soli; anche se fossimo in grado di rilevare ogni forma di spam e proteggere di conseguenza gli utenti, gli hacker non smetterebbero di sfruttare eventuali falle di sicurezza non ancora risolte. I proprietari di siti web possono proteggere i propri siti adottando delle valide misure di sicurezza: è più facile impedire che un sito venga compromesso che ripristinarlo a seguito di una compromissione. Google offre varie risorse per aiutarvi a comprendere le modalità più comuni di compromissione dei siti e come utilizzare Search Console per verificare se il vostro sito è stato compromesso. Consultate quindi queste risorse e proteggiamo assieme il Web.

Dati i grandi avvenimenti dell'anno scorso, tra cui una pandemia globale, abbiamo compiuto notevoli sforzi per migliorare la protezione di miliardi di ricerche che abbiamo ricevuto su argomenti così importanti. Se cercate un centro per i test per il COVID-19 nelle vicinanze, è importante che non dobbiate preoccuparvi di incappare in contenuti spam senza senso che potrebbero reindirizzarvi a siti di phishing. Oltre a eliminare i contenuti di spam, abbiamo collaborato con molti altri team della Ricerca per assicurarci che troviate le informazioni più aggiornate e della migliore qualità nei momenti e nelle situazioni che contano.

Impedire allo spam di raggiungere gli utenti

Prima che un insieme di risultati di ricerca vi venga mostrato su Google, dietro le quinte accadono molte cose. Tutti i giorni scopriamo, eseguiamo la scansione e indicizziamo miliardi di pagine web e tra queste è presente una grande quantità di spam: ogni giorno troviamo 40 miliardi di pagine contenenti spam. Ecco come facciamo per impedire che questi contenuti spam ostacolino la vostra ricerca di informazioni utili.

Il nostro processo di protezione dallo spam in ogni sua fase
Questo diagramma illustra come proteggiamo gli utenti dallo spam.

In primo luogo, disponiamo di sistemi in grado di rilevare lo spam quando eseguiamo la scansione delle pagine o di altri contenuti. Tramite la scansione, i nostri sistemi automatici consultano i contenuti e valutano se includerli nell'indice che utilizziamo per fornire i risultati di ricerca. Alcuni contenuti rilevati come spam non vengono aggiunti all'indice.

Questi sistemi funzionano anche per i contenuti che scopriamo tramite le Sitemap e Search Console. Ad esempio, Search Console dispone della funzionalità Richiesta di indicizzazione che consente agli autori di informarci su nuove pagine che devono essere aggiunte rapidamente. Abbiamo notato che gli spammer compromettono siti vulnerabili, fingono di essere i proprietari di questi siti, eseguono la verifica in Search Console e utilizzano lo strumento per chiedere a Google di eseguire la scansione e indicizzare le numerose pagine contenenti spam che hanno creato. L'utilizzo dell'AI ci ha permesso di individuare verifiche sospette e impedire che gli URL di spam venissero inseriti in tal modo nel nostro indice.

In secondo luogo, disponiamo di sistemi che analizzano i contenuti inclusi nel nostro indice. Quando eseguite una ricerca, i sistemi verificano se i contenuti corrispondenti contengono spam e, se è così, questi non vengono visualizzati nei principali risultati di ricerca. Utilizziamo queste informazioni anche per migliorare i nostri sistemi e impedire a monte che spam di questo tipo venga incluso nell'indice.

Il risultato è che, grazie ai nostri sistemi automatici supportati dall'AI, solo una minima parte di spam compare effettivamente tra i principali risultati di una ricerca visibili a chiunque. Secondo le nostre stime, questi sistemi automatici contribuiscono a fare in modo che oltre il 99% delle visite provenienti dalla Ricerca sia completamente privo di spam. Per la piccola percentuale rimanente, i nostri team intraprendono azioni manuali e utilizzano i dati raccolti per migliorare ulteriormente i sistemi automatici.

Protezione oltre lo spam

Googlebot e il suo fidato amico vi proteggono anche oltre lo spam

Oltre allo spam, nel 2020 abbiamo ampliato i nostri sforzi per proteggervi da altri tipi di comportamenti illeciti, molti dei quali possono causare danni finanziari e personali significativi.

Nel 2020, abbiamo compiuto notevoli progressi per migliorare la nostra copertura e proteggere un maggior numero di utenti da truffe e attività fraudolente online. Le frodi online assumono molte forme e possono incidere negativamente sugli utenti in più modi rispetto allo spam web tradizionale. Ad esempio, molti truffatori fingono di offrire i numeri di telefono dell'assistenza clienti per servizi e prodotti comuni, con l'unico obiettivo di indurre con l'inganno gli utenti che telefonano a effettuare un pagamento, ad esempio, tramite bonifici bancari o carte regalo. Questo tipo di frode, comunemente nota come "dell'assistenza clienti" o "dell'assistenza tecnica", è stata segnalata da centinaia di migliaia di utenti e potrebbe comportare la perdita di centinaia di dollari a favore dei truffatori per ogni singolo caso.

Esempio di frode dell'assistenza clienti nei risultati di ricerca

Dal 2018, i nostri sistemi sono stati in grado di proteggere centinaia di milioni di ricerche all'anno tramite il rilevamento di siti potenzialmente fraudolenti. Sul Web, i truffatori hanno cercato di creare molti siti web di bassa qualità con parole chiave in eccesso, imitazioni di loghi di brand e un numero di telefono per indurre gli utenti a chiamare. Grazie alle nostre soluzioni algoritmiche, esiste una probabilità molto limitata che frodi e attività fraudolente appaiano nei vostri risultati di ricerca. Questo è solo uno dei diversi tipi di protezioni che abbiamo introdotto l'anno scorso per garantire la qualità dei risultati di ricerca e la vostra sicurezza. La nostra missione è superare le sfide che si presenteranno e fornirvi i risultati più affidabili possibili. Allo stesso tempo, potete anche proteggervi meglio restando aggiornati e informandovi sulle frodi.

Un altro fronte su cui i progressi dell'AI hanno dato un contributo enorme è la comprensione dei contenuti dei siti. Ne è un esempio il miglioramento delle modalità di ranking dei siti di recensioni di prodotti nonché di quelli informativi e di acquisti. La Ricerca Google è un ottimo modo per cercare e trovare prodotti prima di effettuare un acquisto e il nostro obiettivo è assicurarci che riceviate le informazioni più utili per il vostro prossimo acquisto premiando i contenuti che riportano informazioni approfondite e utili.

Nonostante le innovazioni significative che abbiamo apportato nell'ambito del nostro impegno per la lotta allo spam, gli spammer sono estremamente motivati a sviluppare nuove tecniche in grado di aggirare i sistemi di rilevamento. Ci impegniamo costantemente per migliorare e per proteggere le persone dai nuovi tipi di attività illecite e le segnalazioni esterne possono essere d'aiuto. Avete esperienze recenti con la Ricerca in cui vi siete sentiti vittime di inganni, frodi o spam e pensate che potremmo fare di meglio per evitare situazioni simili? Se sì, condividete il vostro feedback utilizzando la segnalazione di spam e includendo la query ed eventuali altre informazioni che potrebbero essere utili.

Googlebot collabora con voi per combattere lo spam