Cómo luchamos en el 2020 contra el spam en la Búsqueda de Google

Jueves, 29 de abril del 2021

El robot de Google y su amiga araña aparecen leyendo el informe de spam web del 2020

La Búsqueda de Google es una herramienta potente que puede ayudarte a encontrar información útil en la Web abierta. Lamentablemente, no todas las páginas web se crean con buenas intenciones. Muchas de ellas se han creado expresamente para engañar a los usuarios, y esto es algo contra lo que luchamos a diario. Para ofrecerte seguridad y proteger tu experiencia de búsqueda frente a contenido desagradable y comportamientos malintencionados, la Búsqueda ha invertido en muchas innovaciones en el 2020.

Luchar contra el spam de forma más eficiente

Aunque llevamos luchando contra el spam desde que lanzamos la Búsqueda, los avances recientes en inteligencia artificial (IA) tienen un potencial sin precedentes para revolucionar nuestro enfoque.

Al combinar nuestro profundo conocimiento del spam con la tecnología de la IA, el año pasado pudimos crear nuestra propia IA de lucha contra el spam, que resulta increíblemente eficaz para detectar las tendencias de spam nuevas y conocidas. Por ejemplo, hemos reducido los sitios con contenido generado automáticamente y copiado en más de un 80 % en comparación con hace un par de años.

El spam procedente de pirateos seguía vigente en el 2020, ya que el número de sitios web vulnerables seguía siendo bastante alto, aunque hemos mejorado nuestra capacidad de detección en más de un 50 % y hemos quitado de los resultados de búsqueda la mayor parte del spam procedente de pirateos.

Se trata de un problema que no podemos solucionar solos. Aunque podamos detectar todo el spam y protegernos contra él, los hackers no dejarían de explotar las lagunas legales hasta que no quede ninguna. Los propietarios de sitios web pueden proteger sus sitios si hacen correctamente las tareas de mantenimiento de la seguridad. Es más fácil impedir que pirateen un sitio que recuperarse de un ataque informático. Google te ofrece recursos para ayudarte a entender las formas más habituales en que se piratean sitios web y cómo usar Search Console para comprobar si han pirateado el tuyo. Échale un vistazo y ayúdanos a conseguir que la Web sea un lugar más seguro.

Debido a los importantes acontecimientos del año pasado, como la pandemia global, hemos dedicado un gran esfuerzo a mejorar la protección en los miles de millones de búsquedas que hemos recibido sobre estos temas tan importantes. Cuando estés buscando un punto de toma de muestras de COVID cercano, no deberías tener que preocuparte por que acaben redirigiéndote a sitios de suplantación de identidad (phishing) por culpa de spam de texto autogenerado. Además de eliminar contenido spam, trabajamos con otros equipos de la Búsqueda para asegurarnos de que recibes la información más actualizada y de mayor calidad en el momento y lugar en que es más importante.

Evitar que te llegue spam

Antes de ofrecer un conjunto de resultados de búsqueda en Google, se producen muchos procesos que no se ven a simple vista. Cada día, descubrimos, rastreamos e indexamos miles de millones de páginas web. Entre esas páginas hay mucho spam, y cada día descubrimos 40.000 millones de páginas con contenido engañoso. A continuación te indicamos cómo trabajamos para evitar que el spam obstaculice tu búsqueda de información útil.

Cómo luchamos contra el spam en todo momento
En este diagrama, se explica cómo nos defendemos del spam.

En primer lugar, contamos con sistemas que pueden detectar el spam cuando rastreamos páginas u otro contenido. El rastreo es el proceso mediante el cual nuestros sistemas automatizados visitan el contenido y lo tienen en cuenta para incluirlo en el índice que utilizamos para ofrecer resultados de búsqueda. No todo el contenido detectado como spam se añade al índice.

Estos sistemas también aprovechan el contenido que descubrimos a través de sitemaps y de Search Console. Por ejemplo, Search Console cuenta con la función Solicitar indexación, mediante la cual los creadores pueden informarnos sobre las nuevas páginas que se deben añadir pronto. Algunos spammers atacaron sitios vulnerables haciéndose pasar por los propietarios de estos sitios, verificándose en Search Console y utilizando la herramienta para pedir a Google que rastreara e indexara un gran número de páginas que habían creado con contenido engañoso. Gracias a la inteligencia artificial, hemos podido detectar verificaciones sospechosas y evitar que se incluyan URLs de spam en nuestro índice de esta manera.

También tenemos sistemas que analizan el contenido que incluye nuestro índice. Cuando haces una búsqueda, tratan de comprobar dos veces si el contenido que coincide puede ser spam. Si es así, ese contenido no aparecerá en los primeros resultados de búsqueda. Esta información también se utiliza para mejorar nuestros sistemas y evitar que se incluya spam en el índice.

Como resultado y gracias a nuestros sistemas automatizados con ayuda de la IA, pocas veces llega a mostrarse spam en los primeros resultados que ve un usuario al hacer una búsqueda. Estimamos que estos sistemas automatizados ayudan a mantener más del 99 % de las visitas de la Búsqueda por completo sin spam. En cuanto al pequeño porcentaje restante, nuestros equipos aplican acciones manuales y los conocimientos que adquieren les sirven para mejorar nuestros sistemas automatizados.

Protegerte no solo frente al spam

El robot de Google y su amiga te protegen frente a otros peligros aparte del spam

Además del spam, en el 2020 ampliamos nuestras iniciativas para protegerte contra otros tipos de ataques. Muchos de ellos pueden causar daños personales y financieros importantes.

En el 2020, empezamos a mejorar considerablemente nuestra cobertura y a proteger a más usuarios frente a las estafas y el fraude online. Hay estafas online de muchos tipos y pueden afectar negativamente de más formas que el spam web tradicional. Por ejemplo, muchos estafadores incluyen números de teléfono y fingen ser equipos de asistencia de productos y servicios populares para engañar a los usuarios pidiéndoles pagos a través de transferencias bancarias o tarjetas regalo. Cientos de miles de usuarios han denunciado este tipo de estafa común en la que un cliente puede perder cientos de euros.

Ejemplo de estafa del servicio de asistencia en los resultados de búsqueda

Nuestros sistemas han protegido a usuarios frente a sitios potencialmente engañosos desde el 2018 en cientos de millones de búsquedas anuales. En la Web, los estafadores intentaban crear muchos sitios web de baja calidad con exceso de palabras clave, logotipos de las marcas que imitaban y un número de teléfono en el que recibir llamadas. Nuestras soluciones algorítmicas se han asegurado de que sea muy poco probable que aparezcan estafas y fraudes en los resultados de búsqueda. Este es uno de los distintos tipos de medidas de protección que lanzamos el año pasado para vigilar la calidad de los resultados de búsqueda y tu seguridad. Nuestro objetivo es adelantarnos a los retos para ofrecerte los resultados más fiables. Al mismo tiempo, para protegerte, puedes leer las novedades que haya y consultar información sobre las estafas.

Otro campo en el que los avances en IA han contribuido en gran medida ha sido en la comprensión del contenido de los sitios. Por ejemplo, podemos ver esto en la forma en que hemos ayudado a mejorar cómo posicionamos los sitios de reseñas de productos, de información y de compras. La Búsqueda de Google es un lugar excelente para consultar información sobre productos y encontrarlos antes de decidirte a comprarlo. Por eso, hemos querido asegurarnos de que tengas a tu disposición la información más útil para tu próxima compra, recompensando el contenido que tiene análisis más detallados y datos que te puedan ser de ayuda.

A pesar de los importantes avances que hemos logrado en nuestra lucha contra el spam, los spammers se esfuerzan al máximo para desarrollar nuevas técnicas que no seamos capaces de detectar. Trabajamos constantemente para mejorar y proteger a los usuarios ante los nuevos tipos de ataques, y los informes de los propios usuarios pueden ser muy útiles. ¿Has tenido experiencias recientes en la Búsqueda en las que te hayan engañado, estafado o enviado spam, y crees que podemos mejorar nuestro servicio de prevención de esas experiencias? Si es así, envíanos tus comentarios a través del informe de spam, junto con la consulta y cualquier otro dato que pueda ser útil.

El robot de Google trabaja con los usuarios para combatir el spam