Cómo combatimos el spam en la Búsqueda de Google en 2020

Jueves, 29 de abril de 2021

Googlebot y la amiga araña leen el informe de spam web de 2020

La Búsqueda de Google es una herramienta potente que te permite encontrar información útil en la Web abierta. Lamentablemente, no todas las páginas web se crean con buenas intenciones. Muchas de ellas se crean explícitamente para engañar a las personas, y esto es lo que combatimos todos los días. En 2020, a fin de garantizar la seguridad y la protección de la experiencia de la búsqueda contra el contenido disruptivo y los comportamientos maliciosos, se realizaron muchos cambios innovadores en la Búsqueda.

Combatimos el spam de manera más inteligente

Si bien combatimos el spam desde los inicios de la Búsqueda, los últimos avances en inteligencia artificial (IA) brindan un potencial sin precedentes para revolucionar nuestro enfoque.

Con la combinación de nuestro conocimiento profundo sobre el spam y la IA, el año pasado pudimos compilar nuestra propia herramienta de IA contra spam, que es increíblemente efectiva para detectar tendencias de spam conocidas y nuevas. Por ejemplo, redujimos los sitios con contenido copiado y generado automáticamente en más de un 80%, en comparación con un par de años atrás.

En 2020, el spam hackeado todavía estaba fuera de control, ya que la cantidad de sitios web vulnerables se mantuvo bastante alta. Sin embargo, mejoramos nuestra capacidad de detección fue superior al 50% y quitamos la mayor parte del spam hackeado de los resultados de la búsqueda.

Es un problema que no podemos resolver solos. Incluso, si pudiéramos detectar y proteger contra todo el spam, los hackers no dejarían de explotar las brechas de seguridad hasta que no se eliminen todas. Los propietarios de los sitios web pueden proteger sus sitios con una buena higiene de seguridad, ya que es más fácil evitar que hackeen un sitio que recuperarlo. Google ofrece recursos que ayudan a comprender las maneras más comunes en las que se hackean los sitios web y a usar Search Console para verificar si hackearon un sitio. Consulta estos recursos, y mantengamos juntos la seguridad de la Web.

Con los acontecimientos importantes del año pasado, incluida la pandemia a nivel mundial, dedicamos un esfuerzo importante en extender la protección a los miles de millones de búsquedas que recibimos sobre esos temas importantes. Si buscas un punto de toma de muestras del COVID-19 cerca de tu ubicación, no deberías preocuparte por si te encuentras con spam incoherente que puede redireccionarte a sitios de suplantación de identidad. Además de eliminar el contenido de spam, trabajamos con otros equipos de la Búsqueda para asegurarnos de recibir la información más actualizada y de la mejor calidad en el momento y el lugar más importantes.

Cómo evitamos que recibas spam

Antes de publicar un conjunto de resultados de la búsqueda en Google, se toman muchas medidas detrás de escena. Todos los días, descubrimos, rastreamos e indexamos miles de millones de páginas web. En estas páginas, puedes encontrar mucho spam. Todos los días, descubrimos 40,000 millones de páginas generadoras de spam. A continuación, te explicamos cómo trabajamos para impedir que el spam se interponga en la búsqueda de información útil y práctica.

cómo protegemos contra el spam en cada paso
En este diagrama, conceptualizamos la manera en que protegemos contra el spam.

En primer lugar, contamos con sistemas que pueden detectar el spam cuando rastreamos páginas u otro contenido. El rastreo se lleva a cabo cuando nuestros sistemas automáticos visitan contenido y lo consideran a fin de incluirlo en el índice que utilizamos para brindar los resultados de la búsqueda. Parte del contenido que se detecta como spam no se agrega al índice.

Estos sistemas también funcionan para el contenido que descubrimos en los mapas de sitios y en Search Console. Por ejemplo, Search Console incluye la característica para solicitar indexación, de modo que los creadores puedan informarnos sobre páginas nuevas que deben agregarse con rapidez. Observamos que los generadores de spam hackearon sitios vulnerables. Para ello, simularon ser los propietarios de esos sitios, verificaron su identidad en Search Console y usaron la herramienta a fin de solicitarle a Google que rastreara e indexara las numerosas páginas generadoras de spam que creaban. Con la inteligencia artificial, pudimos detectar verificaciones sospechosas y evitar que las URL de spam ingresaran a nuestro índice de esta manera.

Además, contamos con sistemas que analizan el contenido que se incluye en nuestro índice. Cuando realizas una búsqueda, funcionan para volver a verificar si el contenido que coincide puede ser spam. Si es así, ese contenido no aparecerá en los resultados principales de la búsqueda. También, usamos esa información para mejorar mucho más nuestros sistemas a fin de evitar que el spam se incluya en el índice.

El resultado es que, en realidad, muy poco spam logra aparecer en los resultados principales que las personas ven en una búsqueda, gracias a nuestros sistemas automatizados con la asistencia de la IA. Estimamos que estos sistemas automatizados permiten mantener más del 99% de las visitas desde la Búsqueda sin spam. En cuanto al pequeño porcentaje restante, nuestros equipos toman acciones manuales y utilizan los conocimientos obtenidos a fin de mejorar aún más los sistemas automatizados.

Te protegemos contra el spam y más

Googlebot y la amiga te protegen contra el spam y más

Además de spam, ampliamos nuestros esfuerzos en 2020 para protegerte contra otros tipos de abuso. Muchas de estos pueden causar daños financieros y personales significativos.

En 2020, logramos importantes avances para mejorar nuestra cobertura y proteger a más usuarios contra las estafas y los fraudes en línea. Las estafas en línea tienen muchas formas y pueden afectarte de forma negativa de muchas más maneras que el spam web tradicional. Por ejemplo, muchos estafadores simulan ofrecer números de teléfono de asistencia al cliente para productos y servicios populares, solo con el fin de engañar a los usuarios que llaman para que paguen a través de transferencias bancarias o tarjetas de regalo. Esta estafa, conocida como "estafa de asistencia al cliente" o "estafa de asistencia técnica", fue denunciada por cientos de miles de usuarios, en la que, en cada caso, los usuarios podían perder cientos de dólares por culpa de los estafadores.

ejemplo de una estafa de asistencia al cliente en los resultados de la búsqueda

Desde 2018, nuestros sistemas han podido proteger cientos de millones de búsquedas por año mediante la detección de sitios potencialmente sospechosos. En la Web, los estafadores intentaban crear muchos sitios web de baja calidad con el uso de palabras clave de relleno, logotipos de marcas que imitaban y un número de teléfono al que deseaban que llames. Con nuestras soluciones algorítmicas, nos aseguramos de que sea muy poco probable que las estafas y los fraudes aparezcan en los resultados de la búsqueda. Este es uno de los varios tipos de protecciones que lanzamos el año pasado para garantizar tu seguridad y la calidad de los resultados de la búsqueda. Nuestra misión es adelantarnos a los desafíos para brindarte los resultados más confiables. Al mismo tiempo, para protegerte mejor, también puedes mantenerte informado y aprender sobre las estafas.

Comprender el contenido de los sitios fue otra dimensión en la que los avances de la IA nos ayudaron enormemente. Por ejemplo, podemos mencionar cómo ayudábamos a mejorar la manera en que calificábamos las opiniones sobre productos, el contenido informativo y los sitios de compras. La Búsqueda de Google es una manera excelente de investigar y encontrar productos antes de hacer una compra. Es por ello que queremos brindarte contenido con una investigación más profunda e información práctica a fin de asegurarnos de que recibas información más útil para tu próxima compra.

A pesar de los importantes avances que hicimos con nuestros esfuerzos contra el spam, los generadores del mismo están muy motivados para desarrollar técnicas nuevas que puedan evadir nuestra detección. Trabajamos de manera constante, para mejorar y proteger a las personas de las nuevas clases de abuso, y los informes externos pueden ayudarte. ¿Tuviste una experiencia reciente confusa con la Búsqueda de Google, te sentiste estafado o se incluyó spam y crees que podemos tomar mejores medidas para evitar esto? Si es así, comparte tus comentarios mediante el informe de spam junto con la consulta y cualquier otra información que pueda resultar útil.

Googlebot trabaja contigo para combatir el spam