Notre lutte contre le spam dans la recherche Google : rapport 2019

Mardi 9 juin 2020

Googlebot présente le rapport sur le spam Web 2019

Toutes les recherches comptent. C'est pourquoi notre mission est de fournir aux internautes les résultats les plus pertinents possibles lorsqu'ils accèdent à la recherche Google pour trouver des informations spécifiques.

Malheureusement, certains comportements et contenus perturbateurs sur le Web (généralement connus sous le nom de "spam") peuvent nuire à l'expérience utilisateur. Plusieurs de nos équipes s'attellent à empêcher le spam d'affecter vos résultats de recherche, mais la lutte contre les spammeurs demande une attention de tous les instants. Parallèlement, nous continuons à collaborer avec les webmasters pour nous assurer qu'ils appliquent les bonnes pratiques et qu'ils optimisent leurs performances dans la recherche Google grâce à un contenu Web de haute qualité, accessible à tous.

Vous découvrirez ci-dessous comment nous avons lutté contre le spam dans la recherche en 2019, ainsi que les mesures que nous avons prises pour soutenir la communauté de webmasters.

Lutter contre le spam à grande échelle

Chaque jour, les centaines de milliards de pages Web qui composent notre index contribuent à répondre à plusieurs milliards de requêtes. Il n'est donc pas surprenant que des personnes mal intentionnées essaient de manipuler le classement dans la recherche. Nous avons d'ailleurs constaté que parmi les pages que nous découvrons chaque jour, plus de 25 milliards contiennent du spam. Cela témoigne de l'ampleur de ce phénomène, de l'acharnement des spammeurs et des moyens qu'ils sont prêts à mettre en œuvre pour arriver à leurs fins. Il est très important d'éliminer les pages contenant du spam dans les résultats de recherche, et nous prenons cette tâche très au sérieux. Grâce à nos efforts, plus de 99 % des visites de sites effectuées à partir de nos résultats renvoient les internautes vers des contenus sans spam.

Actualités de l'année dernière

En 2018, nous avions observé une baisse de 80 % du spam généré par les utilisateurs. Nous sommes heureux de confirmer que ce type de pratique abusive n'a pas gagné de terrain en 2019. L'utilisation de liens spam est restée une technique populaire, mais notre équipe est parvenue à en limiter l'impact en 2019. Plus de 90 % des liens spam ont été détectés par nos systèmes, tandis que des pratiques telles que les liens payants ou les échanges de liens ont perdu en efficacité.

Quant au piratage de contenu, bien qu'il affecte encore beaucoup de sites, son évolution est restée stable comparée aux années précédentes. Nous avons poursuivi nos efforts de développement de solutions permettant de détecter ce type de spam et d'informer les webmasters ainsi que les plates-formes concernés le plus efficacement possible, afin de les aider à rétablir l'état d'origine de leurs sites.

En 2019, l'un de nos principaux objectifs était d'améliorer la lutte contre le spam grâce à des systèmes de machine learning. Nos solutions de machine learning, alliées à des actions manuelles ayant fait leurs preuves, ont joué un rôle clé pour identifier les résultats associés à du spam et pour en empêcher la diffusion auprès des internautes.

Ces dernières années, nous avons constaté une augmentation du nombre de sites dont le contenu est généré automatiquement ou détourné. Ces sites utilisent, par exemple, des boutons fictifs, des annonces intempestives, des redirections douteuses ou des logiciels malveillants, ce qui nuit à l'expérience utilisateur. Leur contenu est souvent trompeur et n'apporte aucune valeur ajoutée aux internautes. En 2019, nous avons réussi à réduire l'impact de ce type de spam sur les utilisateurs de la recherche de 60 % par rapport à l'année précédente.

Alors que nous améliorons nos techniques de détection du spam, nous investissons continuellement dans la réduction des nuisances plus générales, telles que les escroqueries et les fraudes. Les sites incriminés font croire à leurs visiteurs que leur contenu provient d'une entité officielle ou faisant autorité. Dans de nombreux cas, les internautes finissent par révéler des informations personnelles sensibles et peuvent perdre de l'argent, voire infecter leurs appareils avec un logiciel malveillant. Nous prêtons donc une attention particulière aux requêtes les plus susceptibles d'être ciblées par les escroqueries et les fraudes, afin d'anticiper le risque et de protéger efficacement les utilisateurs contre ces tactiques.

L'union fait la force

Pour lutter contre le spam, nous avons en grande partie recours à des systèmes automatisés qui permettent d'identifier les comportements douteux. Toutefois, ces systèmes ne sont pas parfaits et ne peuvent pas tout détecter. En tant qu'utilisateur de la recherche, vous pouvez également nous aider à lutter contre le spam et d'autres problèmes. Pour ce faire, vous avez la possibilité de signaler le spam dans la recherche, les tentatives d'hameçonnage ou les logiciels malveillants. En 2019, nous avons reçu près de 230 000 rapports de spam et sommes parvenus à résoudre 82 % des rapports que nous avons traités. Nous vous sommes particulièrement reconnaissants de prendre le temps de nous signaler ces pratiques abusives et de contribuer ainsi à la qualité des résultats de recherche.

Quelles mesures prenons-nous lorsque nous recevons des rapports de spam ou que nous identifions un problème ? L'une des principales étapes que nous suivons lorsque nous détectons une anomalie sur un site Web consiste à en informer le webmaster. En 2019, nous avons généré plus de 90 millions de messages à l'attention des propriétaires de sites Web pour leur signaler des problèmes potentiels susceptibles d'altérer l'apparence de leur site dans les résultats de recherche, et pour leur suggérer des améliorations possibles. Environ 4,3 millions de ces messages portaient sur des actions manuelles découlant du non-respect des consignes aux webmasters.

Nous sommes constamment à la recherche de nouveaux moyens d'aider au mieux les propriétaires de sites. En 2019, de nombreuses initiatives visaient à améliorer la communication, par exemple avec les messages de la nouvelle Search Console, le kit pour les sites WordPress ou la validation DNS automatique disponible dans la nouvelle Search Console. Nous espérons que ces initiatives ont permis aux webmasters de valider plus facilement leur site et qu'elles continueront à leur apporter l'aide dont ils ont besoin. Nous espérons également que les webmasters ont ainsi plus rapidement accès à l'information et qu'ils sont davantage en mesure de résoudre efficacement les problèmes liés au spam ou au piratage.

Bien que notre attention se soit, en grande partie, portée sur l'élimination du spam, nous n'avons pas oublié de suivre l'évolution du Web et avons repensé notre façon de traiter les liens "nofollow". Initialement créé pour faciliter la lutte contre le spam dans les commentaires et pour annoter les liens commerciaux, l'attribut "nofollow" a beaucoup évolué. Mais nous ne comptons pas l'arrêter dans sa course. Nous pensons que l'heure est venue d'en repousser les limites, tout comme notre capacité à lutter contre le spam a évolué. Nous avons créé deux attributs "link" (rel="sponsored" et rel="ugc") qui offrent aux webmasters une nouvelle façon d'identifier la nature de certains liens pour la recherche Google. Avec rel="nofollow", nous avons commencé à tenir compte de ces attributs pour le classement des sites dans la recherche. Nous sommes ravis de constater que ces nouveaux attributs "rel" ont été bien accueillis et qu'ils ont été adoptés par de nombreux webmasters à travers le monde.

Interagir avec la communauté

Toutes les opportunités qui nous ont été données, l'année dernière, d'entrer en contact avec des webmasters du monde entier, de les aider à améliorer leur présence dans la recherche et de recueillir leur feedback nous remplissent toujours de joie. Nous avons proposé plus de 150 heures d'assistance en ligne, des événements en ligne et en personne dans un large éventail de villes à travers le monde, touchant ainsi une audience éclectique composée de référenceurs, de développeurs, de responsables marketing en ligne et d'entrepreneurs. Parmi tous ces événements, nous nous réjouissons du succès recueilli par les Webmaster Conferences, qui se sont tenues dans pas moins de 12 langues et qui ont eu lieu dans 35 villes réparties dans 15 pays. Nous sommes notamment très fiers de la première version de notre "sommet produit" à Mountain View. Bien qu'à l'heure actuelle, il ne soit plus possible d'organiser des événements en personne, nous sommes impatients de pouvoir vous rencontrer à nouveau et de partager à terme notre passion sur des plates-formes virtuelles.

En 2019, les webmasters ont continué à trouver des solutions et des conseils par l'intermédiaire de la communauté d'aide aux webmasters avec plus de 30 000 fils de discussion dans plus de 12 langues. Sur YouTube, nous avons lancé #AskGoogleWebmasters, ainsi que des séries comme Démystifier le SEO pour répondre à vos questions et à vos incertitudes.

Nous sommes conscients que l'amélioration du Web demande des efforts constants et espérons continuer à compter sur vous l'année à venir. Par conséquent, retrouvez-nous sur Twitter, sur YouTube, sur notre blog ou dans la communauté d'aide, ou venez à notre rencontre à l'occasion d'une de nos conférences près de chez vous.

Illustration montrant des personnes qui se tapent dans la main