Notre lutte contre le spam dans la recherche Google en 2020

Jeudi 29 avril 2021

Googlebot et son robot lisent le rapport 2020 sur le spam

La recherche Google est un puissant outil qui vous aide à trouver des informations utiles dans l'immensité du Web. Malheureusement, les pages Web ne sont pas toutes créées avec de bonnes intentions. Beaucoup d'entre elles visent explicitement à tromper les utilisateurs, et nous luttons chaque jour contre ces pratiques. Pour assurer votre sécurité et protéger vos activités de recherche contre les contenus pernicieux et les comportements malveillants, Google a investi dans de nombreuses innovations en 2020 afin d'améliorer son moteur de recherche.

Lutter plus intelligemment contre le spam

Nous luttons contre le spam depuis les débuts de la recherche Google, mais les récents progrès en intelligence artificielle (IA) nous offrent plus que jamais la possibilité de révolutionner notre approche.

En combinant nos connaissances approfondies sur le spam avec l'IA, nous avons pu développer l'an dernier notre propre intelligence artificielle de lutte contre le spam. Celle-ci s'avère particulièrement efficace pour détecter non seulement les pratiques déjà connues, mais aussi les nouvelles tendances dans le domaine du spam. En l'espace de quelques années, nous avons par exemple réduit de plus de 80 % les sites comportant des contenus générés automatiquement ou des contenus détournés.

Le piratage de contenu a continué à faire des ravages en 2020, car le nombre de sites Web vulnérables reste relativement élevé, mais nous avons amélioré notre capacité de détection de plus de 50 % et supprimé des résultats de recherche la majeure partie des contenus piratés.

C'est un problème que nous ne pouvons pas résoudre seuls. Quand bien même nous pourrions détecter toutes les formes de spam et protéger les utilisateurs en conséquence, les pirates informatiques ne cesseront jamais d'exploiter la moindre faille en attendant qu'elle soit comblée. Les propriétaires de sites Web peuvent protéger leurs sites en suivant les bonnes pratiques de sécurité : il est plus facile d'empêcher le piratage d'un site que de remédier à ce piratage. Google met des ressources à votre disposition pour vous aider à identifier les méthodes les plus courantes de piratage des sites Web et expliquer comment utiliser la Search Console pour vérifier si votre site a été piraté. Pensez à les consulter : ensemble, nous pouvons rendre le Web plus sûr !

Suite aux événements survenus l'an dernier, dont la pandémie, nous avons cherché à renforcer la protection des milliards de recherches reçues sur ces sujets importants. Si vous cherchez un site de test COVID à proximité de chez vous, vous ne risquez pas de tomber sur du spam vide de sens qui pourrait vous rediriger vers des sites d'hameçonnage. Nous avons non seulement éliminé des contenus comportant du spam, mais aussi travaillé avec d'autres équipes de la recherche Google pour vous permettre de bénéficier d'informations à jour et de qualité, partout et à tout moment.

Bloquer le spam avant qu'il ne vous atteigne

Pour pouvoir afficher des résultats de recherche sur Google, nos systèmes réalisent de nombreuses opérations en arrière-plan. Chaque jour, nous découvrons, explorons et indexons des milliards de pages Web. Beaucoup de ces pages contiennent du spam : nous en détectons 40 milliards par jour. Voici comment nous empêchons le spam d'apparaître dans les résultats, pour que vous n'ayez accès qu'à des informations pertinentes et utiles.

notre lutte contre le spam étape par étape
Ce schéma représente nos méthodes de lutte contre le spam.

Tout d'abord, certains de nos systèmes peuvent détecter le spam lors de l'exploration des pages ou d'autres contenus. Réalisée par nos systèmes automatisés, l'exploration consiste à consulter des contenus pour déterminer s'il faut ou non les inclure dans l'index que nous utilisons pour afficher les résultats de recherche. Certains contenus sont identifiés comme spam dès cette étape et ne sont pas ajoutés à l'index.

Ces systèmes fonctionnent également avec les contenus découverts par le biais de sitemaps et de la Search Console. Par exemple, la Search Console offre une fonctionnalité de demande d'indexation qui permet aux créateurs de signaler les nouvelles pages à ajouter rapidement à l'index. D'après nos constatations, des spammeurs piratent des sites vulnérables en se faisant passer pour leurs propriétaires : ils s'authentifient auprès de la Search Console et utilisent cet outil pour demander à Google d'explorer et d'indexer les nombreuses pages de spam qu'ils ont créées. Grâce à l'IA, nous avons pu identifier les validations suspectes et empêcher les URL de spam d'entrer dans notre index.

Ensuite, d'autres systèmes analysent les contenus inclus dans l'index. Lorsque vous effectuez une recherche, ils vérifient une nouvelle fois les contenus correspondants pour contrôler qu'il ne s'agit pas de spam. S'ils détectent du spam, les contenus en question n'apparaissent pas dans les premiers résultats de recherche. Nous utilisons également ces informations pour améliorer nos systèmes afin d'éviter que ce type de spam ne soit inclus dans l'index.

Au final, très peu de spam parvient à atteindre les premiers résultats de recherche visibles, grâce à nos systèmes automatisés assistés par l'intelligence artificielle. D'après nos estimations, grâce à ces systèmes automatisés, plus de 99 % des visites sur la recherche Google n'entraînent l'affichage d'aucun spam. Quant au faible pourcentage restant, nos équipes peuvent entreprendre des actions manuelles et tirer profit des renseignements collectés pour améliorer davantage nos systèmes automatisés.

Vous protéger contre le spam, mais pas seulement

Googlebot et son petit compagnon vous protègent contre le spam, mais pas seulement

Nous avons redoublé d'efforts en 2020 pour vous protéger contre d'autres types d'utilisations abusives. Bon nombre de ces abus peuvent causer des dommages financiers et personnels importants.

En 2020, nous avons significativement amélioré notre couverture et protégé davantage d'utilisateurs contre les escroqueries et les fraudes en ligne. Il existe de nombreuses formes d'escroqueries en ligne, et celles-ci peuvent avoir des conséquences bien plus lourdes que le spam traditionnel. Par exemple, de nombreux escrocs prétendent proposer une assistance téléphonique pour certains services et produits très courants. Les utilisateurs qui appellent ces numéros doivent ensuite les régler par virement bancaire ou carte cadeau. Généralement appelées "escroquerie au faux service client" ou "escroquerie d'assistance technique", ces méthodes d'escroquerie ont été signalées par des centaines de milliers d'utilisateurs, avec un préjudice de plusieurs centaines de dollars dans chaque cas.

exemple d'escroquerie au faux service client dans les résultats de recherche

Depuis 2018, nos systèmes protègent des centaines de millions de recherches chaque année en détectant les sites potentiellement frauduleux. Des escrocs ont essayé de créer de nombreux sites Web de mauvaise qualité par accumulation de mots clés, en ajoutant les logos de marques légitimes et un numéro de téléphone auquel l'utilisateur doit les contacter. Grâce à nos solutions algorithmiques, il est très peu probable que ces escroqueries et fraudes se retrouvent dans vos résultats de recherche. Voilà quelques exemples des protections lancées l'an dernier pour proposer des résultats de recherche de qualité et assurer votre sécurité. Notre objectif est de garder une longueur d'avance sur les challenges qui se posent à nous, afin d'afficher les résultats les plus fiables possibles. Parallèlement, vous pouvez également mieux vous protéger en vous tenant informé et en vous renseignant sur les différentes escroqueries.

Les progrès dans le domaine de l'IA nous ont aussi beaucoup aidés à mieux comprendre le contenu des sites. Nous avons par exemple pu améliorer nos méthodes de classement des avis sur les produits, des sites d'information et des sites de commerce en ligne. La recherche Google est un excellent moyen de rechercher et de trouver des produits avant d'effectuer un achat, et nous tenons à ce que vous obteniez les informations les plus utiles possibles lors de votre prochain achat, en récompensant les contenus comportant des données plus détaillées et des informations utiles.

Malgré nos avancées significatives dans la lutte contre le spam, les spammeurs continuent à développer de nouvelles techniques pour échapper à nos systèmes de détection. Nous mettons tout en œuvre pour améliorer ces systèmes et protéger les utilisateurs contre les nouveaux types d'abus. À ce titre, les rapports externes nous sont utiles. En utilisant la recherche Google, avez-vous été victime de tromperie, d'escroquerie ou de spam récemment ? Vous pensez que nous aurions pu empêcher cette situation ? Dans ce cas, merci de nous envoyer vos commentaires via un rapport de spam, en précisant votre requête et les autres informations que vous jugez utiles.

Googlebot est à vos côtés pour lutter contre le spam