Empêcher le spam sur certaines sections de votre site

Mercredi 26 mai 2021

Si vous êtes propriétaire d'un site Web, vous pouvez mettre à la disposition des utilisateurs différents canaux d'interaction : forums, livres d'or, plates-formes de réseaux sociaux, outils de mise en ligne de fichiers, services d'hébergement ou encore services de recherche internes. Ces services permettent aux utilisateurs de créer un compte pour publier des contenus, mettre en ligne des fichiers ou effectuer des recherches sur votre site. Malheureusement, les spammeurs exploitent souvent ce type de services pour générer des centaines de pages de spam qui n'apportent aucune valeur ajoutée en ligne. Conformément aux Consignes aux webmasters de Google, Google peut être amené à entreprendre des actions manuelles sur les pages concernées. Voici quelques exemples :

Forum/Livre d'or utilisé de manière abusive Outil de mise en ligne de fichiers utilisé de manière abusive pour importer un fichier PDF contenant du spam Services d'hébergement utilisés de manière abusive Résultats de recherche interne utilisés de manière abusive

Ces contenus comportant du spam peuvent être dangereux pour votre site et vos utilisateurs, à plusieurs titres :

  • La présence d'un contenu de mauvaise qualité à certains endroits d'un site Web peut avoir un impact sur le classement de l'ensemble du site.
  • Les contenus comportant du spam peuvent inciter les utilisateurs à accéder à des contenus indésirables, voire dangereux, tels que des sites contenant des logiciels malveillants ou pratiquant l'hameçonnage, ce qui peut nuire à la réputation de votre site.
  • Un trafic imprévu sur votre site dû à un contenu sans lien avec le vôtre peut le ralentir et augmenter les coûts d'hébergement.
  • Afin de protéger la qualité des résultats de recherche, nous pouvons supprimer ou rétrograder des pages infestées de spam généré par des tiers.

Dans cet article de blog, nous vous donnerons quelques conseils pour empêcher les spammeurs d'utiliser votre site de manière abusive.

Empêcher la création automatique de comptes

Dans le formulaire permettant aux utilisateurs de créer un compte sur votre site, envisagez d'utiliser le service CAPTCHA ou un autre outil de validation similaire (Securimage ou Jcaptcha, par exemple) pour n'autoriser que les envois effectués par des personnes physiques et empêcher les scripts automatisés de générer des comptes et des contenus sur les plates-formes publiques de votre site.

Afin de vous prémunir contre les nombreuses créations de comptes par des spambots, vous pouvez aussi demander aux nouveaux utilisateurs de valider une véritable adresse e-mail lorsqu'ils s'inscrivent. En outre, vous pouvez configurer des filtres afin de bloquer des adresses e-mail suspectes ou issues de services de messagerie que vous n'estimez pas dignes de confiance.

Activer les fonctionnalités de modération

Vous pouvez activer des fonctionnalités de modération des commentaires et de création de profils, ce qui oblige les utilisateurs à acquérir une certaine réputation pour pouvoir publier des liens. Si possible, modifiez les paramètres afin de ne pas autoriser les publications anonymes et exigez l'approbation des messages des nouveaux utilisateurs pour les rendre visibles.

Surveiller votre site pour repérer le spam et corriger les éventuels problèmes

Enregistrez et validez la propriété de votre site Web dans la Search Console. Pour savoir si Google a détecté des problèmes, consultez le rapport sur les problèmes de sécurité et le rapport sur les actions manuelles. Vous pouvez également consulter le panneau "Messages" pour en savoir plus.

Message dans la Search Console concernant un site utilisé de façon abusive par un tiers pour publier du spam

En outre, nous vous recommandons de rechercher de temps en temps d'éventuels contenus inattendus ou comportant du spam sur votre site en utilisant l'opérateur site: dans la recherche Google, ainsi que des mots clés commerciaux ou à caractère sexuel qui n'ont pas de rapport avec la thématique de votre site. Par exemple, recherchez [site:your-domain-name viagra] ou [site:your-domain-name watch online] pour détecter les contenus non pertinents présents sur votre site :

  • Texte hors contexte ou liens hors sujet dont le seul but est de faire la promotion d'un site Web ou d'un service tiers (par exemple, "Téléchargement de film sans frais/Regarder en ligne")
  • Contenu vide de sens ou texte généré automatiquement (non rédigé par un visiteur de votre site)
  • Résultats de recherche internes pour lesquels la requête de l'utilisateur semble être hors sujet et destinée à promouvoir un site ou un service tiers

Surveillez les fichiers journaux de votre serveur Web pour détecter toute hausse de trafic soudaine, notamment en lien avec les nouvelles pages. Recherchez par exemple les URL comportant des mots clés dont le format d'URL n'a aucun rapport avec votre site Web. Pour identifier les URL potentiellement problématiques et générant beaucoup de trafic, utilisez le rapport sur les pages dans Google Analytics.

Empêchez la publication de contenus inappropriés sur votre plate-forme à l'aide d'une liste de termes indésirables (exemples : streaming, téléchargement, réservé aux adultes, jeux d'argent et de hasard, termes pharmaceutiques, etc.). Des fonctionnalités et des plug-ins intégrés peuvent supprimer ou marquer ces contenus comme étant du spam à votre place.

Google Alertes est aussi un outil très efficace. Configurez une alerte [site:your-domain-name spammy-keywords] avec les mots clés commerciaux ou à caractère sexuel que vous ne vous attendez pas à voir sur votre site. Google Alertes est également un outil performant lorsqu'il s'agit de détecter les pages piratées.

Identifier et fermer les comptes de spam

Consultez le journal de votre serveur Web pour repérer les inscriptions d'utilisateurs et identifier les pratiques de spam courantes, par exemple :

  • Quantité importante de formulaires d'inscription remplis en peu de temps
  • Nombreuses requêtes envoyées depuis la même plage d'adresses IP
  • Utilisation d'user-agents inattendus lors de l'inscription
  • Noms d'utilisateur incompréhensibles ou envoi d'autres valeurs vides de sens lors de l'inscription (par exemple "Téléchargement de film sans frais" ou autres noms d'utilisateur commerciaux qui ne semblent pas appartenir à une véritable personne, et renvoyant vers des sites sans rapport avec le vôtre)

Empêcher la recherche Google d'afficher ou de suivre des contenus non approuvés

Si votre site permet aux internautes de créer des pages telles que des pages de profil, des fils de discussion sur un forum ou des sites Web, vous pouvez dissuader les spammeurs en empêchant la recherche Google d'afficher ou de suivre des contenus nouveaux ou non approuvés.

Vous pouvez par exemple utiliser la norme Meta noindex pour bloquer l'accès aux pages non approuvées. Exemple :

<html>
  <head>
    <meta name="googlebot" content="noindex">
  </head>
</html>

Vous pouvez aussi utiliser la norme robots.txt pour bloquer temporairement les pages : Exemple :

Disallow: /guestbook/

Vous pouvez également marquer les liens ayant trait à du contenu généré par les utilisateurs, tels que les commentaires et les posts sur les forums, avec rel="ugc" ou rel="nofollow". Cette approche vous permet d'expliquer à Google votre relation avec la page liée et demander à Google de ne pas suivre ce lien.

Regrouper le contenu de votre plate-forme ouverte dans un chemin d'accès ou un répertoire de fichiers ciblé

Grâce à des scripts automatisés ou à des logiciels, les spammeurs peuvent générer un grand nombre de pages contenant du spam sur votre site en très peu de temps. Une partie de ces contenus peuvent être hébergés de façon fragmentée dans différents chemins d'accès ou répertoires, ce qui empêche les propriétaires du site de repérer le spam et de le nettoyer efficacement. Voici quelques exemples :

example.com/best-online-pharma-buy-red-viagra-online
example.com/free-watch-online-2021-full-movie

Nous vous recommandons également de regrouper les contenus générés par les utilisateurs dans un chemin d'accès ou un répertoire de fichiers ciblé pour faciliter la maintenance et la détection du spam. Utilisez par exemple le chemin d'accès suivant :

example.com/user-generated-content-dir-name/example01.html
example.com/user-generated-content-dir-name/example02.html

Actualiser régulièrement le logiciel de votre site Web et utiliser des systèmes automatisés pour protéger le site

Prenez le temps de maintenir votre logiciel à jour et accordez une attention particulière aux mises à jour de sécurité importantes. Les spammeurs peuvent profiter des problèmes de sécurité présents dans les anciennes versions des blogs, des tableaux d'affichage et d'autres systèmes de gestion de contenu.

Par ailleurs, certains systèmes complets comme Akismet proposent des plug-ins pour de nombreux blogs et systèmes de forums. Faciles à installer, ils feront la majorité du travail de lutte contre le spam à votre place. Enfin, il existe des plug-ins de sécurité reconnus et fiables pour certaines plates-formes. Ceux-ci permettent de sécuriser le site Web et peuvent détecter les abus de façon précoce.

Selon la situation de votre site, veuillez consulter notre documentation pour en savoir plus :

Si vous avez besoin d'aide, vous pouvez également consulter la Communauté d'aide Search Central.