अपनी साइट के हिस्सों को स्पैम से बचाना

बुधवार, 26 मई, 2021

वेबसाइट के मालिक, अपने उपयोगकर्ताओं को कुछ ऐसे चैनल उपलब्ध करा सकते हैं जिन पर वे बातचीत कर सकें. जैसे: फ़ोरम, गेस्टबुक, सोशल मीडिया प्लैटफ़ॉर्म, फ़ाइल अपलोड करने वाले पेज, मुफ़्त होस्टिंग सेवाएं या अंदरूनी खोज सेवाएं. इन सेवाओं की मदद से, उपयोगकर्ता आपकी साइट पर कॉन्टेंट पोस्ट करने, फ़ाइल अपलोड करने या कॉन्टेंट खोजने के लिए खाता बना सकते हैं. हालांकि, स्पैम करने वाले लोग अक्सर इन सेवाओं का गलत फ़ायदा उठाते हैं. वे ऐसे सैकड़ों पेज बना देते हैं जिनका कॉन्टेंट हल्की या बिल्कुल खराब क्वालिटी का होता है. Google की वेबमास्टर गाइडलाइन में बताया गया है कि Google, स्पैम वाले ऐसे पेजों पर मैन्युअल ऐक्शन ले सकता है. यहां कुछ उदाहरण दिए गए हैं:

गलत मकसद से इस्तेमाल किया गया फ़ोरम/गेस्टबुक स्पैम वाली PDF फ़ाइल की मदद से, गलत मकसद से इस्तेमाल किया गया फ़ाइल अपलोडर गलत मकसद से इस्तेमाल की गई होस्टिंग सेवाएं गलत मकसद से इस्तेमाल किए गए अंदरूनी खोज के नतीजे

इस तरह का स्पैम वाला कॉन्टेंट, आपकी साइट और उपयोगकर्ताओं के अनुभव को कई तरीकों से नुकसान पहुंचा सकता है:

  • किसी वेबसाइट के कुछ हिस्सों में मौजूद हल्की क्वालिटी वाला कॉन्टेंट, पूरी साइट की रैंकिंग पर असर डाल सकता है.
  • स्पैम वाला कॉन्टेंट, उपयोगकर्ताओं को अनचाहे या नुकसान पहुंचाने वाले कॉन्टेंट पर ले जा सकता है, जैसे कि मैलवेयर या फ़िशिंग वाली साइटें. इसकी वजह से, आपकी साइट की प्रतिष्ठा कम हो सकती है.
  • आपकी साइट पर विषय से अलग कॉन्टेंट दिखने की वजह से अनचाहा ट्रैफ़िक आता है. इससे, साइट धीमी हो सकती है और इसे होस्ट करने की लागत बढ़ सकती है.
  • Google ऐसे पेजों को हटा सकता है या उनकी रैंकिंग कम कर सकता है जिन पर तीसरे पक्ष का जनरेट किया गया स्पैम कॉन्टेंट बार-बार दिखता है. इससे, Google को खोज के नतीजों की क्वालिटी को बेहतर बनाए रखने में मदद मिलती है.

इस ब्लॉग पोस्ट में हम आपको कुछ सलाह देंगे, ताकि आप स्पैम करने वाले लोगों को अपनी साइट का गलत इस्तेमाल करने से रोक सकें.

खाता अपने-आप बनने से रोकना

जब उपयोगकर्ता आपकी साइट पर खाता बनाते हैं, तो Google की कैप्चा सेवा या पुष्टि करने के लिए ऐसे ही किसी दूसरे टूल (जैसे, Securimage या Jcaptcha) का इस्तेमाल किया जा सकता है. इस तरह से, आपकी साइट के सार्वजनिक प्लैटफ़ॉर्म पर ऑटोमेटेड स्क्रिप्ट की मदद से, अपने-आप बनने वाले खातों और कॉन्टेंट को बनने से रोका जा सकता है. साथ ही, सिर्फ़ असली उपयोगकर्ताओं को खाता बनाने की अनुमति दी जा सकती है.

नया खाता बनाने के दौरान साइन अप करने के लिए, नए उपयोगकर्ताओं से उनके ईमेल पते की पुष्टि कराने से भी कई स्पैम बॉट को अपने-आप खाते बनाने से रोका जा सकता है. इसके अलावा, कुछ फ़िल्टर भी सेट किए जा सकते हैं, ताकि उन ईमेल पतों को ब्लॉक किया जा सके जो भरोसेमंद न हों या ऐसी ईमेल सेवाओं से आ रहे हों जिन पर आपको भरोसा न हो.

मॉडरेशन (कंट्रोल करने से जुड़ी) सुविधाएं चालू करना

टिप्पणी करने और प्रोफ़ाइल बनाने से जुड़ी मॉडरेशन (कंट्रोल करने से जुड़ी) सुविधाएं चालू करें. इससे, ऐसे उपयोगकर्ता ही लिंक पोस्ट कर सकेंगे जिन पर आप भरोसा करते हों. अगर हो सके, तो अपनी सेटिंग में बदलाव करें, ताकि कोई भी अपनी पहचान छिपाकर पोस्ट न कर सके. साथ ही, आपकी अनुमति के बिना नए उपयोगकर्ताओं की पोस्ट सार्वजनिक तौर पर न दिखें.

स्पैम वाले कॉन्टेंट से बचने के लिए, अपनी साइट की निगरानी करना और साइट पर समस्याओं को ठीक करना

Search Console में, अपनी वेबसाइट को रजिस्टर करें और इसके मालिकाना हक की पुष्टि करें. Google को आपकी वेबसाइट पर कोई समस्या मिली है या नहीं, यह देखने के लिए सुरक्षा से जुड़ी समस्याओं की रिपोर्ट और मैन्युअल ऐक्शन रिपोर्ट देखें. ज़्यादा जानकारी के लिए, मैसेज पैनल देखें.

Search Console में, साइट पर तीसरे पक्ष के स्पैम के बारे में बताने वाला एक मैसेज

इसके अलावा, आप समय-समय पर अपनी साइट की जांच करके देखें कि इस पर गलत या स्पैम वाला कॉन्टेंट न हो. इसके लिए, Google Search में site: ऑपरेटर का इस्तेमाल करें. इसमें, साइट के विषय से अलग कीवर्ड जोड़कर स्पैम वाले कॉन्टेंट का पता लगाया जा सकता है, जैसे कि कारोबार या वयस्कों के लिए बने कॉन्टेंट से जुड़े कीवर्ड. उदाहरण के लिए, आप [site:your-domain-name viagra] या [site:your-domain-name watch online] खोजें और अपनी साइट पर ऐसे कॉन्टेंट का पता लगाएं जो काम का नहीं है. इस तरीके से, खास तौर पर इस तरह के कॉन्टेंट का पता लगाया जा सकता है:

  • आपकी साइट के विषय से मेल न खाने वाला टेक्स्ट या विषय से अलग लिंक, जिनका इस्तेमाल तीसरे पक्ष की वेबसाइट या सेवाओं का प्रमोशन करने के मकसद से किया जाता है. जैसे, "मुफ़्त में फ़िल्म डाउनलोड करें या ऑनलाइन देखें”.
  • बेमतलब के शब्द या टेक्स्ट, जो अपने-आप जनरेट होते हैं (जिन्हें असली उपयोगकर्ता ने नहीं बनाया)
  • अंदरूनी खोज के नतीजे, जहां उपयोगकर्ता की क्वेरी के नतीजों में, विषय से अलग ऐसी पोस्ट दिखती हों जिनमें तीसरे पक्ष की वेबसाइट या सेवाओं का प्रमोशन किया जा रहा हो

अपने वेब सर्वर की लॉग फ़ाइलों पर नज़र रखें और देखें कि साइट का ट्रैफ़िक अचानक तेज़ी से बढ़ने तो नहीं लगा. खास तौर पर, हाल में बने पेजों पर ज़रूर ध्यान दें. उदाहरण के लिए, यूआरएल प्रतिमान में ऐसे कीवर्ड वाले यूआरएल ढूंढें जो आपकी वेबसाइट के हिसाब से काम के न हों. ज़्यादा ट्रैफ़िक की समस्या पैदा करने वाले यूआरएल का पता लगाने के लिए, Google Analytics में पेज रिपोर्ट का इस्तेमाल करें.

अपने प्लैटफ़ॉर्म पर आपत्तिजनक कॉन्टेंट पब्लिश होने से रोकें. इस कॉन्टेंट में कई तरह के स्पैम वाले शब्द शामिल हो सकते हैं. जैसे, स्ट्रीमिंग या डाउनलोड, वयस्क, जुआ, दवाओं से जुड़े शब्द. पहले से मौजूद सुविधाएं या प्लग इन, ऐसे कॉन्टेंट को स्पैम के तौर पर मार्क कर सकते हैं या मिटा सकते हैं.

इसके लिए एक और बेहतरीन टूल है, जिसका नाम Google Alerts है. [site:your-domain-name spammy-keywords] चेतावनी सेट अप करें. इसके लिए, ऐसे कारोबार या वयस्कों के लिए बने कॉन्टेंट से जुड़े कीवर्ड इस्तेमाल करें जिन्हें आपको अपनी साइट पर नहीं देखना. Google Alerts की मदद से, हैक किए गए पेजों का भी पता लगाया जाता है.

स्पैम वाले खातों की पहचान करके उन्हें बंद करना

उपयोगकर्ताओं के साइन अप को ट्रैक करने के लिए, अपने वेब सर्वर के लॉग पर नज़र रखें. साथ ही, स्पैम से जुड़ी सामान्य गतिविधियों को पहचानें, जैसे कि:

  • कम समय में बहुत ज़्यादा साइन अप फ़ॉर्म पूरे हो गए हों.
  • एक ही तरह के आईपी पते से भेजे गए अनुरोधों की संख्या.
  • साइन अप के दौरान, ऐसे उपयोगकर्ता एजेंट का इस्तेमाल किया गया हो जिनकी उम्मीद नहीं थी.
  • साइन अप करने के लिए, गलत शब्दों वाले उपयोगकर्ता नाम देना या दूसरी जानकारी गलत शब्दों में सबमिट होना. उदाहरण के लिए, कारोबार वाले उपयोगकर्ता नाम (जैसे कि "मुफ़्त में फ़िल्म डाउनलोड"), जो किसी असली उपयोगकर्ता के नाम जैसे नहीं लगते और ऐसी साइटों पर ले जाते हैं जिनका आपकी वेबसाइट से कोई संबंध नहीं है.

Google Search को संदेहजनक कॉन्टेंट दिखाने या फ़ॉलो करने से रोकना

अगर आपकी साइट उपयोगकर्ताओं को प्रोफ़ाइल पेज, फ़ोरम थ्रेड या वेबसाइट जैसे पेज बनाने की अनुमति देती है, तो Google Search को नया या संदेहजनक कॉन्टेंट दिखाने और फ़ॉलो करने से रोककर, स्पैम से होने वाले नुकसान से अपनी साइट को बचाया जा सकता है.

उदाहरण के लिए, आप noindex मेटा स्टैंडर्ड का इस्तेमाल करके, संदेहजनक पेजों को ऐक्सेस किए जाने से रोकें. इस तरह:

<html>
  <head>
    <meta name="googlebot" content="noindex">
  </head>
</html>

इसके अलावा, robots.txt स्टैंडर्ड का इस्तेमाल करके, पेजों को कुछ समय के लिए ब्लॉक किया जा सकता है. जैसे:

Disallow: /guestbook/

टिप्पणियां और फ़ोरम की पोस्ट जैसे यूज़र जनरेटेड कॉन्टेंट (यूजीसी) को, यूजीसी के तौर पर मार्क किया जा सकता है. इसके लिए, आपको rel="ugc" या rel="nofollow" का इस्तेमाल करना होगा. इससे, आपको Google को यह बताने में मदद मिलेगी कि लिंक किए गए पेज पर आपको भरोसा है या नहीं. साथ ही, उस लिंक को फ़ॉलो न करने के लिए, Google से अनुरोध भी किया जा सकता है.

अपनी साइट का ऐसा कॉन्टेंट इकट्ठा करके, किसी खास फ़ाइल पाथ या डायरेक्ट्री में जोड़ें जो सभी के लिए उपलब्ध है

स्पैम करने वाले लोग, कुछ ही समय में आपकी साइट पर बड़ी संख्या में स्पैम वाले पेज जनरेट कर सकते हैं. इसके लिए, वे ऑटोमेटेड स्क्रिप्ट या सॉफ़्टवेयर का इस्तेमाल करते हैं. इसमें से कुछ कॉन्टेंट को छोटे-छोटे फ़ाइल पाथ या डायरेक्ट्री में होस्ट किया जा सकता है. यह साइट मालिकों को स्पैम का पता लगाने और उसे हटाने से रोकता है. इसके कुछ उदाहरण यहां बताए गए हैं:

example.com/best-online-pharma-buy-red-viagra-online
example.com/free-watch-online-2021-full-movie

हमारा सुझाव है कि आप अपना यूज़र जनरेटेड कॉन्टेंट इकट्ठा करके, किसी खास फ़ाइल पाथ या डायरेक्ट्री में जोड़ें. इससे, साइट का रखरखाव आसानी से किया जा सकता है और स्पैम की पहचान भी आसानी से की जा सकती है. उदाहरण के लिए, हम यहां दिए गए फ़ाइल पाथ का सुझाव देते हैं:

example.com/user-generated-content-dir-name/example01.html
example.com/user-generated-content-dir-name/example02.html

अपनी वेबसाइट के सॉफ़्टवेयर को अपडेट रखना और अपनी साइट को सुरक्षित रखने के लिए, ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाला सिस्टम) का इस्तेमाल करना

अपने सॉफ़्टवेयर को अप-टू-डेट रखने के लिए समय निकालें और अहम सुरक्षा अपडेट पर खास तौर पर ध्यान दें. स्पैम करने वाले लोगों को ब्लॉग, बुलेटिन बोर्ड, और दूसरे कॉन्टेंट मैनेजमेंट सिस्टम के पुराने वर्शन में सुरक्षा से जुड़ी समस्याओं का फ़ायदा मिल सकता है.

इसके अलावा, स्पैम को रोकने वाले कुछ बेहतर सिस्टम, जैसे कि Akismet में कई ब्लॉग और फ़ोरम सिस्टम के लिए प्लग इन उपलब्ध होते हैं. ये प्लग इन इंस्टॉल करने में आसान होते हैं और आपके कॉन्टेंट को स्पैम से बचाते हैं. साथ ही, कुछ प्लैटफ़ॉर्म के लिए भरोसेमंद और ऐसे सुरक्षा प्लग इन भी उपलब्ध होते हैं जिनका इस्तेमाल जानी-मानी कंपनियां करती हैं. ये प्लग इन कोई खतरा होने पर वेबसाइट को सुरक्षित रखने में मदद करते हैं और स्पैम का जल्दी से पता लगा लेते हैं.

अपनी साइट की स्थिति के हिसाब से, ज़्यादा जानकारी पाने के लिए कृपया हमारे दस्तावेज़ देखें:

ज़्यादा मदद के लिए, हमारे Search Central के सहायता समुदाय पेज पर भी जाएं.