साल 2020 में, हमने Google Search पर आने वाले स्पैम से निपटने के लिए क्या कदम उठाए

गुरुवार, 29 अप्रैल, 2021

Googlebot और उसका दोस्त स्पाइडर, 2020 की वेब स्पैम रिपोर्ट पढ़ते हुए

Google Search एक बेहतरीन टूल है और हर कोई इसका इस्तेमाल कर सकता है. इससे, आपको वेब पर काम की जानकारी ढूंढने में मदद मिलेगी. हालांकि, सभी वेब पेजों को अच्छे मकसद से नहीं बनाया जाता. इनमें से कई वेब पेज, सिर्फ़ धोखाधड़ी के मकसद से बनाए जाते हैं. हमारा मकसद उपयोगकर्ताओं को इसी धोखाधड़ी से बचाना है. आपकी खोज के अनुभव को खराब कॉन्टेंट और नुकसान पहुंचाने वाली गतिविधियों से बचाने और सुरक्षित करने के लिए, Search ने 2020 में अलग-अलग तरीकों में निवेश किया है.

स्पैम से स्मार्ट तरीके से बचाव करना

हम Search के शुरुआती दिनों से ही, स्पैम से बचाव करने की कोशिश कर रहे हैं. हालांकि, आर्टिफ़िशियल इंटेलिजेंस (AI) में हाल ही में हुए बदलाव, इसके लिए काफ़ी मददगार साबित हुए हैं.

स्पैम से जुड़ी ज़्यादा जानकारी और एआई (AI) की मदद से, पिछले साल हमने स्पैम से बचाव करने वाला एआई (AI) बनाया. यह, पहले से पता होने वाले स्पैम के साथ-साथ नए स्पैम रुझानों का पता लगाने में भी असरदार है. उदाहरण के लिए, हमने अपने-आप जनरेट होने वाले और नकल किए गए कॉन्टेंट वाली साइटों को कम किया है. पिछले कुछ सालों के मुकाबले ऐसी साइटों की संख्या में 80% से ज़्यादा की कमी आई है.

साल 2020 में भी हैक करके स्पैम किया जाता था, क्योंकि उस समय ऐसी वेबसाइटें काफ़ी ज़्यादा थीं जिन्हें हैक किया जा सकता था. हालांकि, हमने स्पैम का पता लगाने की अपनी क्षमता को, पहले से 50% ज़्यादा बेहतर किया है. साथ ही, खोज के नतीजों से, हैक करके स्पैम करने वाले ज़्यादातर नतीजों को हटा दिया है.

यह एक ऐसी समस्या है जिसे हम अकेले हल नहीं कर सकते. अगर हम सभी स्पैम का पता लगाकर उनसे सुरक्षा के बेहतर तरीके अपना लें, तब भी हैकर तब तक कमियों का फ़ायदा उठाते रहेंगे, जब तक उन्हें पूरी तरह से खत्म न कर दिया जाए. वेबसाइट के मालिक, सुरक्षा के बेहतर तरीके अपनाकर, अपनी साइटों को सुरक्षित रख सकते हैं. साइट को हैक होने से रोकना, उसके हैक होने के बाद रिकवर करने से ज़्यादा आसान होता है. Google, ऐसे कई रिसॉर्स उपलब्ध कराता है जिनसे पता चलता है कि वेबसाइट हैक होने के सबसे आम तरीके क्या हैं. इसके अलावा, उनसे यह भी पता चलता है कि किस तरह Search Console का इस्तेमाल करके, यह पता लगाया जा सकता है कि आपकी साइट हैक हुई है या नहीं. कृपया इस जानकारी को देखें और साथ मिलकर वेब को ज़्यादा सुरक्षित बनाएं!

पिछले साल, वैश्विक महामारी के साथ-साथ कई अहम इवेंट से जुड़े विषयों पर करोड़ों खोजें की गईं. इन खोजों के सही नतीजे दिखाने के लिए, हमने भरपूर कोशिश की. अगर आपने Search पर आस-पास के इलाके में COVID-19 की जांच करने वाले लैब की खोज क्वेरी डाली है, तो बेफ़िक्र रहें. आपको खोज के नतीजों में, बेमतलब के शब्द वाले ऐसे स्पैम नतीजे नहीं दिखेंगे जो आपको फ़िशिंग वाली साइटों पर भेज सकते हैं. स्पैम वाला कॉन्टेंट हटाने के अलावा, हमने Search की दूसरी कई टीमों के साथ काम किया. ऐसा इसलिए किया गया, ताकि आपको सही समय और सही जगह पर अप-टू-डेट और सबसे सही जानकारी मिल सके.

आपको स्पैम वाले कॉन्टेंट से बचाना

Google पर खोज के नतीजे दिखाने से पहले, कई तरह से उनकी जांच की जाती है. हर दिन, हम करोड़ों वेब पेज खोजते हैं, उन्हें क्रॉल करते हैं, और इंडेक्स करते हैं. इन पेजों में से कई पेज स्पैम होते हैं. हर दिन, हमें स्पैम वाले 4,000 करोड़ पेजों का पता लगता है. यहां बताया गया है कि काम की जानकारी पाने के लिए की गई आपकी खोज के नतीजों को, स्पैम से बचाने के लिए हम क्या करते हैं.

हर कदम पर हम स्पैम से बचाव कैसे करते हैं
इस डायग्राम से पता चलता है कि हम स्पैम से बचाव कैसे करते हैं.

सबसे पहले, हमारे पास ऐसे सिस्टम मौजूद हैं जो पेजों या किसी दूसरे कॉन्टेंट को क्रॉल करते समय स्पैम का पता लगा सकते हैं. क्रॉल तब किया जाता है, जब हमारे ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाले सिस्टम) कॉन्टेंट पर जाते हैं और उसे उस इंडेक्स में शामिल करते हैं जिसका इस्तेमाल हम खोज के नतीजे देने के लिए करते हैं. स्पैम के तौर पर पाया गया कॉन्टेंट, इंडेक्स में शामिल नहीं किया जाता.

ये सिस्टम, साइटमैप और Search Console के ज़रिए खोजे गए कॉन्टेंट पर भी काम करते हैं. उदाहरण के लिए, Search Console में इंडेक्स करने का अनुरोध करें सुविधा मौजूद है. इससे, क्रिएटर्स हमें उन नए पेजों के बारे में बता सकेंगे जिन्हें खोज के नतीजों में जल्द से जल्द जोड़ा जाना चाहिए. हमने पाया है कि स्पैम करने वाले व्यक्ति, ऐसी साइटों को हैक करते हैं जो ज़्यादा सुरक्षित नहीं हैं. वे खुद को इन साइटों का मालिक बताते हैं और Search Console में खुद की पुष्टि करवाते हैं. इसके अलावा, टूल का इस्तेमाल करके, Google को अपनी स्पैम वाली वेबसाइटों या पेजों को क्रॉल और इंडेक्स करने के लिए कहते हैं. एआई (AI) की मदद से, हमने पुष्टि के संदिग्ध मामलों की पहचान करने और स्पैम वाले यूआरएल को इंडेक्स में शामिल होने से रोका है.

हमारे पास ऐसे सिस्टम मौजूद हैं जो इंडेक्स में शामिल किए गए कॉन्टेंट का विश्लेषण करते हैं. कोई खोज करने पर, खोज से मेल खाने वाला कॉन्टेंट स्पैम है या नहीं, इसके लिए वे दोबारा जांच करते हैं. अगर वह कॉन्टेंट स्पैम होता है, तो सबसे ऊपर दिखने वाले खोज नतीजों में उसे शामिल नहीं किया जाता. हम इस जानकारी का इस्तेमाल, अपने सिस्टम को बेहतर बनाने और इस तरह के स्पैम को इंडेक्स में शामिल होने से रोकने के लिए भी करते हैं.

इससे, बहुत कम स्पैम ही खोज के नतीजों में सबसे ऊपर दिखते हैं. यह, एआई (AI) की मदद से चलने वाले हमारे ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाले सिस्टम) से संभव हो पाया है. हमारा अनुमान है कि Search के 99% से ज़्यादा नतीजों में स्पैम नहीं दिखता है, जिसकी वजह हमारे ये ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाले सिस्टम) हैं. बाकी बचे हुए 1% से भी कम हिस्से के लिए, हमारी टीम मैन्युअल ऐक्शन लेती है. साथ ही, इससे मिली सीख का इस्तेमाल, ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाले सिस्टम) को बेहतर बनाने के लिए करती है.

स्पैम के अलावा, अलग-अलग तरह के खतरों से सुरक्षा देना

Googlebot और उसका दोस्त, आपको स्पैम के अलावा दूसरी चीज़ों से बचाते हुए

स्पैम के अलावा, अलग-अलग तरह के खतरों से बचाने के लिए, हमने साल 2020 में अपनी कोशिशों को बढ़ाया है. इनमें से कई खतरों की वजह से, बड़ा आर्थिक और निजी नुकसान हो सकता है.

साल 2020 में, हमने अपने कवरेज को बढ़ाया और कई उपयोगकर्ताओं को ऑनलाइन धोखाधड़ी और बेईमानी से बचाया. ऑनलाइन धोखाधड़ी कई तरह की होती हैं. ये आपको पुराने तरीके से किए जाने वाले वेब स्पैम के मुकाबले, कई तरीकों से नुकसान पहुंचा सकती हैं. उदाहरण के लिए, धोखाधड़ी करने वाले कई लोग, लोकप्रिय सेवाओं और प्रॉडक्ट की ग्राहक सहायता के फ़ोन नंबर देते हैं. ऐसा वे इसलिए करते हैं, ताकि उपयोगकर्ता उन नंबर पर कॉल करें और धोखाधड़ी करने वाले लोग, उन्हें बैंक ट्रांसफ़र या उपहार कार्ड के ज़रिए पैसे चुकाने के लिए फंसा सकें. आम तौर पर, इस तरह की धोखाधड़ी को 'ग्राहक सहायता धोखाधड़ी' या 'तकनीकी सहायता धोखाधड़ी' कहते हैं. इस तरह की धोखाधड़ी की शिकायत, लाखों उपयोगकर्ताओं ने की है. इस तरह के हर मामले में, उपयोगकर्ताओं को हज़ारों रुपयों का नुकसान हुआ है.

खोज के नतीजों में, ग्राहक सहायता से जुड़ी धोखाधड़ी का उदाहरण

साल 2018 से, हमारे सिस्टम ने धोखाधड़ी कर सकने वाली साइटों का पता लगाकर, हर साल करोड़ों खोजों को सुरक्षित किया है. धोखाधड़ी करने वाले लोगों ने, वेब पर कीवर्ड स्टफ़िंग (बार-बार एक जैसे कीवर्ड डालना) का इस्तेमाल करके हल्की क्वालिटी वाली कई वेबसाइटें बनाई हैं. इनमें कई सारे ब्रैंड के लोगो की नकल की गई है. इसके अलावा, उन्होंने वेबसाइटों पर फ़ोन नंबर भी डाले हैं, ताकि उपयोगकर्ता उस पर कॉल करें. इनसे बचाने के लिए, हमारे एल्गोरिदम वाले समाधान यह पक्का करते हैं कि धोखाधड़ी और बेईमानी वाली साइटें, आपकी खोज के नतीजों में न दिखें. आपको सुरक्षित रखने और खोज के नतीजों की क्वालिटी को बनाए रखने के लिए, यह पिछले साल शुरू किए गए सुरक्षा के तरीकों में से एक है. सबसे भरोसेमंद नतीजे दिखाने के लिए, चुनौतियों से एक कदम आगे रहना ही हमारा मकसद है. इसके अलावा, जानकार बनकर और धोखाधड़ी के बारे में जानकारी पाकर खुद की बेहतर सुरक्षा की जा सकती है.

एआई (AI) में हुए बदलावों से, साइटों का कॉन्टेंट समझने में बहुत मदद मिली है. इसका उदाहरण, प्रॉडक्ट की समीक्षाएं, जानकारी, और शॉपिंग की साइटों को रैंक करने के तरीकों में किए गए सुधारों में देखा जा सकता है. खरीदने से पहले किसी प्रॉडक्ट के बारे जानने और उसे ढूंढने के लिए, Google Search एक बेहतरीन तरीका है. इसलिए, हम यह पक्का करना चाहते हैं कि आपको अपनी अगली खरीदारी के लिए, सबसे काम की जानकारी मिले. इसके लिए, हम आपको ऐसा कॉन्टेंट दिखाएंगे जिसमें प्रॉडक्ट की पूरी जानकारी शामिल हो.

स्पैम से बचाव करने के लिए की गई ज़रूरी कोशिशों के बावजूद, स्पैम करने वाले व्यक्ति हमारे सिस्टम से बचने के लिए, नई-नई तकनीक अपनाते रहते हैं. सिस्टम को बेहतर बनाने और अलग-अलग तरह के नए खतरों से लोगों को बचाने के लिए, हम लगातार कोशिश कर रहे हैं. आपकी शिकायतें इस कोशिश में हमारी मदद कर सकती हैं. Search का इस्तेमाल करते हुए, क्या आप हाल ही में स्पैम का शिकार हुए हैं, गुमराह हुए हैं या आपके साथ धोखाधड़ी हुई है? क्या आपको लगता है कि हम ऐसा होने से रोक सकते थे? अगर आपका जवाब हां है, तो कृपया स्पैम रिपोर्ट के ज़रिए अपना सुझाव, शिकायत या राय शेयर करें. इसके साथ ही, क्वेरी और वह जानकारी डालें जो मददगार हो सकती है.

स्पैम से बचने के लिए, Googlebot आपके साथ काम करते हुए