अपने डुप्लीकेट पेजों के लिए सही कैननिकल यूआरएल चुनने में, Google की मदद करें

अगर आपकी साइट पर कोई ऐसा पेज है जिसके कई यूआरएल हैं या एक जैसे कॉन्टेंट वाले कई पेज हैं, तो Google उन्हें एक ही पेज के डुप्लीकेट वर्शन मानता है. जैसे, कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं. Google उस पेज के किसी एक यूआरएल को कैननिकल वर्शन के तौर पर चुनकर, उसे क्रॉल करेगा. बाकी सभी यूआरएल काे डुप्लीकेट यूआरएल मानकर, उन्हें कभी-कभी ही क्रॉल करेगा.

अगर Google को साफ़ ताैर पर यह नहीं बताया जाता कि कौनसे यूआरएल को कैननिकल माना जाए, तो Google अपने हिसाब से एक कैननिकल यूआरएल चुन लेगा या दाेनाें ही यूआरएल काे बराबर मान लेगा. इससे हो सकता है कि आपके पेज, खोज नतीजों में सही से न दिखाए जाएं. इस बारे में ज़्यादा जानकारी, नीचे दिए गए सेक्शन कैननिकल यूआरएल क्यों चुनना चाहिए में माैजूद है.

कैननिकल यूआरएल क्या है?

कैननिकल यूआरएल उस पेज का यूआरएल होता है जिसे Google आपकी साइट पर मौजूद, डुप्लीकेट पेजों में से सबसे ज़रूरी मानता है. उदाहरण के लिए, अगर आपके पास एक ही पेज के कई यूआरएल हैं (जैसे, example.com?dress=1234 और example.com/dresses/1234), तो Google किसी एक को कैननिकल यूआरएल के तौर पर चुन लेता है.

यह ज़रूरी नहीं है कि सभी पेज बिलकुल एक जैसे हों. डुप्लीकेट पेजों पर कॉन्टेंट का क्रम बदलने या फ़िल्टर लगाने जैसे छोटे-मोटे बदलाव करने पर उन्हें अलग-अलग पेज के तौर पर नहीं गिना जाता है. उदाहरण के लिए, कीमत के हिसाब से क्रम में लगाने या रंग के हिसाब से आइटम को फ़िल्टर करने पर, इन्हें अलग-अलग पेज के तौर पर नहीं गिना जाएगा. कैननिकल यूआरएल का डोमेन, डुप्लीकेट यूआरएल से अलग हो सकता है.

Google का, कैननिकल यूआरएल को चुनने और इंडेक्स करने का तरीका

किसी साइट को इंडेक्स करते समय, Google उस साइट के हर पेज के मुख्य कॉन्टेंट का पता लगाने की कोशिश करता है. अगर Google को एक ही साइट पर एक जैसे कई पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे सबसे ज़्यादा जानकारी देने वाला और काम का लगता है. इस पेज को कैननिकल पेज के तौर पर मार्क किया जाता है. आपकी साइट के कैननिकल पेज को नियमित तौर पर क्रॉल किया जाएगा, लेकिन डुप्लीकेट पेज कभी-कभी ही क्रॉल किए जाएंगे. इससे, आपकी साइट पर क्रॉल करने से जुड़े लोड को कम करने में मदद मिलती है.

Google कई चीज़ों (या सिग्नल) को ध्यान में रखकर, कैननिकल पेज चुनता है. उदाहरण के लिए, पेज की क्वालिटी, साइटमैप में यूआरएल की मौजूदगी, पेज के लिए किस प्रोटोकॉल का इस्तेमाल किया गया है - एचटीटीपी या फिर एचटीटीपीएस, और पेज पर rel=canonical लेबल की मौजूदगी. इन तरीकों से Google को अपनी पसंद बताएं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं.

किसी पेज के अलग-अलग भाषाओं वाले वर्शन तभी डुप्लीकेट माने जाते हैं, जब पेज का मुख्य कॉन्टेंट एक ही भाषा में हो. इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गै़र-ज़रूरी टेक्स्ट का तो अनुवाद किया गया हो, लेकिन मुख्य लेख एक ही भाषा में दिया गया हो.

Google, कॉन्टेंट और क्वॉलिटी का आकलन करने के लिए कैननिकल पेजों का इस्तेमाल करता है. Google Search के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता की क्वेरी के हिसाब से कोई डुप्लीकेट पेज बेहतर हो, तो कैननिकल पेज की जगह वह पेज दिखाया जाता है. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा है, तो हो सकता है कि खोज के नतीजों में उसे पेज का मोबाइल वर्शन ही दिखाया जाए. भले ही, डेस्कटॉप वर्शन को कैननिकल पेज के तौर पर सेट किया गया हो.

मिलते-जुलते या डुप्लीकेट पेज रखने की वजहें

आपकी साइट पर एक ही पेज के अलग-अलग यूआरएल हो सकते हैं. साथ ही, अलग-अलग यूआरएल पर डुप्लीकेट या मिलते-जुलते पेज भी हो सकते हैं. इसकी सबसे आम वजहें यहां दी गई हैं:

  • कई तरह के डिवाइस पर काम करने के लिए:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • अगर सर्च पैरामीटर या सेशन आईडी जैसी चीज़ों के लिए, डाइनैमिक यूआरएल चालू करना हो:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • अगर एक ही पोस्ट को कई सेक्शन में डालने पर, आपका ब्लॉग सिस्टम अपने-आप कई यूआरएल सेव करता हो.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • अगर आपका सर्वर, www/non-www http/https और प्रोटोकॉल पोर्ट वैरिएंट के लिए, एक जैसा कॉन्टेंट दिखाने के लिए कॉन्फ़िगर किया गया हो:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    http://example.com:80/green-dresses
    https://example.com:443/green-dresses
  • अगर आपने किसी ब्लॉग पर ऐसा कॉन्टेंट दिया हो जो दूसरी साइटों पर सिंडिकेशन के लिए हो और उस कॉन्टेंट को उन डोमेन पर पूरा या थोड़ा-बहुत दिखाया जाता हो:
    https://news.example.com/green-dresses-for-every-day-155672.html (सिंडिकेटेड पोस्ट) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (ओरिजनल पोस्ट)

कैननिकल यूआरएल चुनने की वजहें

आपको डुप्लीकेट/एक जैसे पेजों के सेट में से किसी पेज को खास तौर से कैननिकल पेज के तौर पर क्यों चुनना चाहिए, इसकी कई वजहें हो सकती हैं:

  • यह बताने के लिए कि आपको लोगों को, खोज के नतीजों में कौनसा यूआरएल दिखाना है. हो सकता है आप चाहें कि लोग आपके हरे रंग के कपड़ों के प्रॉडक्ट पेज पर, https://example.com/dresses/cocktail?gclid=ABCD के बजाय https://www.example.com/dresses/green/greendress.html से पहुंचें.
  • एक जैसे या डुप्लीकेट पेजों के लिए लिंक सिग्नलों को एक करने के लिए. इससे, सर्च इंजन को अलग-अलग यूआरएल के लिए मौजूद जानकारी (जैसे, उनके लिंक) को एक पसंदीदा (कैननिकल) यूआरएल में, एक साथ शामिल करने में मदद मिलती है. इसका मतलब है कि http://example.com/dresses/cocktail?gclid=ABCD के लिए दूसरी साइटों के लिंक, https://www.example.com/dresses/green/greendress.html के लिंक के साथ मिलकर एक हो जाते हैं.
  • सिर्फ़ एक प्रॉडक्ट/विषय की ट्रैकिंग मेट्रिक को आसान बनाने के लिए. अलग-अलग तरह के यूआरएल होने की वजह से, किसी खास कॉन्टेंट के लिए एक ऐसा मेट्रिक पाना मुश्किल होता है जिसमें सभी यूआरएल की जानकारी शामिल हो.
  • सिंडिकेटेड कॉन्टेंट को मैनेज करने के लिए. अगर आपने अन्य डोमेन पर पब्लिश करने के लिए अपने कॉन्टेंट का डुप्लीकेट बनाने का विकल्प चुना है, तो इसका मतलब है कि आपको पसंदीदा (कैननिकल) यूआरएल, खोज के नतीजों में दिखाना है.
  • डुप्लीकेट पेजों पर क्रॉलिंग में समय गंवाने से बचने के लिए. आप चाहेंगे कि Googlebot आपकी साइट का ज़्यादा से ज़्यादा कॉन्टेंट क्रॉल कर ले. इसलिए, बेहतर होगा कि वह एक ही पेज के डेस्कटॉप और मोबाइल वर्शन को क्रॉल करने के बजाय, आपकी साइट के नए (या अपडेट किए गए) पेजों को क्रॉल करे.

जानना कि Google किस पेज को कैननिकल मानता है

यूआरएल जांचने वाले टूल का इस्तेमाल करके जानें कि Google किस पेज को कैननिकल मानता है. भले ही आपने किसी पेज को खास तौर से कैननिकल पेज के तौर पर मार्क किया हो, फिर भी Google किसी अन्य पेज को कैननिकल के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं, जैसे कि पेज का कॉन्टेंट या परफ़ॉर्मेंस.

कैननिकल पेज तय करना

अगर मिलते-जुलते पेजों या डुप्लीकेट यूआरएल के लिए कैननिकल यूआरएल तय करना है, तो यहां दिए गए तरीकों में से किसी एक का इस्तेमाल करें. हमारी सलाह है कि आप इनमें से किसी एक तरीके का इस्तेमाल करें. हालांकि, ऐसा करना ज़रूरी नहीं है. अगर कोई कैननिकल यूआरएल तय नहीं किया जाता है, तो हम अपने हिसाब से सबसे अच्छे वर्शन या यूआरएल की पहचान कर लेंगे. सामान्य दिशा-निर्देशों का पालन ज़रूर करें.

तरीका और ब्यौरा
rel=canonical <link> टैग

कैननिकल पेज पर ले जाने वाले सभी डुप्लीकेट पेजों के लिए, कोड में एक <link> टैग जोड़ें.

फ़ायदे:
  • अनगिनत डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • इससे, पेज का साइज़ बढ़ सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
  • सिर्फ़ एचटीएमएल पेजों के लिए काम करता है, PDF जैसी फ़ाइलों के लिए नहीं. ऐसे मामलों में, आप rel=canonical एचटीटीपी हेडर इस्तेमाल कर सकते हैं.
rel=canonical एचटीटीपी हेडर

आपका पेज खोजे जाने पर एक rel=canonical हेडर भेजें.

फ़ायदे:

  • इससे, पेज का साइज़ नहीं बढ़ता है.
  • अनगिनत डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
साइटमैप

साइटमैप में अपने कैननिकल पेजों के बारे में जानकारी दें.

फ़ायदे:

  • खास तौर पर, बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • Google को अब भी ऐसे किसी कैननिकल पेज से जुड़ा डुप्लीकेट पेज तय करना होगा जिसके बारे में आपने साइटमैप में बताया है.
  • Google के लिए, rel=canonical मैपिंग तकनीक के मुकाबले कमज़ोर सिग्नल.
301 रीडायरेक्ट 301 रीडायरेक्ट का इस्तेमाल Googlebot को यह बताने के लिए करें कि रीडायरेक्ट करने वाला यूआरएल, दिए गए यूआरएल के मुकाबले एक बेहतर वर्शन है. इसका इस्तेमाल सिर्फ़ तब करें, जब किसी डुप्लीकेट पेज को क्रॉल किए जाने से रोकना हो.
एएमपी के वैरिएंट अगर कोई वैरिएंट एक एएमपी पेज है, तो कैननिकल पेज और एएमपी फ़ॉर्मैट के बारे में बताने के लिए, आपको एएमपी दिशा-निर्देशों का पालन करना होगा.

सामान्य दिशा-निर्देश

यूआरएल के कैननिकल होने की जांच करने के सभी तरीकों के लिए, इन सामान्य दिशा-निर्देशों का पालन करें:

  • यूआरएल के कैननिकल होने की जांच करने के लिए, robots.txt फ़ाइल का इस्तेमाल न करें.
  • यूआरएल के कैननिकल होने की जांच करने के लिए, यूआरएल हटाने वाले टूल का इस्तेमाल न करें. ऐसा करने से यूआरएल के सभी वर्शन, Search के नतीजों से हटा दिए जाते हैं.
  • यूआरएल के कैननिकल होने की जांच करने की एक जैसी या अलग-अलग तकनीकों का इस्तेमाल करके, एक ही पेज के लिए अलग-अलग यूआरएल को कैननिकल के तौर पर तय न करें (उदाहरण के लिए, ऐसा न हो कि किसी पेज के लिए साइटमैप में एक यूआरएल को और rel="canonical" का इस्तेमाल करके किसी दूसरे यूआरएल को कैननिकल के तौर पर तय कर दिया जाए).
  • किसी कैननिकल पेज को चुने जाने से रोकने के लिए, noindex का इस्तेमाल न करें. यह डायरेक्टिव, इंडेक्स से पेज को बाहर करने के लिए है, पसंद के कैननिकल पेज के चुनाव को मैनेज करने के लिए नहीं.
  • hreflang टैग इस्तेमाल करते समय, एक कैननिकल पेज ज़रूर चुनें. अपना कैननिकल पेज उसी भाषा में चुनें जिसमें आपका ओरिजनल वेबपेज है. अगर उस भाषा में कैननिकल पेज मौजूद न हो, तो उसके हिसाब से सबसे ठीक भाषा के पेज को चुनें.

  • अपनी साइट में लिंक करते समय, डुप्लीकेट यूआरएल के बजाय कैननिकल यूआरएल से लिंक करें. हमेशा कैननिकल यूआरएल से ही लिंक करने पर Google को आपकी पसंद समझने में आसानी होगी.

कैननिकल यूआरएल के लिए एचटीटीपी के बजाय एचटीटीपीएस को चुनना

Google एक जैसे पेजों के लिए, एचटीटीपी के बजाय एचटीटीपीएस पेजों को कैननिकल के तौर पर चुनता है. इसमें नीचे दी गई समस्याएं या आपस में टकराने वाले सिग्नल से जुड़े मामले शामिल नहीं हैं:

  • एचटीटीपीएस पेज में ऐसा एसएसएल सर्टिफ़िकेट शामिल हो जो गलत है.
  • एचटीटीपीएस पेज में ऐसी चीज़ें (इमेज के अलावा दूसरी चीज़ें) शामिल हैं जो सुरक्षित नहीं, लेकिन ज़रूरी हैं.
  • एचटीटीपीएस पेज, उपयोगकर्ताओं को किसी एचटीटीपी पेज पर या इसके ज़रिए दूसरे वेबलिंक पर भेजता है.
  • एचटीटीपीएस पेज में एचटीटीपी पेज का rel="canonical" link शामिल होता है.

हमारे सिस्टम डिफ़ॉल्ट तौर पर एचटीटीपी पेजों की जगह एचटीटीपीएस पेजों को ही चुनते हैं. हालांकि, इनमें से किसी भी कार्रवाई की मदद से यह तय किया जा सकता है कि ऐसा ही हो:

  • एचटीटीपी पेज से एचटीटीपीएस पेज पर भेजने के लिए रीडायरेक्ट जोड़ें.
  • एचटीटीपी पेज से एचटीटीपीएस पेज पर भेजने के लिए rel="canonical" link जोड़ें.
  • एचएसटीएस लागू करें.

Google को गलती से एचटीटीपी पेज को कैननिकल बनाने से रोकने के लिए, इन तरीकों का इस्तेमाल करने से बचें:

  • गलत TLS/एसएसएल सर्टिफ़िकेट इस्तेमाल करने और एचटीटीपीएस से एचटीटीपी पर रीडायरेक्ट करने से बचें. ऐसा होने पर Google, एचटीटीपी पेज को चुनना बहुत ज़रूरी मान लेता है. एचएसटीएस लागू करने पर भी Google, एचटीटीपी पेज को चुनना ज़रूरी मानता है.
  • अपने साइटमैप या hreflang कोडिंग में एचटीटीपीएस वर्शन के बजाय एचटीटीपी पेज को शामिल करने से बचें.
  • गलत होस्ट वैरिएंट के लिए, अपने एसएसएल/TLS सर्टिफ़िकेट का इस्तेमाल करने से बचें. उदाहरण के लिए, www.example.com की जगह example.com के लिए अपने सर्टिफ़िकेट का इस्तेमाल करने से बचें. सर्टिफ़िकेट, आपकी साइट के पूरे यूआरएल से मेल खाना चाहिए या फिर वह ऐसा वाइल्डकार्ड सर्टिफ़िकेट हो जिसे एक डोमेन के कई सबडोमेन के लिए इस्तेमाल किया जा सके.

अगर कोई पेज किसी अन्य पेज का डुप्लीकेट है, तो यह दिखाने के लिए, अपने एचटीएमएल के head सेक्शन में <link> टैग का इस्तेमाल किया जा सकता है.

मान लीजिए कि आप https://example.com/dresses/green-dresses को कैननिकल यूआरएल के तौर पर चुनना चाहते हैं, जबकि इस कॉन्टेंट को कई अन्य यूआरएल से भी ऐक्सेस किया जा सकता है. ऐसे में, इस यूआरएल को कैननिकल यूआरएल के तौर पर दिखाने के लिए यह तरीका अपनाएं:

  1. सभी डुप्लीकेट पेजों को rel="canonical" लिंक टैग से मार्क करें.

    कैननिकल पेज पर ले जाने के लिए, डुप्लीकेट पेजों के <head> सेक्शन में rel="canonical" एट्रिब्यूट वाला <link> एलिमेंट जोड़ें. उदाहरण के लिए:

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. अगर कैननिकल पेज का कोई मोबाइल वर्शन है, तो उस मोबाइल वर्शन पर ले जाने के लिए, पेज में rel="alternate" link जोड़ें:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">
  3. कोई भी hreflang या दूसरे रीडायरेक्ट जोड़ें, जो पेज के लिए सही हों.

rel="canonical" link टैग के साथ, रिलेटिव पाथ के बजाय ऐब्सलूट पाथ का इस्तेमाल करें.

सुझाया गया:https://www.example.com/dresses/green/greendress.html

इन्हें इस्तेमाल करने का सुझाव नहीं दिया जाता:/dresses/green/greendress.html

अगर आप rel="canonical" लिंक टैग जोड़ने के लिए JavaScript का इस्तेमाल करें, तो कैननिकल लिंक टैग को ठीक से इंजेक्ट करें.

rel="canonical" एचटीटीपी हेडर का इस्तेमाल करना

अगर आपके सर्वर को कॉन्फ़िगर करना मुमकिन है, तो Search के साथ काम करने वाले दस्तावेज़ का कैननिकल यूआरएल तय करने के लिए, rel="canonical" एचटीटीपी हेडर (एचटीएमएल टैग के बजाय) का इस्तेमाल किया जा सकता है. इसमें, PDF फ़ाइलों जैसे बिना एचटीएमएल वाले दस्तावेज़ भी शामिल हैं.

फ़िलहाल, Google पर यह तरीका सिर्फ़ वेब खोज के नतीजों के लिए काम करता है.

अगर आपकी कोई PDF फ़ाइल खोज के नतीजों में कई यूआरएल के ज़रिए दिखती है, तो rel="canonical" एचटीटीपी हेडर दिखाकर, Googlebot को यह बताया जा सकता कि PDF फ़ाइल का कैननिकल यूआरएल कौनसा है:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

rel="canonical" एचटीटीपी हेडर के लिए सुझाव वही हैं जो rel="canonical" link टैग के लिए हैं. आरएफ़सी2616 के मुताबिक, rel="canonical" एचटीटीपी हेडर में सिर्फ़ डबल कोट का इस्तेमाल करें.

साइटमैप का इस्तेमाल करना

अपने हर पेज के लिए एक कैननिकल यूआरएल चुनें और उसे साइटमैप में सबमिट करें. साइटमैप में दिए गए सभी पेजों को कैननिकल के तौर पर बताया गया है. कॉन्टेंट का मिलान करके, Google यह तय करेगा कि कौनसा पेज (अगर कोई है) डुप्लीकेट है.

हम इस बात की गारंटी नहीं देते हैं कि हम साइटमैप में दिए गए यूआरएल को कैननिकल मानेंगे. हालांकि, एक बड़ी साइट के लिए कैननिकल यूआरएल तय करने का यह एक आसान तरीका है. साथ ही, साइटमैप Google को यह बताने का एक अच्छा तरीका है कि आपके लिए, अपनी साइट पर कौनसे पेज सबसे ज़्यादा अहम हैं.

साइटमैप में ऐसे पेजों को शामिल न करें जो कैननिकल नहीं हैं. अगर किसी साइटमैप का इस्तेमाल किया जा रहा है, तो साइटमैप में सिर्फ़ कैननिकल यूआरएल के बारे में बताएं.

अब काम न करने वाले यूआरएल के लिए, 301 रीडायरेक्ट इस्तेमाल करें

इस तरीके का इस्तेमाल तब करें, जब आपको मौजूदा डुप्लीकेट पेजों से छुटकारा पाना हो. हालांकि, पुराने यूआरएल का इस्तेमाल बंद करने से पहले यह पक्का करना ज़रूरी है कि इसे आसानी से बदला जा सकता है.

मान लेते हैं कि आपके पेज पर कई तरीकों से पहुंचा जा सकता है:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

इनमें से किसी एक यूआरएल को अपने कैननिकल यूआरएल के तौर पर चुनें और अन्य यूआरएल से अपने पसंदीदा यूआरएल में ट्रैफ़िक भेजने के लिए, 301 रीडायरेक्ट इस्तेमाल करें. सर्वर साइड पर 301 रीडायरेक्ट का होना, लोगों और सर्च इंजन को सही पेज पर ले जाने का सबसे अच्छा तरीका है. 301 स्टेटस कोड का मतलब है कि पेज को हमेशा के लिए किसी नए यूआरएल पर ले जाया गया है.

अगर आपने वेबसाइट होस्ट करने वाली किसी कंपनी की सेवा ले रखी है, तो 301 रीडायरेक्ट को सेट अप करने से जुड़े उनके दस्तावेज़ देखें.

समस्याएं हल करना

अगर कोई कैननिकल यूआरएल ऐसी प्रॉपर्टी में है जिसके आप मालिक नहीं हैं, तो आप अपने डुप्लीकेट पेज का ट्रैफ़िक नहीं देख पाएंगे. यहां, कैननिकल पेज के किसी अलग प्रॉपर्टी में मौजूद होने की कुछ आम वजहें बताई गई हैं:

  • भाषा के गलत वैरिएंट चुनना: अगर आपकी ऐसी कई वेबसाइटें हैं जिनमें दुनिया भर के उपयोगकर्ताओं के लिए एक जैसा कॉन्टेंट उनकी स्थानीय भाषा में उपलब्ध कराया जाता है, तो अलग-अलग भाषा और इलाके के हिसाब से बनाई गई साइटों के लिए तय किए गए दिशा-निर्देशों का पालन ज़रूर करें.
  • गलत कैननिकल टैग: कुछ सीएमएस प्लग इन या कॉन्टेंट मैनेजमेंट सिस्टम (सीएमएस), यूआरएल के कैननिकल होने की जांच करने की तकनीकों का गलत इस्तेमाल कर सकते हैं. इससे वे आपकी साइट पर आने वाले उपयोगकर्ता या क्रॉलर को, किसी दूसरी साइट पर मौजूद यूआरएल पर भेज सकते हैं. देख लें कि कहीं आपके कॉन्टेंट में यह समस्या तो नहीं है. अगर आपकी साइट ऐसे यूआरएल को कैननिकल यूआरएल मान रही है जिसे आम तौर पर कैननिकल यूआरएल नहीं चुना जाना चाहिए, तो यह rel="canonical" के गलत इस्तेमाल या 301 रीडायरेक्ट की वजह से हो सकता है. इस समस्या को तुरंत ठीक करें.
  • गलत तरीके से कॉन्फ़िगर किए गए सर्वर: होस्ट करने की कुछ सेटिंग को गलत तरीके से सेट करने की वजह से, ऐसे क्रॉस-डोमेन यूआरएल को चुन लिया जाता है जिसे आम तौर पर नहीं चुना जाना चाहिए. उदाहरण के लिए:
    • कोई सर्वर गलत तरीके से कॉन्फ़िगर हो सकता है. ऐसा हाेने पर, b.com के किसी यूआरएल के लिए अनुरोध करने पर a.com का कॉन्टेंट दिख सकता है
    • दो अलग-अलग वेब सर्वर, एक जैसे soft 404 पेजों पर भेज सकते हैं जिन्हें Google, गड़बड़ी वाले पेजों के तौर पर पहचान नहीं पाया था.
  • नुकसान पहुंचाने के मकसद से की गई हैकिंग: वेबसाइटों पर किए गए कुछ हमलों में ऐसा कोड डाला जाता है जिसकी वजह से, अनुरोध के जवाब में एचटीटीपी 301 रीडायरेक्ट मिलता है. इसके अलावा, एचटीएमएल <head> या एचटीटीपी हेडर में, क्रॉस-डोमेन वाला ऐसा rel="canonical" लिंक टैग भी डाला जा सकता है जो अक्सर नुकसान पहुंचाने या स्पैम वाले कॉन्टेंट को होस्ट करने वाले यूआरएल पर भेजता है. इन मामलों में हमारे एल्गोरिदम, छेड़छाड़ की गई वेबसाइट पर मौजूद यूआरएल चुनने के बजाय, नुकसान पहुंचाने या स्पैम वाले यूआरएल को चुन सकते हैं.
  • नकली वेबसाइट: बहुत कम मामलों में, हमारा एल्गोरिदम किसी ऐसी बाहरी साइट से यूआरएल चुन सकता है जिस पर आपकी अनुमति के बिना आपका कॉन्टेंट मौजूद हो. अगर आपको लगता है कि कोई अन्य साइट, आपके कॉन्टेंट को डुप्लीकेट करके कॉपीराइट कानून का उल्लंघन कर रही है, तो आप उस साइट के होस्ट से कॉन्टेंट हटाने का अनुरोध कर सकते हैं. साथ ही, आप Google से भी यह अनुरोध कर सकते हैं कि कॉपीराइट के नियमाें का उल्लंघन करने वाले पेजों को खोज नतीजाें से हटा दिया जाए. इसके लिए, आप डिजिटल मिलेनियम कॉपीराइट ऐक्ट के तहत अनुरोध कर सकते हैं.