यूआरएल का स्ट्रक्चर आसान रखना

किसी साइट के यूआरएल का स्ट्रक्चर जितना हो सके उतना आसान होना चाहिए. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें.

जहां भी हो सके, अपने यूआरएल में लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्दों का इस्तेमाल करें.

इसका सुझाव दिया जाता है: यूआरएल में आसान और जानकारी देने वाले शब्दों का इस्तेमाल करें:

https://en.wikipedia.org/wiki/Aviation

इसका सुझाव दिया जाता है: अगर हो सके, तो यूआरएल में स्थानीय भाषा के शब्दों का इस्तेमाल करना.

https://www.example.com/lebensmittel/pfefferminz

इसका सुझाव दिया जाता है: ज़रूरत के हिसाब से, UTF-8 एन्कोडिंग का इस्तेमाल करना. जैसे, इस उदाहरण में, यूआरएल में मौजूद ऐरेबिक वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

इस उदाहरण में, यूआरएल में मौजूद चाइनीज़ वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

इस उदाहरण में, यूआरएल में मौजूद ऊमलाउट वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://www.example.com/gem%C3%BCse

इस उदाहरण में, यूआरएल में मौजूद इमोजी के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:

https://example.com/%F0%9F%A6%99%E2%9C%A8

इसका सुझाव नहीं दिया जाता: यूआरएल में, बिना ASCII वाले वर्णों का इस्तेमाल करना:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

इसका सुझाव नहीं दिया जाता: यूआरएल में, पढ़े नहीं जा सकने वाले, लंबे आईडी नंबर का इस्तेमाल करना:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

अगर आपकी साइट कई इलाकों में उपलब्ध है, तो ऐसे यूआरएल का इस्तेमाल करें जिनकी मदद से, आपकी साइट अलग-अलग इलाकों के उपयोगकर्ताओंं को टारगेट कर सके. यूआरएल को स्ट्रक्चर करने से जुड़े और उदाहरण देखने के लिए, अलग-अलग इलाकों के हिसाब से बनाए गए यूआरएल इस्तेमाल करना लेख देखें.

इसका सुझाव दिया जाता है: देश के हिसाब से डोमेन इस्तेमाल करें:

https://example.de

इसका सुझाव दिया जाता है: देश के हिसाब से, gTLD वाली सबडायरेक्ट्री इस्तेमाल करना:

https://example.com/de/

अपने यूआरएल में शब्दों को अलग-अलग करने के लिए, हाइफ़न का इस्तेमाल करें. इससे लोग और सर्च इंजन, यूआरएल में मौजूद कीवर्ड ज़्यादा आसानी से समझ पाते हैं. हमारा सुझाव है कि यूआरएल में, अंडरस्कोर (_) के बजाय हाइफ़न (-) का इस्तेमाल करें.

इसका सुझाव दिया जाता है: हाइफ़न (-) का इस्तेमाल करना:

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

इसका सुझाव नहीं दिया जाता: अंडरस्कोर (_) का इस्तेमाल करना:

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

इसका सुझाव नहीं दिया जाता: यूआरएल में मौजूद कीवर्ड को एक साथ लिखना:

https://www.example.com/greendress

ज़्यादा मुश्किल स्ट्रक्चर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है, क्योंकि ये यूआरएल आपकी साइट के लिए ऐसे कई यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट दिखाते हैं. इनमें खास तौर पर ऐसे यूआरएल शामिल हैं जिनमें एक से ज़्यादा पैरामीटर इस्तेमाल किए जाते हैं. इस वजह से हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ का इस्तेमाल करे. इसके अलावा, आपकी साइट के पूरे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.

इस समस्या की सामान्य वजहें

बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से आम वजह यहां दी गई हैं:

  • एक आइटम सेट के लिए कई फ़िल्टर इस्तेमाल करना. कई साइटें, एक ही आइटम सेट या खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. कई मामलों में उपयोगकर्ता, दिए गए पैरामीटर के हिसाब से आइटम सेट के लिए फ़िल्टर का इस्तेमाल भी कर सकते हैं. फ़िल्टर के लिए, पहले से तय कुछ विकल्प भी दिए गए होते हैं (उदाहरण के लिए, ऐसे होटल दिखाओ जो समुद्र के किनारे हैं). इसके अलावा, जब कई फ़िल्टर एक साथ इस्तेमाल किए जाते हैं (उदाहरण के लिए, ऐसे होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी है), तो साइटों में यूआरएल की संख्या (डेटा को देखे जाने की संख्या) अचानक बढ़ जाती है. थोड़े-बहुत अंतर की वजह से होटल के लिए अलग-अलग सूचियां बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और वह उनसे हर होटल के पेज पर पहुंच सकता है. उदाहरण के लिए:
    • "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र के किनारे "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल: :
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • डाइनैमिक तरीके से दस्तावेज़ बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
  • यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना सकते हैं.
  • पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. जैसे:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों की सीमा तय किए बिना, पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. जैसे:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से यूआरएल में असीमित खाली जगह बन सकती है. आम तौर पर, यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. जैसे:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

इस समस्या को ठीक करना

हमारा सुझाव है कि यूआरएल स्ट्रक्चर से जुड़ी समस्याओं से बचने के लिए, आप यह तरीका अपनाएं:

  • ऐसे यूआरएल जिनमें समस्या आ रही है, उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. खास तौर पर, डाइनैमिक यूआरएल ब्लॉक करें. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करें. ऐसा करके, आसानी से बहुत सारे यूआरएल ब्लॉक किए जा सकते हैं.
  • जहां भी हो सके, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें.
  • जहां भी हो सके, गै़र-ज़रूरी पैरामीटर को काट-छांट कर यूआरएल को छोटा करें.
  • अगर आपकी साइट में ऐसा कैलेंडर है जिसमें शुरू और खत्म होने की तारीख मौजूद नहीं है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक nofollow एट्रिब्यूट जोड़ें.
  • अपनी साइट पर काम न करने वाले मिलते-जुलते लिंक देखें.