यूआरएल का स्ट्रक्चर आसान रखना

किसी साइट के यूआरएल का स्ट्रक्चर जितना हो सके उतना आसान होना चाहिए. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें.

जहां भी हो सके, अपने यूआरएल में लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्दों का इस्तेमाल करें.

इसका सुझाव दिया जाता है: यूआरएल में आसान और जानकारी देने वाले शब्दों का इस्तेमाल करें:

http://en.wikipedia.org/wiki/Aviation

इसका सुझाव दिया जाता है: अगर हो सके, तो यूआरएल में स्थानीय भाषा के शब्दों का इस्तेमाल करें. ज़रूरत के मुताबिक, UTF-8 एन्कोडिंग का इस्तेमाल करें.

example.com/lebensmittel/pfefferminz

इसका सुझाव नहीं दिया जाता है: यूआरएल में, पढ़े नहीं जा सकने वाले, लंबे आईडी नंबर का इस्तेमाल न करें:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

अगर आपकी साइट कई इलाकों में उपलब्ध है, तो ऐसे यूआरएल का इस्तेमाल करें जिनकी मदद से, आपकी साइट अलग-अलग इलाकों के उपयोगकर्ताओंं को टारगेट कर सके. यूआरएल को स्ट्रक्चर करने से जुड़े और उदाहरण देखने के लिए, अलग-अलग इलाकों के हिसाब से बनाए गए यूआरएल इस्तेमाल करना लेख देखें.

इसका सुझाव दिया जाता है: देश के हिसाब से डोमेन इस्तेमाल करें:

example.de

इसका सुझाव दिया जाता है: देश के हिसाब से, gTLD वाली सबडायरेक्ट्री इस्तेमाल करें:

example.com/de/

यूआरएल में हाइफ़न का इस्तेमाल करें. इससे, उपयोगकर्ताओं और सर्च इंजन को यूआरएल में मौजूद कीवर्ड समझने में मदद मिलती है.

इसका सुझाव दिया जाता है: हाइफ़न का इस्तेमाल करके, यूआरएल में मौजूद कीवर्ड को अलग-अलग लिखें:

https://www.example.com/green-dress

इसका सुझाव नहीं दिया जाता है: यूआरएल में मौजूद कीवर्ड को एक साथ न लिखें:

https://www.example.com/greendress

हमारा सुझाव है कि आप अपने यूआरएल में, अंडरस्कोर (_) के बजाय, हाइफ़न (-) का इस्तेमाल करें.

इसका सुझाव दिया जाता है: हाइफ़न (-) का इस्तेमाल करें:

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

इसका सुझाव नहीं दिया जाता है: अंडरस्कोर (_) का इस्तेमाल न करें:

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

ज़्यादा मुश्किल स्ट्रक्चर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है, क्योंकि ये यूआरएल आपकी साइट के लिए ऐसे कई यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट ही दिखाते हैं. इनमें, खास तौर पर ऐसे यूआरएल शामिल हैं जिनमें एक से ज़्यादा पैरामीटर का इस्तेमाल किया जाता है. इस वजह से हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ का इस्तेमाल करे. इसके अलावा, आपकी साइट के पूरे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.

इस समस्या की सामान्य वजहें

बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से आम वजह यहां दी गई हैं:

  • एक आइटम सेट के लिए कई फ़िल्टर इस्तेमाल करना. कई साइटें, एक ही आइटम सेट या खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. कई मामलों में उपयोगकर्ता, दिए गए पैरामीटर के हिसाब से आइटम सेट के लिए फ़िल्टर का इस्तेमाल भी कर सकते हैं. फ़िल्टर के लिए, पहले से तय कुछ विकल्प भी दिए गए होते हैं (उदाहरण के लिए, ऐसे होटल दिखाओ जो समुद्र के किनारे हैं). इसके अलावा, जब कई फ़िल्टर एक साथ इस्तेमाल किए जाते हैं (उदाहरण के लिए, ऐसे होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी है), तो साइटों में यूआरएल की संख्या (डेटा को देखे जाने की संख्या) अचानक बढ़ जाती है. थोड़े-बहुत अंतर की वजह से होटल के लिए अलग-अलग सूचियां बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और वह उनसे हर होटल के पेज पर पहुंच सकता है. उदाहरण के लिए:
    • "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र के किनारे "किफ़ायती दरों" पर होटल:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल: :
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • डाइनैमिक तरीके से दस्तावेज़ बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
  • यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना सकते हैं.
  • पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. जैसे:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों की सीमा तय किए बिना, पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. जैसे:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से यूआरएल में असीमित खाली जगह बन सकती है. आम तौर पर, यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. जैसे:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

इस समस्या को ठीक करना

हमारा सुझाव है कि यूआरएल स्ट्रक्चर से जुड़ी समस्याओं से बचने के लिए, आप यह तरीका अपनाएं:

  • ऐसे यूआरएल जिनमें समस्या आ रही है, उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. खास तौर पर, डाइनैमिक यूआरएल ब्लॉक करें. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करें. ऐसा करके, आसानी से बहुत सारे यूआरएल ब्लॉक किए जा सकते हैं.
  • जहां भी हो सके, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें. ज़्यादा जानकारी के लिए, हमारी वेबमास्टर गाइडलाइन देखें.
  • जहां भी हो सके, गै़र-ज़रूरी पैरामीटर को काट-छांट कर यूआरएल को छोटा करें.
  • अगर आपकी साइट में ऐसा कैलेंडर है जिसमें शुरू और खत्म होने की तारीख मौजूद नहीं है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक nofollow एट्रिब्यूट जोड़ें.
  • अपनी साइट पर काम न करने वाले मिलते-जुलते लिंक देखें.