यूआरएल का स्ट्रक्चर आसान रखना

किसी साइट का यूआरएल जितना हो सके उतना आसान होना चाहिए. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें. लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्द शामिल करें. उदाहरण के लिए, अगर आप एविएशन के बारे में जानकारी ढूंढ रहे हैं, तो http://en.wikipedia.org/wiki/Aviation जैसा कोई यूआरएल, यह तय करने में आपकी मदद करेगा कि उस लिंक पर क्लिक करना है या नहीं. http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 जैसे किसी यूआरएल पर उपयोगकर्ताओं का ध्यान कम जाएगा.

अपने यूआरएल में विराम चिह्न का इस्तेमाल करें. हमारे लिए http://www.example.com/greendress.html के बजाय, http://www.example.com/green-dress.html ज़्यादा उपयोगी यूआरएल है. हमारा सुझाव है कि आप अपने यूआरएल में अंडरस्कोर (_) के बजाय, हाइफ़न (-) का इस्तेमाल करें.

ज़्यादा मुश्किल, खासकर एक से ज़्यादा पैरामीटर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है. ये यूआरएल आपकी साइट के लिए, कई ऐसे यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट ही दिखाते हैं. इस वजह से, हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ इस्तेमाल करे या आपकी साइट के सारे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.

इस समस्या की आम वजहें

बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से कुछ हैं:

  • एक आइटम सेट के लिए कई फ़िल्टर लगाना कुछ साइटें एक ही आइटम सेट या खोज के नतीजों को अलग-अलग तरीके से दिखाने की सुविधा देती हैं. इसमें अक्सर उपयोगकर्ताओं को, इस सेट को तय तरीके से फ़िल्टर करने का मौका मिलता है (उदाहरण के लिए: मुझे ऐसे होटल दिखाओ जो समुद्र के किनारे हैं). जब एक साथ कई फ़िल्टर लगाए जाते हैं (जैसे: होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी हैं), तो साइट में यूआरएल की संख्या (डेटा के देखे जाने की संख्या) अचानक बढ़ जाती है. होटल की, थोड़े से अंतर वाली सूचियों को बड़ी संख्या में बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और उनसे वह हर एक होटल के पेज पर पहुंच सकता है. जैसे:
    • "किफ़ायती दरों" पर होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र के किनारे "किफ़ायती दरों" पर होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • दस्तावेज़ों को डाइनैमिक तरीके से बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
  • यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी जो बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना देते हैं.
  • पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. जैसे:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों पर बिना प्रतिबंध लगाए, पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. जैसे:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से यूआरएल में असीमित खाली जगह बन सकती है. आम तौर पर, यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. जैसे:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

इस समस्या का समाधान करना

हमारा सुझाव है कि यूआरएल बनाने में होने वाली समस्याओं से बचने के लिए, आप ये तरीके अपनाएं:

  • ऐसे यूआरएल जिनमें समस्या आ रही है उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. आपको खास तौर पर डाइनैमिक यूआरएल ब्लॉक करने चाहिए. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करके, आप आसानी से बहुत सारे यूआरएल ब्लॉक कर सकते हैं.
  • जब भी मुमकिन हो, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें. ज़्यादा जानकारी के लिए, हमारी वेबमास्टर गाइडलाइन देखें.
  • जब भी मुमकिन हो, गैर-ज़रूरी पैरामीटर को काट-छांट कर यूआरएल छोटा करें.
  • अगर आपकी साइट में असीमित कैलेंडर है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक nofollow एट्रिब्यूट जोड़ें.
  • देखें कि आपकी साइट पर काम न करने वाले मिलते-जुलते लिंक हैं या नहीं.