कई भाषाओं वाली वेबसाइटों के साथ काम करना

शुक्रवार, 19 मार्च, 2010

कई भाषाओं में उपलब्ध वेबसाइट, वह वेबसाइट होती है जिसका कॉन्टेंट एक से ज़्यादा भाषाओं में उपलब्ध होता है. कई भाषाओं में उपलब्ध वेबसाइटों के उदाहरणों में कनाडा का कोई ऐसा कारोबार शामिल हो सकता है जिसकी साइट, अंग्रेज़ी और फ़्रेंच, दोनों भाषाओं में उपलब्ध हो या लैटिन अमेरिकन फ़ुटबॉल पर कोई ब्लॉग शामिल हो सकता है जो स्पैनिश और पॉर्चगीज़, दोनों भाषाओं में उपलब्ध हो.

आम तौर पर, एक से ज़्यादा भाषाओं में वेबसाइट बनाना तब सही होता है, जब आपकी टारगेट ऑडियंस में अलग-अलग भाषाएं बोलने वाले लोग हों. अगर लैटिन अमेरिकन फ़ुटबॉल के बारे में आपके ब्लॉग का मकसद, ब्राज़ील के दर्शकों तक पहुंचना है, तो आपके पास इसे सिर्फ़ पॉर्चगीज़ में पब्लिश करने का विकल्प है. हालांकि, अगर आपको अर्जेंटीना में फ़ुटबॉल के प्रशंसकों तक भी पहुंच बनानी है, तो स्पैनिश में कॉन्टेंट डालकर, आपको इसमें मदद मिल सकती है.

Google और भाषा की पहचान करने वाला टूल

Google यह तय करने की कोशिश करता है कि आपके हर एक पेज पर, मुख्य भाषा कौनसी है. अगर आपको भाषा को आसानी से पहचानने में Google की मदद करनी है, तो एक पेज पर एक ही भाषा का इस्तेमाल करें. इसके अलावा, मूल कॉन्टेंट के साथ भाषा का अनुवाद न दिखाएं. Google यह पहचान सकता है कि पेज को एक से ज़्यादा भाषाओं में इस्तेमाल किया जा रहा है, लेकिन हमारा सुझाव है कि आप पेज के सभी एलिमेंट, जैसे कि हेडर, साइडबार, मेन्यू वगैरह के लिए एक ही भाषा का इस्तेमाल करें.

ध्यान रखें कि Google भाषा से जुड़ी, कोड-लेवल की सभी जानकारी को अनदेखा करता है. इसमें "lang" एट्रिब्यूट से लेकर डॉक्यूमेंट टाइप डेफ़िनिशन (डीटीडी) तक शामिल हैं. वेबसाइट में बदलाव करने की सुविधा देने वाले कुछ प्रोग्राम, अपने-आप ये एट्रिब्यूट बनाते हैं. इसलिए, किसी वेबपेज की भाषा तय करते समय, इन एट्रिब्यूट पर भरोसा नहीं किया जा सकता.

जब कोई व्यक्ति Google पर अपनी भाषा में खोज करता है, तो उसे उम्मीद होती है कि उसे खोज के नतीजे, स्थानीय भाषा में दिखेंगे. वेबमास्टर के तौर पर, आपका काम यही होता है. अगर आपका पेज स्थानीय भाषा में है, तो इसे खोज के नतीजों में दिखाएं. ऐसा करने के लिए, हमारे दिए गए सुझावों का पालन करें.

कई भाषाओं वाली साइट का स्ट्रक्चर: यूआरएल का स्ट्रक्चर

कई भाषाओं में उपलब्ध वेबसाइट बनाते समय, खास यूआरएल बनाने की ज़रूरत नहीं होती. फिर भी, लोग यूआरएल पर एक नज़र डालकर यह पता लगाना चाहेंगे कि वे आपकी वेबसाइट के किस सेक्शन पर हैं. उदाहरण के लिए, नीचे दिए गए यूआरएल से लोगों को पता चलता है कि वे इस साइट के अंग्रेज़ी सेक्शन में हैं: https://example.ca/en/mountain-bikes.html या https://en.example.ca/mountain-bikes.html. वहीं, यहां दिए गए अन्य यूआरएल से लोगों को पता चलता है कि वे उसी पेज को फ़्रेंच में देख रहे हैं: https://example.ca/fr/mountain-bikes.html या https://fr.example.ca/mountain-bikes.html. इसके अलावा, इस यूआरएल स्ट्रक्चर की मदद से, कई भाषाओं वाले कॉन्टेंट के इंडेक्स होने का विश्लेषण आसानी से किया जा सकता है.

अगर आपको अंग्रेज़ी के अलावा किसी अन्य भाषा के वर्णों का इस्तेमाल करके यूआरएल बनाना है, तो UTF-8 एन्कोडिंग ज़रूर इस्तेमाल करें. अपने कॉन्टेंट में लिंक किए जाने पर, UTF-8 एन्कोडिंग वाले यूआरएल सही तरीके से एस्केप किए जाने चाहिए. अगर आपको अपने यूआरएल को मैन्युअल तरीके से एस्केप करना है, तो आपको आसानी से एक ऑनलाइन यूआरएल एन्कोडर मिल जाएगा. यह आपके लिए यूआरएल एस्केप करेगा. उदाहरण के लिए, अगर मैं इस यूआरएल का अनुवाद अंग्रेज़ी से फ़्रेंच https://example.ca/fr/mountain-bikes.html में करना चाहूं, तो यह कुछ ऐसा दिखेगा: https://example.ca/fr/vélo-de-montagne.html. क्योंकि, इस यूआरएल में एक गैर-अंग्रेज़ी वर्ण (é) है, इसलिए आपके पेजों के लिंक में ठीक से एस्केप करके इस्तेमाल किए जाने पर, यह कुछ ऐसा दिखेगा: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

कई भाषाओं में उपलब्ध आपकी वेबसाइट को क्रॉल और इंडेक्स करना

हमारा सुझाव है कि आप अपने-आप होने वाले अनुवादों को इंडेक्स करने की अनुमति न दें. मशीन से किया गया अनुवाद हमेशा सही नहीं होता है और उसे स्पैम के तौर पर देखा जा सकता है. इससे भी अहम बात यह है कि कई भाषाओं में उपलब्ध वेबसाइट बनाने का मकसद, कई भाषाओं में ज़रूरी कॉन्टेंट उपलब्ध कराकर, ज़्यादा से ज़्यादा लोगों तक पहुंचना है. अगर लोगों को अपने-आप किया गया अनुवाद समझ नहीं आता या उन्हें लगता है कि यह कॉन्टेंट नकली है, तो आपको सोचना चाहिए कि क्या आपको वाकई उन्हें इस तरह का कॉन्टेंट दिखाना है.

अगर आपको अपनी साइट स्थानीय भाषा में उपलब्ध करानी है, तो पक्का करें कि Googlebot आपकी साइट के सभी भाषाओं के वर्शन को आसानी से क्रॉल कर सके. हर पेज के हिसाब से क्रॉस-लिंक करने पर विचार करें. दूसरे शब्दों में, अलग-अलग भाषाओं में एक ही कॉन्टेंट वाले पेजों को लिंक की मदद से जोड़ा जा सकता है. इससे लोगों को भी काफ़ी मदद मिल सकती है. हमारे पिछले उदाहरण के मुताबिक, मान लेते हैं कि फ़्रेंच बोलने वाला कोई व्यक्ति https://example.ca/en/mountain-bikes.html पर आता है. अब, एक क्लिक करके वह https://example.ca/fr/vélo-de-montagne.html पर पहुंच सकता है, जहां उसे वही कॉन्टेंट फ़्रेंच में दिखेगा.

अपनी साइट के सारे कॉन्टेंट को क्रॉल करने लायक बनाने के लिए, लोगों की भाषा के हिसाब से अपने-आप रीडायरेक्ट करने से बचें. इस तरह रीडायरेक्ट करने से, हो सकता है कि लोगों और सर्च इंजन को आपकी साइट के सभी वर्शन न दिखें.

आखिर में, हर भाषा के कॉन्टेंट को अलग-अलग यूआरएल पर रखें. अनुवाद किए गए वर्शन दिखाने के लिए, कुकी इस्तेमाल न करें.

कैरेक्टर एन्कोडिंग के साथ काम करना

Google, एचटीटीपी हेडर, एचटीएमएल पेज हेडर, और कॉन्टेंट से सीधे तौर पर कैरेक्टर एन्कोडिंग का पता लगा सकता है. कैरेक्टर एन्कोडिंग के लिए आपको ज़्यादा मेहनत नहीं करनी होती. हालांकि, आपको सिर्फ़ यह देखना है कि साइट पर एक ही जगह, अलग-अलग जानकारी न दी गई हो. जैसे, कॉन्टेंट और हेडर में. हालांकि, Google अलग-अलग कैरेक्टर एन्कोडिंग को पहचान सकता है, लेकिन हमारा सुझाव है कि जहां तक हो सके, अपनी वेबसाइट पर UTF-8 एन्कोडिंग का इस्तेमाल करें.

जब किसी दूसरी भाषा को बोलने में आपकी ज़बान अटक जाए...

अब जब आपको इस बारे में पूरी जानकारी है, तो हो सकता है कि कई भाषाओं में बात करने पर आपकी ज़बान अटक जाए. हालांकि, ऐसा आपकी वेबसाइट के लिए नहीं होना चाहिए!

ज़्यादा जानकारी के लिए, हमारी कई इलाकों में उपलब्ध साइटों के बारे में पोस्ट पढ़ें. साथ ही, हमारी अगली पोस्ट देखने के लिए हमारे साथ बने रहें. उसमें हम ऐसी खास स्थितियों के बारे में बताएंगे जिनका सामना अलग-अलग भाषाओं में उपलब्ध वेबसाइट बनाने पर करना पड़ता है. तब तक, सहायता फ़ोरम पर बेझिझक होकर आएं और बातचीत में शामिल हों!