Google उन दस्तावेज़ों के लिए शीर्षक कैसे जनरेट करता है जिनमें भाषा या स्क्रिप्ट मेल नहीं खाती है

शुक्रवार, 3 जून, 2022

इस हफ़्ते, हमने एल्गोरिदम को बेहतर बनाने की शुरुआत की है. इसकी मदद से ऐसे दस्तावेज़ों की पहचान की जाती है जिनका शीर्षक एलिमेंट, अपने कॉन्टेंट से अलग भाषा या स्क्रिप्ट में लिखा गया हो. साथ ही, हम ऐसा शीर्षक चुनते हैं जो दस्तावेज़ की भाषा और स्क्रिप्ट से मिलता-जुलता है. यह इस सामान्य सिद्धांत पर आधारित है कि किसी दस्तावेज़ का शीर्षक, उसके मुख्य कॉन्टेंट की भाषा या स्क्रिप्ट में ही लिखा जाना चाहिए. यह भी एक वजह है कि हम वेब नतीजे के शीर्षकों के लिए शीर्षक एलिमेंट के शब्दों पर न जाकर, उन्हें बेहतर तरीके से समझ सकते हैं.

कई भाषाओं में उपलब्ध शीर्षक

कई भाषाओं वाले शीर्षकों में एक ही वाक्यांश दो अलग-अलग भाषाओं या स्क्रिप्ट के साथ दोहराया जाता है. सबसे ज़्यादा लोकप्रिय पैटर्न, अंग्रेज़ी वर्शन को मूल शीर्षक टेक्स्ट में जोड़ना है.

गीतांजलि की जीवनी - हिन्दी में गीतांजलि की जीवनी

इस उदाहरण में, शीर्षक के दो हिस्से (हाइफ़न से अलग किए गए) हैं और वे एक ही कॉन्टेंट को अलग-अलग भाषाओं (हिन्दी और अंग्रेज़ी) में दिखाते हैं. हालांकि, शीर्षक दोनों भाषाओं में मौजूद है, लेकिन दस्तावेज़ सिर्फ़ हिन्दी में लिखा है. हमारा सिस्टम इस तरह की गड़बड़ी का पता लगाता है. साथ ही, हो सकता है कि सिर्फ़ हिन्दी हेडलाइन टेक्स्ट का इस्तेमाल किया जाए, जैसे:

गीतांजलि की जीवनी

लैटिन स्क्रिप्ट के शीर्षक

जब कॉन्टेंट को एक भाषा से किसी दूसरी भाषा में लिखा जाता है, तो किसी दूसरी स्क्रिप्ट या वर्णमाला का इस्तेमाल किया जाता है. उदाहरण के लिए, हिन्दी में लिखे गए गाने के पेज के शीर्षक को ध्यान में रखें. हालांकि, हिन्दी की देवनागरी स्क्रिप्ट के बजाय, लैटिन वर्णों का इस्तेमाल करें.

jis desh me holi kheli jati hai

ऐसे में, हमारा सिस्टम, पेज पर मौजूद स्क्रिप्ट का इस्तेमाल करके, कोई दूसरा शीर्षक ढूंढने की कोशिश करता है. ऐसा हो सकता है कि यह शीर्षक इस तरह का हो:

जिस देश में होली खेली जाती है

खास जानकारी

आम तौर पर, हमारे सिस्टम पेज के शीर्षक एलिमेंट का इस्तेमाल करते हैं. कई भाषाओं में या ट्रांसलिट्रेट किए गए शीर्षक के मामले में, हमारे सिस्टम वे विकल्प चुन सकते हैं जो पेज की मुख्य भाषा से मेल खाते हैं. इसलिए, शीर्षक और/या पेज के मुख्य कॉन्टेंट की स्क्रिप्ट से मिलता-जुलता शीर्षक देना अच्छा तरीका है.

हम अपने फ़ोरम में आपके सुझाव, शिकायत या राय का स्वागत करते हैं. यहां इस विषय से जुड़े, इंग्लिश और जैपनीज़ भाषा के हमारे मौजूदा थ्रेड का भी इस्तेमाल किया जा सकता है.