Google, वेब पेज के नतीजों के लिए शीर्षक कैसे जनरेट करता है, इस बारे में ज़्यादा जानकारी

शुक्रवार, 17 सितंबर, 2021

पिछले महीने, हमने वेब पेज के नतीजों के लिए शीर्षक जनरेट करने वाले हमारे नए सिस्टम के बारे में जानकारी दी थी. आपके सुझाव के लिए धन्यवाद. इन सुझावों को ध्यान में रखकर, हमने शीर्षक जनरेट करने वाले अपने सिस्टम को और बेहतर बनाया है. क्रिएटर्स की मदद के लिए, यहां ज़्यादा जानकारी दी गई है. साथ ही, बताया गया है कि हम क्या कर रहे हैं.

शीर्षक एलिमेंट सबसे ज़्यादा इस्तेमाल किए जाते हैं

जैसा कि हमने अपनी पिछली पोस्ट में बताया था, हमारा नया सिस्टम खोज के नतीजों में दिखाए जाने वाले ज़्यादातर वेब पेजों के शीर्षक के लिए, एचटीएमएल शीर्षक एलिमेंट का इस्तेमाल करता है. इन्हें कभी-कभी शीर्षक टैग भी कहा जाता है. आपके सुझाव के आधार पर, हमने अपने सिस्टम में बदलाव किए हैं. इसका मतलब यह है कि अब शीर्षक एलिमेंट का इस्तेमाल करीब 87% किया जाता है, जबकि पहले यह आंकड़ा करीब 80% था.

शीर्षक एलिमेंट का इस्तेमाल हर समय क्यों नहीं करना चाहिए? साल 2012 से, हम शीर्षक एलिमेंट के अलावा दूसरे टेक्स्ट का इस्तेमाल कर रहे हैं. ऐसा उन मामलों में किया जाता है जिनमें हमारे सिस्टम यह तय करते हैं कि शीर्षक एलिमेंट, शायद किसी पेज की जानकारी सही ढंग से न दे पाए. कुछ पेजों के शीर्षक नहीं होते. कुछ साइटें, सभी पेजों पर एक ही शीर्षक का इस्तेमाल करती हैं. भले ही, पेज का कॉन्टेंट शीर्षक से मैच न करता हो. कुछ पेजों पर शीर्षक एलिमेंट नहीं होता.

शीर्षक एलिमेंट के अलावा दूसरे टेक्स्ट के इस्तेमाल के उदाहरण

हमारे नए सिस्टम को और भी ज़्यादा स्थितियों को ध्यान में रखकर डिज़ाइन किया गया है. ये ऐसी स्थितियां है जिनमें शीर्षक एलिमेंट के अलावा किसी दूसरे टेक्स्ट का इस्तेमाल करना फ़ायदेमंद हो सकता है. यहां उस तरह के कॉन्टेंट के कुछ उदाहरण दिए गए हैं जिसका पता लगाकर, यह सिस्टम उसमें बदलाव करता है. ये उदाहरण, हमारी सूची में शामिल खरबों पेजों में मिलने वाली असल समस्याओं पर आधारित हैं.

आधे-अधूरे शीर्षक

आधे-अधूरे शीर्षक अक्सर तब बनते हैं, जब बड़ी साइटें अपने वेब पेजों के शीर्षक बनाने के लिए टेंप्लेट का इस्तेमाल करती हैं और शीर्षक में टेक्स्ट का कुछ हिस्सा मौजूद नहीं होता. ऐसा हो सकता है कि टेंप्लेट की मदद से बनाए गए शीर्षक में, पेज की खास जानकारी पहले हो और साइट का नाम बाद में. आधे-अधूरे शीर्षकों में, अक्सर खास जानकारी मौजूद नहीं होती. इस वजह से, शीर्षक कुछ इस तरह के बन जाते हैं:

| साइट का नाम

हमारा सिस्टम, आधे-अधूरे शीर्षकों का पता लगाने और उनमें बदलाव करने के मकसद से डिज़ाइन किया गया है. ये बदलाव, हेडर एलिमेंट में दी गई जानकारी या पेज पर मौजूद दूसरे बड़े और मुख्य टेक्स्ट को देखकर किए जाते हैं. इससे साइट पर मौजूद कॉन्टेंट के हिसाब से शीर्षक बनाने में मदद मिलती है. जैसे:

प्रॉडक्ट का नाम | साइट का नाम

बहुत पुराने शीर्षक

शीर्षक बहुत पुराने तब हो जाते हैं, जब एक ही पेज पर साल-दर-साल नई जानकारी जोड़ी जाती है, लेकिन किसी वजह से, शीर्षक एलिमेंट में मौजूद तारीख को अपडेट नहीं किया जाता. मान लें कि कोई शीर्षक एलिमेंट इस तरह का होगा:

साल 2020 में एडमिशन के लिए ज़रूरी शर्तें - दिल्ली विश्वविद्यालय

इस उदाहरण में, एक ऐसे पेज का शीर्षक है जो दिल्ली विश्वविद्यालय में एडमिशन के बारे में जानकारी देता है. इस पेज पर एक बड़ी और साफ़ तौर पर नज़र आने वाली हेडलाइन, "साल 2021 में एडमिशन के लिए ज़रूरी शर्तें" मौजूद है. हालांकि, किसी वजह से शीर्षक एलिमेंट की तारीख को अपडेट नहीं किया गया. हमारा सिस्टम इस गड़बड़ी का पता लगाकर, हेडलाइन में मौजूद सही तारीख को शीर्षक में इस्तेमाल करता है. इससे शीर्षक ऐसा दिखता है:

साल 2021 में एडमिशन के लिए ज़रूरी शर्तें - दिल्ली विश्वविद्यालय

गलत शीर्षक

कभी-कभी शीर्षकों से पता नहीं चलता कि पेज किस बारे में है. उदाहरण के लिए, पेज पर लगातार अपडेट होने वाली जानकारी हो सकती है, जिसका शीर्षक एलिमेंट ऐसा हो सकता है:

स्टफ़ करके बनाए गए बड़े जानवर, टेडी बियर, पोलर बियर - साइट का नाम

यह सामान्य बात है कि लोग यह उम्मीद करें कि पेज पर इन नामों वाले प्रॉडक्ट उपलब्ध हों. हालांकि, यह स्टैटिक शीर्षक ऐसे पेज के लिए है जिस पर लगातार जानकारी अपडेट होती रहती है. कभी-कभी ये प्रॉडक्ट दिख सकते हैं, लेकिन कई बार ये नहीं दिखते.

हमारा सिस्टम यह समझने की कोशिश करता है कि शीर्षक से पेज के बारे में सटीक जानकारी मिल रही है या नहीं. अगर शीर्षक से सही जानकारी नहीं मिल रही, तो सिस्टम इसमें बदलाव कर सकता है. इससे उपयोगकर्ता यह अच्छी तरह समझ पाते हैं कि पेज पर किस तरह की जानकारी मौजूद होगी. जैसे:

स्टफ़ करके बनाए गए जानवर - साइट का नाम

माइक्रो-बॉयलरप्लेट शीर्षक

बॉयलरप्लेट शीर्षकों का पता लगाना काफ़ी आसान होता है. हमें साइट के हर पेज या करीब-करीब सभी पेजों पर एक ही शीर्षक दिखता है. किसी साइट के पेजों के सबसेट में, जहां बॉयलरप्लेट शीर्षक एलिमेंट दिखते हैं वहां माइक्रो-बॉयलरप्लेट शीर्षक मौजूद होते हैं. हमारा सिस्टम इन गड़बड़ियों का पता लगाकर, उन्हें ठीक करने में मदद करता है. यह ठीक वैसे ही होता है जैसे हम सभी बॉयलरप्लेट शीर्षक एलिमेंट के साथ करते हैं.

मान लें कि टेलिविज़न शो के बारे में चर्चा करने वाला कोई ऑनलाइन फ़ोरम है. इसमें अलग-अलग शो के लिए अलग-अलग पेज हो सकते हैं. इसके अलावा, हर शो के अलग-अलग सीज़न के थ्रेड के लिए भी अलग-अलग पेज हो सकते हैं. माइक्रो-बॉयलरप्लेट शीर्षक एलिमेंट, सीज़न वाले पेजों पर दिखते हैं. शीर्षक में सीज़न की संख्या मौजूद नहीं होती. इस वजह से, यह पता नहीं चलता कि कौनसा पेज किस सीज़न का है. इससे, इस तरह के डुप्लीकेट शीर्षक बनते हैं:

मेरा तथाकथित मशहूर टीवी शो

मेरा तथाकथित मशहूर टीवी शो

मेरा तथाकथित मशहूर टीवी शो

हमारा सिस्टम, हेडलाइन के टेक्स्ट में इस्तेमाल हुई बड़ी और साफ़ तौर पर दिखने वाली सीज़न की संख्या को, शीर्षक में डाल सकता है. ऐसा करने से, शीर्षक से बेहतर जानकारी मिल पाती है:

सीज़न एक - मेरा तथाकथित मशहूर टीवी शो

सीज़न दो - मेरा तथाकथित मशहूर टीवी शो

सीज़न तीन - मेरा तथाकथित मशहूर टीवी शो

साइट के मालिकों के लिए दिशा-निर्देश

आम तौर पर, शीर्षकों के बारे में साइट के मालिकों के लिए हमारी मुख्य सलाह और सहायता पेज पर इसी विषय के बारे में हमारी सलाह, एक जैसी होती है. एचटीएमएल वाले बेहतर शीर्षक एलिमेंट बनाने पर ध्यान दें. शीर्षक जनरेट करने के सभी तरीकों में से, इनका सबसे ज़्यादा इस्तेमाल किया जाता है.

इसके अलावा, इस पोस्ट में दिए गए उदाहरणों पर ध्यान दें. इससे आपको यह समझने में मदद मिलेगी कि क्या आपने भी वही तरीके अपनाए हैं जिसकी वजह से हमारा सिस्टम आपके शीर्षक एलिमेंट के अलावा, किसी दूसरे टेक्स्ट का इस्तेमाल करता है. कई बार क्रिएटर्स यह समझ नहीं पाते कि उनके शीर्षकों में क्या गड़बड़ी है. ये बदलाव खास तौर पर ऐसी ही गड़बड़ियों को ठीक करने के लिए किए गए हैं. इन बदलावों से, यह पक्का किया जा सकता है कि आपका शीर्षक एलिमेंट दोबारा इस्तेमाल किया जा सके. हमारी प्राथमिकता भी यही है.

शीर्षकों को बेहतर बनाने की हमारी कोशिश जारी रहेगी

शीर्षक बनाने वाला कोई भी सिस्टम सटीक नहीं होता. शीर्षक एलिमेंट का हर समय इस्तेमाल करने से, आपको ऊपर बताई गई समस्याओं का सामना करना पड़ सकता है. हालांकि, हम यह भी जानते हैं कि शीर्षक जनरेट करने वाला हमारा सिस्टम भी सटीक नहीं है. आपके सुझावों से, हमें अपने सिस्टम को बेहतर बनाने में काफ़ी मदद मिली है. हम अपने फ़ोरम में आपके सुझाव, शिकायत या राय का स्वागत करते हैं. यहां इस विषय से जुड़े, इंग्लिश और जैपनीज़ भाषा के हमारे मौजूदा थ्रेड का भी इस्तेमाल किया जा सकता है.