रोबोट मेटा टैग, data-nosnippet, और X-Robots-Tag की विशेषताएं
इस दस्तावेज़ में यह जानकारी दी गई है कि Google, आपके कॉन्टेंट को खोज के नतीजों में कैसे दिखाए, यह तय करने के लिए पेज और टेक्स्ट के लेवल की सेटिंग का इस्तेमाल किस तरह से किया जाए. एचटीएमएल पेज पर या किसी एचटीटीपी हेडर में मेटा टैग
शामिल करके, पेज के लेवल की सेटिंग तय की जा सकती है. पेज में दिए गए एचटीएमएल एलिमेंट के लिए
data-nosnippet
एट्रिब्यूट जोड़कर, टेक्स्ट के लेवल की सेटिंग तय की जा सकती है.
ध्यान रखें कि इन सेटिंग को सिर्फ़ तब ही पढ़ा और फ़ॉलो किया जा सकता है, जब क्रॉलर को इन सेटिंग वाले पेजों को ऐक्सेस करने की अनुमति हो.
<meta name="robots" content="noindex">
टैग या डायरेक्टिव, सर्च इंजन के क्रॉलर पर लागू होता है. AdsBot-Google
जैसे बिना सर्च इंजन वाले क्रॉलर को ब्लॉक करने के लिए, आपको खास क्रॉलर (जैसे कि <meta name="AdsBot-Google" content="noindex">
) को टारगेट करने वाले डायरेक्टिव जोड़ने पड़ सकते हैं.
रोबोट मेटा टैग का इस्तेमाल करना
रोबोट मेटा टैग, किसी पेज पर बारीकी से यह कंट्रोल करने की सुविधा देता है कि उस पेज को किस तरह इंडेक्स किया जाए. साथ ही, उसे Google Search के नतीजों में कैसे दिखाया जाए. किसी पेज के <head>
सेक्शन में
इस तरह से
रोबोट मेटा टैग डालें:
<!DOCTYPE html> <html><head> <meta name="robots" content="noindex"> (…) </head> <body>(…)</body> </html>
इस उदाहरण में रोबोट मेटा टैग ने सर्च इंजन को निर्देश दिया कि वे इस पेज को
खोज के नतीजों में न दिखाएं. name
एट्रिब्यूट की वैल्यू (जो robots
है)
से पता चलता है कि यह डायरेक्टिव सभी क्रॉलर पर लागू होता है. किसी खास क्रॉलर को
निर्देश देने के लिए,
name
एट्रिब्यूट की robots
वैल्यू की जगह, उस क्रॉलर का नाम डालें जिसे
निर्देश दिए जा रहे हैं. कुछ चुनिंदा क्रॉलर, उपयोगकर्ता एजेंट के नाम से भी जाने जाते हैं. कोई क्रॉलर किसी पेज का अनुरोध करने के लिए, अपने उपयोगकर्ता एजेंट का इस्तेमाल करता है. Google के स्टैंडर्ड वेब क्रॉलर के उपयोगकर्ता एजेंट का नाम Googlebot
है. सिर्फ़ Google को पेज इंडेक्स करने से रोकने के लिए, टैग को इस तरीके से अपडेट करें:
<meta name="googlebot" content="noindex">
यह टैग, अब Google को खास तौर पर निर्देश देता है कि इस पेज को खोज के नतीजों में न दिखाया जाए.
name
और content
, दोनों एट्रिब्यूट केस-सेंसिटिव (बड़े और छोटे अक्षरों में अंतर) नहीं होते हैं.
अलग-अलग काम के लिए, सर्च इंजन में अलग-अलग क्रॉलर हो सकते हैं. Google के क्रॉलर की पूरी सूची देखें. उदाहरण के लिए, किसी पेज को Google के वेब के खोज नतीजों में तो दिखाना है, लेकिन उसे Google News में नहीं दिखाना है, तो इस मेटा टैग का इस्तेमाल करें:
<meta name="googlebot-news" content="noindex">
एक से ज़्यादा क्रॉलर के बारे में एक-एक करके जानकारी देने के लिए, कई रोबोट मेटा टैग का इस्तेमाल करें:
<meta name="googlebot" content="noindex"> <meta name="googlebot-news" content="nosnippet">
बिना एचटीएमएल वाले रिसॉर्स, जैसे कि PDF फ़ाइलों, वीडियो फ़ाइलों या इमेज फ़ाइलों को इंडेक्स होने से रोकने के लिए,
X-Robots-Tag
रिस्पॉन्स हेडर का इस्तेमाल करें.
X-Robots-Tag
एचटीटीपी हेडर का इस्तेमाल करना
किसी यूआरएल के लिए, X-Robots-Tag
का इस्तेमाल एचटीटीपी हेडर रिस्पॉन्स के एलिमेंट के तौर पर किया जा सकता है. रोबोट मेटा टैग में इस्तेमाल किए जाने वाले किसी भी डायरेक्टिव को X-Robots-Tag
के तौर पर भी बताया जा सकता है. यहां एचटीटीपी रिस्पॉन्स का एक उदाहरण दिया गया है. इसमें X-Robots-Tag
, क्रॉलर को पेज इंडेक्स न करने का निर्देश दे रहा है:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noindex (…)
कई X-Robots-Tag
हेडर, एचटीटीपी रिस्पॉन्स में जोड़े जा सकते हैं या डायरेक्टिव की कॉमा-सेपरेटेड लिस्ट बनाई जा सकती है. यहां
एचटीटीपी हेडर रिस्पॉन्स का एक उदाहरण दिया गया है, जिसमें unavailable_after
X-Robots-Tag
के साथ noarchive
X-Robots-Tag
जुड़े
हुए हैं.
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST (…)
ऐसा हो सकता है कि X-Robots-Tag
,
डायरेक्टिव से पहले उपयोगकर्ता एजेंट तय करे. उदाहरण के लिए, नीचे दिए गए X-Robots-Tag
एचटीटीपी
हेडर के सेट का इस्तेमाल, किसी पेज को कुछ शर्तों के साथ, अलग-अलग सर्च इंजन के खोज के नतीजों में दिखाने की अनुमति देने के लिए किया जा सकता है:
HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: googlebot: nofollow X-Robots-Tag: otherbot: noindex, nofollow (…)
उपयोगकर्ता एजेंट तय किए बिना दिए गए डायरेक्टिव, सभी क्रॉलर के लिए मान्य होते हैं. एचटीटीपी हेडर, उपयोगकर्ता एजेंट का नाम, और तय की गई वैल्यू केस-सेंसिटिव नहीं होती हैं.
सही तरह से इंडेक्स करना और डायरेक्टिव देना
यहां दिए गए डायरेक्टिव का इस्तेमाल करके, यह तय किया जा सकता है कि
रोबोट मेटा टैग और X-Robots-Tag
के साथ कोई स्निपेट कैसे दिखे और उस स्निपेट को कैसे इंडेक्स किया जाए. स्निपेट, खोज के नतीजों में दिखने वाला वह छोटा टेक्स्ट होता है जिसका इस्तेमाल यह बताने के लिए किया जाता है कि
दस्तावेज़ और उपयोगकर्ता की क्वेरी एक-दूसरे से कितना मेल खाते हैं. नीचे दी गई टेबल में वे सभी डायरेक्टिव दिखाए गए हैं जिनका Google पालन करता है. साथ ही, इसमें उनके मतलब भी बताए गए हैं. हर वैल्यू एक खास डायरेक्टिव के बारे में बताती है. एक से ज़्यादा डायरेक्टिव को कॉमा-सेपरेटेड लिस्ट या अलग-अलग मेटा टैग में जोड़ा जा सकता है. ये डायरेक्टिव, केस-इनसेंसिटिव होते हैं.
डायरेक्टिव | |
---|---|
|
इंडेक्स करने या खोज के नतीजों में दिखाए जाने पर कोई भी पाबंदी नहीं है. यह डायरेक्टिव, डिफ़ॉल्ट वैल्यू है और साफ़ तौर पर सूची में शामिल करने पर इसका कोई असर नहीं पड़ता. |
|
इस पेज, मीडिया या रिसॉर्स को खोज के नतीजों में न दिखाएं. अगर आप यह डायरेक्टिव न दें, तो पेज, मीडिया या रिसॉर्स को इंडेक्स किया जा सकता है और उसे खोज के नतीजों में दिखाया जा सकता है. Google से जानकारी हटाने के लिए, हमारे,सिलसिलेवार निर्देशों का पालन करें. |
|
इस पेज पर दिए गए लिंक फ़ॉलो न करें. अगर आप यह डायरेक्टिव न दें, तो Google, पेज पर दिए गए लिंक को फ़ॉलो करके, लिंक किए गए पेजों को क्रॉल कर सकता है. nofollow के बारे में ज़्यादा जानें.
|
|
noindex, nofollow के बराबर.
|
|
खोज के नतीजों में, कैश में स्टोर हुआ लिंक न दिखाएं. अगर यह डायरेक्टिव नहीं दिया जाता है, तो Google कोई ऐसा पेज जनरेट कर सकता है जो कैश मेमोरी में सेव हो. साथ ही, उपयोगकर्ता उस पेज को खोज के नतीजों में देख सकते हैं. |
|
इस पेज के लिए, खोज के नतीजों में साइटलिंक के लिए खोज बॉक्स न दिखाएं. अगर यह डायरेक्टिव नहीं दिया जाता है, तो Google खोज के नतीजों में आपकी साइट के लिए बना एक खोज बॉक्स जनरेट कर सकता है. साथ ही, आपकी साइट पर ले जाने वाले दूसरे डायरेक्ट लिंक भी जनरेट हो सकते हैं. |
|
इस पेज के लिए, खोज के नतीजों में कोई टेक्स्ट स्निपेट या वीडियो की झलक न दिखाएं. बेहतर उपयोगकर्ता अनुभव देने के लिए, अब भी स्टैटिक इमेज थंबनेल दिख सकता है. हालांकि, इसके लिए थंबनेल का उपलब्ध होना ज़रूरी है. यह हर तरह के खोज नतीजों (Google पर: Google Web Search, Google Images, डिस्कवर) पर लागू होता है. अगर आप यह डायरेक्टिव न दें, तो Google, पेज से मिली जानकारी के मुताबिक टेक्स्ट स्निपेट या वीडियो की झलक जनरेट कर सकता है. |
|
|
|
खोज के इस नतीजे के लिए, टेक्स्ट स्निपेट के तौर पर ज़्यादा से ज़्यादा [number] वर्णों का इस्तेमाल करें. (ध्यान दें कि कोई यूआरएल, खोज के नतीजे वाले पेज में एक से ज़्यादा खोज नतीजों के तौर पर दिख सकता है.) इससे इमेज या वीडियो की झलक पर कोई असर नहीं पड़ता. यह खोज के हर तरह के नतीजों पर लागू होता है. जैसे, Google Web Search, Google Image, डिस्कवर, Assistant. हालांकि, वर्णों की यह सीमा तब लागू नहीं होती है, जब पब्लिशर ने कॉन्टेंट के इस्तेमाल की अनुमति अलग से दी हो. उदाहरण के लिए, अगर पब्लिशर इन-पेज स्ट्रक्चर्ड डेटा के तौर पर कॉन्टेंट उपलब्ध कराता है या उसका Google के साथ कोई लाइसेंस वाला कानूनी समझौता है, तो यह सेटिंग उन इस्तेमाल पर लागू नहीं होती है जिनके लिए मंज़ूरी दी जा चुकी है. अगर पार्स किया जा सकने वाला कोई [number] मौजूद न हो, तो इस डायरेक्टिव को नज़रअंदाज़ कर दिया जाता है. अगर आप इस डायरेक्टिव की जानकारी न दें, तो स्निपेट की लंबाई Google तय करेगा. खास वैल्यू:
उदाहरण: किसी स्निपेट को खोज के नतीजों में दिखने से रोकने के लिए: <meta name="robots" content="max-snippet:0"> स्निपेट में ज़्यादा से ज़्यादा 20 वर्ण दिखाने के लिए: <meta name="robots" content="max-snippet:20"> यह बताने के लिए कि स्निपेट में जितने चाहें उतने वर्ण शामिल किए जा सकते हैं: <meta name="robots" content="max-snippet:-1"> |
|
खोज नतीजों में दिखाने के लिए, इस पेज की झलक वाली इमेज का साइज़, ज़्यादा से ज़्यादा पर सेट करें.
अगर आप ये [setting] वैल्यू दी जा सकती हैं:
यह हर तरह के खोज नतीजों पर लागू होता है. जैसे, Google Web Search, Google Images, डिस्कवर, Assistant. हालांकि, यह सीमा तब लागू नहीं होती है, जब पब्लिशर ने कॉन्टेंट के इस्तेमाल की अनुमति अलग से दी हो. उदाहरण के लिए, अगर पब्लिशर इन-पेज स्ट्रक्चर्ड डेटा (जैसे, एएमपी और किसी लेख के कैननिकल वर्शन) के तौर पर कॉन्टेंट उपलब्ध कराता है या उसका Google के साथ कोई लाइसेंस वाला कानूनी समझौता है, तो यह सेटिंग उन इस्तेमाल पर लागू नहीं होती है जिनके लिए मंज़ूरी दी जा चुकी है.
अगर आप नहीं चाहते कि Google आपके एएमपी पेजों और
किसी लेख के कैननिकल वर्शन को Search या डिस्कवर में बड़े थंबनेल वाली इमेज के साथ दिखाए, तो उदाहरण के लिए: <meta name="robots" content="max-image-preview:standard"> |
|
खोज के नतीजों में इस पेज पर, वीडियो के लिए ज़्यादा से ज़्यादा [number] सेकंड के वीडियो स्निपेट का इस्तेमाल करें.
अगर आप खास वैल्यू:
यह खोज के हर तरह के नतीजों पर लागू होता है. Google में: Google Web Search, Google Images, Google वीडियो, डिस्कवर, Assistant. अगर पार्स किया जा सकने वाला कोई [number] मौजूद नहीं है, तो इस डायरेक्टिव को नज़रअंदाज़ किया जाता है. उदाहरण के लिए: <meta name="robots" content="max-video-preview:-1"> |
|
खोज के नतीजों में, इस पेज के कॉन्टेंट का अनुवाद न दिखाएं. अगर यह डायरेक्टिव नहीं दिया जाता है, तो Google खोज के नतीजों के लिए, शीर्षक के लिंक और स्निपेट, दोनों का अनुवाद उपलब्ध करा सकता है. साथ ही, यह खोज उन भाषाओं के लिए हो सकती है जो इस भाषा की खोज क्वेरी में नहीं हैं. अगर कोई उपयोगकर्ता, अनुवाद किए गए शीर्षक के लिंक पर क्लिक करता है, तो पेज के साथ होने वाले उसके सभी इंटरैक्शन, Google Translate की मदद से होते हैं. इसके बाद के सभी लिंक का अनुवाद अपने-आप हो जाता है. |
|
इस पेज पर मौजूद इमेज को इंडेक्स न करें. अगर आप इस वैल्यू का इस्तेमाल न करें, तो पेज पर मौजूद इमेज, इंडेक्स की जा सकती हैं और खोज के नतीजों में दिखाई जा सकती हैं. |
|
बताई गई तारीख या समय के बाद, इस पेज को खोज के नतीजों में न दिखाएं. तारीख या समय, आम तौर पर इस्तेमाल किए जाने वाले फ़ॉर्मैट में ही होना चाहिए. हालांकि, यह RFC 822, RFC 850, और ISO 8601 तक सीमित नहीं है. अगर कोई मान्य तारीख या समय मौजूद नहीं है, तो इस डायरेक्टिव को नज़रअंदाज़ कर दिया जाता है. डिफ़ॉल्ट तौर पर, कॉन्टेंट के लिए खत्म होने की कोई तारीख नहीं होती है. अगर आप इस डायरेक्टिव का इस्तेमाल न करें, तो खोज के नतीजों में पेज दिखता रहेगा. Googlebot बताई गई तारीख और समय के बाद, यूआरएल की क्रॉल दर को बहुत कम कर देगा. उदाहरण: <meta name="robots" content="unavailable_after: 2020-09-21"> |
इंडेक्स करने और नतीजे दिखाने वाले डायरेक्टिव को एक साथ इस्तेमाल करना
रोबोट मेटा टैग डायरेक्टिव को कॉमा से जोड़कर या कई मेटा टैग का इस्तेमाल करके, कई डायरेक्टिव वाले निर्देश बनाए जा सकते हैं. यहां रोबोट मेटा टैग का एक उदाहरण दिया गया है. यह वेब क्रॉलर को पेज इंडेक्स न करने और पेज पर किसी भी लिंक को क्रॉल न करने का निर्देश देता है:
कॉमा-सेपरेटेड लिस्ट
<meta name="robots" content="noindex, nofollow">
एक से ज़्यादा मेटा टैग
<meta name="robots" content="noindex"> <meta name="robots" content="nofollow">
यहां एक उदाहरण दिया गया है जिसमें टेक्स्ट स्निपेट के लिए, ज़्यादा से ज़्यादा 20 वर्णों का इस्तेमाल करने और इमेज की बड़ी झलक दिखाने की अनुमति है:
<meta name="robots" content="max-snippet:20, max-image-preview:large">
अलग-अलग क्रॉलर को अलग-अलग डायरेक्टिव देने की स्थिति में, सर्च इंजन नेगेटिव डायरेक्टिव के कुल योग का इस्तेमाल करेगा. उदाहरण के लिए:
<meta name="robots" content="nofollow"> <meta name="googlebot" content="noindex">
Googlebot से क्रॉल किए जाने पर, जिस पेज में ये मेटा टैग होंगे उसकी पहचान, noindex, nofollow
डायरेक्टिव वाले पेज के तौर पर की जाएगी.
data-nosnippet
एचटीएमएल एट्रिब्यूट का इस्तेमाल करना
एचटीएमएल पेज के टेक्स्ट वाले किन हिस्सों को स्निपेट के तौर पर इस्तेमाल न किया जाए, यह तय किया जा सकता है ऐसा करने के लिए, आप चाहें तो एचटीएमएल एलिमेंट के स्तर पर span
, div
, और section
एलिमेंट में, data-nosnippet
एचटीएमएल एट्रिब्यूट का इस्तेमाल किया जा सकता है. data-nosnippet
को बूलियन एट्रिब्यूट माना जाता है.
सभी बूलियन एट्रिब्यूट की तरह ही, इसके लिए दी गई किसी भी वैल्यू को नज़रअंदाज़ कर दिया जाता है. मशीन (कंप्यूटर) आपके पेज को ठीक तरह से समझ सके, इसके लिए ज़रूरी है कि एचटीएमएल सेक्शन एक मान्य एचटीएमएल हो और सभी टैग उसके मुताबिक बंद किए जाते हों.
उदाहरण:
<p>This text can be shown in a snippet <span data-nosnippet>and this part would not be shown</span>.</p> <div data-nosnippet>not in snippet</div> <div data-nosnippet="true">also not in snippet</div> <div data-nosnippet="false">also not in snippet</div> <!-- all values are ignored --> <div data-nosnippet>some text</html> <!-- unclosed "div" will include all content afterwards --> <mytag data-nosnippet>some text</mytag> <!-- NOT VALID: not a span, div, or section -->
आम तौर पर, Google किसी पेज को इंडेक्स करने के लिए रेंडर करता है, लेकिन यह ज़रूरी नहीं है कि इंडेक्स किया गया हर पेज रेंडर किया गया हो.
इस वजह से, data-nosnippet
को रेंडर करने के पहले और बाद
में, कभी भी निकाला जा सकता है. रेंडर करने की प्रक्रिया का सही इस्तेमाल करने के लिए, JavaScript का इस्तेमाल करके, मौजूदा नोड के data-nosnippet
एट्रिब्यूट को जोड़ें या हटाएं नहीं.
JavaScript की मदद से DOM एलिमेंट जोड़ते समय, data-nosnippet
एट्रिब्यूट शामिल करें. पेज के DOM में एलिमेंट जोड़ते समय, ऐसा करना ज़रूरी होता है. अगर पसंद के मुताबिक बनाए गए एलिमेंट इस्तेमाल किए जाते हैं, तो data-nosnippet
का इस्तेमाल करने के लिए div
, span
या section
के साथ उन्हें रैप करें या उनकी इमेज बनाएं.
स्ट्रक्चर्ड डेटा का इस्तेमाल करना
रोबोट मेटा टैग उस कॉन्टेंट को कंट्रोल करते हैं जिसे Google, खोज के नतीजों में दिखाने के लिए वेब पेजों से अपने-आप निकालता है. हालांकि, कई पब्लिशर खोज नतीजों में दिखाने के लिए खास जानकारी उपलब्ध कराते हैं. इसके लिए, वे schema.org वाले स्ट्रक्चर्ड डेटा का भी इस्तेमाल करते हैं. रोबोट मेटा टैग की सीमाएं दूसरे क्रिएटिव कामों के लिए तय स्ट्रक्चर्ड डेटा के article.description
और description
की वैल्यू छोड़कर, उस स्ट्रक्चर्ड डेटा के इस्तेमाल पर असर नहीं डालती हैं. इन description
वैल्यू के आधार पर झलक की ज़्यादा से ज़्यादा लंबाई तय करने के लिए, max-snippet
रोबोट मेटा टैग का इस्तेमाल करें. उदाहरण के लिए, किसी पेज के recipe
स्ट्रक्चर्ड डेटा को रेसिपी कैरसेल में जोड़ा जा सकता है. टेक्स्ट की झलक सीमित होने पर भी ऐसा किया जा सकता है. max-snippet
से, टेक्स्ट की झलक की लंबाई सीमित की जा सकती है. हालांकि, यह रोबोट मेटा टैग तब लागू नहीं होता है, जब ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के लिए स्ट्रक्चर्ड डेटा का इस्तेमाल करके जानकारी दी गई हो.
अपने वेब पेज के लिए स्ट्रक्चर्ड डेटा के इस्तेमाल को मैनेज करने के लिए, स्ट्रक्चर्ड डेटा के टाइप और उनकी वैल्यू को बदला जा सकता है. अगर आप सिर्फ़ वही डेटा उपलब्ध कराना चाहें जो खोज के नतीजों में दिखे, तो जानकारी जोड़ी या हटाई जा सकती है. यह भी ध्यान दें कि data-nosnippet
एलिमेंट में स्ट्रक्चर्ड डेटा इस्तेमाल किए जाने पर भी खोज के नतीजों में स्ट्रक्चर्ड डेटा का इस्तेमाल किया जा सकता है.
X-Robots-Tag
को लागू करना
आप अपनी साइट के वेब सर्वर सॉफ़्टवेयर की कॉन्फ़िगरेशन
फ़ाइलों के ज़रिए, साइट के एचटीटीपी रिस्पॉन्स में X-Robots-Tag
जोड़े जा सकते हैं. उदाहरण के लिए, Apache सर्वर पर .htaccess और httpd.conf फ़ाइलों का इस्तेमाल किया जा सकता है. एचटीटीपी रिस्पॉन्स के साथ X-Robots-Tag
के इस्तेमाल का यह फ़ायदा होता है कि क्रॉल करने से जुड़े निर्देश तय किए जा सकते हैं. ये निर्देश पूरी साइट पर लागू होते हैं. रेगुलर एक्सप्रेशन के काम करने से यह बहुत ज़्यादा सुविधाजनक बन जाता है.
उदाहरण के लिए,
पूरी साइट पर मौजूद सभी .PDF फ़ाइलों के लिए, एचटीटीपी रिस्पॉन्स में noindex, nofollow
X-Robots-Tag
जोड़ने के लिए, साइट की रूट .htaccess फ़ाइल या
Apache पर httpd.conf फ़ाइल या NGINX पर साइट की .conf फ़ाइल में, यह स्निपेट जोड़ें.
Apache
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow" </Files>
location ~* \.pdf$ { add_header X-Robots-Tag "noindex, nofollow"; }
NGINX
इमेज फ़ाइलों जैसी उन गैर-एचटीएमएल फ़ाइलों के लिए X-Robots-Tag
का इस्तेमाल किया जा सकता है
जिनके लिए रोबोट मेटा टैग का इस्तेमाल नहीं किया जा सकता. यहां पूरी एक साइट पर
इमेज फ़ाइलों (.png, .jpeg, .jpg, .gif) के लिए
noindex
X-Robots-Tag
डायरेक्टिव जोड़ने का एक उदाहरण दिया गया है:
Apache
<Files ~ "\.(png|jpe?g|gif)$"> Header set X-Robots-Tag "noindex" </Files>
NGINX
location ~* \.(png|jpe?g|gif)$ { add_header X-Robots-Tag "noindex"; }
अलग-अलग स्टैटिक फ़ाइलों के लिए, X-Robots-Tag
हेडर भी सेट किए जा सकते हैं:
Apache
# the htaccess file must be placed in the directory of the matched file. <Files "unicorn.pdf"> Header set X-Robots-Tag "noindex, nofollow" </Files>
NGINX
location = /secrets/unicorn.pdf { add_header X-Robots-Tag "noindex, nofollow"; }
robots.txt डायरेक्टिव को इंडेक्स करने और नतीजे दिखाने वाले डायरेक्टिव के साथ जोड़ना
रोबोट मेटा टैग और X-Robots-Tag
एचटीटीपी हेडर का पता तब चलता है, जब किसी यूआरएल को क्रॉल किया जाता है. अगर किसी पेज को robots.txt फ़ाइल से क्रॉल करने से मना कर दिया जाता है, तो इंडेक्स करने या डायरेक्टिव दिखाने के बारे में कोई जानकारी नहीं मिलेगी. इसलिए, उसे अनदेखा कर दिया जाएगा. अगर इंडेक्स करने या डायरेक्टिव से जुड़ी जानकारी शामिल करना ज़रूरी है, तो उन निर्देशों वाले यूआरएल को क्रॉल करने से रोका नहीं जा सकता.