डेटासेट

डेटासेट के बारे में अलग से दूसरी जानकारी देने पर उन्हें ढूंढना आसान हो जाता है. यह दूसरी जानकारी स्ट्रक्चर्ड डेटा के तौर पर उनके नाम, ब्यौरे, क्रिएटर, और बंटवारे के फ़ॉर्मैट दी जाती है. Google डेटासेट खोजने के अपने तरीके में schema.org और उन दूसरे मेटाडेटा मानकों का इस्तेमाल करता है जिन्हें डेटासेट की जानकारी देने वाले पेजों में जोड़ा जा सकता है. इस मार्कअप का मकसद चिकित्सा विज्ञान, सामाजिक विज्ञान, मशीन लर्निंग, नागरिक, और सरकारी डेटा जैसे फ़ील्ड से डेटासेट खोजने की सुविधा को बेहतर बनाना है. आप डेटासेट सर्च टूल का इस्तेमाल करके डेटासेट ढूंढ सकते हैं.

Dataset Search का उदाहरण

यहां कुछ ऐसी चीज़ों के उदाहरण दिए गए हैं जिन्हें डेटासेट के तौर पर इस्तेमाल किया जा सकता है:

  • कुछ डेटा वाली टेबल या CSV फ़ाइल
  • टेबल का व्यवस्थित संग्रह
  • मालिकाना फ़ॉर्मैट में ऐसी फ़ाइल जिसमें डेटा मौजूद हो
  • फ़ाइलों का ऐसा संग्रह, जो एक साथ मिलकर कुछ बेहतर डेटासेट तैयार कर सके
  • किसी दूसरे फ़ॉर्मैट में मौजूद, डेटा के साथ ऐसा स्ट्रक्चर्ड ऑब्जेक्ट जिसे प्रॉसेस करने के लिए आप शायद किसी खास टूल में लोड करना चाहें
  • इमेज कैप्चर करने वाला डेटा
  • मशीन लर्निंग से जुड़ी फ़ाइलें, जैसे, तैयार किए गए पैरामीटर या न्यूरल नेटवर्क स्ट्रक्चर की परिभाषाएं
  • ऐसी कोई भी चीज़, जो आपको डेटासेट की तरह लगती हो

स्ट्रक्चर्ड डेटा को जोड़ने का तरीका

स्ट्रक्चर्ड डेटा, किसी पेज के बारे में जानकारी देने और पेज के कॉन्टेंट को श्रेणियों में बाँटने का एक मानक फ़ॉर्मैट है. अगर आप स्ट्रक्चर्ड डेटा के बारे में ज़्यादा नहीं जानते, तो स्ट्रक्चर्ड डेटा के काम करने का तरीका पर जाकर इसके बारे में ज़्यादा जान सकते हैं.

स्ट्रक्चर्ड डेटा बनाने, उसकी जांच करने, और उसे रिलीज़ करने के बारे में खास जानकारी यहां दी गई है. वेब पेज में स्ट्रक्चर्ड डेटा जोड़ने के सिलसिलेवार निर्देशों के लिए, स्ट्रक्चर्ड डेटा कोडलैब (कोड बनाना सीखना) देखें.

  1. ज़रूरी प्रॉपर्टी जोड़ें. पेज पर स्ट्रक्चर्ड डेटा कहां जोड़ना चाहिए, इस बारे में जानकारी पाने के लिए, JSON-LD स्ट्रक्चर्ड डेटा: इसे पेज पर कहां डाला जाए देखें.
  2. दिशा-निर्देशों का पालन करें.
  3. ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) के टेस्ट का इस्तेमाल करके अपने कोड की पुष्टि करें.
  4. स्ट्रक्चर्ड डेटा वाले कुछ पेजों को डिप्लॉय करें. इसके बाद, यूआरएल जांचने वाला टूल इस्तेमाल करके जांचें कि Google को पेज कैसा दिखेगा. पक्का करें कि Google आपका पेज ऐक्सेस कर सकता है. उसे robots.txt फ़ाइल से रोका न गया हो और noindex टैग इस्तेमाल करना या लॉग इन करना ज़रूरी न हो. अगर पेज ठीक दिखता है, तो आप Google को अपने यूआरएल फिर से क्रॉल करने के लिए कह सकते हैं.
  5. Google को आने वाले समय में होने वाले बदलावों की जानकारी देने के लिए, हमारा सुझाव है कि आप साइटमैप सबमिट करें. आप Search Console साइटमैप एपीआई की मदद से इसे अपने-आप चलने दे सकते हैं.

Dataset Search के नतीजों से डेटासेट मिटाना

अगर आप चाहते हैं कि Dataset Search के नतीजों में डेटासेट न दिखे, तो रोबोट मेटा टैग का इस्तेमाल करके अपने डेटा को इंडेक्स किए जाने के तरीके को कंट्रोल करें. ध्यान रखें कि Dataset Search में, बदलाव दिखने में कुछ समय (क्रॉल करने के शेड्यूल के हिसाब से दिन या हफ़्ते) लग सकते हैं.

डेटासेट खोजने का हमारा तरीका

हम डेटासेट के बारे में, वेब पेजों पर मौजूद स्ट्रक्चर्ड डेटा को समझ सकते हैं. इसे समझने के लिए, हम schema.org Dataset मार्कअप या W3C के डेटा कैटलॉग शब्दावली (DCAT) फ़ॉर्मैट में पेश किए गए उसी के जैसे स्ट्रक्चर का इस्तेमाल करते हैं. हम W3C CSVW के आधार पर स्ट्रक्चर्ड डेटा के लिए प्रयोग के तौर पर सुविधाओं की खोज भी कर रहे हैं. हम डेटासेट की जानकारी देने के लिए और भी बेहतर काम करना चाहते हैं. साथ ही, हमारे तरीके को सबसे अच्छे तरीके के तौर पर अपनाए जाने की उम्मीद करते हैं. हम डेटासेट ढूंढने के लिए किस तरीके का इस्तेमाल करते हैं, इस बारे में ज़्यादा जानने के लिए, डेटासेट ढूंढना आसान बनाना देखें.

उदाहरण

ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में, JSON-LD और schema.org सिंटैक्स (पसंदीदा) का इस्तेमाल करने वाले डेटासेट का उदाहरण यहां दिया गया है. उसी schema.org शब्दावली का इस्तेमाल RDFa 1.1 या माइक्रोडेटा सिंटैक्स में भी किया जा सकता है. आप मेटाडेटा के बारे में बताने के लिए, W3C DCAT शब्दावली का भी इस्तेमाल कर सकते हैं. नीचे दिया गया उदाहरण असल डेटासेट की जानकारी पर आधारित है.

JSON-LD

JSON-LD में डेटासेट का एक उदाहरण यहां दिया गया है:


  <html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

RDFa में DCAT शब्दावली का इस्तेमाल करने वाले डेटासेट का एक उदाहरण यहां दिया गया है:


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

दिशा-निर्देश

साइटों को स्ट्रक्चर्ड डेटा के दिशा-निर्देशों का पालन करना चाहिए. स्ट्रक्चर्ड डेटा के दिशा-निर्देशों के अलावा, हम नीचे दिए गए साइटमैप और स्रोत और मूल जगह के सबसे अच्छे तरीके अपनाने का सुझाव देते हैं.

साइटमैप इस्तेमाल करने के सबसे अच्छे तरीके

साइटमैप फ़ाइल का इस्तेमाल करें, ताकि Google को आपके यूआरएल ढूंढने में मदद मिल सके. साइटमैप फ़ाइल और sameAs मार्कअप का इस्तेमाल करने से, आपकी साइट पर डेटासेट की जानकरी प्रकाशित करने का रिकॉर्ड रखने में मदद मिलती है.

अगर आपके पास डेटासेट रिपॉज़िटरी (डेटा स्टोर करने की जगह) है, तो आपके पास कम से कम दो तरह के पेज हो सकते हैं: हर डेटासेट के लिए कैननिकल ("लैंडिंग") पेज और एक से ज़्यादा डेटासेट वाले पेज (जैसे कि, खोज नतीजे या डेटासेट के कुछ सबसेट). हमारा सुझाव है कि आप कैननिकल पेज में डेटासेट के बारे में स्ट्रक्चर्ड डेटा जोड़ें. अगर आप डेटासेट की एक से ज़्यादा कॉपी में स्ट्रक्चर्ड डेटा (यानी खोज नतीजों के पेज में सूचियां) जोड़ते हैं, तो कैननिकल पेज से लिंक करने के लिए sameAs प्रॉपर्टी का इस्तेमाल करें.

स्रोत और मूल जगह के लिए सबसे अच्छे तरीके

खुले डेटासेट को फिर से प्रकाशित करना, इकट्ठा करना, और दूसरे डेटासेट के आधार पर तैयार करना सामान्य बात है. यह स्थितियों को दिखाने के हमारे तरीके का शुरुआती हिस्सा है. इसमें डेटासेट को किसी दूसरे डेटासेट की कॉपी करके या दूसरे डेटासेट के आधार पर अलग तरीके से बनाया जाता है.

  • जब डेटासेट या दी गई जानकारी को कहीं और प्रकाशित की गई सामग्रियों की कॉपी करके फिर से प्रकाशित करना हो, तो मूल डेटासेट के सबसे ज़्यादा कैननिकल यूआरएल दिखाने के लिए sameAs प्रॉपर्टी का इस्तेमाल करें. sameAs का मान साफ़ तौर पर डेटासेट की पहचान बताने वाला होना चाहिए. दूसरे शब्दों में कहें, तो अलग-अलग डेटासेट को sameAs मान में दिए गए यूआरएल का इस्तेमाल नहीं करना चाहिए.
  • अगर फिर से प्रकाशित किए गए डेटासेट (और उसके मेटाडेटा) में बहुत सारे बदलाव किए गए हैं, तो isBasedOn प्रॉपर्टी का इस्तेमाल करें.
  • जब डेटासेट के बारे में जानकारी कई मूल डेटासेट से ली गई हो या इकट्ठा की गई हो, तो isBasedOn प्रॉपर्टी का इस्तेमाल करें.
  • किसी भी ज़रूरी डिजिटल ऑब्जेक्ट पहचानकर्ता (डीओआई) या कॉम्पैक्ट पहचानकर्ता को अटैच करने के लिए, identifier प्रॉपर्टी का इस्तेमाल करें. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता हैं, तो identifier प्रॉपर्टी को एक से ज़्यादा बार इस्तेमाल करें. अगर आप JSON-LD का इस्तेमाल कर रहे हैं, तो यह JSON सूची के सिंटैक्स का इस्तेमाल करके दिखाया जाता है.

हम सुझावों के आधार पर अपनी सलाह को बेहतर बनाने की उम्मीद करते हैं. खास तौर पर ऐसे सुझाव जो मूल जगह, वर्शन, और टाइम सीरीज़ के प्रकाशन से जुड़ी तारीखों की जानकारी के बारे में हैं. कृपया समुदाय की चर्चाओं में शामिल हों.

टेक्स्ट प्रॉपर्टी के लिए सुझाव

हम टेक्स्ट वाली सभी प्रॉपर्टी को 5000 या इससे कम वर्णों तक सीमित रखने का सुझाव देते हैं. Google Dataset Search किसी भी टेक्स्ट वाली प्रॉपर्टी के पहले 5000 वर्णों का ही इस्तेमाल करता है. नाम और शीर्षक आम तौर पर कुछ शब्दों के या एक छोटे वाक्य के होते हैं.

पहले से जानकारी वाली गड़बड़ियां और चेतावनियां

आपको Google के स्ट्रक्चर्ड डेटा टेस्टिंग टूल और पुष्टि के दूसरे सिस्टम में गड़बड़ियां या चेतावनियां मिल सकती हैं. खास तौर पर, पुष्टि करने वाले सिस्टम सुझाव दे सकते हैं कि संगठनों को संपर्क जानकारी होनी चाहिए जिसमें contactType भी शामिल है. इसके उपयोगी मानों में customer service, emergency, journalist, newsroom, और public engagement को शामिल किया जाना चाहिए. आप csvw:Table की गड़बड़ियों को mainEntity प्रॉपर्टी के अनचाहे मान के तौर पर अनदेखा भी कर सकते हैं.

अलग-अलग तरह के स्ट्रक्चर्ड डेटा की जानकारी

आपका कॉन्टेंट ज़्यादा बेहतर नतीजे के तौर पर दिखाई दे, इसके लिए आपको ज़रूरी प्रॉपर्टी जोड़नी होंगी. अपने कॉन्टेंट के बारे में ज़्यादा जानकारी जोड़ने के लिए, आप सुझाई गई प्रॉपर्टी भी शामिल कर सकते हैं. इससे उपयोगकर्ता को बेहतर अनुभव मिल सकता है.

अपने मार्कअप की पुष्टि करने के लिए, आप स्ट्रक्चर्ड डेटा टेस्टिंग टूल का इस्तेमाल कर सकते हैं.

इसमें डेटासेट (उसके मेटाडेटा) और उसके कॉन्टेंट को दिखाने के बारे में जानकारी देने पर खास तौर से ध्यान दिया जाता है. जैसे कि, डेटासेट का मेटाडेटा उसके बारे में जानकारी देता है. इससे पता चलता है कि यह किस वैरिएबल के लिए काम करता है, इसे किसने बनाया है वगैरह. यानी, इसमें वैरिएबल के लिए खास मान शामिल नहीं होते हैं.

Dataset

Dataset की पूरी जानकारी, schema.org/Dataset पर मौजूद है.

आप डेटासेट के प्रकाशन के बारे में ज़्यादा जानकारी दे सकते हैं, जैसे कि लाइसेंस, प्रकाशित करने की तारीख, इसका डीओआई या किसी अलग रिपॉज़िटरी (डेटा स्टोर की जगह) में डेटासेट के कैननिकल वर्शन के बारे में बताने वाली sameAs. मूल जगह और लाइसेंस की जानकारी देने वाले डेटासेट के लिए identifier, license, और sameAs जोड़ें.

ज़रूरी प्रॉपर्टी
description Text

डेटासेट के बारे में कम शब्दों में खास जानकारी.

दिशा-निर्देश

  • यह जानकारी 50 से 5000 वर्णों की होनी चाहिए.
  • जानकारी में मार्कडाउन सिंटैक्स शामिल हो सकता है. एम्बेड की गई इमेज के लिए सही यूआरएल का पाथ इस्तेमाल किया जाना चाहिए (बजाय इसके कि सही यूआरएल पाथ की जगह उससे मिलते-जुलते पाथ का इस्तेमाल किया जाए).
  • JSON-LD फ़ॉर्मैट का इस्तेमाल करने पर, नई लाइन को \n (दो वर्ण: बैकस्लैश और लोअर केस में अंग्रेज़ी के वर्ण "n") से बताएं.
name Text

डेटासेट की जानकारी देने वाला नाम. जैसे कि "उत्तरी गोलार्ध में बर्फ़ की मोटाई".

दिशा-निर्देश

  • जहां भी हो सके, अलग-अलग डेटासेट के लिए खास नामों का इस्तेमाल करें.
  • सुझाया गया: दो अलग-अलग डेटासेट के लिए "Snow depth in the Northern Hemisphere" और "Snow depth in the Southern Hemisphere".

    इसका सुझाव हम नहीं देते: दो अलग-अलग डेटासेट के लिए "Snow depth" और "Snow depth".

सुझाई गई प्रॉपर्टी
alternateName Text

इस डेटासेट के बारे में जानकारी देने वाले वैकल्पिक नाम, जैसे कि उपनाम या छोटा नाम. उदाहरण (JSON-LD फ़ॉर्मैट में):


"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person या Organization

यह डेटासेट बनाने वाला. व्यक्ति की खास पहचान करने के लिए, Person तरह की sameAs प्रॉपर्टी के मान में ORCID ID का इस्तेमाल करें. संस्थानों और संगठनों की खास पहचान करने के लिए, ROR ID का इस्तेमाल करें. उदाहरण (JSON-LD फ़ॉर्मैट में):


"creator": [
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0000",
        "givenName": "Jane",
        "familyName": "Foo",
        "name": "Jane Foo"
    },
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0001",
        "givenName": "Jo",
        "familyName": "Bar",
        "name": "Jo Bar"
    },
    {
        "@type": "Organization",
        "sameAs": "http://ror.org/xxxxxxxxx",
        "name": "Fictitious Research Consortium"
    }
]
citation Text या CreativeWork

शैक्षणिक लेखों की पहचान करता है जिसका सुझाव डेटा उपलब्ध कराने वाले व्यक्ति ने दिया हो. इसका मकसद उपयोगकर्ताओं कोडेटासेट के साथ इन लेखों का सुझाव देना है. दूसरी प्रॉपर्टी से डेटासेट के उद्धरण की जानकारी दें, जैसे कि name, identifier, creator, और publisher प्रॉपर्टी. उदाहरण के लिए, इस प्रॉपर्टी में डेटासेट से मिलते-जुलते खास शैक्षणिक प्रकाशन के बारे में जानकारी दी जा सकती है. जैसे, डेटा की जानकारी देने वाला दस्तावेज़, डेटा पेपर या ऐसा लेख जिससे डेटासेट को बेहतर तरीके से समझा जा सके. उदाहरण (JSON-LD फ़ॉर्मैट में):


"citation": "https://doi.org/10.1111/111"

"citation": "https://identifiers.org/pubmed:11111111"

"citation": "https://identifiers.org/arxiv:0111.1111v1"

"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

अन्य दिशा-निर्देश

  • डेटासेट के बारे में उद्धरण की जानकारी देने के लिए इस प्रॉपर्टी का इस्तेमाल न करें. इस फ़ील्ड का मकसद डेटासेट से मिलते-जुलते शैक्षणिक लेखों को पहचानना है, न कि डेटासेट के बारे में जानकारी देना. डेटासेट को बेहतर तरीके से समझने के लिए ज़रूरी जानकारी देना हमेशा बेहतर होता है. इसके लिए, name, identifier, creator, और publisher प्रॉपर्टी इस्तेमाल करें.
  • उद्धरण प्रॉपर्टी में उद्धरण स्निपेट डालते समय, जहां भी हो सके वहां लेख की पहचान करने वाली जानकारी (जैसे, डीओआई) ज़रूर दें.

    सुझाया गया: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    इसका सुझाव नहीं दिया जाता: "Doe J (2014) Influence of X. Biomics 1(1)."

hasPart या isPartOf URL या Dataset

अगर कोई डेटासेट छोटे-छोटे डेटासेट का संग्रह हो, तो ऐसा संबंध बताने के लिए hasPart प्रॉपर्टी का इस्तेमाल करें. इसके उलट, अगर कोई डेटासेट बड़े डेटासेट का हिस्सा है, तो isPartOf का इस्तेमाल करें. दोनों प्रॉपर्टी एक यूआरएल या एक Dataset इंस्टेंस के रूप में हो सकती है. अगर Dataset का इस्तेमाल मान के रूप में किया जाता है, तो इसमें स्टैंडअलोन Dataset के लिए ज़रूरी सभी प्रॉपर्टी शामिल होनी चाहिए. उदाहरण:


"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  }
]

"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL, Text या PropertyValue

एक पहचानकर्ता, जैसे कि डीओआई या कॉम्पैक्ट पहचानकर्ता. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता हैं, तो identifier प्रॉपर्टी को एक से ज़्यादा बार इस्तेमाल करें. अगर आप JSON-LD का इस्तेमाल कर रहे हैं, तो यह JSON सूची के सिंटैक्स का इस्तेमाल करके दिखाया गया है.

keywords Text

डेटासेट की खास जानकारी देने वाले कीवर्ड.

license URL या CreativeWork

वह लाइसेंस जिससे डेटासेट उपलब्ध कराया जाता है. उदाहरण के लिए:


"license" : "https://creativecommons.org/publicdomain/zero/1.0/"

"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

अन्य दिशा-निर्देश

  • ऐसा यूआरएल दें जो साफ़ तौर पर, इस्तेमाल किए गए लाइसेंस के खास वर्शन की पहचान करता हो.

    सुझाया गया

    
    "license" : "https://creativecommons.org/licenses/by/4.0"

    इसका सुझाव नहीं दिया जाता

    
    "license" : "https://creativecommons.org/licenses/by"
measurementTechnique Text या URL

किसी डेटासेट में इस्तेमाल की गई तकनीक, टेक्नोलॉजी या तरीका जो variableMeasured में बताए गए वैरिएबल के मुताबिक हो.

sameAs URL

रेफ़रंस वाले वेब पेज का यूआरएल, जो साफ़ तौर पर डेटासेट की पहचान बताता है.

spatialCoverage Text या Place

आप डेटासेट की जगह से जुड़ी जानकारी, एक ही जगह पर मुहैया करा सकते हैं. अगर डेटासेट में जगह की जानकारी दी गई है, तो ही इस प्रॉपर्टी को शामिल करें. जैसे कि, ऐसी एक जगह जहां इकट्ठी की गई माप की सारी जानकारियां या किसी जगह के लिए बाउंडिंग बॉक्स की जगह की जानकारी मौजूद हो.

पॉइंट


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

आकार

अलग-अलग आकार वाली जगहों के बारे में जानकारी देने के लिए GeoShape का इस्तेमाल करें. जैसे कि बाउंडिंग बॉक्स बताने के लिए.


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

box, circle, line या polygonप्रॉपर्टी में दिए गए पॉइंट में अक्षांश और देशांतर (इसी क्रम में) के हिसाब से दो मानों के जोड़े को स्पेस से अलग करके दिखाया जाना चाहिए.

जगहों के नाम


"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

डेटासेट के डेटा में समय अंतराल की खास जानकारी शामिल होती है. अगर डेटासेट में समय की जानकारी दी गई है, तो ही इस प्रॉपर्टी को शामिल करें. Schema.org में ISO 8601 मानक का इस्तेमाल करके समय अंतरालों और किसी खास समय के बारे में जानकारी दी जाती है. आप डेटासेट में दिए अंतराल के आधार पर, तारीखों के बारे में अलग-अलग तरह से जानकारी दे सकते हैं. समय के दो खुले अंतरालों के बारे में बताने के लिए दो दशमलव बिंदुओं (..) का इस्तेमाल किया जाता है.

कोई एक तारीख


"temporalCoverage" : "2008"

समयावधि


"temporalCoverage" : "1950-01-01/2013-12-18"

खुली समयावधि


"temporalCoverage" : "2013-12-19/.."
variableMeasured Text या PropertyValue

ऐसा वैरिएबल जिसे यह डेटासेट मापता है. जैसे कि तापमान या दबाव.

version Text या Number

डेटासेट का वर्शन नंबर.

url URL

डेटासेट के बारे में जानकारी देने वाले पेज की जगह.

DataCatalog

DataCatalog की पूरी जानकारी schema.org/DataCatalog पर मौजूद है.

डेटासेट अक्सर रिपोज़िटरी (डेटा स्टोर की जगह) में प्रकाशित किए जाते हैं. यहां पर कई दूसरे डेटासेट भी मौजूद होते हैं. एक ही डेटासेट को ऐसी एक से ज़्यादा रिपोज़िटरी (डेटा स्टोर की जगह) में शामिल किया जा सकता है. आप सीधे इस डेटासेट की जानकारी देते हुए इसके डेटा कैटलॉग के बारे में बता सकते हैं.

सुझाई गई प्रॉपर्टी
includedInDataCatalog DataCatalog

वह कैटलॉग जिससे यह डेटासेट जुड़ा है.

DataDownload

DataDownload की पूरी जानकारी schema.org/DataDownload पर मौजूद है. डेटासेट की प्रॉपर्टी के अलावा, डेटासेट के लिए नीचे बताई गई वे प्रॉपर्टी जोड़ें जो डाउनलोड के विकल्प मुहैया कराती हैं.

distribution प्रॉपर्टी, डेटासेट पाने की सुविधा मुहैया कराती है. इसमें मौजूद यूआरएल अक्सर डेटासेट की जानकारी देने वाले लैंडिंग पेज पर ले जाता है. distribution प्रॉपर्टी में यह जानकारी दी जाती है कि डेटा कहां से और किस फ़ॉर्मैट में मिलेगा. इस प्रॉपर्टी में कई मान हो सकते हैं: जैसे कि CSV वर्शन एक यूआरएल में मौजूद होता है और Excel वर्शन दूसरे यूआरएल में.

ज़रूरी प्रॉपर्टी
distribution.contentUrl URL

डाउनलोड करने के लिए लिंक.

सुझाई गई प्रॉपर्टी
distribution DataDownload

डेटासेट डाउनलोड करने की जगह और डाउनलोड किए जाने वाले फ़ाइल फ़ॉर्मैट की जानकारी.

distribution.encodingFormat Text या URL

डेटासेट शेयर करने के लिए फ़ाइल फ़ॉर्मैट.

टेबल में रखे गए डेटासेट

टेबल में रखे गए डेटासेट को खास तौर पर पंक्तियों और कॉलम के ग्रिड में व्यवस्थित किया जाता है. टेबल में रखे गए डेटासेट एम्बेड करने वाले पेजों के लिए, आप ऊपर बताए गए मूल तरीके के हिसाब से ज़्यादा साफ़ जानकारी देने वाला मार्कअप भी बना सकते हैं. फ़िलहाल, हमें CSVW ("वेब पर CSV", W3C देखें) के उस फ़र्क़ की जानकारी है जिसे एचटीएमएल पेज पर टेबल में रखे गए उपयोगकर्ता के काम के कॉन्टेंट के साथ ही उपलब्ध कराया जाता है.

यहां ऐसी छोटी टेबल का उदाहरण दिया गया है जिसे CSVW JSON-LD फ़ॉर्मैट के कोड में बदला गया है. ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में कुछ पहले से जानकारी वाली गड़बड़ियां मिली हैं.

Search Console की मदद से, ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) पर नज़र रखना

Search Console एक ऐसा टूल है जिसकी मदद से, आप Google Search में अपने पेज की परफ़ॉर्मेंस पर नज़र रख सकते हैं. Google Search के नतीजों में अपनी साइट शामिल कराने लिए, आपको Search Console में साइन अप करने की ज़रूरत नहीं है. हालांकि, इससे आपको यह समझने में मदद मिलेगी कि Google आपकी साइट को कैसे देखता है. साथ ही, इसकी मदद से, आप साइट की परफ़ॉर्मेंस को भी बेहतर बना पाएंगे. हमारा सुझाव है कि आप इन मामलों में Search Console देखें:

  1. पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद
  2. नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद
  3. समय-समय पर ट्रैफ़िक का विश्लेषण करना

पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद

जब Google, आपके पेजों को इंडेक्स कर ले, तब ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) की स्थिति रिपोर्ट का इस्तेमाल करके, उन गड़बड़ियों को देखें जिन्हें ठीक करने की ज़रूरत है. आपको सही पेजों की संख्या में बढ़ोतरी दिखेगी और गड़बड़ियों या चेतावनियों में कोई बढ़ोतरी नहीं दिखेगी. अगर आपको स्ट्रक्चर्ड डेटा में गड़बड़ियां मिलती हैं, तो:

  1. गड़बड़ियां ठीक करें.
  2. लाइव यूआरएल की जांच करें और देखें कि गड़बड़ी ठीक हुई या नहीं.
  3. स्थिति रिपोर्ट का इस्तेमाल करके, पुष्टि करने का अनुरोध करें.

नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद

जब आप वेबसाइट में, कई या ज़रूरी बदलाव करते हैं, तब स्ट्रक्चर्ड डेटा की गड़बड़ियों और चेतावनियों में हुई बढ़ोतरी पर नज़र रखें.
  • अगर आपको गड़बड़ियों में बढ़ोतरी, दिखती है, तो हो सकता है कि आपने ऐसा नया टेंप्लेट जारी किया हो जो काम नहीं करता. इसके अलावा, यह भी हो सकता है कि आपकी साइट, मौजूदा टेंप्लेट से नए और खराब तरीके से इंटरैक्ट कर रही हो.
  • अगर आपको मान्य आइटम की संख्या में कमी दिखती है यानी वह गड़बड़ियों में बढ़ोतरी से मेल नहीं खाती, तो हो सकता है कि अब आप पेजों में स्ट्रक्चर्ड डेटा एम्बेड नहीं कर रहे हैं. गड़बड़ी की वजह जानने के लिए, यूआरएल जांचने वाले टूल का इस्तेमाल करें.

समय-समय पर ट्रैफ़िक का विश्लेषण करना

परफ़ॉर्मेंस रिपोर्ट का इस्तेमाल करके, Google Search से आने वाले ट्रैफ़िक का विश्लेषण करें. आपको डेटा से पता चलेगा कि आपका पेज Search में, रिच रिज़ल्ट के तौर पर कितनी बार दिखता है. साथ ही, यह भी पता चलेगा कि उयोगकर्ता उस पर कितनी बार क्लिक करते हैं और खोज के नतीजों में आपकी साइट के दिखने की औसत रैंक क्या है. आप इन नतीजों को Search Console API की मदद से, अपने-आप भी देख सकते हैं.

समस्या का हल

अगर आपको स्ट्रक्चर्ड डेटा का इस्तेमाल करने में कोई परेशानी आ रही है, तो ये रिसॉर्स आपकी मदद कर सकते हैं.

Dataset Search के नतीजों में खास डेटासेट नहीं दिख रहा है

गड़बड़ी की वजह क्या है: आपकी साइट में, डेटासेट की जानकारी देने वाले पेज पर स्ट्रक्चर्ड डेटा नहीं है या पेज को अभी तक क्रॉल नहीं किया गया है.

गड़बड़ी को ठीक करना

  1. जिस पेज को आप Dataset Search के नतीजों में देखना चाहते हैं उसके लिंक को कॉपी करें और इसे ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट के लिए डालें. अगर "इस टेस्ट से पता चला है कि पेज ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के लिए ज़रूरी शर्तें पूरी नहीं करता" या "सभी मार्कअप ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के लिए ज़रूरी शर्तें पूरी नहीं करते" मैसेज दिखता है, तो इसका मतलब है कि पेज पर कोई भी डेटासेट मार्कअप नहीं है या डेटासेट मार्कअप गलत है. आप स्ट्रक्चर्ड डेटा को जोड़ने का तरीका सेक्शन में जाकर, इसे ठीक कर सकते हैं.
  2. अगर पेज पर मार्कअप है, तो हो सकता है कि उसे अभी तक क्रॉल न किया गया हो. आप Search Console से क्रॉल की स्थिति की जांच कर सकते हैं.

कंपनी का लोगो मौजूद नहीं है या वह नतीजों में सही तरीके से नहीं दिख पा रहा है

गड़बड़ी की वजह क्या है: हो सकता है कि आपके पेज पर संगठन के लोगो के लिए schema.org मार्कअप मौजूद न हो या Google के साथ आपका कारोबार रजिस्टर न हुआ हो.

गड़बड़ी को ठीक करना

  1. अपने पेज पर स्ट्रक्चर्ड डेटा का लोगो जोड़ें.
  2. Google पर कारोबार की जानकारी रजिस्टर करें.