डेटासेट के बारे में अलग से दूसरी जानकारी देने पर उन्हें ढूंढना आसान हो जाता है. यह दूसरी जानकारी स्ट्रक्चर्ड डेटा के तौर पर उनके नाम, ब्यौरे, क्रिएटर, और बंटवारे के फ़ॉर्मैट दी जाती है. Google डेटासेट खोजने के अपने तरीके में schema.org और उन दूसरे मेटाडेटा मानकों का इस्तेमाल करता है जिन्हें डेटासेट की जानकारी देने वाले पेजों में जोड़ा जा सकता है. इस मार्कअप का मकसद चिकित्सा विज्ञान, सामाजिक विज्ञान, मशीन लर्निंग, नागरिक, और सरकारी डेटा जैसे फ़ील्ड से डेटासेट खोजने की सुविधा को बेहतर बनाना है. आप डेटासेट सर्च टूल का इस्तेमाल करके डेटासेट ढूंढ सकते हैं.

यहां कुछ ऐसी चीज़ों के उदाहरण दिए गए हैं जिन्हें डेटासेट के तौर पर इस्तेमाल किया जा सकता है:
- कुछ डेटा वाली टेबल या CSV फ़ाइल
- टेबल का व्यवस्थित संग्रह
- मालिकाना फ़ॉर्मैट में ऐसी फ़ाइल जिसमें डेटा मौजूद हो
- फ़ाइलों का ऐसा संग्रह, जो एक साथ मिलकर कुछ बेहतर डेटासेट तैयार कर सके
- किसी दूसरे फ़ॉर्मैट में मौजूद, डेटा के साथ ऐसा स्ट्रक्चर्ड ऑब्जेक्ट जिसे प्रॉसेस करने के लिए आप शायद किसी खास टूल में लोड करना चाहें
- इमेज कैप्चर करने वाला डेटा
- मशीन लर्निंग से जुड़ी फ़ाइलें, जैसे, तैयार किए गए पैरामीटर या न्यूरल नेटवर्क स्ट्रक्चर की परिभाषाएं
- ऐसी कोई भी चीज़, जो आपको डेटासेट की तरह लगती हो
स्ट्रक्चर्ड डेटा को जोड़ने का तरीका
स्ट्रक्चर्ड डेटा, किसी पेज के बारे में जानकारी देने और उसके कॉन्टेंट की श्रेणियां तय करने का एक स्टैंडर्ड फ़ॉर्मैट है. अगर आप स्ट्रक्चर्ड डेटा के बारे में ज़्यादा नहीं जानते, तो जानकारी बढ़ाने के लिए इसके काम करने का तरीका जानें.
स्ट्रक्चर्ड डेटा बनाने, उसकी जांच करने, और उसे रिलीज़ करने के बारे में खास जानकारी यहां दी गई है. वेब पेज में स्ट्रक्चर्ड डेटा जोड़ने के सिलसिलेवार निर्देशों के लिए, स्ट्रक्चर्ड डेटा कोडलैब (कोड बनाना सीखने के लिए ट्यूटोरियल) देखें.
- ज़रूरी प्रॉपर्टी जोड़ें. पेज पर स्ट्रक्चर्ड डेटा कहां जोड़ना चाहिए, इस बारे में जानकारी पाने के लिए, JSON-LD स्ट्रक्चर्ड डेटा: इसे पेज पर कहां डाला जाए देखें.
- दिशा-निर्देशों का पालन करें.
- ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) के टेस्ट का इस्तेमाल करके अपने कोड की पुष्टि करें.
- स्ट्रक्चर्ड डेटा वाले कुछ पेजों को डिप्लॉय करें. इसके बाद, यूआरएल जांचने वाला टूल इस्तेमाल करके जांचें कि Google को कैसा दिखेगा. पक्का करें कि Google आपका पेज ऐक्सेस कर सकता है. उसे robots.txt फ़ाइल से रोका न गया हो और
noindex
टैग इस्तेमाल करना या लॉग इन करना ज़रूरी न हो. अगर पेज ठीक दिखता है, तो आप Google को अपने यूआरएल फिर से क्रॉल करने के लिए कह सकते हैं. - Google को आगे होने वाले बदलावों की जानकारी देने के लिए, हमारा सुझाव है कि आप साइटमैप सबमिट करें. आप Search Console साइटमैप एपीआई की मदद से इसे अपने-आप चलने दे सकते हैं.
Dataset Search के नतीजों से डेटासेट मिटाना
अगर आप चाहते हैं कि Dataset Search के नतीजों में डेटासेट न दिखे, तो रोबोट मेटा टैग का इस्तेमाल करके अपने डेटा को इंडेक्स किए जाने के तरीके को कंट्रोल करें. ध्यान रखें कि Dataset Search में, बदलाव दिखने में कुछ समय (क्रॉल करने के शेड्यूल के हिसाब से दिन या हफ़्ते) लग सकते हैं.
डेटासेट खोजने का हमारा तरीका
हम डेटासेट के बारे में, वेब पेजों पर मौजूद स्ट्रक्चर्ड डेटा को समझ सकते हैं. इसे समझने के लिए, हम schema.org Dataset
मार्कअप या
W3C के डेटा कैटलॉग शब्दावली (DCAT) फ़ॉर्मैट में पेश किए गए उसी के जैसे स्ट्रक्चर का इस्तेमाल करते हैं. हम W3C CSVW के आधार
पर स्ट्रक्चर्ड डेटा के लिए प्रयोग के तौर पर सुविधाओं की खोज भी कर रहे हैं. हम डेटासेट की जानकारी देने के लिए और भी बेहतर काम करना चाहते हैं. साथ ही, हमारे तरीके को सबसे अच्छे तरीके के तौर पर अपनाए जाने की उम्मीद करते हैं. हम डेटासेट ढूंढने के लिए किस तरीके का इस्तेमाल
करते हैं, इस बारे में ज़्यादा जानने के लिए,
डेटासेट ढूंढना आसान बनाना देखें.
उदाहरण
ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में, JSON-LD और schema.org सिंटैक्स (पसंदीदा) का इस्तेमाल करने वाले डेटासेट का उदाहरण यहां दिया गया है. उसी schema.org शब्दावली का इस्तेमाल RDFa 1.1 या माइक्रोडेटा सिंटैक्स में भी किया जा सकता है. आप मेटाडेटा के बारे में बताने के लिए, W3C DCAT शब्दावली का भी इस्तेमाल कर सकते हैं. नीचे दिया गया उदाहरण असल डेटासेट की जानकारी पर आधारित है.
JSON-LD में डेटासेट का एक उदाहरण यहां दिया गया है:
<html> <head> <title>NCDC Storm Events Database</title> <script type="application/ld+json"> { "@context":"https://schema.org/", "@type":"Dataset", "name":"NCDC Storm Events Database", "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...", "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database", "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510", "identifier": ["https://doi.org/10.1000/182", "https://identifiers.org/ark:/12345/fk1234"], "keywords":[ "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE" ], "license" : "https://creativecommons.org/publicdomain/zero/1.0/", "hasPart" : [ { "@type": "Dataset", "name": "Sub dataset 01", "description": "Informative description of the first subdataset...", "license" : "https://creativecommons.org/publicdomain/zero/1.0/" }, { "@type": "Dataset", "name": "Sub dataset 02", "description": "Informative description of the second subdataset...", "license" : "https://creativecommons.org/publicdomain/zero/1.0/" } ], "creator":{ "@type":"Organization", "url": "https://www.ncei.noaa.gov/", "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce", "contactPoint":{ "@type":"ContactPoint", "contactType": "customer service", "telephone":"+1-828-271-4800", "email":"ncei.orders@noaa.gov" } }, "includedInDataCatalog":{ "@type":"DataCatalog", "name":"data.gov" }, "distribution":[ { "@type":"DataDownload", "encodingFormat":"CSV", "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp" }, { "@type":"DataDownload", "encodingFormat":"XML", "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510" } ], "temporalCoverage":"1950-01-01/2013-12-18", "spatialCoverage":{ "@type":"Place", "geo":{ "@type":"GeoShape", "box":"18.0 -65.0 72.0 172.0" } } } </script> </head> <body> </body> </html>
RDFa में DCAT शब्दावली का इस्तेमाल करने वाले डेटासेट का एक उदाहरण यहां दिया गया है:
<article about="/node/1234" typeof="dcat:Dataset"> <dl> <dt>Name:</dt> <dd property="dc:title">ACME Inc Cash flow data</dd> <dt>Identifiers:</dt> <dd property="dc:identifier">https://doi.org/10.1000/182</dd> <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd> <dt>Description:</dt> <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd> <dt>Category:</dt> <dd rel="dc:subject">Financial</dd> <dt class="field-label">Downloads:</dt> <dd> <ul> <li> <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a> </li> <li> <a rel="dcat:distribution" href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a> </li> <li> <a rel="dcat:distribution" href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a> </li> </ul> </dd> </dl> </article>
दिशा-निर्देश
साइटों को स्ट्रक्चर्ड डेटा के दिशा-निर्देशों का पालन करना चाहिए. स्ट्रक्चर्ड डेटा के दिशा-निर्देशों के अलावा, हम नीचे दिए गए साइटमैप और स्रोत और मूल जगह के सबसे अच्छे तरीके अपनाने का सुझाव देते हैं.
साइटमैप इस्तेमाल करने के सबसे सही तरीके
साइटमैप फ़ाइल का इस्तेमाल
करें, ताकि Google को आपके यूआरएल ढूंढने में मदद मिल सके. साइटमैप फ़ाइल और sameAs
मार्कअप का इस्तेमाल
करने से, आपकी साइट पर डेटासेट की जानकरी प्रकाशित करने का रिकॉर्ड रखने में मदद मिलती है.
अगर आपके पास डेटासेट रिपॉज़िटरी (डेटा स्टोर करने की जगह) है, तो आपके पास कम से कम दो तरह के पेज हो सकते हैं: हर
डेटासेट के लिए कैननिकल ("लैंडिंग") पेज और एक से ज़्यादा डेटासेट वाले पेज (जैसे
कि, खोज नतीजे या डेटासेट के कुछ सबसेट). हमारा सुझाव है कि आप कैननिकल पेज में डेटासेट के बारे में
स्ट्रक्चर्ड डेटा जोड़ें. अगर आप डेटासेट की एक से ज़्यादा कॉपी
में स्ट्रक्चर्ड डेटा (यानी खोज नतीजों के पेज में सूचियां) जोड़ते हैं, तो कैननिकल
पेज से लिंक करने के लिए sameAs
प्रॉपर्टी का इस्तेमाल करें.
स्रोत और मूल जगह के लिए सबसे अच्छे तरीके
खुले डेटासेट को फिर से प्रकाशित करना, इकट्ठा करना, और दूसरे डेटासेट के आधार पर तैयार करना सामान्य बात है. यह स्थितियों को दिखाने के हमारे तरीके का शुरुआती हिस्सा है. इसमें डेटासेट को किसी दूसरे डेटासेट की कॉपी करके या दूसरे डेटासेट के आधार पर अलग तरीके से बनाया जाता है.
- जब डेटासेट
या दी गई जानकारी को कहीं और प्रकाशित की गई सामग्रियों की कॉपी करके फिर से प्रकाशित करना हो, तो मूल डेटासेट
के सबसे ज़्यादा कैननिकल यूआरएल दिखाने के लिए
sameAs
प्रॉपर्टी का इस्तेमाल करें.sameAs
का मान साफ़ तौर पर डेटासेट की पहचान बताने वाला होना चाहिए. दूसरे शब्दों में कहें, तो अलग-अलग डेटासेट कोsameAs
मान में दिए गए यूआरएल का इस्तेमाल नहीं करना चाहिए. - अगर फिर से प्रकाशित किए गए
डेटासेट (और उसके मेटाडेटा) में बहुत सारे बदलाव किए गए हैं, तो
isBasedOn
प्रॉपर्टी का इस्तेमाल करें. - जब डेटासेट के बारे में जानकारी कई मूल डेटासेट से ली गई हो या इकट्ठा की गई हो, तो
isBasedOn
प्रॉपर्टी का इस्तेमाल करें. - किसी भी ज़रूरी
डिजिटल ऑब्जेक्ट पहचानकर्ता (डीओआई) या कॉम्पैक्ट पहचानकर्ता को अटैच करने के लिए,
identifier
प्रॉपर्टी का इस्तेमाल करें. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता हैं, तोidentifier
प्रॉपर्टी को एक से ज़्यादा बार इस्तेमाल करें. अगर आप JSON-LD का इस्तेमाल कर रहे हैं, तो यह JSON सूची के सिंटैक्स का इस्तेमाल करके दिखाया जाता है.
हम सुझावों के आधार पर अपनी सलाह को बेहतर बनाने की उम्मीद करते हैं. खास तौर पर ऐसे सुझाव जो मूल जगह, वर्शन, और टाइम सीरीज़ के प्रकाशन से जुड़ी तारीखों की जानकारी के बारे में हैं. कृपया समुदाय की चर्चाओं में शामिल हों.
टेक्स्ट प्रॉपर्टी के लिए सुझाव
हम टेक्स्ट वाली सभी प्रॉपर्टी को 5000 या इससे कम वर्णों तक सीमित रखने का सुझाव देते हैं. Google Dataset Search किसी भी टेक्स्ट वाली प्रॉपर्टी के पहले 5000 वर्णों का ही इस्तेमाल करता है. नाम और शीर्षक आम तौर पर कुछ शब्दों के या एक छोटे वाक्य के होते हैं.
पहले से जानकारी वाली गड़बड़ियां और चेतावनियां
आपको Google के स्ट्रक्चर्ड डेटा टेस्टिंग टूल और
पुष्टि के दूसरे सिस्टम में गड़बड़ियां या चेतावनियां मिल सकती हैं. खास तौर पर, पुष्टि करने वाले सिस्टम
सुझाव दे सकते हैं कि संगठनों को संपर्क जानकारी होनी चाहिए जिसमें contactType
भी शामिल है. इसके उपयोगी मानों में
customer service
, emergency
, journalist
, newsroom
, और public engagement
को शामिल किया जाना चाहिए.
आप csvw:Table
की गड़बड़ियों को mainEntity
प्रॉपर्टी के अनचाहे मान के तौर पर अनदेखा भी कर सकते हैं.
अलग-अलग तरह के स्ट्रक्चर्ड डेटा की जानकारी
आपका कॉन्टेंट ज़्यादा बेहतर नतीजे के तौर पर दिखाई दे, इसके लिए आपको ज़रूरी प्रॉपर्टी जोड़नी होंगी. अपने कॉन्टेंट के बारे में ज़्यादा जानकारी जोड़ने के लिए, आप सुझाई गई प्रॉपर्टी भी शामिल कर सकते हैं. इससे उपयोगकर्ता को बेहतर अनुभव मिल सकता है.
अपने मार्कअप की पुष्टि करने के लिए, आप स्ट्रक्चर्ड डेटा टेस्टिंग टूल का इस्तेमाल कर सकते हैं.
इसमें डेटासेट (उसके मेटाडेटा) और उसके कॉन्टेंट को दिखाने के बारे में जानकारी देने पर खास तौर से ध्यान दिया जाता है. जैसे कि, डेटासेट का मेटाडेटा उसके बारे में जानकारी देता है. इससे पता चलता है कि यह किस वैरिएबल के लिए काम करता है, इसे किसने बनाया है वगैरह. यानी, इसमें वैरिएबल के लिए खास मान शामिल नहीं होते हैं.
Dataset
Dataset
की पूरी जानकारी, schema.org/Dataset
पर मौजूद है.
आप डेटासेट के प्रकाशन के बारे में ज़्यादा जानकारी दे सकते हैं, जैसे कि लाइसेंस, प्रकाशित करने की
तारीख, इसका डीओआई या
किसी अलग
रिपॉज़िटरी (डेटा स्टोर की जगह) में डेटासेट के कैननिकल वर्शन के बारे में
बताने वाली sameAs
. मूल जगह और लाइसेंस की जानकारी देने
वाले डेटासेट के लिए identifier
, license
, और sameAs
जोड़ें.
ज़रूरी प्रॉपर्टी | |
---|---|
description
|
Text
डेटासेट के बारे में कम शब्दों में खास जानकारी. दिशा-निर्देश
|
name
|
Text
डेटासेट की जानकारी देने वाला नाम. जैसे कि "उत्तरी गोलार्ध में बर्फ़ की मोटाई". दिशा-निर्देश
सुझाया गया: दो अलग-अलग डेटासेट के लिए इसका सुझाव हम नहीं देते: दो अलग-अलग डेटासेट के लिए |
सुझाई गई प्रॉपर्टी | |
---|---|
alternateName
|
Text
इस डेटासेट के बारे में जानकारी देने वाले वैकल्पिक नाम, जैसे कि उपनाम या छोटा नाम. उदाहरण (JSON-LD फ़ॉर्मैट में): "name": "The Quick, Draw! Dataset" "alternateName": ["Quick Draw Dataset", "quickdraw-dataset"] |
creator
|
Person या
Organization
यह डेटासेट बनाने वाला. व्यक्ति की खास पहचान करने के लिए,
"creator": [ { "@type": "Person", "sameAs": "http://orcid.org/0000-0000-0000-0000", "givenName": "Jane", "familyName": "Foo", "name": "Jane Foo" }, { "@type": "Person", "sameAs": "http://orcid.org/0000-0000-0000-0001", "givenName": "Jo", "familyName": "Bar", "name": "Jo Bar" }, { "@type": "Organization", "sameAs": "http://ror.org/xxxxxxxxx", "name": "Fictitious Research Consortium" } ] |
citation
|
Text या CreativeWork
शैक्षणिक लेखों की पहचान करता है जिसका सुझाव डेटा उपलब्ध कराने वाले व्यक्ति ने दिया हो. इसका मकसद उपयोगकर्ताओं कोडेटासेट के साथ इन लेखों का
सुझाव देना है. दूसरी प्रॉपर्टी से डेटासेट के उद्धरण की जानकारी दें, जैसे कि "citation": "https://doi.org/10.1111/111" "citation": "https://identifiers.org/pubmed:11111111" "citation": "https://identifiers.org/arxiv:0111.1111v1" "citation": "Doe J (2014) Influence of X ... https://doi.org/10.1111/111" अन्य दिशा-निर्देश
|
hasPart या isPartOf
|
URL या
Dataset
अगर कोई डेटासेट छोटे-छोटे डेटासेट का संग्रह हो, तो ऐसा संबंध बताने के लिए "hasPart" : [ { "@type": "Dataset", "name": "Sub dataset 01", "description": "Informative description of the first subdataset...", "license" : "https://creativecommons.org/publicdomain/zero/1.0/" }, { "@type": "Dataset", "name": "Sub dataset 02", "description": "Informative description of the second subdataset...", "license" : "https://creativecommons.org/publicdomain/zero/1.0/" } ] "isPartOf" : "https://example.com/aggregate_dataset" |
identifier
|
URL , Text या PropertyValue
एक पहचानकर्ता, जैसे कि डीओआई या कॉम्पैक्ट पहचानकर्ता. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता
हैं, तो |
keywords
|
Text
डेटासेट की खास जानकारी देने वाले कीवर्ड. |
license
|
URL या CreativeWork
वह लाइसेंस जिससे डेटासेट उपलब्ध कराया जाता है. उदाहरण के लिए: "license" : "https://creativecommons.org/publicdomain/zero/1.0/" "license" : { "@type": "CreativeWork", "name": "Custom license", "url": "https://example.com/custom_license" } अन्य दिशा-निर्देश
|
measurementTechnique
|
Text या URL
किसी डेटासेट में इस्तेमाल की गई तकनीक, टेक्नोलॉजी या तरीका जो |
sameAs
|
URL
रेफ़रंस वाले वेब पेज का यूआरएल, जो साफ़ तौर पर डेटासेट की पहचान बताता है. |
spatialCoverage |
Text या Place
आप डेटासेट की जगह से जुड़ी जानकारी, एक ही जगह पर मुहैया करा सकते हैं. अगर डेटासेट में जगह की जानकारी दी गई है, तो ही इस प्रॉपर्टी को शामिल करें. जैसे कि, ऐसी एक जगह जहां इकट्ठी की गई माप की सारी जानकारियां या किसी जगह के लिए बाउंडिंग बॉक्स की जगह की जानकारी मौजूद हो. पॉइंट "spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoCoordinates", "latitude": 39.3280, "longitude": 120.1633 } } आकार अलग-अलग आकार वाली जगहों के बारे में जानकारी देने के लिए GeoShape का इस्तेमाल करें. जैसे कि बाउंडिंग बॉक्स बताने के लिए. "spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoShape", "box": "39.3280 120.1633 40.445 123.7878" } }
जगहों के नाम "spatialCoverage:" "Tahoe City, CA" |
temporalCoverage |
Text
डेटासेट के डेटा में समय अंतराल की खास जानकारी शामिल होती है. अगर डेटासेट में समय की जानकारी दी गई है,
तो ही इस प्रॉपर्टी को शामिल करें. Schema.org में ISO 8601 मानक का इस्तेमाल करके
समय अंतरालों और किसी खास समय के बारे में जानकारी दी जाती है. आप डेटासेट में दिए अंतराल के आधार पर,
तारीखों के बारे में अलग-अलग तरह से जानकारी दे सकते हैं. समय के दो खुले अंतरालों के बारे में बताने के लिए दो दशमलव बिंदुओं ( कोई एक तारीख "temporalCoverage" : "2008" समयावधि "temporalCoverage" : "1950-01-01/2013-12-18" खुली समयावधि "temporalCoverage" : "2013-12-19/.." |
variableMeasured
|
Text या PropertyValue
ऐसा वैरिएबल जिसे यह डेटासेट मापता है. जैसे कि तापमान या दबाव. |
version
|
Text या Number
डेटासेट का वर्शन नंबर. |
url
|
URL
डेटासेट के बारे में जानकारी देने वाले पेज की जगह. |
DataCatalog
DataCatalog
की पूरी जानकारी schema.org/DataCatalog
पर मौजूद है.
डेटासेट अक्सर रिपोज़िटरी (डेटा स्टोर की जगह) में प्रकाशित किए जाते हैं. यहां पर कई दूसरे डेटासेट भी मौजूद होते हैं. एक ही डेटासेट को ऐसी एक से ज़्यादा रिपोज़िटरी (डेटा स्टोर की जगह) में शामिल किया जा सकता है. आप सीधे इस डेटासेट की जानकारी देते हुए इसके डेटा कैटलॉग के बारे में बता सकते हैं.
सुझाई गई प्रॉपर्टी | |
---|---|
includedInDataCatalog
|
DataCatalog
वह कैटलॉग जिससे यह डेटासेट जुड़ा है.
|
DataDownload
DataDownload
की पूरी जानकारी schema.org/DataDownload
पर मौजूद है. डेटासेट की प्रॉपर्टी के अलावा, डेटासेट के लिए
नीचे बताई गई वे प्रॉपर्टी जोड़ें जो डाउनलोड के विकल्प मुहैया कराती हैं.
distribution
प्रॉपर्टी, डेटासेट पाने की सुविधा मुहैया कराती है. इसमें मौजूद यूआरएल अक्सर
डेटासेट की जानकारी देने वाले लैंडिंग पेज पर ले जाता है. distribution
प्रॉपर्टी
में यह जानकारी दी जाती है कि डेटा कहां से और किस फ़ॉर्मैट में मिलेगा. इस प्रॉपर्टी में
कई मान हो सकते हैं: जैसे कि CSV वर्शन एक यूआरएल में मौजूद होता है और
Excel वर्शन दूसरे यूआरएल में.
ज़रूरी प्रॉपर्टी | |
---|---|
distribution.contentUrl
|
URL
डाउनलोड करने के लिए लिंक. |
सुझाई गई प्रॉपर्टी | |
---|---|
distribution
|
DataDownload
डेटासेट डाउनलोड करने की जगह और डाउनलोड किए जाने वाले फ़ाइल फ़ॉर्मैट की जानकारी.
|
distribution.encodingFormat
|
Text या URL
डेटासेट शेयर करने के लिए फ़ाइल फ़ॉर्मैट.
|
टेबल में रखे गए डेटासेट
टेबल में रखे गए डेटासेट को खास तौर पर पंक्तियों और कॉलम के ग्रिड में व्यवस्थित किया जाता है. टेबल में रखे गए डेटासेट एम्बेड करने वाले पेजों के लिए, आप ऊपर बताए गए मूल तरीके के हिसाब से ज़्यादा साफ़ जानकारी देने वाला मार्कअप भी बना सकते हैं. फ़िलहाल, हमें CSVW ("वेब पर CSV", W3C देखें) के उस फ़र्क़ की जानकारी है जिसे एचटीएमएल पेज पर टेबल में रखे गए उपयोगकर्ता के काम के कॉन्टेंट के साथ ही उपलब्ध कराया जाता है.
यहां ऐसी छोटी टेबल का उदाहरण दिया गया है जिसे CSVW JSON-LD फ़ॉर्मैट के कोड में बदला गया है. ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में कुछ पहले से जानकारी वाली गड़बड़ियां मिली हैं.
Search Console की मदद से, ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) पर नज़र रखना
Search Console एक ऐसा टूल है जिसकी मदद से, आप Google Search में अपने पेज की परफ़ॉर्मेंस पर नज़र रख सकते हैं. Google Search के नतीजों में अपनी साइट शामिल कराने लिए, आपको Search Console में साइन अप करने की ज़रूरत नहीं है. हालांकि, इससे आपको यह समझने में मदद मिलेगी कि Google आपकी साइट को कैसे देखता है. साथ ही, इसकी मदद से, आप साइट की परफ़ॉर्मेंस को भी बेहतर बना पाएंगे. हमारा सुझाव है कि आप इन मामलों में Search Console देखें:
- पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद
- नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद
- समय-समय पर ट्रैफ़िक का विश्लेषण करना
पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद
जब Google, आपके पेजों को इंडेक्स कर ले, तब ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) की स्थिति की रिपोर्ट का इस्तेमाल करके, उन गड़बड़ियों को देखें जिन्हें ठीक करने की ज़रूरत है. आपको सही पेजों की संख्या में बढ़ोतरी दिखेगी और गड़बड़ियों या चेतावनियों में कोई बढ़ोतरी नहीं दिखेगी. अगर आपको स्ट्रक्चर्ड डेटा में गड़बड़ियां मिलती हैं, तो:
- गड़बड़ियां ठीक करें.
- लाइव यूआरएल की जांच करें और देखें कि गड़बड़ी ठीक हुई या नहीं.
- स्थिति की रिपोर्ट का इस्तेमाल करके, पुष्टि करने का अनुरोध करें.
नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद
जब आप वेबसाइट में, कई या ज़रूरी बदलाव करते हैं, तब स्ट्रक्चर्ड डेटा की गड़बड़ियों और चेतावनियों में हुई बढ़ोतरी पर नज़र रखें.- अगर आपको गड़बड़ियों में बढ़ोतरी दिखती है, तो हो सकता है कि आपने ऐसा नया टेंप्लेट रोल आउट किया हो जो काम नहीं करता. इसके अलावा, यह भी हो सकता है कि आपकी साइट, मौजूदा टेंप्लेट से नए और खराब तरीके से इंटरैक्ट कर रही हो.
- अगर आपको मान्य आइटम की संख्या में कमी दिखती है, यानी वह गड़बड़ियों में बढ़ोतरी से मेल नहीं खाती, तो हो सकता है कि अब आप पेजों में स्ट्रक्चर्ड डेटा एम्बेड नहीं कर रहे हैं. गड़बड़ी की वजह जानने के लिए, यूआरएल जांचने वाले टूल का इस्तेमाल करें.
समय-समय पर ट्रैफ़िक का विश्लेषण करना
परफ़ॉर्मेंस रिपोर्ट का इस्तेमाल करके, Google Search से आने वाले ट्रैफ़िक का विश्लेषण करें. आपको डेटा से पता चलेगा कि आपका पेज Search में, रिच रिज़ल्ट के तौर पर कितनी बार दिखता है. साथ ही, यह भी पता चलेगा कि उयोगकर्ता उस पर कितनी बार क्लिक करते हैं और खोज के नतीजों में आपकी साइट के दिखने की औसत रैंक क्या है. आप इन नतीजों को Search Console API की मदद से, अपने-आप भी देख सकते हैं.समस्या का हल
अगर आपको स्ट्रक्चर्ड डेटा का इस्तेमाल करने में कोई परेशानी आ रही है, तो ये रिसॉर्स आपकी मदद कर सकते हैं.
- आपके स्ट्रक्चर्ड डेटा में गड़बड़ी हो सकती है. स्ट्रक्चर्ड डेटा से जुड़ी गड़बड़ी की सूची देखें.
- शामिल न किए गए ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) / सभी ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) में कमी की समस्या हल करना.
- क्रॉल और इंडेक्स करने के बारे में सामान्य सवालों के जवाब पाने के लिए, वेबमास्टर के बारे में अक्सर पूछे जाने वाले सवाल देखें.
- वेबमास्टर के काम के घंटों के दौरान सवाल पूछें.
- वेबमास्टर फ़ोरम में सवाल पोस्ट करें.
Dataset Search के नतीजों में खास डेटासेट नहीं दिख रहा है
error गड़बड़ी की वजह क्या है: आपकी साइट में, डेटासेट की जानकारी देने वाले पेज पर स्ट्रक्चर्ड डेटा नहीं है या पेज को अभी तक क्रॉल नहीं किया गया है.
done गड़बड़ी को ठीक करना
- जिस पेज को आप Dataset Search के नतीजों में देखना चाहते हैं उसके लिंक को कॉपी करें और इसे ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट के लिए डालें. अगर "इस टेस्ट से पता चला है कि पेज ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के लिए ज़रूरी शर्तें पूरी नहीं करता" या "सभी मार्कअप ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के लिए ज़रूरी शर्तें पूरी नहीं करते" मैसेज दिखता है, तो इसका मतलब है कि पेज पर कोई भी डेटासेट मार्कअप नहीं है या डेटासेट मार्कअप गलत है. आप स्ट्रक्चर्ड डेटा को जोड़ने का तरीका सेक्शन में जाकर, इसे ठीक कर सकते हैं.
- अगर पेज पर मार्कअप है, तो हो सकता है कि उसे अभी तक क्रॉल न किया गया हो. आप Search Console से क्रॉल की स्थिति की जांच कर सकते हैं.
कंपनी का लोगो मौजूद नहीं है या वह नतीजों में सही तरीके से नहीं दिख पा रहा है
error गड़बड़ी की वजह क्या है: हो सकता है कि आपके पेज पर संगठन के लोगो के लिए schema.org मार्कअप मौजूद न हो या Google के साथ आपका कारोबार रजिस्टर न हुआ हो.
done गड़बड़ी को ठीक करना
- अपने पेज पर स्ट्रक्चर्ड डेटा का लोगो जोड़ें.
- Google पर कारोबार की जानकारी रजिस्टर करें.