البيانات المنظَّمة الخاصة بمجموعات البيانات (Dataset، وDataCatalog، وDataDownload)

يصبح العثور على مجموعات البيانات أسهل عند تقديم معلومات داعمة في شكل بيانات منظَّمة، مثل الاسم والوصف والمنشئ وتنسيقات التوزيع. يتّبع محرّك البحث Google أسلوبًا لاكتشاف مجموعات البيانات يتمثّل في الاستفادة من schema.org وغيرها من معايير البيانات الوصفية التي يمكن إضافتها إلى الصفحات التي تصف مجموعات البيانات. ويهدف هذا الترميز إلى تحسين مستوى اكتشاف مجموعات البيانات في مجالات مختلفة، مثل علوم الحياة والعلوم الاجتماعية وتعلُّم الآلة والبيانات المدنية والحكومية وغيرها المزيد. ويمكنك العثور على مجموعات البيانات باستخدام أداة بحث مجموعة البيانات.

مثال على "بحث مجموعة البيانات"

في ما يلي بعض الأمثلة على العناصر التي يمكن اعتبارها مجموعة بيانات:

  • جدول أو ملف CSV به بعض البيانات
  • مجموعة منظَّمة من الجداول
  • ملف بتنسيق يتمتع بملكية خاصة يحتوي على بيانات
  • مجموعة ملفات تشكّل معًا مجموعة بيانات مهمّة
  • كائن منظَّم مع بيانات بتنسيق مختلف قد تحتاج إلى تحميله إلى أداة خاصة لمعالجته
  • صور تتضمّن بيانات
  • ملفات ذات صلة بتعلُّم الآلة، مثل المعلَمات المُدرَّبة أو تعريفات بنية الشبكة العصبونية

كيفية إضافة البيانات المنظَّمة

البيانات المنظَّمة هي تنسيق موحّد لتقديم معلومات عن صفحة محدّدة وتصنيف محتواها. إذا كنت لا تزال مبتدئًا في مجال البيانات المنظَّمة، يمكنك الاطّلاع على المزيد من المعلومات حول آلية عمل البيانات المنظَّمة.

إليك نظرة عامة حول كيفية إنشاء بيانات منظَّمة واختبارها وإصدارها.

  1. أضِف السمات المطلوبة. استنادًا إلى التنسيق الذي تستخدمه، يمكنك معرفة مكان إدراج البيانات المنظَّمة في الصفحة.
  2. اتّبِع الإرشادات.
  3. تحقَّق من صحة الرمز باستخدام اختبار النتائج الغنية بصريًا، وأصلِح أي أخطاء ملحّة. ننصحك أيضًا بحلّ أي مشاكل غير ملحّة قد ترصدها الأداة لأنّ ذلك قد يساعدك على تحسين جودة بياناتك المنظَّمة (ولكن هذا الإجراء ليس ضروريًا لتكون بياناتك مؤهّلة للظهور ضمن النتائج الغنية بصريًا).
  4. انشر بعض الصفحات التي تتضمّن بياناتك المنظَّمة واستخدِم أداة فحص عنوان URL لاختبار الطريقة التي يرى بها محرّك بحث Google الصفحة. تأكَّد من إمكانية وصول محرّك بحث Google إلى صفحتك ومن عدم حظرها باستخدام ملف robots.txt أو علامة noindex أو متطلبات تسجيل الدخول. إذا بدت الصفحة جيدة، يمكنك أن تطلب من محرّك بحث Google إعادة الزحف إلى عناوين URL الخاصة بك.
  5. لإعلام محرّك بحث Google بأي تغييرات لاحقة، ننصحك بإرسال خريطة الموقع. يمكنك برمجة هذا الإجراء باستخدام Search Console Sitemap API.

حذف مجموعة بيانات من نتائج "بحث مجموعة البيانات"

إذا كنت تريد منع ظهور مجموعة بيانات في نتائج "بحث مجموعة البيانات"، يمكنك استخدام العلامة meta robots للتحكّم في كيفية فهرسة مجموعة البيانات. وقد يستغرق ظهور التغييرات في "بحث مجموعة البيانات" بعض الوقت (أيام أو أسابيع، حسب جدول الزحف).

الأسلوب الذي نتّبعه لاكتشاف مجموعات البيانات

يمكننا فهم البيانات المنظَّمة المضافة إلى صفحات الويب حول مجموعات البيانات، والتي تستخدم الترميز Dataset من schema.org أو بنى مكافئة يتم تمثيلها بالتنسيق Data Catalog Vocabulary (DCAT)‎ من W3C. وندرس أيضًا إمكانية إتاحة البيانات المنظَّمة المستندة إلى W3C CSVW بصورة تجريبية، ونتوقّع أن نتمكن من تطوير أسلوبنا وتكييفه بالتزامن مع إصدار أفضل الممارسات لوصف مجموعات البيانات. للحصول على مزيد من المعلومات حول أسلوبنا في اكتشاف مجموعات البيانات، راجِع تسهيل اكتشاف مجموعات البيانات.

أمثلة

في ما يلي مثال على مجموعات بيانات تستخدم بنية JSON-LD وschema.org (وهي بنية مفضّلة) في اختبار النتائج الغنية بصريًا. ويمكن أيضًا استخدام مصطلحات schema.org نفسها في بنية RDFa 1.1 أو بنية البيانات الجزئية. يمكنك أيضًا استخدام مصطلحات W3C DCAT لتوضيح البيانات الوصفية. يستند المثال التالي إلى وصف مجموعة بيانات فعلي.

JSON-LD

في ما يلي مثال على مجموعة بيانات بترميز JSON-LD:


<html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "isAccessibleForFree" : true,
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 01 creator"
          }
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 02 creator"
          }
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "funder":{
         "@type": "Organization",
         "sameAs": "https://ror.org/00tgqzw13",
         "name": "National Weather Service"
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"https://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"https://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

في ما يلي مثال على مجموعة بيانات بالترميز RDFa ويستخدم مصطلحات DCAT:


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

الإرشادات

على المواقع الإلكترونية اتّباع إرشادات البيانات المنظَّمة. وبالإضافة إلى إرشادات البيانات المنظَّمة، ننصح باتّباع أفضل الممارسات المتعلقة بخرائط الموقع والمصدر والأصل الواردة أدناه.

أفضل الممارسات المتعلقة بخريطة الموقع

استخدِم خريطة موقع لمساعدة Google في العثور على عناوين URL. ويساعد استخدام خرائط موقع والترميز sameAs في توثيق أسلوب نشر أوصاف مجموعات البيانات في موقعك الإلكتروني.

إذا كان لديك مستودع من مجموعات البيانات، لديك على الأرجح نوعان على الأقل من أنواع الصفحات: الصفحات الأساسية ("الصفحة المقصودة") لكل مجموعة بيانات، والصفحات التي تسرد مجموعات بيانات متعددة (مثل نتائج البحث أو بعض مجموعات بيانات فرعية). وننصحك بإضافة البيانات المنظَّمة المتعلقة بمجموعة البيانات إلى الصفحات الأساسية. ويمكنك استخدام السمة sameAs لإنشاء رابط يؤدي إلى الصفحة الأساسية في حال إضافة بيانات منظَّمة إلى عدّة نُسخ من مجموعة البيانات، مثل بطاقات البيانات الواردة ضمن صفحات نتائج البحث.

أفضل الممارسات المتعلّقة بالمصدر والأصل

يشيع إعادة نشر مجموعات البيانات المفتوحة وتجميعها واستنادها إلى مجموعات بيانات أخرى. في ما يلي مخطط مبدئي لأسلوبنا في تمثيل المواقف التي تكون فيها مجموعة البيانات نسخة من مجموعة أخرى أو مستندة إليها بشكل آخر.

  • استخدِم السمة sameAs للإشارة إلى معظم عناوين URL الأساسية للأصل في الحالات التي تكون فيها مجموعة البيانات أو الوصف عبارة عن إعادة نشر لمواد منشورة في مكان آخر. ويجب أن تشير قيمة sameAs بوضوح إلى هوية مجموعة البيانات. وبعبارة أخرى، لا تستخدم قيمة sameAs نفسها لمجموعتَي بيانات مختلفتَين.
  • استخدِم السمة isBasedOn في الحالات التي تم فيها إجراء تغيير كبير على قاعدة البيانات المُعاد نشرها (بما في ذلك بياناتها الوصفية).
  • استخدِم السمة isBasedOn عندما تكون مجموعة البيانات مشتقة من عدة أصول أو مجمّعة منها.
  • استخدِم السمة identifier لإرفاق معرّفات الكائنات الرقمية (DOI) ذات الصلة أو المعرّفات المضغوطة. إذا كانت مجموعة البيانات تحتوي على أكثر من معرّف، يمكنك استخدام الخاصية identifier مجددًا. وعند استخدام JSON-LD، يمكن تمثيل ذلك باستخدام بنية قائمة JSON.

ونأمل في تحسين اقتراحاتنا استنادًا إلى التعليقات الواردة إلينا، لا سيما في ما يخص وصف الأصل ومنح أرقام للإصدارات والتواريخ المرتبطة بنشر السلاسل الزمنية. يرجى الانضمام إلى مناقشات المنتدى.

السمات النصية المقترَحة

ننصح بألا تتجاوز جميع الخصائص النصية حد 5000 حرف. يستخدم &quot;بحث مجموعة البيانات من Google&quot; أول 5,000 حرف فقط من أي سمة نصية. وعادة ما تكون الأسماء والعناوين مكونة من كلمات قليلة أو جملة قصيرة.

الأخطاء والتحذيرات المعروفة

قد تظهر أخطاء أو تحذيرات في اختبار النتائج الغنية بصريًا من Google وأنظمة التحقق الأخرى. وقد تقترح أنظمة التحقق على وجه التحديد أن تكون للمؤسسات معلومات اتصال تتضمن السمة contactType. وتشمل القيم المفيدة كلاً من customer service وemergency وjournalist وnewsroom وpublic engagement. ويمكنك كذلك تجاهل الأخطاء على أساس أن csvw:Table هي قيمة غير متوقعة للسمة mainEntity.

تعريفات أنواع البيانات المنظّمة

يجب تضمين السمات المطلوبة حتى يصبح المحتوى مؤهّلاً للعرض كنتيجة غنية بصريًا. ويمكنك أيضًا تضمين السمات المقترَحة لإضافة المزيد من المعلومات المتعلقة بالمحتوى، ما يؤدي إلى تحسين تجربة المستخدم.

يمكنك استخدام اختبار النتائج الغنية بصريًا للتأكّد من صحة الترميز.

ينصب التركيز على وصف معلومات عن مجموعة البيانات (بياناتها الوصفية) وتمثيل محتواها. على سبيل المثال، تذكر البيانات الوصفية لمجموعة البيانات الموضوع الذي تتناوله المجموعة والمتغيرات التي تقيسها ومنشئها ومعلومات أخرى. ولا تحتوي مثلاً على قيم معيّنة للمتغيرات.

Dataset

يتوفَّر تعريف Dataset الكامل على schema.org/Dataset.

يمكنك وصف معلومات إضافية عن نشر مجموعة البيانات، مثل الترخيص أو وقت نشرها أو معرّف الكائن الرقمي لها أو السمة sameAs التي توجِّه إلى نسخة أساسية من مجموعة البيانات في مستودع مختلف. أضِف identifier وlicense وsameAs لمجموعات البيانات التي تقدّم معلومات عن المصدر والترخيص.

في ما يلي السمات المتوافقة مع Google:

السمات المطلوبة
description Text

تمثّل هذه السمة ملخّصًا قصيرًا يصف مجموعة بيانات.

الإرشادات

  • يجب أن يتراوح طول الملخص بين 50 حرفًا و5000 حرف.
  • ويمكن أن يشتمل على بنية Markdown. يجب أن تستخدم الصور المضمّنة عناوين URL لمسارات مطلقة (بدلاً من المسارات النسبية).
  • عند استخدام تنسيق JSON-LD، يمكنك الإشارة إلى الأسطر الجديدة باستخدام \n (حرفان: شرطة مائلة للخلف وحرف n صغير).
name Text

تمثّل هذه السمة اسمًا وصفيًا لمجموعة بيانات، مثل "عمق الثلج في نصف الكرة الشمالي".

الإرشادات

  • استخدِم أسماء فريدة لمجموعات البيانات المميزة إذا أمكن.
  • صيغة محبَّذة: "Snow depth in the Northern Hemisphere" و"Snow depth in the Southern Hemisphere" لمجموعتَي بيانات مختلفتَين.

    صيغة غير محبَّذة: "Snow depth" و "Snow depth" لمجموعتَي بيانات مختلفتَين.

الخصائص المقترَحة
alternateName Text

الأسماء البديلة التي تم استخدامها للإشارة إلى مجموعة البيانات هذه، مثل الأسماء المستعارة أو الاختصارات. مثال (بتنسيق JSON-LD):

"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person أو Organization

تمثّل هذه السمة منشئ أو مؤلّف مجموعة البيانات هذه. لتحديد الأفراد بطريقة فريدة، استخدِم معرّف ORCID باعتباره قيمة الخاصية sameAs من النوع Person. ولتحديد المؤسسات والمنظمات بطريقة فريدة، استخدِم معرّف ROR. مثال (بتنسيق JSON-LD):

"creator": [
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0000",
    "givenName": "Jane",
    "familyName": "Foo",
    "name": "Jane Foo"
  },
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0001",
    "givenName": "Jo",
    "familyName": "Bar",
    "name": "Jo Bar"
  },
  {
    "@type": "Organization",
    "sameAs": "https://ror.org/xxxxxxxxx",
    "name": "Fictitious Research Consortium"
  }
]
citation Text أو CreativeWork

للإشارة إلى المقالات الأكاديمية التي يوصي مقدّم البيانات بالإشارة إليها إلى جانب مجموعة البيانات نفسها. يمكنك تقديم معلومات المقالة لمجموعة البيانات نفسها مع خصائص أخرى، مثل خصائص name وidentifier وcreator وpublisher. على سبيل المثال، يمكن لهذه الخاصية تمييز منشور أكاديمي ذي صلة، مثل أداة توصيف بيانات أو ورقة بيانات أو مقالة تمثل مجموعة البيانات هذه مادة أساسية فيها. على سبيل المثال، (بتنسيق JSON-LD):

"citation": "https://doi.org/10.1111/111"
"citation": "https://identifiers.org/pubmed:11111111"
"citation": "https://identifiers.org/arxiv:0111.1111v1"
"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

إرشادات إضافية

  • لا تستخدم هذه السمة لتقديم معلومات المقالة لمجموعة البيانات نفسها. الهدف من هذه السمة هو تحديد المقالات الأكاديمية ذات الصلة، وليس مجموعة البيانات بحد ذاتها. لتقديم المعلومات اللازمة للإشارة إلى مجموعة البيانات نفسها، استخدِم الخصائص name وidentifier وcreator وpublisher كخيار بديل.
  • عند تعبئة خاصية معلومات المقالة بمقتطف معلومات مقالة، عليك إدراج معرّف المقالة (مثل DOI) متى أمكن ذلك.

    صيغة محبَّذة: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    صيغة غير محبَّذة: "Doe J (2014) Influence of X. Biomics 1(1)."

funder Person أو Organization

تمثّل هذه السمة شخصًا أو مؤسسة تقدم الدعم المالي لمجموعة البيانات هذه. لتحديد الأفراد بطريقة فريدة، استخدِم معرّف ORCID باعتباره قيمة السمةsameAs من النوع Person. ولتحديد المؤسسات والمنظمات بطريقة فريدة، استخدِم معرّف ROR. مثال (بتنسيق JSON-LD):

"funder": [
  {
    "@type": "Person",
    "sameAs": "https://orcid.org/0000-0000-0000-0002",
    "givenName": "Jane",
    "familyName": "Funder",
    "name": "Jane Funder"
  },
  {
    "@type": "Organization",
    "sameAs": "https://ror.org/yyyyyyyyy",
    "name": "Fictitious Funding Organization"
  }
]
hasPart أو isPartOf URL أو Dataset

إذا كانت مجموعة البيانات تضم مجموعات بيانات أصغر، استخدِم خاصية hasPart للإشارة إلى هذه العلاقة. وعلى العكس من ذلك، إذا كانت مجموعة البيانات جزءًا من مجموعة بيانات أكبر، استخدِم isPartOf. ويمكن أن تكون كلتا الخاصيتَين على شكل عنوان URL أو مثال Dataset. في حال استخدام Dataset كقيمة، يجب أن تتضمن جميع الخصائص المطلوبة لعنصر Dataset مستقل. أمثلة:

"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license": "https://creativecommons.org/publicdomain/zero/1.0/",
    "creator": {
      "@type":"Organization",
      "name": "Sub dataset 01 creator"
    }
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license": "https://creativecommons.org/publicdomain/zero/1.0/",
    "creator": {
      "@type":"Organization",
      "name": "Sub dataset 02 creator"
    }
  }
]
"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL أو Text أو PropertyValue

معرّف، مثل DOI أو معرّف مضغوط. إذا كانت مجموعة البيانات تحتوي على أكثر من معرّف، استخدِم الخاصية identifier مجددًا. وعند استخدام JSON-LD، يمكن تمثيل ذلك باستخدام بنية قائمة JSON.

isAccessibleForFree Boolean

ما إذا كان من الممكن الوصول إلى مجموعة البيانات بدون دفع.

keywords Text

تمثّل هذه السمة الكلمات الرئيسية التي تلخّص مجموعة البيانات.

license URL أو CreativeWork

تمثّل هذه الخاصية ترخيصًا يتم بموجبه توزيع مجموعة البيانات. مثلاً:

"license" : "https://creativecommons.org/publicdomain/zero/1.0/"
"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

إرشادات إضافية

  • يجب توفير عنوان URL يعرّف بوضوح إصدارًا محددًا من الترخيص المُستخدَم.

    عنوان محبَّذ

    "license" : "https://creativecommons.org/licenses/by/4.0"

    عنوان غير محبَّذ

    "license" : "https://creativecommons.org/licenses/by"
measurementTechnique Text أو URL

التقنية أو التكنولوجيا أو المنهجية المستخدمة في مجموعة بيانات، والتي يمكن أن تتوافق مع المتغيرات الموضّحة في variableMeasured.

sameAs URL

تمثّل هذه الخاصية عنوان URL لصفحة ويب مرجعية تشير بوضوح إلى هوية مجموعة البيانات.

spatialCoverage Text أو Place

يمكنك توفير نقطة واحدة تصف الجانب المكاني لمجموعة البيانات. وتُستخدَم هذه السمة فقط إذا كان للمجموعة بُعد مكاني. على سبيل المثال، نقطة واحدة يتم فيها تجميع كل القياسات أو إحداثيات مربع الإحاطة بمنطقة.

النقاط

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

الأشكال

يمكنك استخدام GeoShape لوصف المناطق ذات الأشكال المختلفة، مثل تحديد مربع الإحاطة.

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

يجب التعبير عن النقاط داخل الخصائص box أو circle أو line أو polygon باعتبارها أزواجًا من القيم تفصل بينها مسافات وتشير إلى خط العرض وخط الطول (بهذا الترتيب).

المواقع الجغرافية التي لها أسماء

"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

تغطي البيانات الموجودة في مجموعة البيانات فاصلاً زمنيًا محددًا. وتُستخدَم هذه السمة فقط إذا كان للمجموعة بُعد زماني. يستخدم مخطط Schema.org المعيار ISO 8601 لوصف الفواصل الزمنية والنقاط الزمنية. يمكنك وصف التواريخ بشكل مختلف تبعًا للفاصل الزمني لمجموعة البيانات. أشِر إلى الفواصل الزمنية المفتوحة بنقطتين عشريتين (..).

تاريخ واحد

"temporalCoverage" : "2008"

فترة زمنية

"temporalCoverage" : "1950-01-01/2013-12-18"

فترة زمنية مفتوحة

"temporalCoverage" : "2013-12-19/.."
variableMeasured Text أو PropertyValue

تمثّل هذه السمة المتغيّر الذي تقيسه مجموعة البيانات، مثل درجة الحرارة أو الضغط.

version Text أو Number

تمثّل هذه السمة رقم نسخة مجموعة البيانات.

url URL

تمثّل هذه السمة مكان صفحة تصف مجموعة البيانات.

DataCatalog

يتوفّر تعريف DataCatalog الكامل على schema.org/DataCatalog.

غالبًا ما يتم نشر مجموعات البيانات في مستودعات تحتوي على الكثير من مجموعات البيانات الأخرى. لذلك، يمكن تضمين مجموعة البيانات نفسها في أكثر من مستودع واحد. يمكنك الإشارة إلى كتالوج البيانات الذي تنتمي إليه مجموعة البيانات هذه من خلال الإشارة إليها مباشرةً باستخدام السمات التالية:

السمات المقترَحة
includedInDataCatalog DataCatalog

تمثّل هذه السمة القائمة الذي تنتمي إليها مجموعة البيانات.

DataDownload

يتوفّر تعريف DataDownload الكامل على schema.org/DataDownload. إلى جانب سمات &quot;مجموعة البيانات&quot;، أضِف السمات التالية إلى مجموعات البيانات التي توفّر خيارات للتنزيل.

تصف الخاصية distribution طريقة الحصول على مجموعة البيانات نفسها لأن عنوان URL غالبًا ما يوجّه إلى الصفحة المقصودة التي تصف مجموعة البيانات. تصف السمة distribution مكان البيانات وتنسيقها. يمكن أن تكون لهذه الخاصية عدة قيم: مثل نسخة ملف CSV لها عنوان URL واحد ونسخة ملف Excel متاحة على عنوان مختلف.

الخصائص المطلوبة
distribution.contentUrl URL

تمثل هذه السمة رابط التنزيل.

الخصائص المقترَحة
distribution DataDownload

تمثّل هذه السمة وصفًا للمكان الذي سيتم فيه تنزيل مجموعة البيانات وتنسيق الملف المُراد تنزيله.

distribution.encodingFormat Text أو URL

تمثل هذه السمة تنسيق الملف المُراد توزيعه.

مجموعة البيانات الجدولية

مجموعة البيانات الجدولية هي مجموعة بيانات يتم تنظيمها أساسًا في شكل شبكة من الصفوف والأعمدة. في الصفحات التي تتضمن مجموعات بيانات جدولية، يمكنك أيضًا إنشاء ترميز أكثر وضوحًا استنادًا إلى الأسلوب الأساسي. في الوقت الحالي، نفهم صيغة من CSVW ("ملف CSV على الويب"، راجِع W3C)، ويتم توفيرها بالتوازي مع المحتوى الجدولي الموجَّه للمستخدمين على صفحة HTML.

في ما يلي مثال يوضّح جدولاً صغيرًا تم ترميزه بالتنسيق CSVW JSON-LD. يعرض اختبار النتائج الغنية بصريًا بعض الأخطاء المعروفة.


<html>
  <head>
    <title>American Humane Association</title>
    <script type="application/ld+json">
    {
      "@context": ["https://schema.org", {"csvw": "https://www.w3.org/ns/csvw#"}],
      "@type": "Dataset",
      "name":"AMERICAN HUMANE ASSOCIATION",
      "description": "ProPublica's Nonprofit Explorer lets you view summaries of 2.2 million tax returns from tax-exempt organizations and see financial details such as their executive compensation and revenue and expenses. You can browse raw IRS data released since 2013 and access over 9.4 million tax filing documents going back as far as 2001.",
      "publisher": {
        "@type": "Organization",
        "name": "ProPublica"
      },
      "mainEntity" : {
        "@type" : "csvw:Table",
        "csvw:tableSchema": {
          "csvw:columns": [
            {
              "csvw:name": "Year",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "2016",
                  "csvw:primaryKey": "2016"
                },
                {
                  "csvw:value": "2015",
                  "csvw:primaryKey": "2015"
                }]
            },
            {
              "csvw:name": "Organization name",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2016"
                },
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2015"
                }]
            },
            {
              "csvw:name": "Organization address",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2016"
                },
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2015"
                }]
            },
            {
              "csvw:name": "Organization NTEE Code",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2016"
                },
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2015"
                }]
            },
            {
              "csvw:name": "Total functional expenses ($)",
              "csvw:datatype": "integer",
              "csvw:cells": [
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2016"
                },
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2015"
                }]
            }]
        }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

مراقبة النتائج المنسّقة باستخدام Search Console

Search Console هي أداة تساعدك في مراقبة مستوى أداء صفحاتك في &quot;بحث Google&quot;. ليس عليك الاشتراك في Search Console لإدراج موقعك الإلكتروني ضمن نتائج &quot;بحث Google&quot;، ولكن تساعدك هذه الأداة في التعرّف على شكل موقعك كما يراه محرّك البحث Google وتحسين هذا الشكل. ننصح بالتحقق من Search Console في الحالات التالية:

  1. بعد نشر بيانات منظَّمة للمرة الأولى
  2. بعد إصدار نماذج جديدة أو تعديل الترميز
  3. تحليل الزيارات بشكل دوري

بعد نشر بيانات منظَّمة للمرة الأولى

بعد أن ينتهي محرّك بحث Google من فهرسة الصفحات، تحقَّق مما إذا كان هناك أي مشاكل باستخدام تقرير &quot;حالة النتائج المنسّقة&quot; المناسب. من المفترض أن ترى زيادة في العناصر الصالحة وليس في العناصر غير الصالحة. إذا عثرت على مشاكل في بياناتك المنظَّمة:

  1. أصلِح العناصر غير الصالحة.
  2. افحص عنوان URL منشور لمعرفة ما إذا لا تزال المشكلة مستمرّة.
  3. اطلب إجراء تحقُّق من الإصلاحات باستخدام تقرير الحالة.

بعد إصدار نماذج جديدة أو تعديل الترميز

عندما تُجري تغييرات كبيرة على موقعك الإلكتروني، عليك مراقبة الزيادات في عدد العناصر غير الصالحة ضمن البيانات المنظَّمة.
  • إذا لاحظت زيادة في عدد العناصر غير الصالحة، قد يكون السبب أنّك طرحت نموذجًا جديدًا لا يعمل أو أنّ موقعك الإلكتروني يتفاعل مع النموذج الحالي بطريقة جديدة وغير صحيحة.
  • إذا لاحظت انخفاضًا في العناصر الصالحة (لا تقابله زيادة في عدد العناصر غير الصالحة)، قد يشير ذلك إلى أنّك توقّفت عن تضمين بيانات منظَّمة في صفحاتك. استخدِم أداة فحص عنوان URL للاطّلاع على سبب المشكلة.

تحليل الزيارات بشكل دوري

يمكنك تحليل الزيارات إلى صفحتك في &quot;بحث Google&quot; باستخدام تقرير الأداء. ستعرض لك البيانات عدد مرات ظهور صفحتك كنتيجة منسّقة في &quot;بحث Google&quot; وعدد المرات التي نقر فيها المستخدمون على الصفحة ومتوسط موضع ظهور الصفحة في نتائج البحث. يمكنك أيضًا عرض هذه النتائج تلقائيًا باستخدام Search Console API.

تحديد المشاكل وحلّها

إذا كنت تواجه مشكلة في تطبيق البيانات المنظَّمة أو تصحيح الأخطاء فيها، إليك بعض المراجع التي قد تساعدك.

عدم ظهور مجموعة بيانات محددة في نتائج &quot;بحث مجموعة البيانات&quot;

سبب المشكلة: لا يحتوي موقعك الإلكتروني على بيانات منظَّمة في الصفحة التي تصف مجموعات البيانات أو لم يتم الزحف إلى الصفحة بعد.

حلّ المشكلة

  1. انسخ رابط الصفحة التي تتوقّع رؤيتها في نتائج &quot;بحث مجموعة البيانات&quot;، والصقه في اختبار النتائج الغنية بصريًا. إذا ظهرت الرسالة "الصفحة غير مؤهّلة للنتائج الغنية بصريًا المعروفة في هذا الاختبار" أو "ليس كل الترميز مؤهّلاً للحصول على النتائج الغنية بصريًا"، هذا يعني أنّه ليس هناك ترميز لمجموعة البيانات في الصفحة أو أنّ الترميز غير صحيح. يمكنك إصلاح هذه المشكلة من خلال الرجوع إلى القسم كيفية إضافة بيانات منظَّمة.
  2. إذا كانت الصفحة تتضمّن ترميزًا، من الممكن أنه لم يتم الزحف إليها بعد. يمكنك التحقق من حالة الزحف باستخدام Search Console.

شعار الشركة غير متوفّر أو لا يظهر بشكل صحيح في النتائج.

سبب المشكلة: ربما تفتقد صفحتك إلى ترميز schema.org لشعارات المؤسسة أو أنّ نشاطك التجاري لم يتم ربطه بحساب Google.

حلّ المشكلة

  1. إضافة بيانات الشعار المنظَّمة إلى صفحتك
  2. إضافة تفاصيل نشاطك التجاري إلى Google