ชุดข้อมูล

เราจะพบชุดข้อมูลได้ง่ายขึ้นเมื่อคุณให้ข้อมูลสนับสนุน เช่น ชื่อ คำอธิบาย ผู้สร้าง และรูปแบบการเผยแพร่เป็นข้อมูลที่มีโครงสร้าง วิธีการค้นพบชุดข้อมูลของ Google ใช้ประโยชน์จาก schema.org และมาตรฐานข้อมูลเมตาอื่นๆ ที่เพิ่มลงในหน้าที่อธิบายชุดข้อมูลได้ วัตถุประสงค์ของมาร์กอัปนี้คือการปรับปรุงการค้นพบชุดข้อมูลจากสาขาต่างๆ เช่น วิทยาศาสตร์ชีวภาพ สังคมศาสตร์ แมชชีนเลิร์นนิง ข้อมูลภาคพลเมืองและภาครัฐ เป็นต้น คุณค้นหาชุดข้อมูลได้โดยใช้เครื่องมือ Dataset Search

ตัวอย่างของ Dataset Search

ต่อไปนี้คือตัวอย่างของสิ่งที่จัดว่าเป็นชุดข้อมูล

  • ตารางหรือไฟล์ CSV ที่มีข้อมูล
  • คอลเล็กชันตารางที่มีการจัดระเบียบ
  • ไฟล์ในรูปแบบกรรมสิทธิ์ที่มีข้อมูล
  • คอลเล็กชันไฟล์ที่ประกอบกันขึ้นเป็นชุดข้อมูลที่มีความหมาย
  • ออบเจ็กต์ที่มีโครงสร้างซึ่งมีข้อมูลในรูปแบบอื่นที่คุณอาจต้องโหลดลงในเครื่องมือพิเศษเพื่อการประมวลผล
  • รูปภาพที่มีข้อมูล
  • ไฟล์เกี่ยวกับแมชชีนเลิร์นนิง เช่น พารามิเตอร์ที่เทรนไว้ หรือคำจำกัดความโครงสร้างของโครงข่ายระบบประสาทเทียม
  • ทุกอย่างที่ดูเหมือนชุดข้อมูลสำหรับคุณ

วิธีเพิ่มข้อมูลที่มีโครงสร้าง

ข้อมูลที่มีโครงสร้างคือรูปแบบมาตรฐานในการแจ้งข้อมูลเกี่ยวกับหน้าและจำแนกประเภทเนื้อหาของหน้า หากคุณเพิ่งใช้ข้อมูลที่มีโครงสร้างเป็นครั้งแรก โปรดดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีการทำงานของข้อมูลที่มีโครงสร้าง

ต่อไปนี้เป็นภาพรวมเกี่ยวกับวิธีสร้าง ทดสอบ และเผยแพร่ข้อมูลที่มีโครงสร้าง ดูคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีเพิ่มข้อมูลที่มีโครงสร้างลงในหน้าเว็บได้ใน Codelab สำหรับข้อมูลที่มีโครงสร้าง

  1. เพิ่มพร็อพเพอร์ตี้ที่จำเป็น หากต้องการทราบเกี่ยวกับตำแหน่งการวางข้อมูลที่มีโครงสร้างในหน้าเว็บ โปรดดูข้อมูลที่มีโครงสร้างของ JSON-LD: ตำแหน่งที่จะแทรกในหน้าเว็บ
  2. ปฏิบัติตามหลักเกณฑ์
  3. ตรวจสอบความถูกต้องของโค้ดโดยใช้การทดสอบผลการค้นหาที่เป็นสื่อสมบูรณ์
  4. ทำให้หน้าบางหน้าที่มีข้อมูลที่มีโครงสร้างใช้งานได้และใช้เครื่องมือตรวจสอบ URL เพื่อทดสอบว่า Google เห็นหน้าในลักษณะใด ตรวจสอบว่า Google เข้าถึงหน้าดังกล่าวได้และไม่มีการบล็อกหน้าด้วยไฟล์ robots.txt, แท็ก noindex หรือข้อกำหนดให้เข้าสู่ระบบ หากหน้าเว็บดูถูกต้องดีแล้ว ก็ขอให้ Google รวบรวมข้อมูล URL อีกครั้งได้
  5. หากต้องการให้ Google ทราบถึงการเปลี่ยนแปลงที่จะเกิดขึ้นในอนาคตอยู่ตลอด เราขอแนะนำให้คุณส่งแผนผังเว็บไซต์ ซึ่งกำหนดให้ดำเนินการแบบอัตโนมัติได้โดยใช้ Search Console Sitemap API

การลบชุดข้อมูลออกจากผลการค้นหาของ Dataset Search

หากไม่ต้องการให้ชุดข้อมูลแสดงในผลการค้นหาของ Dataset Search ให้ใช้เมตาแท็ก robots เพื่อควบคุมวิธีจัดทำดัชนีชุดข้อมูล โปรดทราบว่าอาจใช้เวลาสักระยะ (หลายวันหรือหลายสัปดาห์ ขึ้นอยู่กับกำหนดการรวบรวมข้อมูล) กว่าการเปลี่ยนแปลงจะสะท้อนให้เห็นใน Dataset Search

วิธีการค้นพบชุดข้อมูลของเรา

เราทำความเข้าใจข้อมูลที่มีโครงสร้างในหน้าเว็บเกี่ยวกับชุดข้อมูลได้โดยใช้มาร์กอัป Dataset ของ schema.org หรือโครงสร้างที่เทียบเท่าซึ่งนำเสนออยู่ในรูปแบบคำศัพท์แคตตาล็อกข้อมูล (DCAT) ของ W3C เรายังลองทดสอบการรองรับข้อมูลที่มีโครงสร้างโดยอิงตาม W3C CSVW ด้วย และคาดว่าจะพัฒนาและปรับเปลี่ยนวิธีการของเราเมื่อมีแนวทางปฏิบัติที่ดีที่สุดใหม่ๆ เกิดขึ้นสำหรับการอธิบายชุดข้อมูล ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีการค้นพบชุดข้อมูลของเราได้ที่การทำให้ค้นพบชุดข้อมูลได้ง่ายขึ้น

ตัวอย่าง

นี่คือตัวอย่างของชุดข้อมูลที่ใช้ JSON-LD และไวยากรณ์ตาม schema.org (แนะนำ) ในการทดสอบผลการค้นหาที่เป็นสื่อสมบูรณ์ คำศัพท์คำเดียวกันตาม schema.org ยังใช้ในไวยากรณ์ RDFa 1.1 หรือ Microdata ได้ด้วย หรือคุณจะใช้คำศัพท์ W3C DCAT เพื่ออธิบายข้อมูลเมตาก็ได้เช่นกัน ตัวอย่างต่อไปนี้อิงตามคำอธิบายชุดข้อมูลที่มีการใช้งานจริง

JSON-LD

นี่คือตัวอย่างชุดข้อมูล JSON-LD


  <html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

นี่คือตัวอย่างชุดข้อมูล RDFa ที่ใช้คำศัพท์ DCAT


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

หลักเกณฑ์

เว็บไซต์ต้องเป็นไปตามหลักเกณฑ์เกี่ยวกับข้อมูลที่มีโครงสร้าง นอกเหนือจากหลักเกณฑ์เกี่ยวกับข้อมูลที่มีโครงสร้างแล้ว เราขอแนะนำให้ทำตามแนวทางปฏิบัติที่ดีที่สุดสำหรับแผนผังเว็บไซต์และแหล่งที่มาและต้นทางต่อไปนี้ด้วย

แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับแผนผังเว็บไซต์

โปรดใช้ไฟล์แผนผังเว็บไซต์เพื่อช่วยให้ Google พบ URL ของคุณ การใช้ไฟล์แผนผังเว็บไซต์และมาร์กอัป sameAs ช่วยบันทึกวิธีเผยแพร่คำอธิบายชุดข้อมูลทั่วทุกที่ในเว็บไซต์ของคุณ

หากคุณมีที่เก็บชุดข้อมูล เป็นไปได้ว่าคุณมีหน้า Canonical ("Landing Page") อย่างน้อย 2 ประเภทสำหรับชุดข้อมูลแต่ละชุดและหน้าที่แสดงรายการชุดข้อมูลหลายรายการ (เช่น ผลการค้นหาหรือชุดข้อมูลบางชุด) เราขอแนะนำให้คุณเพิ่มข้อมูลที่มีโครงสร้างเกี่ยวกับชุดข้อมูลลงในหน้า Canonical ใช้พร็อพเพอร์ตี้ sameAs เพื่อลิงก์หน้า Canonical หากคุณเพิ่มข้อมูลที่มีโครงสร้างลงในสำเนาชุดข้อมูลหลายสำเนา เช่น ข้อมูลในหน้าผลการค้นหา

แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับแหล่งที่มาและต้นทาง

ชุดข้อมูลแบบเปิดอาจมีการเผยแพร่ต่อ การรวม และการอิงตามชุดข้อมูลอื่นๆ เป็นเรื่องปกติ นี่คือข้อมูลสรุปเบื้องต้นเกี่ยวกับวิธีการนำเสนอสถานการณ์ที่ชุดข้อมูลหนึ่งอิงตามหรือเป็นสำเนาของชุดข้อมูลอื่น

  • ใช้พร็อพเพอร์ตี้ sameAs เพื่อระบุ Canonical URL ที่ตรงกันมากที่สุดของต้นฉบับในกรณีที่ชุดข้อมูลหรือคำอธิบายเป็นเพียงการเผยแพร่ซ้ำเนื้อหาที่เผยแพร่ไว้ที่อื่น ค่าของ sameAs ต้องระบุเอกลักษณ์ของชุดข้อมูลอย่างชัดเจน ซึ่งก็คือชุดข้อมูลสองชุดที่ต่างกันไม่ควรใช้ URL เดียวกันกับค่าของ sameAs
  • ใช้พร็อพเพอร์ตี้ isBasedOn ในกรณีที่ชุดข้อมูลที่เผยแพร่ซ้ำ (รวมถึงข้อมูลเมตา) มีการเปลี่ยนแปลงไปอย่างมาก
  • เมื่อชุดข้อมูลดัดแปลงมาจากหรือรวมมาจากต้นฉบับหลายรายการ ให้ใช้พร็อพเพอร์ตี้ isBasedOn
  • ใช้พร็อพเพอร์ตี้ identifier เพื่อแนบDigital Object Identifier (DOI) หรือ Compact Identifier ใดก็ตามที่เกี่ยวข้อง ถ้าชุดข้อมูลมีตัวระบุมากกว่า 1 ตัว ให้ใช้พร็อพเพอร์ตี้ identifier ซ้ำ หากใช้ JSON-LD ระบบจะแสดงโดยใช้รูปแบบรายการ JSON

เราต้องการปรับปรุงคำแนะนำของเราโดยอิงตามความคิดเห็น โดยเฉพาะอย่างยิ่งในเรื่องคำอธิบายต้นทาง การกำหนดเวอร์ชัน และวันที่ที่เชื่อมโยงกับการเผยแพร่ตามอนุกรมเวลา โปรดเข้าร่วมในการสนทนาของชุมชน

คำแนะนำพร็อพเพอร์ตี้แบบข้อความ

เราขอแนะนำให้จำกัดพร็อพเพอร์ตี้แบบข้อความทั้งหมดไว้ไม่เกิน 5,000 อักขระ Google Dataset Search จะใช้เพียง 5,000 อักขระแรกของพร็อพเพอร์ตี้แบบข้อความแต่ละรายการ โดยปกติชื่อกับหัวข้อจะเป็นประโยคสั้นๆ หรือมีเพียงไม่กี่คำ

ข้อผิดพลาดและคำเตือนที่ทราบ

คุณอาจพบข้อผิดพลาดหรือคำเตือนในเครื่องมือทดสอบข้อมูลที่มีโครงสร้างของ Google และระบบตรวจสอบความถูกต้องอื่นๆ โดยเฉพาะอย่างยิ่ง ระบบตรวจสอบความถูกต้องอาจแนะนำให้องค์กรมีข้อมูลติดต่อ ซึ่งรวมถึง contactType ในกรณีนี้ ค่าที่เป็นประโยชน์ ได้แก่ customer service, emergency, journalist, newsroom และ public engagement และคุณไม่จำเป็นต้องสนใจข้อผิดพลาดที่ csvw:Table เป็นค่าที่ไม่คาดคิดของพร็อพเพอร์ตี้ mainEntity ด้วย

คำจำกัดความของประเภทข้อมูลที่มีโครงสร้าง

คุณต้องใส่พร็อพเพอร์ตี้ที่จำเป็นลงในเนื้อหาเพื่อให้มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นสื่อสมบูรณ์ คุณอาจใส่พร็อพเพอร์ตี้ที่แนะนำด้วยเพื่อให้ข้อมูลเพิ่มเติมเกี่ยวกับเนื้อหา ซึ่งจะช่วยให้ผู้ใช้ได้รับประสบการณ์ที่ดียิ่งขึ้น

คุณใช้เครื่องมือทดสอบข้อมูลที่มีโครงสร้างเพื่อตรวจสอบความถูกต้องของมาร์กอัปได้

สิ่งสำคัญคือการอธิบายข้อมูลเกี่ยวกับชุดข้อมูล (ข้อมูลเมตา) และการนำเสนอเนื้อหา เช่น ข้อมูลเมตาของชุดข้อมูลจะบอกว่าชุดข้อมูลนั้นเกี่ยวกับอะไร ตัวแปรที่วัดมีอะไรบ้าง ใครเป็นผู้สร้างชุดข้อมูล และอื่นๆ แต่จะไม่มีค่าที่เจาะจงของตัวแปร เป็นต้น

Dataset

ดูคำจำกัดความที่สมบูรณ์ของ Dataset ได้ที่ schema.org/Dataset

คุณบรรยายข้อมูลเพิ่มเติมเกี่ยวกับสิ่งพิมพ์ของชุดข้อมูลได้ เช่น ใบอนุญาต, เวลาที่เผยแพร่, DOI ของชุดข้อมูล หรือ sameAs ที่ชี้ไปยังเวอร์ชัน Canonical ของชุดข้อมูลในที่เก็บอื่น ใส่ identifier, license และ sameAs สำหรับชุดข้อมูลที่มีต้นทางและข้อมูลใบอนุญาต

พร็อพเพอร์ตี้ที่จำเป็น
description Text

สรุปสั้นๆ ที่อธิบายเกี่ยวกับชุดข้อมูล

หลักเกณฑ์

  • สรุปต้องมีความยาวระหว่าง 50 ถึง 5,000 อักขระ
  • ในสรุปอาจใส่รูปแบบ Markdown ด้วยก็ได้ รูปภาพที่ฝังจะต้องใช้เส้นทาง URL แบบสัมบูรณ์ (ไม่ใช่เส้นทางแบบสัมพัทธ์)
  • เมื่อใช้รูปแบบ JSON-LD ให้แสดงบรรทัดใหม่ด้วย \n (มีอักขระ 2 ตัวคือ แบ็กสแลชและอักษร "n" ตัวพิมพ์เล็ก)
name Text

ชื่อที่สื่อความหมายของชุดข้อมูล เช่น "ความลึกของหิมะในซีกโลกเหนือ"

หลักเกณฑ์

  • ใช้ชื่อที่ไม่ซ้ำกันสำหรับชุดข้อมูลที่แตกต่างกันเมื่อใดก็ตามที่ทำได้
  • แนะนำ: "Snow depth in the Northern Hemisphere" และ "Snow depth in the Southern Hemisphere" สำหรับชุดข้อมูล 2 ชุดที่แตกต่างกัน

    ไม่แนะนํา: "Snow depth" และ "Snow depth" สําหรับชุดข้อมูล 2 ชุดที่แตกต่างกัน

พร็อพเพอร์ตี้ที่แนะนำ
alternateName Text

ชื่ออื่นที่ใช้เพื่ออ้างถึงชุดข้อมูลนี้ เช่น ชื่อแทนหรือคำย่อ ตัวอย่าง (ในรูปแบบ JSON-LD)


"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person หรือ Organization

ผู้สร้างหรือผู้เขียนชุดข้อมูลนี้ ใช้ ORCID ID เป็นค่าของพร็อพเพอร์ตี้ sameAs ประเภท Person เพื่อระบุตัวตนของบุคคลโดยไม่ซ้ำ ใช้ ROR ID เพื่อระบุสถาบันและองค์กรโดยไม่ซ้ำ ตัวอย่าง (ในรูปแบบ JSON-LD)


"creator": [
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0000",
        "givenName": "Jane",
        "familyName": "Foo",
        "name": "Jane Foo"
    },
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0001",
        "givenName": "Jo",
        "familyName": "Bar",
        "name": "Jo Bar"
    },
    {
        "@type": "Organization",
        "sameAs": "http://ror.org/xxxxxxxxx",
        "name": "Fictitious Research Consortium"
    }
]
citation Text หรือ CreativeWork

ระบุบทความทางวิชาการที่ผู้ให้ข้อมูลแนะนำให้อ้างอิงนอกเหนือจากตัวชุดข้อมูล ระบุการอ้างอิงสำหรับชุดข้อมูลด้วยพร็อพเพอร์ตี้อื่น เช่น name, identifier, creator และ publisher ตัวอย่างเช่น พร็อพเพอร์ตี้นี้ระบุสิ่งพิมพ์ทางวิชาการที่เกี่ยวข้องโดยเฉพาะ เช่น ข้อบ่งชี้ข้อมูล เอกสารข้อมูล หรือบทความที่ชุดข้อมูลนี้เป็นส่วนเสริมให้ ตัวอย่าง (ในรูปแบบ JSON-LD)


"citation": "https://doi.org/10.1111/111"

"citation": "https://identifiers.org/pubmed:11111111"

"citation": "https://identifiers.org/arxiv:0111.1111v1"

"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

หลักเกณฑ์เพิ่มเติม

  • อย่าใช้พร็อพเพอร์ตี้นี้สำหรับให้ข้อมูลการอ้างอิงของชุดข้อมูลนั้น ช่องนี้ใช้สำหรับระบุบทความทางวิชาการที่เกี่ยวข้องไม่ใช่ตัวชุดข้อมูลเอง หากต้องการให้ข้อมูลที่จำเป็นสำหรับการอ้างอิงชุดข้อมูลนั้น ให้ใช้พร็อพเพอร์ตี้ name, identifier, creator และ publisher แทน
  • เมื่อใส่ข้อมูลโค้ดในพร็อพเพอร์ตี้อ้างอิง ให้ใส่ตัวระบุบทความ (เช่น DOI) ทุกครั้งที่ทำได้

    แนะนำ: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    ไม่แนะนำ: "Doe J (2014) Influence of X. Biomics 1(1)."

hasPart หรือ isPartOf URL หรือ Dataset

หากชุดข้อมูลนั้นเป็นการรวบรวมชุดข้อมูลขนาดเล็กไว้ด้วยกัน ให้ใช้พร็อพเพอร์ตี้ hasPart เพื่อแสดงความสัมพันธ์ดังกล่าว ในทางกลับกัน ถ้าชุดข้อมูลนั้นเป็นส่วนหนึ่งของชุดข้อมูลที่มีขนาดใหญ่กว่า ให้ใช้ isPartOf พร็อพเพอร์ตี้ทั้งสองจะอยู่ในรูปแบบ URL หรืออินสแตนซ์ Dataset ก็ได้ ในกรณีที่ใช้ Dataset เป็นค่าหนึ่ง ก็จะต้องรวมพร็อพเพอร์ตี้ทั้งหมดที่จำเป็นสำหรับ Dataset ที่ใช้งานเดี่ยวๆ ตัวอย่าง


"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  }
]

"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL, Text หรือ PropertyValue

ตัวระบุ เช่น DOI หรือ Compact Identifier ถ้าชุดข้อมูลมีตัวระบุมากกว่า 1 ตัว ให้ใช้พร็อพเพอร์ตี้ identifier ซ้ำ หากใช้ JSON-LD ระบบจะแสดงโดยใช้รูปแบบรายการ JSON

keywords Text

คีย์เวิร์ดที่สรุปชุดข้อมูล

license URL หรือ CreativeWork

ใบอนุญาตการเผยแพร่ของชุดข้อมูล เช่น


"license" : "https://creativecommons.org/publicdomain/zero/1.0/"

"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

หลักเกณฑ์เพิ่มเติม

  • ระบุ URL ที่บอกเวอร์ชันของใบอนุญาตที่ใช้อย่างชัดเจน

    แนะนำ

    
    "license" : "https://creativecommons.org/licenses/by/4.0"

    ไม่แนะนำ

    
    "license" : "https://creativecommons.org/licenses/by"
measurementTechnique Text หรือ URL

เทคนิค เทคโนโลยี หรือระเบียบวิธีที่ใช้ในชุดข้อมูล ซึ่งสอดคล้องกับตัวแปรที่อธิบายไว้ใน variableMeasured

sameAs URL

URL ของหน้าเว็บอ้างอิงที่ระบุตัวตนของชุดข้อมูลอย่างชัดเจน

spatialCoverage Text หรือ Place

คุณอาจระบุจุดจุดเดียวที่อธิบายแง่มุมด้านตำแหน่งของชุดข้อมูล โปรดระบุพร็อพเพอร์ตี้นี้เมื่อชุดข้อมูลมีมิติข้อมูลเกี่ยวกับตำแหน่งเท่านั้น เช่น จุดจุดเดียวที่มีการรวบรวมการวัดทั้งหมด หรือพิกัดของกรอบพื้นที่

จุด


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

รูปทรง

โปรดใช้ GeoShape เพื่ออธิบายพื้นที่ที่มีรูปทรงต่างๆ เช่น การระบุกรอบพื้นที่


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

จุดในพร็อพเพอร์ตี้ box, circle, line หรือ polygon ต้องใช้การเว้นวรรคสำหรับแยกค่า 2 ค่าตามละติจูดและลองจิจูด (ตามลำดับนั้น)

สถานที่ที่มีชื่อ


"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

ข้อมูลในชุดข้อมูลครอบคลุมช่วงเวลาที่เจาะจง โปรดระบุพร็อพเพอร์ตี้นี้เมื่อชุดข้อมูลมีมิติข้อมูลเวลาเท่านั้น Schema.org ใช้มาตรฐาน ISO 8601 เพื่ออธิบายช่วงเวลาและจุดเวลา คุณอธิบายวันที่ในแบบต่างๆ ได้โดยขึ้นอยู่กับช่วงเวลาของชุดข้อมูล โปรดระบุช่วงเวลาปลายเปิดด้วยจุดทศนิยม 2 จุด (..)

วันเดียว


"temporalCoverage" : "2008"

ระยะเวลา


"temporalCoverage" : "1950-01-01/2013-12-18"

ระยะเวลาปลายเปิด


"temporalCoverage" : "2013-12-19/.."
variableMeasured Text หรือ PropertyValue

ตัวแปรที่ชุดข้อมูลนี้วัด เช่น อุณหภูมิหรือแรงดัน

version Text หรือ Number

หมายเลขเวอร์ชันของชุดข้อมูล

url URL

ตำแหน่งของหน้าที่อธิบายชุดข้อมูล

DataCatalog

ดูคำจำกัดความที่สมบูรณ์ของ DataCatalog ได้ที่ schema.org/DataCatalog

ชุดข้อมูลมักจะเผยแพร่ในที่เก็บที่มีชุดข้อมูลอื่นๆ อีกมากมาย ชุดข้อมูลเดียวกันอาจรวมอยู่ในที่เก็บดังกล่าวมากกว่า 1 ที่ คุณอ้างถึงแคตตาล็อกข้อมูลที่มีชุดข้อมูลนี้อยู่ได้โดยการอ้างอิงแคตตาล็อกโดยตรง

พร็อพเพอร์ตี้ที่แนะนำ
includedInDataCatalog DataCatalog

แคตตาล็อกที่มีชุดข้อมูลอยู่

DataDownload

ดูคำจำกัดความที่สมบูรณ์ของ DataDownload ได้ที่ schema.org/DataDownload นอกเหนือจากพร็อพเพอร์ตี้ Dataset แล้ว โปรดเพิ่มพร็อพเพอร์ตี้ต่อไปนี้สำหรับชุดข้อมูลที่มีตัวเลือกในการดาวน์โหลดด้วย

พร็อพเพอร์ตี้ distribution อธิบายวิธีดูชุดข้อมูลเพราะ URL มักจะชี้ไปที่หน้า Landing Page ที่อธิบายชุดข้อมูล พร็อพเพอร์ตี้ distribution อธิบายตำแหน่งและรูปแบบของข้อมูล พร็อพเพอร์ตี้นี้อาจมีค่าหลายรายการ เช่น เวอร์ชัน CSV มี URL เดียวและเวอร์ชัน Excel อยู่ที่ URL อื่น

พร็อพเพอร์ตี้ที่จำเป็น
distribution.contentUrl URL

ลิงก์สำหรับการดาวน์โหลด

พร็อพเพอร์ตี้ที่แนะนำ
distribution DataDownload

คำอธิบายตำแหน่งของการดาวน์โหลดชุดข้อมูลและรูปแบบไฟล์สำหรับการดาวน์โหลด

distribution.encodingFormat Text หรือ URL

รูปแบบไฟล์ของการเผยแพร่

ชุดข้อมูลแบบตาราง

ชุดข้อมูลแบบตารางคือชุดข้อมูลที่จัดระเบียบเป็นตารางที่มีแถวและคอลัมน์เป็นหลัก สำหรับหน้าที่ฝังชุดข้อมูลแบบตาราง คุณยังสร้างมาร์กอัปที่ชัดเจนยิ่งขึ้นได้ด้วย โดยต่อยอดจากวิธีการพื้นฐานที่อธิบายไว้ข้างต้น ขณะนี้เราเข้าใจ CSVW ("CSV ในเว็บ" โปรดดู W3C) รูปแบบต่างๆ ที่ระบุพร้อมกันกับเนื้อหาแบบตารางสำหรับผู้ใช้ในหน้า HTML

ต่อไปนี้คือตัวอย่างที่แสดงตารางขนาดเล็กที่เข้ารหัสในรูปแบบ CSVW JSON-LD มีข้อผิดพลาดที่ทราบบางอย่างในการทดสอบผลการค้นหาที่เป็นสื่อสมบูรณ์

ตรวจสอบผลการค้นหาที่เป็นสื่อสมบูรณ์ด้วย Search Console

Search Console เป็นเครื่องมือที่ช่วยในการตรวจสอบประสิทธิภาพของหน้าเว็บใน Google Search คุณไม่จำเป็นต้องลงชื่อสมัครใช้ Search Console เพื่อให้เนื้อหาได้แสดงในผลการค้นหาของ Google แต่การลงชื่อสมัครใช้จะช่วยให้คุณเข้าใจและปรับปรุงวิธีที่ Google เห็นเว็บไซต์ได้ เราขอแนะนำให้ไปดูข้อมูลใน Search Console ในกรณีต่อไปนี้

  1. หลังจากทำให้ข้อมูลที่มีโครงสร้างใช้งานได้เป็นครั้งแรก
  2. หลังจากเผยแพร่เทมเพลตใหม่หรืออัปเดตโค้ด
  3. วิเคราะห์การเข้าชมเป็นระยะ

หลังจากทำให้ข้อมูลที่มีโครงสร้างใช้งานได้เป็นครั้งแรก

หลังจากที่ Google ได้จัดทำดัชนีหน้าของคุณแล้ว ให้ตรวจหาปัญหาโดยใช้รายงานสถานะผลการค้นหาที่เป็นสื่อสมบูรณ์ที่เกี่ยวข้อง ตามหลักแล้วคุณควรจะเห็นว่าหน้าที่ถูกต้องนั้นมีจำนวนมากขึ้น และข้อผิดพลาดหรือคำเตือนไม่เพิ่มขึ้น หากพบปัญหาในข้อมูลที่มีโครงสร้าง ให้ทำดังนี้

  1. แก้ไขข้อผิดพลาด
  2. ตรวจสอบ URL ที่เผยแพร่เพื่อดูว่ายังมีปัญหาอยู่หรือไม่
  3. ขอการตรวจสอบโดยใช้รายงานสถานะ

หลังจากเผยแพร่เทมเพลตใหม่หรืออัปเดตโค้ด

เมื่อทำการเปลี่ยนแปลงที่สำคัญในเว็บไซต์ ให้คอยตรวจดูว่ามีข้อผิดพลาดและคำเตือนเกี่ยวกับข้อมูลที่มีโครงสร้างเพิ่มขึ้นไหม
  • หากเห็นว่ามีข้อผิดพลาดเพิ่มขึ้น อาจเป็นเพราะคุณเผยแพร่เทมเพลตใหม่ที่ใช้งานไม่ได้ หรือเว็บไซต์โต้ตอบกับเทมเพลตที่มีอยู่ด้วยวิธีใหม่และไม่ถูกต้อง
  • หากเห็นว่ารายการที่ถูกต้องลดลง (ไม่สอดคล้องกับข้อผิดพลาดที่เพิ่มขึ้น) อาจเป็นเพราะคุณไม่ได้ฝังข้อมูลที่มีโครงสร้างไว้ในหน้าแล้ว ให้ใช้เครื่องมือตรวจสอบ URL เพื่อดูสาเหตุของปัญหา

วิเคราะห์การเข้าชมเป็นระยะ

วิเคราะห์การเข้าชมจาก Google Search โดยใช้รายงานประสิทธิภาพ ข้อมูลจะแสดงความถี่ที่หน้าปรากฏเป็นผลการค้นหาที่เป็นสื่อสมบูรณ์ใน Search ความถี่ที่ผู้ใช้คลิกหน้า และอันดับเฉลี่ยที่หน้าปรากฏในผลการค้นหา หรือคุณจะดึงผลลัพธ์เหล่านี้โดยอัตโนมัติโดยใช้ Search Console API ก็ได้เช่นกัน

การแก้ปัญหา

หากประสบปัญหาในการใช้ข้อมูลที่มีโครงสร้าง โปรดดูแหล่งข้อมูลต่อไปนี้ซึ่งอาจช่วยคุณได้

ชุดข้อมูลที่เฉพาะเจาะจงไม่แสดงในผลการค้นหาของ Dataset Search

สาเหตุของปัญหา: เว็บไซต์ของคุณไม่มีข้อมูลที่มีโครงสร้างในหน้าเว็บที่อธิบายชุดข้อมูลนั้น หรือยังไม่มีการรวบรวมข้อมูลหน้าเว็บนั้น

แก้ปัญหา

  1. คัดลอกลิงก์ของหน้าที่คุณคาดว่าจะเห็นในผลการค้นหาของ Dataset Search และใส่ไว้ในการทดสอบผลการค้นหาที่เป็นสื่อสมบูรณ์ หากข้อความ "หน้าเว็บไม่มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นสื่อสมบูรณ์ตามที่การทดสอบนี้ทราบ" หรือ "มาร์กอัปบางรายการไม่มีสิทธิ์แสดงเป็นผลการค้นหาที่เป็นสื่อสมบูรณ์" ปรากฏขึ้น แสดงว่าไม่มีมาร์กอัปชุดข้อมูลในหน้านั้นหรือมีแต่ไม่ถูกต้อง คุณดูวิธีแก้ไขได้ที่ส่วนวิธีเพิ่มข้อมูลที่มีโครงสร้าง
  2. หากมีมาร์กอัปในหน้านั้น แสดงว่าอาจยังไม่มีการรวบรวมข้อมูล คุณตรวจสอบสถานะการรวบรวมข้อมูลได้ด้วย Search Console

โลโก้บริษัทหายไปหรือไม่ปรากฏอย่างถูกต้องในผลการค้นหา

สาเหตุของปัญหา: หน้าเว็บอาจไม่มีมาร์กอัปตาม schema.org สำหรับโลโก้ขององค์กร หรือไม่มีข้อมูลธุรกิจของคุณใน Google

แก้ปัญหา

  1. เพิ่มข้อมูลที่มีโครงสร้างสำหรับโลโก้ลงในหน้าเว็บ
  2. ระบุรายละเอียดทางธุรกิจให้ Google ทราบ