DSPL Geliştirici Kılavuzu

DSPL, Veri Kümesi Yayınlama Dili anlamına gelir. Bu biçim, meta veriler (veri kümesiyle ilgili bilgiler; örneğin, adı, sağlayıcı, içerdiği ve gösterdiği kavramlar) ve gerçek verilerini ifade eder. Bu biçimde açıklanan veri kümeleri Google Herkese Açık Verileri Gezgin aracı sayesinde, verilerinizin kapsamlı ve görsel biçimde incelenmesini dışı verilerdir.

Not: Verileri Google Herkese Açık Veriler'e yüklemek için Herkese Açık Veri yükleme aracını kullanıyorsanız bir Google Hesabınız olmalıdır.

Bu doküman, içeriklerinin güvenli olmasını isteyen veri sahipleri için hazırlanmıştır Public Data Explorer'da mevcuttur. Şu konulardaki ayrıntısıyla Eğitim'in ötesine geçer: DSPL şeması ve desteklenen özellikler hakkında ayrıntılı bilgi için tıklayın. Yalnızca temel düzeyde aşinalık XML olduğu varsayılır, ancak ilişkisel veritabanları hakkında bilgi de faydalı olur.

Zorunlu olmamakla birlikte, daha kısa ve kapsamlı olan Eğitim'in tamamını okumanızı öneririz. göz atmayı unutmayın.

Genel Bakış

DSPL veri kümesi, bir XML dosyası ve bir dizi CSV dosyası içeren dosyası olarak da kaydedebilir. CSV dosyaları, veri kümesi verilerini içeren basit tablolardır. XML dosyası ise veri kümesinin meta verilerini açıklar. İkinci özellik, bilgi amaçlı meta veriler (ör. ölçümlerin açıklamaları ve yapısal meta veriler (ör. tablolar arasında referanslar). Bu meta veri Uzman olmayan kullanıcıların verilerinizi keşfedip görselleştirmesini sağlar.

İşleme

Genel olarak, bir DSPL veri kümesi oluşturma süreci aşağıdaki gibidir (bazıları ilgili adımlar da buna paralel olarak yapılabilir):

  1. DSPL XML dosyanızı oluşturun.
  2. Veri kümenizde kullanılacak harici veri kaynaklarını belirleyin.
  3. Kavramlarınızı, dilimlerinizi ve (isteğe bağlı olarak) konularınızı tanımlayın. İterasyonlu/Yinelemeli DSPL dosyanızın içeriğini güncelleyin.
  4. Kaynak verilerinizi .csv dosyalarına aktarın.
  5. Bir DSPL veri kümesi oluşturun.
  6. Veri kümesini Google'a gönderin.

XML Yapısı

Genel Bakış

DSPL XML dosyası, aşağıdakiler de dahil olmak üzere veri kümesinin meta verilerini tanımlar: kavramlar, dilimler, konular ve tablolar arasındaki yapısal ilişkiler. Bu dosyayı elle oluşturmak mümkün olsa da, veri işleme araçları yardımcı olabilir. Örnek DSPL dosyasını yeni penceresi) tıklayın.

Dosya, tabloda özetlenen birçok bölüm içerir bölümüne göz atın. Tabloyu takip ederek bunların her birini daha büyük bolca fırsat sunuyor.

Bölüm Özet Daha Fazla Bilgi
Başlık ve İçe Aktarma İşlemleri Veri kümesinin diğer tüm öğelerinin üst öğesidir. Şunları içerir: ad alanları arasında geçiş yapın. Belgeler
Veri Kümesi Bilgileri Veri kümesinin adı, açıklaması ve URL'si. Belgeler
Sağlayıcı Bilgileri Veri kümesi sağlayıcının adı, açıklaması ve URL'si. Belgeler
Kavramlar

"Nesnelerin" tanımları (ör. ülkeler, işsizlik oranı, cinsiyet vb.)

Her kavramın referans oluşturabileceği benzersiz bir tanımlayıcı vardır dilim ve tablolar içerir.

Belgeler
Dilimler

İstatistiksel verilerde istatistiksel veri bulunan kavramların kombinasyonları veri kümesiyle eşleştirilir. Her dilim boyutlar ve metriklerini inceleyin.

Dilimler hem kavramlara hem de dışı verilerdir. Her bir dilimin, tablolardan oluşur.

Belgeler
Tablolar Kavramlar ve dilimlerle ilgili verileri tanımlayın. Kavram tablolarda muhafaza sıralamalar ve dilim tablolarında istatistiksel veriler bulunur. Tabloların tanımı ve gerçek verileri içeren .csv dosyalarının üzerine gelin. Belgeler
Konular Veri kümesi kavramlarını düzenlemek için kullanılan kategoriler. Zorunlu olmamakla birlikte, verilerinizde gezinen kullanıcılar için son derece faydalı olabilir. Belgeler

Başlık ve İçe Aktarma İşlemleri

Public Data ad alanını tanımlama

DSPL veri kümesi, üst düzey bir <dspl> öğesiyle başlar. Bu, tüm veri kümesi bilgilerini içine almak ve olasılıklarınızı belirtmek için ad alanları gösterilir. Örneğin:

<?xml version="1.0" encoding="UTF-8"?>
<dspl targetNamespace="http://www.example.com/mystats"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://schemas.google.com/dspl/2010" >
    ...
</dspl>

Ad alanı, bir XML şeması (XML öğeleri ve özellikleri kümesi). İlgili içeriği oluşturmak için kullanılan targetNamespace, veri kümenizi tanımlayan bir URI sağlar. Bu URI, gerçek bir kaynağa işaret etmek için gerekli değildir, ancak URI'nın içeriğinizi açıklayan bir dokümana veya veri kümesiyle eşleştirilir.

targetNamespace sağlamanız gerekmez. Şu durumda: içe aktarma işlemi sırasında sizin için otomatik olarak bir tane oluşturulur. gerekir.

targetNamespace özelliğinin ardından bir dizi Kullanılacak diğer XML şemalarını belirten xmlns özellikleri dosyadır. Her DSPL dosyası, Google Herkese Açık Veri şemasını URI'si "http://schemas.google.com/dspl/2010" olan olarak kullanmak için varsayılan ad alanını kullanır. Ayrıca standart W3 XML şemasını da içermelidir. "http://www.w3.org/2001/XMLSchema-instance" tarafından tanımlanır. Farklı bir sonraki bölümde açıklandığı gibi temel bilgileri ele alacağız.

Diğer veri kümesi ad alanlarını içe aktarma

Veri kümeleri, diğer veri kümelerindeki tanımları ve verileri yeniden kullanabilir. Google, yaygın olarak kullanılan kavramları tanımlayan bir dizi temel veri kümesi sağlar veya kullanıcı verilerinde görünür. Örneğin, çoğu veri kümesi için bir kavramı ve yılları temsil eder. Yeni bir kavram tanımlamak yerine yıl içinde Kavram "http://www.google.com/publicdata/dataset/time" veri kümesiyle eşleştirilir. Bkz. Kanonik Kavramlar sayfasına göz atın.

Harici bir veri kümesi kullanmak için <import> öğesini şuraya ekleyin: DSPL dosyasını, ad alanı beyanından hemen sonra gelecek şekilde içe aktardığınız veri alanını şu şekilde değiştirin:

<import namespace="http://www.google.com/publicdata/dataset/google/time"/>

Daha sonra, içe aktarılan ad alanını ekleyin (bu örnekte time="http://www.google.com/publicdata/dataset/google/time") olarak değiştirildi dosyanızın üst kısmındaki ad alanı beyanına şu şekilde ekleyin:

<?xml version="1.0" encoding="UTF-8"?>
<dspl targetNamespace="http://www.stats-bureau.com/mystats"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://schemas.google.com/dspl/2010"
    xmlns:time="http://www.google.com/publicdata/dataset/google/time" >
<import namespace="http://www.google.com/publicdata/dataset/google/time"/>

DSPL dosyanız artık Google Herkese Açık Verileri'ndeki öğelere başvuruda bulunabilir zaman veri kümesini içermelidir. Tekrarla bu işlemi referans olarak almak istediğiniz her veri kümesi için yapmanız gerekir.

Harici veri kümelerindeki içeriğe referans verme

Başka bir veri kümesini içe aktardıktan sonra dilimlere ve verilere ayırmanızı sağlar. Bunu yapmak için prefix:other_id biçiminde referanslar; burada prefix emin olun.

year kavramına ilişkin bir referans time veri kümesi (yukarıda açıklanmıştır):

<slices>
  <slice id="country_slice">
    <dimension concept="country"/>
    <dimension concept="time:year"/>
    <metric concept="population"/>
    <table ref="country_slice_table"/>
  </slice>
  ...
</slices>

Veri Kümesi Bilgileri

<info> öğesi açıklayıcı bilgiler içerir geri dönelim. İlgili XML öğeleriyle ilgili örnek ve ayrıntılar aşağıda listelenmiştir.

Örnek

<info>
  <name>
    <value>Unemployment Rates</value>
  </name>
  <description>
    <value>Worldwide unemployment rates by region</value>
  </description>
  <url>
    <value>http://www.example.com/mystats/info.html</value>
  </url>
</info>

Öğeler

Öğe Zorunlu mu? Açıklama
<info> Evet Veri kümesiyle ilgili tüm açıklayıcı bilgileri içerir. Dahil olan hizmetler: <name> alt öğeleri <description> ve <url>.
<name> Evet <info> alt öğesi. Alt öğeyi içerir <value>, veri kümesiyle eşleştirilir.
<description> İsteğe bağlı <info> alt öğesi. Alt öğeyi içerir <value>; veri kümesiyle eşleştirilir.
<url> Evet <info> alt öğesi. Daha fazla bilgi içeren bir URL bağlantısı bilgi toplar.

Sağlayıcı Bilgileri

<provider> öğesi, veri kümesi sağlayıcısıdır. İlgili XML öğeleriyle ilgili örnek ve ayrıntılar aşağıda listelenmiştir.

Örnek

<provider>
  <name>
    <value>Bureau of Statistics</value>
  </name>
  <url>
    <value>http://www.example.com</value>
  </url>
</provider>

Öğeler

Öğe Zorunlu mu? Açıklama
<provider> Evet Veri kümesi sağlayıcısıyla ilgili tüm açıklayıcı bilgileri içerir. <name> ve alt öğelerini içerir <url>.
<name> İsteğe bağlı <provider> alt öğesi. Alt öğeyi içerir <value>: Veri kümesinin adını tanımlar sağlar.
<url> İsteğe bağlı <info> alt öğesi. Daha fazla bilgi içeren bir URL bağlantısı hakkında bilgi edinin.

Kavramlar

Açıklama

Her veri kümesi bir veya daha fazla kavram içerir. Kavram, bir veri kümesinde görünen veri türünün tanımını ifade eder. Veri kümesi demografik nüfus verilerinde ülke, eyalet, nüfus ve yıl. Bir örnekleri olarak adlandırılır. Kavramlar genellikle veri kümesinde açıklanır ancak bazı kavramlar (zaman veya yıl gibi) harici veri kümelerinde açıklanabilir.

Her kavramın bir veya daha fazla özelliği olabilir. Mülk, bir kavram örneğinin zaman içinde kararlı olan özelliğidir. Örneğin, ülke konseptinde name, population ve capital.

Kavramların bir veya daha fazla özelliği de olabilir. Özellikler sayesinde kavram düzeyinde değil, belirli bir kavramın Örneğin, işsizlik oranı kavramını içeren bir veri kümesimiz olsaydı bu kavramın yüzde olduğunu belirtmek için bir özellik kullanabiliriz. Özelliklerin yaygın bir kullanımına örnek olarak, ekleyebilirsiniz.

Örnek

Aşağıda, benzersiz kimliğe sahip bir ülke kavramı örneği verilmiştir country ve name mülkü. Kavram kimliği ve tablolardan kavrama referans vermek için kullanılır.

<concept id="country" extends="geo:location">
  <info>
    <name><value>Country</value></name>
    <description>
      <value>My list of countries.</value>
    </description>
  </info>
  <type ref="string"/>
  <property id="name">
    <info>
      <name><value>Name</value></name>
      <description>
        <value>The official name of the country</value>
      </description>
    </info>
    <type ref="string" />
  </property>
  <property concept="geo:continent" isParent="true"/>
  <property id="capital" concept="geo:city" />
  <table ref="countries_table" />
</concept>

Bu örneğin çalışma şekli aşağıdaki gibidir.

  • Bu kod, country ve name mülkleri için, continent ve capital.
  • Kavram geo:location, konumları. Süresi geo:location uzatıldığında, country konsepti tarafından tanımlanan tüm özellikleri ve özellikleri devralır: tesis adı, açıklaması, url'si, enlemi ve boylamı. Fena değil country için bu özelliklerden bazılarını yeniden tanımlamak özellikleri (tanım, sağlanan tanımlayıcıyla tutarlı olduğu sürece) genişletilmiş kavram tarafından gerçekleştirilmektedir.
  • <info> kavramı, ve kavram hakkında bilgi edinebilirsiniz. Bu, veri kümesinin açılış sayfası hakkında daha fazla bilgi edinin.
  • <type> öğesi, reklam öğesinin içerik. Bu örnekte dizedir, ancak bu değişkenlik gösterebilir. Kavram Nüfus integer türünde olur; kavram Eurovision winner, boole türünde olabilir.
  • <property> öğesi, kavramını, benzersiz kimliğini (id), info ve type. Mülkler ayrıca çeşitli kavramlarla referans değerleri, bu kavramların geçerli örnekleridir.
  • Kavramda, tablo ve dosyayı gerçek verileri içeren CSV dosyasına gönderebilirsiniz. Veri tablosuna başvuruda bulunuluyor Bunun gibi: <table ref="countries_table"/>.

    Kavramınız bir tabloya referans veriyorsa ilişkili veri dosyası şunları içermelidir: kavramın tüm örnekleri için geçerlidir. Örneğin, tablo oluşturamazsınız veri kümesine dahil edilen ülkelerden yalnızca birkaçını listeleyen bir rapor oluşturun. ( önem verdiğiniz ülkelerin bir alt kümesiyse, bu hedef için ayrı bir bir kavramdır. Örneğin, mycountries.)

Öğeler

Öğe Zorunlu mu? Açıklama
<concepts> Evet Üst düzey öğe. <concept> öğesinin tümünü kapsar öğeler.
<concept> Evet Kavramı tanımlar. Gerekli özelliğin değeri id, veri kümesindeki kavram için benzersiz olmalıdır. Eğer Kavram bir kavram veri tablosuna, id, şurada kavramı açıklayan sütun başlığıyla eşleşmelidir: veri tablosuna bakalım. extends özelliği, yani bu kavram farklı bir kavramın kapsamına giriyor. The value of extends, aynı veya prefix:concept_id biçiminde olmalıdır; burada concept_id, içe aktarılan prefix ile ilişkili harici veri kümesi.
<info> İsteğe bağlı Kavramla ilgili açıklayıcı bilgiler içerir.
<name> Evet <info> alt öğesi. Kavramın adı. İlgili içeriği oluşturmak için kullanılan <value> alt öğesi, - için örnek, Country.
<description> İsteğe bağlı <info> alt öğesi. Alt öğeyi içerir <value>; kavramak.
<url> İsteğe bağlı <info> alt öğesi. Alt öğeyi içerir <value> ( kavramak.
<pluralName> İsteğe bağlı <info> alt öğesi. Anahtar kelimenin çoğul adı kavramak. <value> alt öğesi metni içeriyor - örneğin, Countries.
<totalName> İsteğe bağlı <info> alt öğesi. Karışım kavramın tüm örnekleri için geçerlidir. <value> alt öğesi metni içerir - country durumunda kavram, örneğin, World olabilir.
<type> İsteğe bağlı Kavramın tanımladığı içerik türünü tanımlar. Zorunlu ref özelliğindeki izin verilen değerler:
  • dize
  • kayan noktalı
  • tam sayı
  • tarih
  • boolean
Kavram başka bir kavramı kapsarsa tür atlanabilir. Bu durumda, genişletilmiş kavramdan devralınır.
<property> İsteğe bağlı

Kavramın bir özelliği, ör. capital. Değer zorunlu özelliğin id değeri, kavramak. İsteğe bağlı concept özelliği, bu özelliğin değerlerinin, verilen bir değerin kavramak. concept belirtilmişse id çıkarılabilir; değeri, dolaylı olarak referans verilen kavram (ör. <property concept="geo:country"/> eşdeğerdir <property id="country" concept="geo:country"/>) tıklayın.

Bir mülk, Boole isParent özelliği içerebilir. kavramın bir örneği arasındaki ilişkinin ve bu özelliğin değeri hiyerarşiktir.

Bir mülk, Boole isMapping özelliği içerebilir. için bir 1:1 eşleme olduğunu gösterir. ve değerleri pekiştirir.

Bir mülk, iç içe yerleştirilmiş bir info belirtebilir ve type. Bunlar bir kavram için olduğu gibi tanımlanır. type mülk bir concept özelliğine sahiptir ve referans verilen bir kavram olabilir.

<attribute> İsteğe bağlı

Kavramın bir özelliği. Özellikler, Kavramla ilgili bilgi (ör. GSYİH yüzdedir). Değer zorunlu özelliğin id değeri, kavramak. İsteğe bağlı concept özelliği, bu özelliğin değerlerinin, verilen bir değerin kavramak. concept belirtilmişse id atlanabilir. Değeri, dolaylı olarak referans verilen bir kavramdır. (ör. <attribute concept="unit:unit"/> eşdeğerdir <attribute id="unit" concept="unit:unit"/>.

Bir özellik, iç içe yerleştirilmiş bir info belirtebilir ve type gibi, belirli bir kavram için tanımlanır. type, özellik concept özelliğine sahiptir ve referans verilen bir kavram olabilir.

<table> İsteğe bağlı Kavrama ait verileri içeren veri tablosunu tanımlar. İlgili içeriği oluşturmak için kullanılan gerekli ref özelliğinin değeri tabloyla eşleşmelidir İlgili <table> öğesinde belirtilen kimlik.

Dilimler

Açıklama

Dilim, verilerin bulunduğu kavramların bir kombinasyonudur. Bir dilim İki tür kavram referansı içerir: boyutlar ve metriklerini inceleyin. Boyut, bir projeyi segmentlere ayırmak veya filtrelemek için kullanılan bir kavramdır verileriniz. Öte yandan bir metrik, gözlemlenen değeri veya değerleri gösterilir.

Genellikle boyutlar kategoriktir. Metrikler ise kategorik değildir. sayısal değerlerdir. Her birine ait bazı prototip örnekler şunlardır: şöyle olur:

  • Boyutlar: Ülke, eyalet, ilçe, bölge, yıl, ay, cinsiyet, yaş kategorisi, sektör segmenti
  • Metrikler: Nüfus, GSYİH, işsizlik oranı, okuryazarlık, gelir, maliyet, fiyat

Örnek

<slices>
  <slice id="country_slice">
    <dimension concept="country"/>
    <dimension concept="time:year"/>
    <metric concept="population"/>
    <table ref="country_slice_table"/>
  </slice>
  ...
</slices>

Bu örneğin çalışma şekli aşağıdaki gibidir.

  • Bu dilim ülkeye göre nüfusu gösterir.
  • population metriğini ve country ve year. Her boyut bir kavramdır başka bir yerde tanımlanır. country kavramı ve metrik population mevcut dilimle aynı veri kümesinde yer alır ve şu şekilde referans veriliyor: concept="country"
  • year kavramı, içe aktarılan veri kümesi zamanında mevcut. kavram adından önce kullanılan ön ek ile tanımlanır (year), Bunun gibi: concept="time:year"
  • Dilim, CSV dosyasını işaret eden bir veri tablosuna başvuruda bulunuyor emin olmanız gerekir. Veri tablosuna şu şekilde başvurulur: <table ref="country_slice_table"/> (Yukarıya bakın içe aktarma ile ilgili bilgiler için veri kümeleri.)

Not: Genel olarak, veri kümenizin boyutu mümkün olduğunca az metrik tutarsanız ve bunun yerine anlamlı seçin. Örneğin, metrik oluşturmak yerine Female Unemployment ve Male Unemployment, Unemployment tek metriğini oluşturun ve Gender; Female ve Male.

Öğeler

Öğe Zorunlu mu? Açıklama
<slices> Evet Üst düzey öğe. <slice> öğesinin tümünü kapsar öğeler.
<slice> İsteğe bağlı Dilimi tanımlar. Gerekli özelliğin değeri id, dilime özgü olmalıdır.
<dimension> İsteğe bağlı Bir kavramı referans alarak dilimin boyutunu tanımlar. İlgili içeriği oluşturmak için kullanılan gerekli concept özelliğinin değeri tam olarak eşleşmelidir ve kavramın tanımı gereği geçerli bir ön ek kullanarak , harici olarak içe aktarılan bir veri kümesine ait.
<metric> İsteğe bağlı Bir kavramı referans alarak dilimin metriğini tanımlar. Değer özelliği (concept) ile tam olarak eşleşmelidir ve kavrama aitse geçerli bir önek kullanın. içe aktarılan harici bir veri kümesine eklenir.
<table> Evet Dilime ait verileri içeren veri tablosunu tanımlar. Değer (zorunlu ref özelliği, tablo kimliğiyle eşleşmelidir) ilgili <table> öğesinde belirtilir.
<mapDimension> İsteğe bağlı <table> alt öğesi. concept ve toColumn özelliklerini içerir; ilkinin değeri şöyle dilimdeki boyuttur, ikincinin değeri ise tablo sütunudur alakalı olabilir.
<mapMetric> İsteğe bağlı <table> alt öğesi. concept ve toColumn özelliklerini içerir; ilkinin değeri dilimdeki bir metrik, ikincisinin değeri ise tablo sütunudur alakalı olabilir.

Tablolar

Açıklama

DSPL dosyasının tables bölümü verileri tanımlar tablolarına eklenir. Bu tablolara kavramlar veya dilimlere göre. Her <table> öğesi tablolar ve türleri ile birlikte, tabloyu içeren bir CSV dosyasına dışı verilerdir.

Örnek

<tables>
  <table id="country_slice_table">
    <column id="country" type="string"/>
    <column id="year" type="date" format="yyyy"/>
    <column id="population" type="integer"/>
    <data>
      <file format="csv" encoding="utf-8">country_slice.csv</file>
    </data>
  </table>
  ...
</tables>

Bu örneğin çalışma şekli şöyledir:

  • Bu örnekte country_slice_table tablosu açıklanmaktadır. İlgili içeriği oluşturmak için kullanılan tabloda country, year ve population.
  • Tablodaki her sütun, id özelliği için de kullanılmaktadır. Bu kimlik, sütun başlığını tıklayın.
  • İsteğe bağlı type özelliğinin değeri, verileri tanımlar girin.
  • <data> öğesi, gerçek .csv dosyasını açıklar (country_slice.csv) tablosuyla ilgili verileri içerir. Dosya biçimi her zaman csv.

Öğeler

Öğe Zorunlu mu? Açıklama
<tables> Evet Üst düzey öğe. <table> öğesinin tümünü kapsar öğeler.
<table> Evet Tabloyu tanımlar. Gerekli özelliğin değeri id, tabloya özgü olmalıdır.
<column> İsteğe bağlı <table> alt öğesi. Bir sütunla ilgili bilgiler dahil edilir. Aşağıdaki özellikleri içerir:
  • id (zorunlu): Sütunun kimliği.
  • type (isteğe bağlı): Bilginin veri türü değerini girin. İzin verilen değerler: string, float, integer, date veya boolean.
<data> İsteğe bağlı <table> alt öğesi. Kaynak: yardımcı olabilir. Dosya adı URL biçimindeyse (ör. http://...) ayarlanırsa dosya uygun protokol (HTTP, HTTPS veya FTP); Aksi takdirde, etiket bu ada sahip olmalıdır. Gerekli format özelliğinin değeri: her zaman csv. encoding özelliği isteğe bağlıdır, .csv dosyalarınız UTF-8 olarak kodlanmış olmalıdır.

Konular

Açıklama

Topics, kavramları hiyerarşik olarak sınıflandırarak kullanıcıların gezinebilmesini sağlar dönüşüm gerçekleştirebilirsiniz.

<topics> öğesi, DSPL dosyanızda <concepts> öğesi. (sıra çok önemlidir ve öğeleri yanlış sırada görünebilir.) Konuları kullanmak için öğrenebilirsiniz.

Örnek

Aşağıda örnek bir konu tanımı verilmiştir:

<topics>
  <topic id="population_indicators">
    <info>
      <name>
        <value>Population indicators</value>
      </name>
    </info>
  </topic>
  ...
</topics>
  

...ve aşağıda, bu konuya bir kavramdan örnek verilmiştir:

<concept id="population">
  <info>
    <name>
      <value>Population</value>
    </name>
    <description>
      <value>Size of the resident population.</value>
    </description>
  <topic ref="population_indicators"/>
  <type ref="integer"/>
</concept>

Konular iç içe yerleştirilebilir ve bir kavram birden fazla konuya referans verebilir.

Öğe tanımı

Öğe Zorunlu mu? Açıklama
<topics> Evet Üst düzey öğe. <topic> öğesinin tümünü kapsar öğeler.
<topic> Evet Konuyu tanımlar. Gerekli özelliğin değeri id, veri kümesi için benzersiz olmalıdır.
<info> İsteğe bağlı <topic> alt öğesi. Şuna ilişkin bilgileri içerir: konu.
<name> İsteğe bağlı <info> alt öğesi. Alt öğesi <value>, konunun adını belirtir.

DSPL Veri Dosyaları

XML meta veri dosyasına ek olarak, bir DSPL veri kümesi de CSV biçiminde bir veya daha fazla veri dosyası ekleyin. Her bir veri dosyası veri kümesindeki bir tabloyu destekler ve <data>...</data> bölümü. Kavram olarak bu dosyalar ve bunlarla ilişkilendirilmiş tablolar, kavramı temsil etmek için tanımlar veya dilim verileri kullanır. Bu veri dosyası türlerinin her biri aşağıda daha ayrıntılı olarak açıklanmıştır.

Amaca bağımsız olarak tüm veri dosyalarının Virgülle ayrılmış (CSV) UTF-8 metin dosyaları. Dosyalar yalnızca düz içermelidir metin; HTML yok. Veri dosyalarını manuel olarak oluşturabilirsiniz. Ancak orijinal verileri içeren araçta verilere bir anlam çıkarması ve kaynakta (ör. e-tablo) veya dışa aktarılan dosyanın kendisinde

Dosyalar veri kümesiyle gruplanabilir veya Uzak bir kaynaktan HTTP, HTTPS veya FTP aracılığıyla getirilen URL.

Kavram Veri Dosyaları

Kavram veri dosyaları, her kavramla ilgili bilgiler içerir. İlgili içeriği oluşturmak için kullanılan Kavram tanımı, terimler için <table> öğesini kullanır. bu dosyadaki dosyaları kullanabilirsiniz.

Örnek

Aşağıda, country kavramı için bir tablo örneği verilmiştir. aşağıda tanımlandığı gibi:

country, name
AD, Andorra
AF, Afghanistan
AI, Anguilla
AL, Albania
AO, Angola
AQ, Antarctica
AS, American Samoa

Bu örneğin çalışma şekli şöyledir:

  • Eşleme belirtilmezse veri dosyasının ilk satırı (sütun başlıkları), konsept kimliği ve uygun mülkle tam olarak eşleşmelidir. verilerin ilişkilendirildiği kavramın kimlikleri. Ancak, sıralamadaki veri dosyasında aynı olması gerekmez ve kavram tablosu. Bu durumda, ilk sütun country kavramı, ikinci sütun ise name mülkü.
  • Özellik sütunları isteğe bağlıdır; Bir mülkte sütun yoksa değeri, her bir satır için tanımsız olduğu varsayılır. İlgili içeriği oluşturmak için kullanılan örneğin yukarıdaki tabloda latitude ve longitude özellikleri olduğundan ülkeler eşlenemez.
  • Kavramın kimlik alanı için her değer (bu örnekte country) benzersiz olmalı ve boş olmamalıdır (boş alan bir (0 veya sadece boşluk karakteri bulunan) içerir.
  • Diğer kavramlara başvuruda bulunan mülklerin değerleri boş veya başvurulan kavramın geçerli bir değeri olabilir.
  • Değerleri çift tırnak işareti içine almak, virgül, çift tırnak veya yeni satır karakterleri içermemelidir.
  • Bir değerde görünen düz çift tırnak işaretinin önüne geçerek bu tırnak işaretinden çıkma çift tırnak işareti koyacağım.

Dilim Veri Dosyaları

Dilim veri dosyaları, her bir dilimle ilgili verileri içerir. Dilim tanımı, şunlar için <table ref="..."> öğesini kullanır: <table> tanımına referans verir. Bu da bu dosyada yer alır.

Örnek

Aşağıda, Yukarıda açıklanan population_by_country dilimi:

country, year, population
AF, 1960, 9616353
AF, 1961, 9799379
AF, 1962, 9989846
AF, 1963, 10188299

Örneğin çalışma şekli şöyledir:

  • Metrik alanı population şeklindedir. Alanlar country ve year boyut alanlarıdır.
  • Bir boyut alanının her değeri boş olmamalıdır. Buna zaman da dahildir seçin. Metrik alanlarına ait değerler boş olabilir. Boş bir değer hiçbir karakter içermez.
  • Bir kavrama referansta bulunan her sütun başlığı (örneğin, alanında country kavramını referans göstermelidir) kavramın kavram tanımındaki benzersiz kimliğiyle tam olarak eşleşmelidir.
  • Boyut değerlerinin benzersiz bir kombinasyonu, ör. AF, 2000, yalnızca bir kez yapılabilir.
  • Aynı zaman serisindeki satırlar (aynı kombinasyona sahip satırlar) boyut değerlerinin (zaman hariç tüm boyut değerlerinin) birlikte gruplanması gerekir sıralanması gerekmez.

İleri Seviye Özellikler

Çok Dilli Veri Kümeleri

Çevrilmiş XML Değerleri

xml:lang özelliğini DSPL dosyanızda <value> öğesi. Bu özellik standart, W3C dil etiketleri hakkında daha fazla bilgi edinin. Bu özelliğin kullanımı isteğe bağlıdır; hayır ise xml:lang özelliği eklendi, içeriğin İngilizce.

Aşağıdaki örnekte İngilizce olan bir veri kümesinin anlık görüntüsü gösterilmektedir. Bulgarca, Katalanca ve Basitleştirilmiş Çince:

<dspl ...>
  <info>
    <name>
      <value xml:lang="en">World Bank, World Development Indicators</value>
      <value xml:lang="bg">Световна банка, Индикатори за световно развитие</value>
      <value xml:lang="ca">Banc Mundial, Indicadors del desenvolupament mundial</value>
      <value xml:lang="zh-CN">国家/地区</value>
    </name>
    ...
  </info>

  <concepts>
    <concept id="country">
      <info>
        <name>
          <value xml:lang="en">Country</value>
          <value xml:lang="bg">Страна</value>
          <value xml:lang="ca">País</value>
          <value xml:lang="zh-CN">国家/地区</value>
        </name>
        ...
      </info>
      ...
    </concept>
    ...
  </concepts>

  ...
</dspl>

Çevrilmiş Mülkler

Bazı durumlarda, belgenin kapsamının ötesine geçen kavram düzeyinde meta veriler; kullanıcılara ek olarak (veya bunun yerine) kavram örnekleri. Bu, özellikle bir kavramın değerleri, özellik (ör. ad) dile göre değişir.

Bu tür değerleri birden çok dilde sağlamak için Her tesis/dil kombinasyonuna karşılık gelen tanım tablosu. Ardından, aşağıdaki adımları uygulayarak bu sütunları ilişkili özelliklerine ve dillerine bağlayın: tabloya bir <mapProperty xml:lang="..." ref="..." toColumn="..."> öğe grubu ekleniyor referans etiketi olarak kullanabilirsiniz.

Aşağıda, İngilizce adları bulunan bir ülke kavramını tanımlayan bir örnek verilmiştir. İspanyolca ve Fransızca:

<concepts>
  ...
  <concept id="country" extends="geo:location">
    ...
    <property id="name">
      <info>
        <name>
          <value>Name</value>
        </name>
        <description>
          <value>The official name of the country</value>
        </description>
      </info>
      <type ref="string" />
    </property>
    ...
    <table ref="countries_table">
      <mapProperty xml:lang="en" ref="name" toColumn="name_en"/>
      <mapProperty xml:lang="es" ref="name" toColumn="name_es"/>
      <mapProperty xml:lang="fr" ref="name" toColumn="name_fr"/>
    </table>
  </concept>
  ...
</concepts>

...

<tables>
  ...
  <table id="countries_table">
    <column id="country" type="string"/>
    <column id="name_en" type="string"/>
    <column id="name_es" type="string"/>
    <column id="name_fr" type="string"/>
    ...
  </table>
</tables>

Bu durumda countries_table için CSV dosyası şu formu kullanın:

country,name_en,name_es,name_fr,...
...
US,United States of America,Estados Unidos de América,États-Unis d'Amérique,...
...

Eşlenebilir Kavramlar

Birçok kavram (örneğin: ilçe, eyalet ve şehir) coğrafi konumlara karşılık gelen örneklere sahiptir. DSPL görselleştirebilmeleri için bu örneklerin coğrafi kodlamasını destekler. Google Herkese Açık Verileri animasyonlu harita grafiği.

Konseptiniz Dünya ülkeleri, ABD eyaletleri veya ABD ile eşdeğerse bir bağlantı kullanıyorsanız ilgili Google Standart Sayfası'na kavram; Açık coğrafi kodlamaya gerek yoktur. Daha fazla bilgi için Kanonik Kavramlar Kılavuzu'na bakın bolca fırsat sunuyor.

Aksi halde konseptinizi eşlenebilir hale getirmeniz gerekir. İlk adım geo:location tarihinden itibaren uzatın:

<concept id="..." extends="geo:location">
  ...
</concept>

Ardından, enlem ve boylamı özellik olarak açıkça eklemeniz gerekir:

<concept id="..." extends="geo:location">
  ...
  <property id="latitude"/>
  <property id="longitude"/>
</concept>
  

Ardından, bunların değerleri, ilgili kavram tanımı veri tablosu.

Kavram İlişkileri

Kavramlar genellikle diğer kavramlarla yapılandırılmış bir şekilde ilişkilidir. Örneğin, bir kıta örneği birden fazla ülke örnekleri; bunlar da birden fazla eyalet veya il örneklerine göz atın. Bunları kodlamak veri kümesi meta verilerindeki ilişkiler daha zengin görselleştirmeye olanak tanır özellikleri, ör. daraltılabilir ağaç gösterme pek çok yer var.

Aşağıdaki bölümlerde, proje yönetimi bağlamında desteklenen DSPL şeması.

Hiyerarşiler

Kavram hiyerarşileri, DSPL'de isParent="true" özelliği Alt kavramın <property> etiketi ana kavramdaki örneklerin tanımlayıcılarıdır.

Örneğin, Google'ın ABD İlçesi kavramı şu formu kullanın:

<concept id="us_county" extends="geo:location">
  <info>
    <name>
      <value xml:lang="en">County</value>
    </name>
    ...
  </info>
  ...
  <property id="state" concept="us_state" isParent="true"/>
  ...
  <data>
    <table ref="reference_us_counties"/>
  </data>
</concept>
  

Destekleyici veri tablosunda,state her ilçe için iki harfli eyalet kodu kullanılır. Bu tür meta veriler, Eyaletleri ve ilçeleri hiyerarşi olarak gösteren Public Data Explorer kullanıcıların keşfetmesini çok daha kolay hale getiriyor.

Bir kavramın çok sayıda alt öğe içerebileceğini ancak en fazla bir kavramın ebeveyn.

Eşleştirmeler

Kavram eşleme (yani, temelde aynı olan kavramlar şey), isMapping="true" özelliğini kullanabilirsiniz.property

Bir kavramın başka bir kavramla eşlendiğini belirtmek önceki kavramın tüm özellikleri ve nitelikleri içerir. Diğer uygulamaların yanı sıra bu, "bağlantı oluşturmak" için yararlıdır kişisel coğrafi kavramların Google'ın standart coğrafi veri kümesinde tanımlanmış olanlar:

<concept id="my_country" extends="geo:location">
  <info>
    <name>
      <value xml:lang="en">Country</value>
    </name>
    ...
  </info>
  ...
  <property id="google_country_code" concept="geo:country" isMapping="true"/>
  <data>
    <table ref="countries_concept"/>
  </data>
</concept>
  

Uzantılar

Kavram uzantıları, extends öğesiyle belirtilir tanımlanmıştır. Uzantılar, kullanıcıların başka bir kavramın alt sınıfı olduğunu düşünebilirsiniz. İlgili içeriği oluşturmak için kullanılan genişletilmiş kavram, üst öğesinin tüm özellik ve özelliklerini devralır. ve başkalarını da ekleyebilirsiniz.

Örneğin, Google'ın currency kavramı unit:

<concept id="unit">
  ...
</concept>

<concept id="currency" extends="unit">
  <info>
    <name>
      <value xml:lang="en">Currency unit</value>
    </name>
    ...
  </info>
  ...
  <table ref="currency_table"/>
</concept>
  

Kavramın açıklamasına göz atın uzantıları hakkında daha fazla bilgi edinin.

Veri Kümenizi Gönderme

Veri kümenizi Google Public Data Explorer'a göndermek için şu adımları uygulayın: talimatlar:

  1. Bir dizin oluşturun.
  2. Veri kümesi dspl dosyasını, oluşturduğunuz dizine kaydedin. Şunları yaptığınızdan emin olun: .xml uzantısını kullanın.
  3. Tüm yerel .csv dosyalarını aynı dizine kaydedin. Veri dosyaları gibi URL'ler atlanabilir.
  4. Dizini sıkıştırın.
  5. Google Public Data'ya veri kümenizi yükleyin öğrenin.

Veri kümeniz yüklenip doğrulandıktan sonra imzalandıktan sonra test edebilirsiniz Google Hesabınıza giriş yapın. Siz kontrol edene kadar yayınlanmayacak ve hazır olduğunu söyleyin.