DSPL, Veri Kümesi Yayınlama Dili anlamına gelir. Bu biçim, meta veriler (veri kümesiyle ilgili bilgiler; örneğin, adı, sağlayıcı, içerdiği ve gösterdiği kavramlar) ve gerçek verilerini ifade eder. Bu biçimde açıklanan veri kümeleri Google Herkese Açık Verileri Gezgin aracı sayesinde, verilerinizin kapsamlı ve görsel biçimde incelenmesini dışı verilerdir.
Not: Verileri Google Herkese Açık Veriler'e yüklemek için Herkese Açık Veri yükleme aracını kullanıyorsanız bir Google Hesabınız olmalıdır.
Bu doküman, içeriklerinin güvenli olmasını isteyen veri sahipleri için hazırlanmıştır Public Data Explorer'da mevcuttur. Şu konulardaki ayrıntısıyla Eğitim'in ötesine geçer: DSPL şeması ve desteklenen özellikler hakkında ayrıntılı bilgi için tıklayın. Yalnızca temel düzeyde aşinalık XML olduğu varsayılır, ancak ilişkisel veritabanları hakkında bilgi de faydalı olur.
Zorunlu olmamakla birlikte, daha kısa ve kapsamlı olan Eğitim'in tamamını okumanızı öneririz. göz atmayı unutmayın.
Genel Bakış
DSPL veri kümesi, bir XML dosyası ve bir dizi CSV dosyası içeren dosyası olarak da kaydedebilir. CSV dosyaları, veri kümesi verilerini içeren basit tablolardır. XML dosyası ise veri kümesinin meta verilerini açıklar. İkinci özellik, bilgi amaçlı meta veriler (ör. ölçümlerin açıklamaları ve yapısal meta veriler (ör. tablolar arasında referanslar). Bu meta veri Uzman olmayan kullanıcıların verilerinizi keşfedip görselleştirmesini sağlar.
İşleme
Genel olarak, bir DSPL veri kümesi oluşturma süreci aşağıdaki gibidir (bazıları ilgili adımlar da buna paralel olarak yapılabilir):
- DSPL XML dosyanızı oluşturun.
- Veri kümenizde kullanılacak harici veri kaynaklarını belirleyin.
- Kavramlarınızı, dilimlerinizi ve (isteğe bağlı olarak) konularınızı tanımlayın. İterasyonlu/Yinelemeli DSPL dosyanızın içeriğini güncelleyin.
- Kaynak verilerinizi .csv dosyalarına aktarın.
- Bir DSPL veri kümesi oluşturun.
- Veri kümesini Google'a gönderin.
XML Yapısı
Genel Bakış
DSPL XML dosyası, aşağıdakiler de dahil olmak üzere veri kümesinin meta verilerini tanımlar: kavramlar, dilimler, konular ve tablolar arasındaki yapısal ilişkiler. Bu dosyayı elle oluşturmak mümkün olsa da, veri işleme araçları yardımcı olabilir. Örnek DSPL dosyasını yeni penceresi) tıklayın.
Dosya, tabloda özetlenen birçok bölüm içerir bölümüne göz atın. Tabloyu takip ederek bunların her birini daha büyük bolca fırsat sunuyor.
Bölüm | Özet | Daha Fazla Bilgi |
---|---|---|
Başlık ve İçe Aktarma İşlemleri | Veri kümesinin diğer tüm öğelerinin üst öğesidir. Şunları içerir: ad alanları arasında geçiş yapın. | Belgeler |
Veri Kümesi Bilgileri | Veri kümesinin adı, açıklaması ve URL'si. | Belgeler |
Sağlayıcı Bilgileri | Veri kümesi sağlayıcının adı, açıklaması ve URL'si. | Belgeler |
Kavramlar |
"Nesnelerin" tanımları (ör. ülkeler, işsizlik oranı, cinsiyet vb.) Her kavramın referans oluşturabileceği benzersiz bir tanımlayıcı vardır dilim ve tablolar içerir. |
Belgeler |
Dilimler |
İstatistiksel verilerde istatistiksel veri bulunan kavramların kombinasyonları veri kümesiyle eşleştirilir. Her dilim boyutlar ve metriklerini inceleyin. Dilimler hem kavramlara hem de dışı verilerdir. Her bir dilimin, tablolardan oluşur. |
Belgeler |
Tablolar | Kavramlar ve dilimlerle ilgili verileri tanımlayın. Kavram tablolarda muhafaza sıralamalar ve dilim tablolarında istatistiksel veriler bulunur. Tabloların tanımı ve gerçek verileri içeren .csv dosyalarının üzerine gelin. | Belgeler |
Konular | Veri kümesi kavramlarını düzenlemek için kullanılan kategoriler. Zorunlu olmamakla birlikte, verilerinizde gezinen kullanıcılar için son derece faydalı olabilir. | Belgeler |
Başlık ve İçe Aktarma İşlemleri
Public Data ad alanını tanımlama
DSPL veri kümesi, üst düzey bir <dspl>
öğesiyle başlar.
Bu, tüm veri kümesi bilgilerini içine almak ve olasılıklarınızı belirtmek için
ad alanları gösterilir. Örneğin:
<?xml version="1.0" encoding="UTF-8"?> <dspl targetNamespace="http://www.example.com/mystats" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://schemas.google.com/dspl/2010" > ... </dspl>
Ad alanı, bir
XML şeması (XML öğeleri ve özellikleri kümesi). İlgili içeriği oluşturmak için kullanılan
targetNamespace
, veri kümenizi tanımlayan bir URI sağlar.
Bu URI, gerçek bir kaynağa işaret etmek için gerekli değildir, ancak
URI'nın içeriğinizi açıklayan bir dokümana veya
veri kümesiyle eşleştirilir.
targetNamespace
sağlamanız gerekmez. Şu durumda:
içe aktarma işlemi sırasında sizin için otomatik olarak bir tane oluşturulur.
gerekir.
targetNamespace
özelliğinin ardından bir dizi
Kullanılacak diğer XML şemalarını belirten xmlns
özellikleri
dosyadır. Her DSPL dosyası, Google Herkese Açık Veri şemasını
URI'si "http://schemas.google.com/dspl/2010" olan olarak kullanmak için
varsayılan ad alanını kullanır. Ayrıca standart W3 XML şemasını da içermelidir.
"http://www.w3.org/2001/XMLSchema-instance" tarafından tanımlanır. Farklı
bir sonraki bölümde açıklandığı gibi
temel bilgileri ele alacağız.
Diğer veri kümesi ad alanlarını içe aktarma
Veri kümeleri, diğer veri kümelerindeki tanımları ve verileri yeniden kullanabilir. Google, yaygın olarak kullanılan kavramları tanımlayan bir dizi temel veri kümesi sağlar veya kullanıcı verilerinde görünür. Örneğin, çoğu veri kümesi için bir kavramı ve yılları temsil eder. Yeni bir kavram tanımlamak yerine yıl içinde Kavram "http://www.google.com/publicdata/dataset/time" veri kümesiyle eşleştirilir. Bkz. Kanonik Kavramlar sayfasına göz atın.
Harici bir veri kümesi kullanmak için <import>
öğesini şuraya ekleyin:
DSPL dosyasını, ad alanı beyanından hemen sonra gelecek şekilde
içe aktardığınız veri alanını şu şekilde değiştirin:
<import namespace="http://www.google.com/publicdata/dataset/google/time"/>
Daha sonra, içe aktarılan ad alanını ekleyin (bu örnekte
time="http://www.google.com/publicdata/dataset/google/time"
) olarak değiştirildi
dosyanızın üst kısmındaki ad alanı beyanına şu şekilde ekleyin:
<?xml version="1.0" encoding="UTF-8"?> <dspl targetNamespace="http://www.stats-bureau.com/mystats" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://schemas.google.com/dspl/2010" xmlns:time="http://www.google.com/publicdata/dataset/google/time" > <import namespace="http://www.google.com/publicdata/dataset/google/time"/>
DSPL dosyanız artık Google Herkese Açık Verileri'ndeki öğelere başvuruda bulunabilir zaman veri kümesini içermelidir. Tekrarla bu işlemi referans olarak almak istediğiniz her veri kümesi için yapmanız gerekir.
Harici veri kümelerindeki içeriğe referans verme
Başka bir veri kümesini içe aktardıktan sonra
dilimlere ve verilere ayırmanızı sağlar. Bunu yapmak için
prefix:other_id
biçiminde referanslar; burada
prefix
emin olun.
year
kavramına ilişkin bir referans
time
veri kümesi (yukarıda açıklanmıştır):
<slices> <slice id="country_slice"> <dimension concept="country"/> <dimension concept="time:year"/> <metric concept="population"/> <table ref="country_slice_table"/> </slice> ... </slices>
Veri Kümesi Bilgileri
<info>
öğesi açıklayıcı bilgiler içerir
geri dönelim. İlgili XML öğeleriyle ilgili örnek ve ayrıntılar
aşağıda listelenmiştir.
Örnek
<info> <name> <value>Unemployment Rates</value> </name> <description> <value>Worldwide unemployment rates by region</value> </description> <url> <value>http://www.example.com/mystats/info.html</value> </url> </info>
Öğeler
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<info> |
Evet | Veri kümesiyle ilgili tüm açıklayıcı bilgileri içerir. Dahil olan hizmetler:
<name> alt öğeleri
<description> ve <url> . |
<name> |
Evet | <info> alt öğesi. Alt öğeyi içerir
<value> ,
veri kümesiyle eşleştirilir. |
<description> |
İsteğe bağlı | <info> alt öğesi. Alt öğeyi içerir
<value> ;
veri kümesiyle eşleştirilir. |
<url> |
Evet | <info> alt öğesi. Daha fazla bilgi içeren bir URL bağlantısı
bilgi toplar. |
Sağlayıcı Bilgileri
<provider>
öğesi,
veri kümesi sağlayıcısıdır. İlgili XML öğeleriyle ilgili örnek ve ayrıntılar
aşağıda listelenmiştir.
Örnek
<provider> <name> <value>Bureau of Statistics</value> </name> <url> <value>http://www.example.com</value> </url> </provider>
Öğeler
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<provider> |
Evet | Veri kümesi sağlayıcısıyla ilgili tüm açıklayıcı bilgileri içerir.
<name> ve alt öğelerini içerir
<url> . |
<name> |
İsteğe bağlı | <provider> alt öğesi. Alt öğeyi içerir
<value> : Veri kümesinin adını tanımlar
sağlar. |
<url> |
İsteğe bağlı | <info> alt öğesi. Daha fazla bilgi içeren bir URL bağlantısı
hakkında bilgi edinin. |
Kavramlar
Açıklama
Her veri kümesi bir veya daha fazla kavram içerir. Kavram, bir veri kümesinde görünen veri türünün tanımını ifade eder. Veri kümesi demografik nüfus verilerinde ülke, eyalet, nüfus ve yıl. Bir örnekleri olarak adlandırılır. Kavramlar genellikle veri kümesinde açıklanır ancak bazı kavramlar (zaman veya yıl gibi) harici veri kümelerinde açıklanabilir.
Her kavramın bir veya daha fazla özelliği olabilir. Mülk,
bir kavram örneğinin zaman içinde kararlı olan özelliğidir. Örneğin,
ülke konseptinde name
,
population
ve capital
.
Kavramların bir veya daha fazla özelliği de olabilir. Özellikler sayesinde kavram düzeyinde değil, belirli bir kavramın Örneğin, işsizlik oranı kavramını içeren bir veri kümesimiz olsaydı bu kavramın yüzde olduğunu belirtmek için bir özellik kullanabiliriz. Özelliklerin yaygın bir kullanımına örnek olarak, ekleyebilirsiniz.
Örnek
Aşağıda, benzersiz kimliğe sahip bir ülke kavramı örneği verilmiştir
country
ve name
mülkü. Kavram kimliği
ve tablolardan kavrama referans vermek için kullanılır.
<concept id="country" extends="geo:location"> <info> <name><value>Country</value></name> <description> <value>My list of countries.</value> </description> </info> <type ref="string"/> <property id="name"> <info> <name><value>Name</value></name> <description> <value>The official name of the country</value> </description> </info> <type ref="string" /> </property> <property concept="geo:continent" isParent="true"/> <property id="capital" concept="geo:city" /> <table ref="countries_table" /> </concept>
Bu örneğin çalışma şekli aşağıdaki gibidir.
- Bu kod,
country
vename
mülkleri için,continent
vecapital
. - Kavram
geo:location
, konumları. Süresigeo:location
uzatıldığında,country
konsepti tarafından tanımlanan tüm özellikleri ve özellikleri devralır: tesis adı, açıklaması, url'si, enlemi ve boylamı. Fena değilcountry
için bu özelliklerden bazılarını yeniden tanımlamak özellikleri (tanım, sağlanan tanımlayıcıyla tutarlı olduğu sürece) genişletilmiş kavram tarafından gerçekleştirilmektedir. <info>
kavramı, ve kavram hakkında bilgi edinebilirsiniz. Bu, veri kümesinin açılış sayfası hakkında daha fazla bilgi edinin.<type>
öğesi, reklam öğesinin içerik. Bu örnekte dizedir, ancak bu değişkenlik gösterebilir. Kavram Nüfusinteger
türünde olur; kavramEurovision winner
, boole türünde olabilir.<property>
öğesi, kavramını, benzersiz kimliğini (id
),info
vetype
. Mülkler ayrıca çeşitli kavramlarla referans değerleri, bu kavramların geçerli örnekleridir.-
Kavramda, tablo ve dosyayı gerçek verileri içeren CSV dosyasına gönderebilirsiniz. Veri tablosuna başvuruda bulunuluyor Bunun gibi:
<table ref="countries_table"/>
.Kavramınız bir tabloya referans veriyorsa ilişkili veri dosyası şunları içermelidir: kavramın tüm örnekleri için geçerlidir. Örneğin, tablo oluşturamazsınız veri kümesine dahil edilen ülkelerden yalnızca birkaçını listeleyen bir rapor oluşturun. ( önem verdiğiniz ülkelerin bir alt kümesiyse, bu hedef için ayrı bir bir kavramdır. Örneğin,
mycountries
.)
Öğeler
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<concepts> |
Evet | Üst düzey öğe. <concept> öğesinin tümünü kapsar
öğeler. |
<concept> |
Evet | Kavramı tanımlar. Gerekli özelliğin değeri
id , veri kümesindeki kavram için benzersiz olmalıdır. Eğer
Kavram bir kavram veri tablosuna,
id , şurada kavramı açıklayan sütun başlığıyla eşleşmelidir:
veri tablosuna bakalım. extends özelliği,
yani bu kavram farklı bir kavramın kapsamına giriyor. The value of
extends , aynı
veya prefix:concept_id biçiminde olmalıdır; burada
concept_id , içe aktarılan
prefix ile ilişkili harici veri kümesi. |
<info> |
İsteğe bağlı | Kavramla ilgili açıklayıcı bilgiler içerir. |
<name> |
Evet | <info> alt öğesi. Kavramın adı. İlgili içeriği oluşturmak için kullanılan
<value> alt öğesi, - için
örnek, Country . |
<description> |
İsteğe bağlı | <info> alt öğesi. Alt öğeyi içerir
<value> ;
kavramak. |
<url> |
İsteğe bağlı | <info> alt öğesi. Alt öğeyi içerir
<value> (
kavramak. |
<pluralName> |
İsteğe bağlı | <info> alt öğesi. Anahtar kelimenin çoğul adı
kavramak. <value> alt öğesi metni içeriyor
- örneğin, Countries . |
<totalName> |
İsteğe bağlı | <info> alt öğesi. Karışım
kavramın tüm örnekleri için geçerlidir. <value> alt öğesi
metni içerir - country durumunda
kavram, örneğin, World olabilir. |
<type> |
İsteğe bağlı |
Kavramın tanımladığı içerik türünü tanımlar. Zorunlu
ref özelliğindeki izin verilen değerler:
|
<property> |
İsteğe bağlı |
Kavramın bir özelliği, ör. Bir mülk, Boole Bir mülk, Boole Bir mülk, iç içe yerleştirilmiş bir |
<attribute> |
İsteğe bağlı |
Kavramın bir özelliği. Özellikler,
Kavramla ilgili bilgi (ör. GSYİH yüzdedir). Değer
zorunlu özelliğin Bir özellik, iç içe yerleştirilmiş bir |
<table> |
İsteğe bağlı | Kavrama ait verileri içeren veri tablosunu tanımlar. İlgili içeriği oluşturmak için kullanılan
gerekli ref özelliğinin değeri tabloyla eşleşmelidir
İlgili <table> öğesinde belirtilen kimlik. |
Dilimler
Açıklama
Dilim, verilerin bulunduğu kavramların bir kombinasyonudur. Bir dilim İki tür kavram referansı içerir: boyutlar ve metriklerini inceleyin. Boyut, bir projeyi segmentlere ayırmak veya filtrelemek için kullanılan bir kavramdır verileriniz. Öte yandan bir metrik, gözlemlenen değeri veya değerleri gösterilir.
Genellikle boyutlar kategoriktir. Metrikler ise kategorik değildir. sayısal değerlerdir. Her birine ait bazı prototip örnekler şunlardır: şöyle olur:
- Boyutlar: Ülke, eyalet, ilçe, bölge, yıl, ay, cinsiyet, yaş kategorisi, sektör segmenti
- Metrikler: Nüfus, GSYİH, işsizlik oranı, okuryazarlık, gelir, maliyet, fiyat
Örnek
<slices> <slice id="country_slice"> <dimension concept="country"/> <dimension concept="time:year"/> <metric concept="population"/> <table ref="country_slice_table"/> </slice> ... </slices>
Bu örneğin çalışma şekli aşağıdaki gibidir.
- Bu dilim ülkeye göre nüfusu gösterir.
population
metriğini vecountry
veyear
. Her boyut bir kavramdır başka bir yerde tanımlanır.country
kavramı ve metrikpopulation
mevcut dilimle aynı veri kümesinde yer alır ve şu şekilde referans veriliyor:concept="country"
year
kavramı, içe aktarılan veri kümesi zamanında mevcut. kavram adından önce kullanılan ön ek ile tanımlanır (year
), Bunun gibi:concept="time:year"
- Dilim, CSV dosyasını işaret eden bir veri tablosuna başvuruda bulunuyor
emin olmanız gerekir. Veri tablosuna şu şekilde başvurulur:
<table ref="country_slice_table"/>
(Yukarıya bakın içe aktarma ile ilgili bilgiler için veri kümeleri.)
Not: Genel olarak, veri kümenizin boyutu
mümkün olduğunca az metrik tutarsanız ve bunun yerine anlamlı
seçin. Örneğin, metrik oluşturmak yerine
Female Unemployment
ve Male Unemployment
,
Unemployment
tek metriğini oluşturun ve
Gender
; Female
ve
Male
.
Öğeler
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<slices> |
Evet | Üst düzey öğe. <slice> öğesinin tümünü kapsar
öğeler. |
<slice> |
İsteğe bağlı | Dilimi tanımlar. Gerekli özelliğin değeri
id , dilime özgü olmalıdır. |
<dimension> |
İsteğe bağlı | Bir kavramı referans alarak dilimin boyutunu tanımlar. İlgili içeriği oluşturmak için kullanılan
gerekli concept özelliğinin değeri tam olarak eşleşmelidir
ve kavramın tanımı gereği geçerli bir ön ek kullanarak
, harici olarak içe aktarılan bir veri kümesine ait. |
<metric> |
İsteğe bağlı | Bir kavramı referans alarak dilimin metriğini tanımlar. Değer
özelliği (concept ) ile tam olarak eşleşmelidir
ve kavrama aitse geçerli bir önek
kullanın.
içe aktarılan harici bir veri kümesine eklenir. |
<table> |
Evet | Dilime ait verileri içeren veri tablosunu tanımlar. Değer
(zorunlu ref özelliği, tablo kimliğiyle eşleşmelidir)
ilgili <table> öğesinde belirtilir. |
<mapDimension> |
İsteğe bağlı | <table> alt öğesi.
concept ve toColumn özelliklerini içerir; ilkinin değeri şöyle
dilimdeki boyuttur, ikincinin değeri ise tablo sütunudur
alakalı olabilir. |
<mapMetric> |
İsteğe bağlı | <table> alt öğesi.
concept ve toColumn özelliklerini içerir; ilkinin değeri
dilimdeki bir metrik, ikincisinin değeri ise tablo sütunudur
alakalı olabilir. |
Tablolar
Açıklama
DSPL dosyasının tables
bölümü verileri tanımlar
tablolarına eklenir. Bu tablolara kavramlar veya
dilimlere göre. Her <table>
öğesi
tablolar ve türleri ile birlikte, tabloyu içeren bir CSV dosyasına
dışı verilerdir.
Örnek
<tables> <table id="country_slice_table"> <column id="country" type="string"/> <column id="year" type="date" format="yyyy"/> <column id="population" type="integer"/> <data> <file format="csv" encoding="utf-8">country_slice.csv</file> </data> </table> ... </tables>
Bu örneğin çalışma şekli şöyledir:
- Bu örnekte
country_slice_table
tablosu açıklanmaktadır. İlgili içeriği oluşturmak için kullanılan tablodacountry
,year
vepopulation
. - Tablodaki her sütun,
id
özelliği için de kullanılmaktadır. Bu kimlik, sütun başlığını tıklayın. - İsteğe bağlı
type
özelliğinin değeri, verileri tanımlar girin. <data>
öğesi, gerçek .csv dosyasını açıklar (country_slice.csv) tablosuyla ilgili verileri içerir. Dosya biçimi her zamancsv
.
Öğeler
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<tables> |
Evet | Üst düzey öğe. <table> öğesinin tümünü kapsar
öğeler. |
<table> |
Evet | Tabloyu tanımlar. Gerekli özelliğin değeri
id , tabloya özgü olmalıdır. |
<column> |
İsteğe bağlı |
<table> alt öğesi. Bir sütunla ilgili bilgiler
dahil edilir. Aşağıdaki özellikleri içerir:
|
<data> |
İsteğe bağlı | <table> alt öğesi. Kaynak:
yardımcı olabilir. Dosya adı URL biçimindeyse
(ör. http://... ) ayarlanırsa dosya
uygun protokol (HTTP, HTTPS veya FTP); Aksi takdirde,
etiket bu ada sahip olmalıdır.
Gerekli format özelliğinin değeri:
her zaman csv . encoding özelliği
isteğe bağlıdır, .csv dosyalarınız UTF-8 olarak kodlanmış olmalıdır. |
Konular
Açıklama
Topics, kavramları hiyerarşik olarak sınıflandırarak kullanıcıların gezinebilmesini sağlar dönüşüm gerçekleştirebilirsiniz.
<topics>
öğesi,
DSPL dosyanızda <concepts>
öğesi. (sıra
çok önemlidir ve
öğeleri yanlış sırada görünebilir.) Konuları kullanmak için
öğrenebilirsiniz.
Örnek
Aşağıda örnek bir konu tanımı verilmiştir:
<topics> <topic id="population_indicators"> <info> <name> <value>Population indicators</value> </name> </info> </topic> ... </topics>
...ve aşağıda, bu konuya bir kavramdan örnek verilmiştir:
<concept id="population"> <info> <name> <value>Population</value> </name> <description> <value>Size of the resident population.</value> </description> <topic ref="population_indicators"/> <type ref="integer"/> </concept>
Konular iç içe yerleştirilebilir ve bir kavram birden fazla konuya referans verebilir.
Öğe tanımı
Öğe | Zorunlu mu? | Açıklama |
---|---|---|
<topics> |
Evet | Üst düzey öğe. <topic> öğesinin tümünü kapsar
öğeler. |
<topic> |
Evet | Konuyu tanımlar. Gerekli özelliğin değeri
id , veri kümesi için benzersiz olmalıdır. |
<info> |
İsteğe bağlı | <topic> alt öğesi. Şuna ilişkin bilgileri içerir:
konu. |
<name> |
İsteğe bağlı | <info> alt öğesi. Alt öğesi
<value> , konunun adını belirtir. |
DSPL Veri Dosyaları
XML meta veri dosyasına ek olarak, bir DSPL veri kümesi de
CSV biçiminde bir veya daha fazla veri dosyası ekleyin. Her bir veri dosyası
veri kümesindeki bir tabloyu destekler ve
<data>...</data>
bölümü. Kavram olarak bu dosyalar
ve bunlarla ilişkilendirilmiş tablolar, kavramı temsil etmek için
tanımlar veya dilim verileri kullanır. Bu veri dosyası türlerinin her biri
aşağıda daha ayrıntılı olarak açıklanmıştır.
Amaca bağımsız olarak tüm veri dosyalarının Virgülle ayrılmış (CSV) UTF-8 metin dosyaları. Dosyalar yalnızca düz içermelidir metin; HTML yok. Veri dosyalarını manuel olarak oluşturabilirsiniz. Ancak orijinal verileri içeren araçta verilere bir anlam çıkarması ve kaynakta (ör. e-tablo) veya dışa aktarılan dosyanın kendisinde
Dosyalar veri kümesiyle gruplanabilir veya Uzak bir kaynaktan HTTP, HTTPS veya FTP aracılığıyla getirilen URL.
Kavram Veri Dosyaları
Kavram veri dosyaları, her kavramla ilgili bilgiler içerir. İlgili içeriği oluşturmak için kullanılan
Kavram tanımı, terimler için <table>
öğesini kullanır.
bu dosyadaki dosyaları kullanabilirsiniz.
Örnek
Aşağıda, country
kavramı için bir tablo örneği verilmiştir.
aşağıda tanımlandığı gibi:
country, name AD, Andorra AF, Afghanistan AI, Anguilla AL, Albania AO, Angola AQ, Antarctica AS, American Samoa
Bu örneğin çalışma şekli şöyledir:
- Eşleme belirtilmezse veri dosyasının ilk satırı (sütun
başlıkları), konsept kimliği ve uygun mülkle tam olarak eşleşmelidir.
verilerin ilişkilendirildiği kavramın kimlikleri. Ancak, sıralamadaki
veri dosyasında aynı olması gerekmez ve
kavram tablosu. Bu durumda, ilk sütun
country
kavramı, ikinci sütun isename
mülkü. - Özellik sütunları isteğe bağlıdır; Bir mülkte sütun yoksa
değeri, her bir satır için tanımsız olduğu varsayılır. İlgili içeriği oluşturmak için kullanılan
örneğin yukarıdaki tabloda
latitude
velongitude
özellikleri olduğundan ülkeler eşlenemez. - Kavramın kimlik alanı için her değer (bu örnekte
country
) benzersiz olmalı ve boş olmamalıdır (boş alan bir (0 veya sadece boşluk karakteri bulunan) içerir. - Diğer kavramlara başvuruda bulunan mülklerin değerleri boş veya başvurulan kavramın geçerli bir değeri olabilir.
- Değerleri çift tırnak işareti içine almak, virgül, çift tırnak veya yeni satır karakterleri içermemelidir.
- Bir değerde görünen düz çift tırnak işaretinin önüne geçerek bu tırnak işaretinden çıkma çift tırnak işareti koyacağım.
Dilim Veri Dosyaları
Dilim veri dosyaları, her bir dilimle ilgili verileri içerir. Dilim
tanımı, şunlar için <table ref="...">
öğesini kullanır:
<table>
tanımına referans verir. Bu da
bu dosyada yer alır.
Örnek
Aşağıda,
Yukarıda açıklanan population_by_country
dilimi:
country, year, population AF, 1960, 9616353 AF, 1961, 9799379 AF, 1962, 9989846 AF, 1963, 10188299
Örneğin çalışma şekli şöyledir:
- Metrik alanı
population
şeklindedir. Alanlarcountry
veyear
boyut alanlarıdır. - Bir boyut alanının her değeri boş olmamalıdır. Buna zaman da dahildir seçin. Metrik alanlarına ait değerler boş olabilir. Boş bir değer hiçbir karakter içermez.
- Bir kavrama referansta bulunan her sütun başlığı (örneğin,
alanında
country
kavramını referans göstermelidir) kavramın kavram tanımındaki benzersiz kimliğiyle tam olarak eşleşmelidir. - Boyut değerlerinin benzersiz bir kombinasyonu, ör.
AF, 2000
, yalnızca bir kez yapılabilir. - Aynı zaman serisindeki satırlar (aynı kombinasyona sahip satırlar) boyut değerlerinin (zaman hariç tüm boyut değerlerinin) birlikte gruplanması gerekir sıralanması gerekmez.
İleri Seviye Özellikler
Çok Dilli Veri Kümeleri
Çevrilmiş XML Değerleri
xml:lang
özelliğini
DSPL dosyanızda <value>
öğesi. Bu özellik
standart, W3C
dil etiketleri hakkında daha fazla bilgi edinin. Bu özelliğin kullanımı isteğe bağlıdır; hayır ise
xml:lang
özelliği eklendi, içeriğin
İngilizce.
Aşağıdaki örnekte İngilizce olan bir veri kümesinin anlık görüntüsü gösterilmektedir. Bulgarca, Katalanca ve Basitleştirilmiş Çince:
<dspl ...> <info> <name> <value xml:lang="en">World Bank, World Development Indicators</value> <value xml:lang="bg">Световна банка, Индикатори за световно развитие</value> <value xml:lang="ca">Banc Mundial, Indicadors del desenvolupament mundial</value> <value xml:lang="zh-CN">国家/地区</value> </name> ... </info> <concepts> <concept id="country"> <info> <name> <value xml:lang="en">Country</value> <value xml:lang="bg">Страна</value> <value xml:lang="ca">País</value> <value xml:lang="zh-CN">国家/地区</value> </name> ... </info> ... </concept> ... </concepts> ... </dspl>
Çevrilmiş Mülkler
Bazı durumlarda, belgenin kapsamının ötesine geçen kavram düzeyinde meta veriler; kullanıcılara ek olarak (veya bunun yerine) kavram örnekleri. Bu, özellikle bir kavramın değerleri, özellik (ör. ad) dile göre değişir.
Bu tür değerleri birden çok dilde sağlamak için
Her tesis/dil kombinasyonuna karşılık gelen tanım tablosu.
Ardından, aşağıdaki adımları uygulayarak bu sütunları ilişkili özelliklerine ve dillerine bağlayın:
tabloya bir <mapProperty xml:lang="..."
ref="..." toColumn="...">
öğe grubu ekleniyor
referans etiketi olarak kullanabilirsiniz.
Aşağıda, İngilizce adları bulunan bir ülke kavramını tanımlayan bir örnek verilmiştir. İspanyolca ve Fransızca:
<concepts> ... <concept id="country" extends="geo:location"> ... <property id="name"> <info> <name> <value>Name</value> </name> <description> <value>The official name of the country</value> </description> </info> <type ref="string" /> </property> ... <table ref="countries_table"> <mapProperty xml:lang="en" ref="name" toColumn="name_en"/> <mapProperty xml:lang="es" ref="name" toColumn="name_es"/> <mapProperty xml:lang="fr" ref="name" toColumn="name_fr"/> </table> </concept> ... </concepts> ... <tables> ... <table id="countries_table"> <column id="country" type="string"/> <column id="name_en" type="string"/> <column id="name_es" type="string"/> <column id="name_fr" type="string"/> ... </table> </tables>
Bu durumda countries_table
için CSV dosyası
şu formu kullanın:
country,name_en,name_es,name_fr,... ... US,United States of America,Estados Unidos de América,États-Unis d'Amérique,... ...
Eşlenebilir Kavramlar
Birçok kavram (örneğin: ilçe, eyalet ve şehir) coğrafi konumlara karşılık gelen örneklere sahiptir. DSPL görselleştirebilmeleri için bu örneklerin coğrafi kodlamasını destekler. Google Herkese Açık Verileri animasyonlu harita grafiği.
Konseptiniz Dünya ülkeleri, ABD eyaletleri veya ABD ile eşdeğerse bir bağlantı kullanıyorsanız ilgili Google Standart Sayfası'na kavram; Açık coğrafi kodlamaya gerek yoktur. Daha fazla bilgi için Kanonik Kavramlar Kılavuzu'na bakın bolca fırsat sunuyor.
Aksi halde konseptinizi eşlenebilir hale getirmeniz gerekir. İlk adım
geo:location
tarihinden itibaren uzatın:
<concept id="..." extends="geo:location"> ... </concept>
Ardından, enlem ve boylamı özellik olarak açıkça eklemeniz gerekir:
<concept id="..." extends="geo:location"> ... <property id="latitude"/> <property id="longitude"/> </concept>
Ardından, bunların değerleri, ilgili kavram tanımı veri tablosu.
Kavram İlişkileri
Kavramlar genellikle diğer kavramlarla yapılandırılmış bir şekilde ilişkilidir. Örneğin, bir kıta örneği birden fazla ülke örnekleri; bunlar da birden fazla eyalet veya il örneklerine göz atın. Bunları kodlamak veri kümesi meta verilerindeki ilişkiler daha zengin görselleştirmeye olanak tanır özellikleri, ör. daraltılabilir ağaç gösterme pek çok yer var.
Aşağıdaki bölümlerde, proje yönetimi bağlamında desteklenen DSPL şeması.
Hiyerarşiler
Kavram hiyerarşileri, DSPL'de
isParent="true"
özelliği
Alt kavramın <property>
etiketi
ana kavramdaki örneklerin tanımlayıcılarıdır.
Örneğin, Google'ın ABD İlçesi kavramı şu formu kullanın:
<concept id="us_county" extends="geo:location"> <info> <name> <value xml:lang="en">County</value> </name> ... </info> ... <property id="state" concept="us_state" isParent="true"/> ... <data> <table ref="reference_us_counties"/> </data> </concept>
Destekleyici veri tablosunda,state
her ilçe için iki harfli eyalet kodu kullanılır. Bu tür meta veriler,
Eyaletleri ve ilçeleri hiyerarşi olarak gösteren Public Data Explorer
kullanıcıların keşfetmesini çok daha kolay hale getiriyor.
Bir kavramın çok sayıda alt öğe içerebileceğini ancak en fazla bir kavramın ebeveyn.
Eşleştirmeler
Kavram eşleme (yani, temelde aynı olan kavramlar
şey), isMapping="true"
özelliğini kullanabilirsiniz.property
Bir kavramın başka bir kavramla eşlendiğini belirtmek önceki kavramın tüm özellikleri ve nitelikleri içerir. Diğer uygulamaların yanı sıra bu, "bağlantı oluşturmak" için yararlıdır kişisel coğrafi kavramların Google'ın standart coğrafi veri kümesinde tanımlanmış olanlar:
<concept id="my_country" extends="geo:location"> <info> <name> <value xml:lang="en">Country</value> </name> ... </info> ... <property id="google_country_code" concept="geo:country" isMapping="true"/> <data> <table ref="countries_concept"/> </data> </concept>
Uzantılar
Kavram uzantıları, extends
öğesiyle belirtilir
tanımlanmıştır. Uzantılar, kullanıcıların
başka bir kavramın alt sınıfı olduğunu düşünebilirsiniz. İlgili içeriği oluşturmak için kullanılan
genişletilmiş kavram, üst öğesinin tüm özellik ve özelliklerini devralır.
ve başkalarını da ekleyebilirsiniz.
Örneğin, Google'ın currency
kavramı
unit
:
<concept id="unit"> ... </concept> <concept id="currency" extends="unit"> <info> <name> <value xml:lang="en">Currency unit</value> </name> ... </info> ... <table ref="currency_table"/> </concept>
Kavramın açıklamasına göz atın uzantıları hakkında daha fazla bilgi edinin.
Veri Kümenizi Gönderme
Veri kümenizi Google Public Data Explorer'a göndermek için şu adımları uygulayın: talimatlar:
- Bir dizin oluşturun.
- Veri kümesi dspl dosyasını, oluşturduğunuz dizine kaydedin. Şunları yaptığınızdan emin olun: .xml uzantısını kullanın.
- Tüm yerel .csv dosyalarını aynı dizine kaydedin. Veri dosyaları gibi URL'ler atlanabilir.
- Dizini sıkıştırın.
- Google Public Data'ya veri kümenizi yükleyin öğrenin.
Veri kümeniz yüklenip doğrulandıktan sonra imzalandıktan sonra test edebilirsiniz Google Hesabınıza giriş yapın. Siz kontrol edene kadar yayınlanmayacak ve hazır olduğunu söyleyin.