DSPL ile ilgili SSS

Bu dokümanda, veri sahiplerinin DSPL veri kümeleri oluştururken ve bunları Public Data Explorer'a yüklerken karşılaştığı en yaygın sorunlar ele alınmaktadır.

İçindekiler

Genel Sorular

DSPL nedir?

DSPL, Veri Kümesi Yayınlama Dili anlamına gelir. Hem meta verileri (veri kümesinin adı ve sağlayıcısı gibi veri kümesiyle ilgili bilgiler ile içerdiği ve görüntülediği kavramlar) hem de veri kümelerinin gerçek verilerini temsil eder. Meta veriler XML olarak belirtilirken veriler CSV biçiminde sağlanır.

DSPL'yi kullanmanın temel avantajları nelerdir?

DSPL, baştan sona Public Data Explorer'daki gibi zengin veri görselleştirmeleri için tasarlanmıştır. Bunları oluşturmak için diğer veri kümesi biçimlerinde pek de desteklenmeyen dilimler, boyutlar ve metriklerle ilgili ayrıntılı meta veriler gerekir.

DSPL aynı zamanda veri kümesi içe aktarmalarını, kavram hiyerarşilerini (ör. "country"; "kıtanın"), coğrafi kodlu verilerin ve veri keşfi deneyimini geliştiren bir dizi diğer benzersiz özelliğin alt öğesidir.

DSPL, veri değişimi ve/veya analizi için kullanılan diğer biçimlerin yerine geçer mi?

Genellikle hayır. Önceki yanıtta belirtildiği gibi DSPL, etkileşimli görselleştirme ve keşif için tasarlanmıştır. Genel, her şeyi kapsayan bir veri değişimi veya analizi biçimi olarak tasarlanmamıştır.

Sonuç olarak DSPL'yi diğer biçimlere tamamlayıcı olarak görüyoruz. Kullanıcılar, zengin ve etkileşimli veri görselleştirmeleri oluşturmak için diğer kaynaklardan DSPL veri kümeleri oluşturabilmelidir.

DSPL veri kümesiyle ne yapabilirim?

Verileri Public Data Explorer'a aktarabilir, yayınlayabilir ve diğer kullanıcıların zengin, etkileşimli görselleştirmeler aracılığıyla verileri keşfetmesine izin verebilirsiniz. Yayınlanan veri kümeleri, ilgilenen kullanıcıların bulabilmesi için Public Data Directory'ye de eklenebilir.

Şu anda DSPL kullanan tek uygulama budur. Bununla birlikte, kullanıcıların onu başka uygulamalarda kullanmasını teşvik ediyoruz ve zamanla bu özelliğin benimsenmesinin artacağını umuyoruz.

DSPL için en uygun veri kümesi türleri nelerdir?

DSPL biçimi, rastgele tablo koleksiyonlarını destekler ve bu nedenle çok çeşitli veri kümesi türleri için uygundur. Bununla birlikte, DSPL veri kümelerinin yalnızca bir alt kümesi, Public Data Explorer'da ilginç görselleştirmeler oluşturur. Özellikle ikinci ürün, şu veriler için en iyi sonucu verir:

  • Nicel: Her veri noktasıyla ilişkili bir veya daha fazla sayısal metrik vardır (ör. "population", "grip vakalarının sayısı", "gelir").
  • Kategorik: Veriler, metinle tanımlanabilir sınırlı sayıda kategori (ör. "ülkeler", "cinsiyetler", "yaş grupları").
  • Zaman serisi: Her kategori için veri metrikleri zaman işlevi olarak değişir ve bitişik noktaların arasında en az bir gün vardır (Public Data Explorer, bir günden küçük zaman artışlarını görselleştiremez).
  • Toplu: Her zaman / kategori / metrik kombinasyonu için etkinliklerin veya verilerin bir listesi değil, tek bir veri noktası bulunur.

Bir DSPL veri kümesi oluşturdum ve başkalarının da bulabilmesi için bu veri kümesinin Google Herkese Açık Veri Dizini'nde görünmesini istiyorum. Kiminle iletişime geçmeliyim?

Lütfen bu formu doldurup veri kümenizin bağlantısını sağlayın.

DSPL ile ilgili sorun yaşıyorum. Nereden yardım alabilirim?

Lütfen sorununuzu DSPL tartışma forumunda yayınlayın.

DSPL Veri Kümesi Dosyaları

XML ve CSV dosyalarımı nasıl kodlamalıyım?

Tüm XML ve CSV dosyalarının UTF-8 olarak kodlanmış olması gerekir. ASCII'nin (bazen "düz metin" olarak da adlandırılır) bir UTF-8 alt kümesi olduğunu, dolayısıyla bu biçimdeki veri kümelerinin de çalışacağını unutmayın.

Veri kümesi dosyalarımı oluşturmak ve düzenlemek için hangi yazılımı kullanmalıyım?

Okunabilirlik amacıyla söz dizimi vurgulamaya sahip bir düz metin düzenleyici, XML dosyalarınızı düzenlemek için önerilen seçenektir. Platforma özel öneriler için bu makaleyi inceleyin. Tam özellikli, genel amaçlı kelime işlemciler XML dosyanıza ilave biçimlendirme etiketleri eklediğinden, bu da içe aktarma hatalarına neden olabileceğinden tam özellikli, genel amaçlı kelime işlemciler kullanmamanızı öneririz.

E-tablo, genellikle veri dosyalarınızı oluşturmanın ve düzenlemenin en kolay yoludur. Ancak bunları doğru biçimde (CSV / virgülle ayrılmış değerler) kaydettiğinizden emin olun.

Excel, SPSS, SAS veya başka bir sistemde verilerim var. Bunları doğrudan Public Data Explorer'a aktarabilir miyim?

Hayır, şimdi değil. Önce verilerinizi CSV biçiminde dışa aktarmanız, uygun XML meta verilerini eklemeniz ve daha sonra Public Data Explorer'a DSPL uyumlu bir veri kümesi yüklemeniz gerekir.

Dosyalarıma ne ad verdiğimin bir önemi var mı?

Veri kümesi XML dosyanızın adı .xml ile biten bir ada sahip olmalıdır. İlişkili CSV veri dosyaları, XML meta verilerinizdeki <file> etiketlerinde belirtilen adlarla eşleşmeleri koşuluyla herhangi bir ada sahip olabilir. Veri kümesini paketlemek ve Public Data Explorer'a aktarmak için kullanılan ZIP dosyasının herhangi bir adı olabilir.

CSV dosyalarım sıralanmalı mı?

Evet. CSV dosyalarınızın içeriğini zaman harici boyutlara göre (herhangi bir sırada veya yönde) ve isteğe bağlı olarak diğer sütunlardan herhangi birine (ör. zamana) göre sıralamanız gerekir.

Örneğin, date, dimension1, dimension2, metric1 ve metric2 sütunlarını içeren bir CSV'niz varsa dimension1 ve dimension2 sütununa göre (herhangi bir sırada) sıralamanız gerekir. Tarih/saat sütununa göre de sıralama yapmak istiyorsanız sıralama yaptığınız son değer bu olmalıdır.

Bu şekilde sıralama, her zaman serisine ait gözlemlerin birlikte gruplandırılmasını sağlar. Böylece, DSPL içe aktarma işleminin verimliliği büyük ölçüde artar.

XML Modeli ve Söz Dizimi

Nelerin metrik ve boyutların olması gerektiğine nasıl karar verebilirim?

Boyut, verilerinizi segmentlere ayırmak veya filtrelemek için kullanılan bir öğedir. Öte yandan metrik, her bir veri noktasıyla ilişkili gözlemlenen değeri veya değerleri açıklar.

Genel olarak boyutlar kategoriktir. Metrikler ise kategorik olmayan, zamana bağlı olan sayısal değerlerdir. Her biriyle ilgili bazı prototip örnekler aşağıda verilmiştir:

  • Boyutlar: Ülke, eyalet, ilçe, bölge, yıl, ay, cinsiyet, yaş kategorisi, sektör segmenti
  • Metrikler: Nüfus, GSYİH, işsizlik oranı, okuryazarlık, gelir, maliyet, fiyat

Mülk ile özellik arasındaki fark nedir?

Özellikler, bir kavramın her örneğine eklenir. Örneğin, bir kıta mülkü farklı ülkeler için farklı değerlere sahip olur. Öte yandan özellikler, bir bütün olarak kavramla ilişkilendirilir. Örneğin: isParent özelliği tüm kıtalar için doğrudur.

Etiketlerin sırası önemli mi?

Evet. Etiketlerinizi Geliştirici Kılavuzu'nda göründükleri sırayla ekleyin. Örneğin <topic>, bir kavramın tanımında <type> öncesinde yer almalıdır.

Büyük harf kullanımı önemli mi?

Evet, XML etiketinizin ve özellik adlarınızın büyük harfle yazılması gerekir. Bu, Geliştirici Kılavuzu'nda görüldüğü gibidir. Örneğin, property etiketinde isParent yerine isparent kullanılması içe aktarma hatasına neden olur.

Bir kavramın iki üst öğesi olabilir mi?

Hayır. Her kavramın yalnızca bir isParent referansı olabilir.

Bir kavram kendisine atıfta bulunabilir mi?

Evet. Kendine referans veren kavram hiyerarşisine ilişkin bir örnek için ABD Perakende Satışları veri kümesine bakın.

Veri Biçimlendirme

Tarihleri nasıl biçimlendiririm?

Tarihler, Jada DateTime standardı ile açıklanabilir herhangi bir biçimde yazılabilir. Joda biçimlendirme kodu, karşılık gelen tablo sütunu öğesinde bir format özelliğinde depolanmalıdır.

Bazı popüler tarih biçimlerinin Joda biçimlendirme kodları aşağıda listelenmiştir:

Tarih Örneği Joda Biçimi
2010 yyyy
Mayıs 2010 MMM yyyy
21.05.2010 MM/dd/yyyy
21.05.2010 dd/MM/yyyy
2010-05-21 yyyy-MM-dd

Özellikle ay karakterleri için Joda kodunun m (dakikayı temsil eder) değil, M olduğuna dikkat edin.

Bir günden kısa zaman birimlerini kullanabilir miyim?

Joda DateTime biçimi ve dolayısıyla DSPL de milisaniye cinsinden zaman değerlerini destekler. Ancak Public Data Explorer, (henüz) bir günden kısa zaman ayrıntı düzeylerini görselleştiremez.

Standart Kavramları Kullanma

"Standart kavramlar" nedir ve nasıl yararlıdır?

"Standart kavramlar" terimi, diğer veri kümelerinde temel "yapı taşları" olarak tasarlanmış, Google tarafından oluşturulmuş bir dizi kavramı ifade eder. Kavramların kendisi, altı DSPL veri kümesi genelinde tanımlanır ve ilk verileri "zaman", "coğrafi" vb. gibi kategorilere ayırır. Bu kavramlara erişmek için DSPL XML dosyanızın başında uygun üst veri kümelerini içe aktarmanız yeterlidir.

Standart kavramlar size zaman kazandırmaları (ör. dünyadaki her ülke için manuel olarak enlem ve boylam değerlerini girmek zorunda kalmadan) yardımcı olmaları ve verilerinizin nasıl görselleştirileceğini göstermeleri nedeniyle yararlıdır. Örneğin, Public Data Explorer, çizgi grafik x eksenini biçimlendirmek için time:... kavramlarını kullanır, boyut seçici kullanıcı arayüzü için dizeler oluşturmak amacıyla entity:entity kavramının name özelliğini kullanır, verileri harita görselleştirmede görüntülemek için geo:location öğesinin latitude ve longitude özelliklerini kullanır ve bu şekilde devam eder.

Public Data Explorer, tüm standart kavramları anlıyor mu?

Sağlanan standart kavramların çoğu Public Data Explorer tarafından anlaşılsa da (henüz) görselleştirilemeyen birkaç kavram vardır. Bunlar, önerilen bazı geçici çözümlerle birlikte aşağıda listelenmiştir:

Konsept Geçici çözüm
quantity:index Bunun yerine quantity:ratio veya quantity:magnitude kullanın.
time:quarter time:month öğesini DSPL Tarif Defteri'nde açıklandığı şekilde kullanın.
time:week time:day öğesini DSPL Tarif Defteri'nde açıklandığı şekilde kullanın.

Gelecekte bu kavramları daha iyi desteklemek için bizi takip etmeye devam edin.

Veri kümemde standart bir kavramı nasıl kullanabilirim?

Kullanmak istediğiniz kavramla ilgili belgeleri inceleyin. Ayrıca en yaygın kavramlarla ilgili adım adım açıklamalı ayrıntılı talimatlar içeren DSPL Tarif Defteri'ne de göz atın.

Veri Kümelerini İçe Aktarma ve Görselleştirme

Veri kümemi neden başarılı bir şekilde içe aktaramıyorum?

Public Data Explorer'ın yükleme arayüzü, DSPL veri kümenizi tarar ve herhangi bir hata tespit edilirse içe aktarma işlemini engeller. İçe aktaran, XML dosyanızdaki yazım, büyük harf kullanımı ve etiket düzeni / yerleşimi ile CSV dosyalarınızdaki verilerin düzeni ve sıralaması konularında son derece hassastır. Bu nedenle, bu işlemleri yapmak ve veri kümenizi başarıyla içe aktarmak için birkaç işlem gerekebilir.

Bu sorunları çözmenin ilk adımı, kullanıcı arayüzünde verilen hata mesajlarına bakmak ve uygun düzeltme işlemini yapmaktır. Bu mesajlar her zaman anlaşılması en kolay mesajlar olmadığından (etkin şekilde iyileştirmeye çalışıyoruz) bu konuda en yaygın olanları açıklayan bir tablo derledik:

Hata Açıklama
yinelenen anahtar: ... Kavramınızın tanım tablosunda tekrarlanan bir kimlik değeri (yani, sütunda kavramla aynı ada sahip olan değer) bulunuyor. Bu değerler, kavramın bağımsız örneklerini benzersiz şekilde tanımlamak için kullanıldığından yinelemelere izin verilmez.
Kaynaktan veri satırlarının ayrıştırılmasında ortaya çıkan istisnanın nedeni [...] özellik kombinasyonu, verilerde birden fazla ayrı satır grubunda görünüyor. CSV'niz düzgün bir şekilde sıralanmamış. Bunun nasıl yapılacağıyla ilgili talimatlar için yukarıdaki tartışmaya göz atın.
Geçersiz biçimin neden olduğu kaynaktan veri satırlarının ayrıştırılmasında istisna: "..." hatalı biçimlendirilmiş "..." CSV'nizdeki bu değerin (genellikle bir tarih) biçimlendirmesi, XML dosyanızda verilen biçimle tutarlı değil. Biçimi veya değeri eşleşecek şekilde değiştirin.
(...) numaralı satırdaki öğe sayısı nedeniyle kaynaktaki veri satırlarını ayrıştırmayla ilgili istisna, [...] satırı için belirtilen özellik sayısıyla (...) eşleşmedi CSV'nizdeki bir satırda çok fazla veya çok az değer var. Bu satırın biçimlendirmesini düzeltin.
"..." için giriş dizesi nedeniyle kaynaktan veri satırlarının ayrıştırılmasında istisna oluştu. CSV dosyanızdaki bir değerin (genellikle tam sayı veya kayan noktalı) doğru şekilde ayrıştırılmasını engelleyen sayısal olmayan karakterler (ör. dolar simgesi, yüzde işareti vb.) var. Bu ekstra karakterleri kaldırın.
"..." Dilimin "..." özelliği için "..." veri değeri nedeniyle kaynaktaki veri satırlarını ayrıştırma istisnası, başvuruda bulunulan "..." Kavramının anahtar değeri değil. Dilimlerinizden birinde tanınmayan bir boyut değeri (ör. ilgili kavramın tüm olası değerleri listesinde yer almayan bir değerden birini belirleyin. Boyut kavramı tanımı tablosuna dönün ve gerekirse değeri ekleyin.
Verilerdeki "..." başlığı, tabloda sabit bir özelliktir CSV'deki sütun başlığı, XML tablosu tanımında tanımlanan sütun kimliğiyle eşleşmiyor. İkisinden birini, eşleşecek şekilde değiştirin.
XML ayrıştırma hatası ... '...' öğesiyle başlayan geçersiz içerik bulundu. '{...}', '{...}', ... değerlerinden biri bekleniyor. Başvuruda bulunulan XML öğesi doğru yerde değil. Sıranın doğru olduğundan ve öğenin doğru üst öğeye sahip olduğundan (ör. name için info).
XML ayrıştırma hatası ... "..." özelliğinin "..." öğesinde görünmesine izin verilmiyor. Bu XML etiketi özelliğinin yazımı, büyük/küçük harf kullanımı veya konumu yanlış. Uygun kullanım için dokümanları kontrol edin.
XML ayrıştırma hatası. ... Türün içerik türü yalnızca öğe olduğundan "..." öğesinde [children] karakteri bulunamaz. XML dosyanızda yanlış metin var (< veya > eksik bir etiket olabilir.). Metni düzeltip tekrar deneyin.

Yukarıdaki listede yer almayan bir iletiyi anlamakta sorun yaşıyorsanız lütfen DSPL forumunda bir ileti yayınlayın. Size yardımcı olmaya çalışırız.

Veri kümem başarıyla içe aktarılıyor ancak Public Data Explorer'da herhangi bir görselleştirme alamıyorum. Neler oluyor?

Bu sorun, veri kümenizin geçerli DSPL olması ancak Public Data Explorer'da görselleştirilebilen DSPL alt kümesinde yer almaması durumunda ortaya çıkar. Bunun birçok olası nedeni vardır. En yaygın nedenler şunlardır:

  • Tablo olmadan boyut kavramı tanımlama: Bu bilgiler olmadan Public Data Explorer, kullanıcı arayüzünde hangi seçenekleri görüntüleyeceğini bilemez.
  • Yalnızca metriklerle veri kümesi oluşturma: Public Data Explorer, görselleştirme kullanıcı arayüzünü düzgün şekilde yapılandırmak için veri kümesindeki bir konumda tanımlanmış en az bir kategorik (zaman olmayan) boyut gerektirir.
  • Dilimlerinize zaman boyutu eklememe: Public Data Explorer yalnızca zaman serilerini görselleştirebilir. Zaman harici dilimler ürün tarafından yoksayılır.
  • Standart time:... dışında bir zaman boyutu kullanma: Public Data Explorer, üründeki çeşitli görselleştirmeleri düzenlemek ve canlandırmak için standart time kavramlarını kullanır.Diğer zaman kavramlarını (ör. kendi veri kümenizde oluşturulanlar) anlamaz.
  • Çok büyük veya çok küçük zaman değerleri kullanma: Public Data Explorer, henüz bir günden kısa zaman ayrıntı düzeyine sahip veri kümelerini görselleştirmez. Diğer ucunda ise araç, çok büyük yıl değerleriyle (ör. on binlerce) ilgili sorunlar yaşamaktadır. Gelecekte bu ayrıntı düzeyini daha esnek hale getirmeyi umuyoruz.

Görselleştirilmiş veri kümemi web siteme nasıl entegre ederim?

Public Data Explorer Yardım Merkezi'nde bu makaleyi inceleyin. İkinci bölümde açıklandığı gibi, yerleştirme URL'sini manuel olarak ayarlayarak "tam yerleştirme" (ör. keşif kontrollerini içeren bir) elde edebilirsiniz.