DSPL Check ist ein Dienstprogramm zur Validierung eines DSPL-Datasets. Kriterien wie die Einhaltung des offiziellen DSPL-Schemas, Konsistenz interner Referenzen und CSV-Dateistruktur. Das Dienstprogramm kann viele Probleme zu erkennen, die zu DSPL-Importfehlern führen. diese Probleme schnell zu beheben, bevor Sie mit dem Eingabeprozess beginnen.
Beachten Sie, dass das Dienstprogramm (noch) nicht Ihr DSPL-Dataset auf alle möglichen Probleme. Es werden jedoch die häufigsten Wenn Ihr Dataset also erfolgreich vom Tool validiert wurde, hohe Wahrscheinlichkeit, dass es importiert und in den Public Data Explorer. Weitere Informationen finden Sie im Abschnitt Details prüfen. unten finden Sie weitere Informationen.
DSPL-Prüfung wird ausgeführt
Grundlagen
Hinweis:In dieser Anleitung wird vorausgesetzt, dass Sie hat der Installation bereits gefolgt Anleitung auf der Seite mit den DSPL-Tools.
Um DSPL Check auszuführen, gehe zum Terminal / zur Eingabeaufforderung auf deinem System und Typ:
python dsplcheck.py [path to dataset XML or zip file]
wobei der in Klammern angegebene Term durch den relativen Pfad zu eine Dataset-XML-Datei oder ein gezipptes DSPL-Bundle.
Wenn das Dataset gültig ist, gibt das Tool eine erfolgreich“ angezeigt. Andernfalls werden eine oder mehrere Fehlermeldungen ausgegeben. und beschreibt, warum die Validierung fehlgeschlagen ist. Falls Letzteres eintritt, beheben Sie wie angegeben und führen Sie das Tool dann erneut aus.
Prüfpegel
Standardmäßig untersucht die DSPL-Prüfung das gesamte Dataset, einschließlich der CSV-Dateien. auf die in der DSPL-XML-Hauptdatei verwiesen wird. Dieser Prozess eignet sich gut für kleine bis hin zu mittelgroßen Datasets. für Datasets, die sehr groß sind (d.h. im Bereich Hunderte von Megabyte oder größer).
Um diese Probleme zu beheben, verfügt das Tool über eine Prüfebene.
mit der Sie den Umfang der Prüfung festlegen und
die Leistung bei Bedarf anpassen. Zum Verwenden --checking_level=[...]
einfügen
vor dem Dataset-Pfad, wobei der in Klammern gesetzte Term durch einen der
folgende Werte:
schema_only
: Validiert die Dataset-XML-Datei anhand des DSPL-Schema und halten Sie dann an.schema_and_model
: Schema- und grundlegende Modellvalidierung durchführen, aber CSV-Inhalte nach der Kopfzeile ignorieren.full
: Schema-, Modell- und Datenvalidierung durchführen (Standardeinstellung)
Überprüfungsdetails
Die DSPL-Prüfung führt die folgenden Validierungen durch:
- Validierung des XML-Schemas: Überprüft, ob Ihr Dataset Metadatendatei eine gültige XML-Datei ist und den offizielles DSPL-Schema.
- CSV-Datei vorhanden:Es wird geprüft, ob alle CSV-Dateien die in Ihrem Dataset referenziert sind, und können geladen werden.
-
Konzeptprüfungen: Verschiedene Prüfungen jedes Konzepts in Ihrem
Dataset, einschließlich:
<ph type="x-smartling-placeholder">
- </ph>
- Dataset enthält mindestens ein Konzept*
- Alle Themenverweise sind gültig
- Tabellenverweis ist vorhanden, wenn das Konzept nicht zeitbezogen verwendet wird Dimension*
- Tabellenverweis ist gültig, falls vorhanden
- Die referenzierte Tabelle hat eine Spalte, die der Konzept-ID entspricht
-
Slice-Prüfungen:Verschiedene Prüfungen jedes Slice in Ihrem
Dataset, einschließlich:
<ph type="x-smartling-placeholder">
- </ph>
- Dataset hat mindestens ein Segment*
- Mindestens ein Segment verweist auf eine Nicht-Zeitdimension*
- Das Segment hat mindestens einen Messwert und eine Dimension
- Bezieht sich auf genau eine Dimension
time
kanonisches Konzept* - Jedes Segment hat eine eindeutige Kombination von Dimensionen
- Alle Verweise auf lokale Konzepte sind gültig
- Tabellenreferenz vorhanden
- Tabellenverweis ist gültig
- Die referenzierte Tabelle hat eine Spalte für jede Dimension und jeden Messwert im Segment
- Die Spaltentypen in der referenzierten Tabelle entsprechen den Typen der die im Slice verwendete Konzepte
-
Tabellenprüfungen:Verschiedene Prüfungen jeder Tabelle im
Dataset, einschließlich:
<ph type="x-smartling-placeholder">
- </ph>
- Dataset enthält mindestens eine Tabelle*
- Die Anzahl der Spalten der CSV-Datei entspricht der der Tabelle
- CSV-Headerstrings stimmen mit Spalten-IDs überein
- Alle Datumsspalten haben ein
format
-Attribut - Datumsformate entsprechen ungefähr den
dazugehörigen Zeitkonzepten,
Das Format für eine
time:year
-Spalte umfasst z.B. mindestens einy
Zeichen*
-
CSV-Datenprüfungen:Verschiedene Prüfungen der CSV-Datendateien
in Ihrer Dataset-XML-Datei, auf die verwiesen wird, einschließlich:
<ph type="x-smartling-placeholder">
- </ph>
- Jede CSV-Zeile hat dieselbe Anzahl an Spalten wie der Header
- Die CSV-Datei mit Konzeptdefinitionen enthält jeweils nur eine Zeile Konzept-ID
- Die Slice-CSV-Datei enthält nicht mehr als eine Zeile für jede Kombination von Dimensionen
- Dimensionswerte, auf die in der Slice-CSV-Datei verwiesen wird, sind gültig
- Die Slice-CSV-Datei ist richtig sortiert
- CSV-Werte mit Ganzzahl und Gleitkommazahl sind korrekt formatiert
Mit einem * gekennzeichnete Kriterien sind erforderlich für Visualisierung im Public Data Explorer, sind jedoch für das DSPL-Format.
Andererseits berücksichtigt das Tool (noch) nicht Folgendes:
- Dataset-Importe
- Attribut- und Attributverweise
- Konzepterweiterungen