Datentypen und semantische Typen

Wenn Sie einen Community-Connector erstellen, ist für jedes Feld, das Sie im Schema definieren, ein Datentyp erforderlich. Der Datentyp definiert den primitiven Typ des Felds, z. B. BOOLEAN, STRING, NUMBER usw.

Neben Datentypen verwendet Data Studio auch semantische Typen. Semantische Typen helfen, die Art der Informationen zu beschreiben, die die Daten darstellen. Beispielsweise kann ein Feld mit dem Datentyp NUMBER semantisch einen Währungsbetrag oder Prozentsatz darstellen und ein Feld mit dem Datentyp STRING semantisch eine Stadt. Welche semantischen Typen verfügbar sind, erfahren Sie in der Dokumentation zu semantischen Typen.

Community-Connector-Schema und Data Studio-Felder

Wenn Sie das Schema für Ihren Community-Connector definieren, gibt es verschiedene Eigenschaften für jedes Feld, die bestimmen, wie das Feld in Data Studio dargestellt und verwendet wird. Beispiel:

  • Der conceptType wird im Connectorschema mit der conceptType Eigenschaft definiert. Diese Eigenschaft bestimmt, ob das Feld als Dimension oder Messwert behandelt wird. Eine Erklärung zum Unterschied zwischen Messwerten und Dimensionen finden Sie unter Dimensionen und Messwerte.
  • Der semantische Typ kann entweder im Connectorschema definiert oder von Data Studio automatisch anhand der im Connector definierten Eigenschaft „Datentyp“ und der von Ihrem Connector zurückgegebenen Datenwerte erkannt werden. Weitere Informationen finden Sie unter Automatische Erkennung semantischer Typen zu dieser Funktion.
  • Der Aggregationstyp bestimmt, ob die Messwerte (Dimensionen werden ignoriert) neu aggregiert werden können. Wenn Sie die Eigenschaft semantics.isReaggregatable auf true setzen, wird standardmäßig die Aggregation SUM verwendet. Andernfalls wird sie auf Auto gesetzt. Sie können den Standardaggregationstyp für neu aggregierbare Felder auch manuell mit der defaultAggregationType Eigenschaft festlegen.

Wenn Sie einen Connector in Data Studio konfigurieren und eine Verbindung herstellen, wird im Feldeditor das vollständige Schema für den Connector angezeigt, basierend darauf, wie Sie die oben genannten Eigenschaften definiert haben. Wenn Sie die semantischen Typen angegeben haben, werden sie so angezeigt, wie Sie sie definiert haben. Wenn Sie die automatische Erkennung semantischer Typenverwenden, werden die Felder so angezeigt, wie sie erkannt wurden. Bildschirm „Felder“

Semantische Informationen festlegen

Es gibt zwei Möglichkeiten, semantische Informationen festzulegen. Sie können die Feldsemantik entweder manuell festlegen oder Data Studio sie automatisch erkennen lassen.

Wenn Sie beispielsweise eine Zahl haben, die semantisch US-Dollar darstellt, kann Data Studio diesen semantischen Typ nicht automatisch erkennen. Außerdem erfordert die automatische semantische Erkennung, dass Data Studio für jedes Feld Ihres Schemas Datenabrufe durchführt. Wenn Sie das Schema stattdessen manuell angeben, werden keine Datenabrufe durchgeführt. Wenn Sie den semantischen Typ (z.B. Währung, Prozentsatz, Datum usw.) für Ihre Daten kennen, empfehlen wir, ihn aus Genauigkeits- und Leistungsgründen explizit im Schema festzulegen.

Semantische Typen manuell festlegen (empfohlen)

Wenn Sie die semantischen Typen kennen, können Sie semantics für jedes Schemafeld manuell definieren. Alle verfügbaren Eigenschaften finden Sie in der Feldreferenzseite. Wenn Sie semantische Typen manuell definieren, empfehlen wir, für jedes Feld semanticType und semanticGroup zu definieren. Wenn Sie diese Eigenschaften manuell angeben, wird die automatische Erkennung semantischer Typen nicht ausgeführt. Wenn Sie einige, aber nicht alle Felder manuell festlegen, werden die nicht angegebenen Felder standardmäßig auf Text, Number oder Boolean gesetzt, je nach dem für das Feld angegebenen dataType.

Das folgende Beispiel zeigt ein einfaches Schema, in dem semantische Typen manuell festgelegt werden. Income ist als Währung und Filing Year als Datum festgelegt.

data-studio/semantics.gs
const schema = [
  {
    name: "Income",
    label: "Income (in USD)",
    dataType: "NUMBER",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "CURRENCY",
      semanticType: "CURRENCY_USD",
    },
  },
  {
    name: "Filing Year",
    label: "Year in which you filed the taxes.",
    dataType: "STRING",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "DATE_OR_TIME",
      semanticType: "YEAR",
    },
  },
];

Fehlerbehebung bei manuellen semantischen Typen

Wenn Sie die semantischen Typen für die zugrunde liegenden Daten falsch festlegen, funktionieren sie nicht richtig. Das kann schwierig zu testen sein, aber es gibt einige Dinge, die Sie tun können, um Probleme zu finden.

  1. Geben Sie 2 oder 3 Zeilen aus Ihren Daten zurück, anstatt alle, und prüfen Sie sie dann manuell.
  2. Erstellen Sie in Data Studio eine Tabelle, in der nur das Feld verwendet wird, das Sie prüfen möchten.
  3. Achten Sie genau auf die Felder Geo und Date, da sie das strengste Format haben.

Automatische Erkennung semantischer Typen

Wenn Sie in Ihrem Schema keine semantischen Typen definiert haben, versucht Data Studio , sie automatisch anhand der Eigenschaft „Datentyp“ und des Formats der von Ihrem Connector zurückgegebenen Datenwerte zu erkennen.

Die Schritte der automatischen Erkennung sind wie folgt:

  1. Fordern Sie das Schema an, indem Sie die getSchema Funktion Ihres Community-Connectors ausführen.
  2. Durchlaufen Sie Batches von Feldern, die im Connectorschema definiert sind, und senden Sie getData Anfragen für die Felder. Die getData-Anfragen werden mit dem Parameter sampleExtraction auf true gesetzt, um anzugeben, dass die Datenanfragen für die semantische Erkennung bestimmt sind.
  3. Ermitteln Sie anhand des Datentyps des Felds und des Formats des von der getData-Anfrage zurückgegebenen Werts den semantischen Typ des Felds.

Optionen für die automatische Erkennung semantischer Typen

Wenn Data Studio die Funktion getData eines Community-Connectors zur semantischen Erkennung ausführt, enthält die eingehende Anfrage die Eigenschaft sampleExtraction, die auf true gesetzt ist. Die von Ihrem Connector zurückgegebenen Daten werden von Data Studio nur verwendet, um den semantischen Typ des Felds zu ermitteln. Da der Wert nicht für andere Zwecke verwendet wird, sind keine tatsächlichen Daten aus Ihrer externen Quelle erforderlich.

Es gibt mehrere Möglichkeiten, die Erkennung semantischer Typen in Ihrem Code zu verbessern:

  • Empfohlen: Vordefinierte Werte übergeben
    Geben Sie für jedes Feld einen vordefinierten Wert zurück, der den semantischen Typ für das Feld am besten darstellt und von Data Studio richtig erkannt wird. Wenn der semantische Typ für ein Feld beispielsweise Country ist, geben Sie einen Wert wie IT für Italien zurück. Ein weiterer Vorteil dieses Ansatzes ist, dass er viel schneller ist, da Sie keine HTTP-Anfragen an den Drittanbieterdienst senden müssen, um Daten abzurufen.

  • Nur n Datensätze zurückgeben
    Wenn der Drittanbieterdienst, von dem Sie Daten abrufen, bei der Anforderung von Daten Zeilenlimits unterstützt, geben Sie an Data Studio eine kleine Teilmenge von Zeilen anstelle des vollständigen Datensatzes zurück. Dadurch wird die Datenmenge begrenzt, die Sie für jede semantische Erkennungsanfrage an Data Studio übergeben müssen.

  • Alle Spalten anfordern und die Antwort im Cache speichern
    Wenn Sie alle Spalten für den Drittanbieterdienst anfordern können, von dem Sie Daten abrufen, rufen Sie bei der ersten semantischen Erkennungsanfrage, die Sie von Data Studio erhalten, alle Spalten ab und speichern Sie die Ergebnisse im Cache. Bei nachfolgenden semantischen Erkennungsanfragen rufen Sie die Spaltenwerte aus dem Cache ab, anstatt zusätzliche HTTP-Anfragen an den Drittanbieterdienst zu senden.

  • Nichts ändern
    Sie können auch keine besonderen Maßnahmen für Anfragen implementieren, bei denen sampleExtraction auf true gesetzt ist. Dadurch wird die semantische Erkennung langsamer, da Data Studio alle Daten für die semantische Erkennung abrufen muss. Außerdem wirkt sich dies auf die Anforderungsrate an Ihre externe Datenquelle aus, da viele semantische Erkennungsanfragen parallel ausgeführt werden.

Erkannte Formate für die automatische Erkennung semantischer Typen

Datum und Uhrzeit
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Zeit: Epoche für Sekunde, Mikrosekunde, Millisekunde und Nanosekunde.
Geo