Datentypen und semantische Typen

Wenn Sie einen Community-Connector erstellen, ist für jedes Feld, das Sie im Schema definieren, ein Datentyp erforderlich. Der Datentyp definiert den primitiven Typ des Felds, z. B. BOOLEAN, STRING, NUMBER usw.

In Looker Studio werden nicht nur Datentypen, sondern auch semantische Typen verwendet. Semantische Typen helfen dabei, die Art von Informationen zu beschreiben, die die Daten darstellen. Beispielsweise kann ein Feld mit dem Datentyp NUMBER semantisch einen Währungsbetrag oder -prozentsatz und ein Feld mit dem Datentyp STRING semantisch eine Stadt darstellen. Informationen zu den verfügbaren semantischen Typen finden Sie in der Dokumentation zu semantischen Typen.

Community-Connector-Schema und Looker Studio-Felder

Wenn Sie das Schema für den Community-Connector definieren, gibt es verschiedene Eigenschaften für jedes Feld, die bestimmen, wie das Feld in Looker Studio dargestellt und verwendet wird. Beispiel:

  • Der conceptType wird in Ihrem Connector-Schema mithilfe des Attributs conceptType definiert. Diese Property bestimmt, ob das Feld als Dimension oder Messwert behandelt wird. Eine Erläuterung des Unterschieds zwischen Messwerten und Dimensionen finden Sie unter Dimensionen und Messwerte.
  • Der semantische Typ kann entweder im Connector-Schema definiert oder automatisch von Looker Studio anhand der Datentyp-Eigenschaft, die in Ihrem Connector definiert ist, und den vom Connector zurückgegebenen Datenwerten erkannt werden. Weitere Informationen finden Sie unter Automatische semantische Typerkennung.
  • Der Aggregationstyp bestimmt, ob die Messwerte (Dimensionen werden ignoriert) neu aggregiert werden. Wenn Sie das Attribut semantics.isReaggregatable auf true setzen, wird standardmäßig die Aggregation SUM verwendet. Andernfalls wird Auto festgelegt. Mit dem Attribut defaultAggregationType können Sie den Standardaggregationstyp für aggregierbare Felder auch manuell festlegen.

Wenn Sie in Looker Studio einen Connector konfigurieren und eine Verbindung herstellen, wird im Feldeditor das vollständige Schema für den Connector angezeigt, je nachdem, wie Sie die Attribute oben definiert haben. Wenn Sie die semantischen Typen eingeschlossen haben, werden sie so angezeigt, wie Sie sie definiert haben. Wenn Sie die automatische semantische Typerkennung verwenden, werden die Felder so angezeigt, wie sie erkannt wurden. Bildschirm Felder

Semantische Informationen festlegen

Es gibt zwei Möglichkeiten, semantische Informationen festzulegen. Sie können die Feldsemantik entweder manuell festlegen oder die automatische Erkennung von Looker Studio ausführen lassen.

Wenn Sie beispielsweise eine Zahl haben, die semantisch US-Dollar darstellt, kann Looker Studio diesen semantischen Typ nicht automatisch erkennen. Außerdem muss Looker Studio für die automatische semantische Erkennung Datenabrufe für jedes Feld des Schemas ausführen. Wenn Sie das Schema stattdessen manuell angeben, erfolgen keine Datenabrufaufrufe. Falls Sie den semantischen Typ (z.B. Währung, Prozentsatz, Datum usw.) für Ihre Daten kennen, sollten Sie ihn aus Gründen der Genauigkeit und Leistung explizit im Schema festlegen.

Semantische Typen manuell festlegen (empfohlen)

Wenn Sie Ihre semantischen Typen kennen, können Sie semantics für jedes Schemafeld manuell definieren. Alle verfügbaren Attribute finden Sie auf der Feldreferenzseite. Wenn Sie manuelle semantische Typen definieren möchten, sollten Sie für jedes Feld semanticType und semanticGroup definieren. Wenn Sie diese Attribute manuell angeben, wird der Prozess zur automatischen semantischen Typerkennung nicht ausgeführt. Wenn Sie einige, aber nicht alle Felder manuell festlegen, werden die nicht angegebenen Felder standardmäßig auf Text, Number oder Boolean gesetzt, je nachdem, welche dataType für das Feld angegeben wurde.

Im Folgenden finden Sie ein Beispiel für ein einfaches Schema, mit dem semantische Typen manuell festgelegt werden. Income ist als Währung und Filing Year als Datum festgelegt.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Fehlerbehebung bei manuellen Semantiktypen

Wenn Sie die semantischen Typen für die zugrunde liegenden Daten falsch festlegen, funktionieren sie nicht ordnungsgemäß. Dies kann schwierig zu testen sein, aber es gibt ein paar Dinge, die Sie tun können, um Probleme zu finden.

  1. Geben Sie statt aller Daten zwei oder drei Zeilen aus den Daten zurück und prüfen Sie sie dann manuell.
  2. Erstellen Sie in Looker Studio eine Tabelle, in der nur das zu prüfende Feld verwendet wird.
  3. Achten Sie genau auf die Felder Geo und Date, da sie das strengste Format haben.

Automatische Erkennung semantischer Typen

Wenn Sie im Schema keine semantischen Typen definiert haben, versucht Looker Studio, sie anhand der Datentyp-Eigenschaft und des Formats der vom Connector zurückgegebenen Datenwerte automatisch zu erkennen.

Für die automatische Erkennung sind folgende Schritte erforderlich:

  1. Fordern Sie das Schema an, indem Sie die Funktion getSchema des Community-Connectors ausführen.
  2. Durchläuft Gruppen von Feldern, die im Connector-Schema definiert sind, und getData fordert die Felder an. Die getData-Anfragen werden mit dem Parameter sampleExtraction auf true ausgeführt, um anzugeben, dass die Datenanfragen zur semantischen Erkennung dienen.
  3. Ermitteln Sie anhand des Felddatentyps und des Formats des von der getData-Anfrage zurückgegebenen Werts den semantischen Typ des Felds.

Optionen für die automatische semantische Typerkennung

Wenn in Looker Studio die Funktion getData eines Community-Connectors zur semantischen Erkennung ausgeführt wird, enthält die eingehende Anfrage das Attribut sampleExtraction, das auf true gesetzt wird. Die vom Connector zurückgegebenen Daten werden von Looker Studio nur verwendet, um den semantischen Typ des Felds zu ermitteln. Da der Wert für keinen anderen Zweck verwendet wird, sind keine tatsächlichen Daten aus der externen Quelle erforderlich.

Es gibt mehrere Möglichkeiten, die Erkennung semantischer Typ in Ihrem Code zu verbessern:

  • Empfohlen: Vordefinierte Werte übergeben
    Für jedes Feld wird ein vordefinierter Wert zurückgegeben, der den semantischen Typ des Felds am besten repräsentiert und von Looker Studio bekanntermaßen ordnungsgemäß erkannt wird. Lautet der semantische Typ für ein Feld beispielsweise Country, wird für Italien ein Wert wie IT zurückgegeben. Der andere Vorteil dieses Ansatzes besteht darin, dass er viel schneller geht, da Sie keine HTTP-Anfragen an den Drittanbieterdienst für Daten senden müssen.

  • Nur n Anzahl von Datensätzen zurückgeben
    Wenn der Drittanbieterdienst, von dem Sie Daten abrufen, beim Anfordern von Daten Zeilenlimits unterstützt, wird eine kleine Teilmenge von Zeilen anstelle des gesamten Datensatzes an Looker Studio zurückgegeben. Dadurch wird die Datenmenge begrenzt, die Sie bei jeder Anfrage zur semantischen Erkennung an Looker Studio übergeben müssen.

  • Alle Spalten anfordern und die Antwort im Cache speichern
    Wenn es möglich ist, alle Spalten für den Drittanbieterdienst, von dem Sie Daten abrufen, anzufordern, werden bei der ersten Anfrage zur semantischen Erkennung von Looker Studio alle Spalten abgerufen und die Ergebnisse im Cache gespeichert. Bei nachfolgenden Anfragen zur semantischen Erkennung werden Spaltenwerte aus dem Cache abgerufen, anstatt zusätzliche HTTP-Anfragen an den Drittanbieterdienst zu senden.

  • Nichts weiter unternehmen
    Sie können festlegen, dass Sie keine bestimmten Anpassungen für Anfragen implementieren möchten, bei denen sampleExtraction auf true gesetzt ist. Dadurch wird die semantische Erkennung langsamer, da Looker Studio alle Daten für die semantische Erkennung abrufen muss. Außerdem wirkt sich dies auf die Anfragerate Ihrer externen Datenquelle aus, da viele Anfragen zur semantischen Erkennung parallel ausgeführt werden.

Bekannte Formate für die automatische semantische Typerkennung

Datum und Uhrzeit
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Time: Epoche für Sekunde, Mikro, Milli und Nano.
Geo