Tipi di dati e di semantica

Quando crei un connettore della community, ogni campo definito nello schema richiede un tipo di dati. Il tipo di dati definisce il tipo primitivo del campo, ad esempio BOOLEAN, STRING, NUMBER e così via.

Oltre ai tipi di dati, Data Studio utilizza anche i tipi semantici. I tipi semantici aiutano a descrivere il tipo di informazioni rappresentate dai dati. Ad esempio, un campo con un tipo di dati NUMBER può rappresentare semanticamente un importo in valuta o una percentuale e un campo con un tipo di dati STRING può rappresentare semanticamente una città. Per vedere quali tipi semantici sono disponibili, consulta la documentazione sui tipi semantici

Schema del connettore della community e campi di Data Studio

Quando definisci lo schema per il connettore della community, esistono varie proprietà per ogni campo che determinano il modo in cui il campo viene rappresentato e utilizzato in Data Studio. Ad esempio:

  • Il conceptType è definito nello schema del connettore utilizzando la proprietà conceptType. Questa proprietà determina se il campo viene trattato come una dimensione o una metrica. Una spiegazione della differenza tra metriche e dimensioni è disponibile in Dimensioni e metriche.
  • Il tipo semantico può essere definito nello schema del connettore oppure può essere rilevato automaticamente da Data Studio in base alla proprietà del tipo di dati definita nel connettore e ai valori dei dati restituiti dal connettore. Per informazioni dettagliate sul funzionamento, consulta Rilevamento automatico del tipo semantico.
  • Il tipo di aggregazione determina se i valori delle metriche (le dimensioni vengono ignorate) possono essere riaggregati. Se imposti la proprietà semantics.isReaggregatable su true, l'aggregazione predefinita è SUM, altrimenti è impostata su Auto. Puoi anche impostare manualmente il tipo di aggregazione predefinito per i campi riaggregabili utilizzando la defaultAggregationType proprietà.

Quando configuri e ti connetti utilizzando un connettore in Data Studio, l'editor dei campi mostra lo schema completo del connettore in base a come hai definito le proprietà sopra. Se hai incluso i tipi semantici, verranno visualizzati come li hai definiti. Se utilizzi il rilevamento automatico del tipo semantico, i campi verranno visualizzati così come sono stati rilevati. Schermata Campi

Impostare le informazioni semantiche

Esistono due modi per impostare le informazioni semantiche. Puoi impostare la semantica dei campi manualmente o fare affidamento su Data Studio per il rilevamento automatico.

Ad esempio, se hai un numero che rappresenta semanticamente i dollari statunitensi, Data Studio non sarà in grado di rilevare automaticamente questo tipo semantico. Inoltre, il rilevamento semantico automatico richiede che Data Studio effettui chiamate di recupero dei dati per ogni campo dello schema. Se invece specifichi manualmente lo schema, non verranno effettuate chiamate di recupero dei dati. Se conosci il tipo semantico (ad es. valuta, percentuale, data e così via) dei tuoi dati, ti consigliamo di impostarlo esplicitamente nello schema per motivi di accuratezza e prestazioni.

Impostare manualmente i tipi semantici (consigliato)

Se conosci i tipi semantici, puoi definire manualmente semantics per ogni campo dello schema. I dettagli completi sulle proprietà disponibili sono disponibili nella pagina di riferimento dei campi. Se scegli di definire i tipi semantici manuali, ti consigliamo di definire semanticType e semanticGroup per ogni campo. Se fornisci manualmente queste proprietà, il processo di rilevamento automatico del tipo semantico non verrà eseguito. Se imposti manualmente alcuni campi, ma non tutti, quelli che non specifichi vengono impostati per impostazione predefinita su Text, Number o Boolean a seconda del dataType specificato per il campo.

Di seguito è riportato un esempio di schema semplice che imposta manualmente i tipi semantici. Income è impostato come valuta e Filing Year è impostato come data.

data-studio/semantics.gs
const schema = [
  {
    name: "Income",
    label: "Income (in USD)",
    dataType: "NUMBER",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "CURRENCY",
      semanticType: "CURRENCY_USD",
    },
  },
  {
    name: "Filing Year",
    label: "Year in which you filed the taxes.",
    dataType: "STRING",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "DATE_OR_TIME",
      semanticType: "YEAR",
    },
  },
];

Risoluzione dei problemi relativi ai tipi semantici manuali

Se imposti i tipi semantici in modo errato per i dati sottostanti, non funzioneranno correttamente. Può essere difficile da testare, ma ci sono alcune cose che puoi fare per trovare i problemi.

  1. Restituisci 2 o 3 righe dai dati anziché tutte, quindi ispezionale manualmente.
  2. Crea una tabella in Looker Studio che utilizzi solo il campo che stai tentando di controllare.
  3. Presta particolare attenzione ai campi Geo e Date, poiché hanno il formato più rigoroso.

Rilevamento automatico del tipo semantico

Se non hai definito alcun tipo semantico nello schema, Data Studio tenterà di rilevarli automaticamente in base alla proprietà del tipo di dati e al formato dei valori dei dati restituiti dal connettore.

Di seguito sono riportati i passaggi del processo di rilevamento automatico:

  1. Richiedi lo schema eseguendo la getSchema funzione del tuo connettore della community.
  2. Esegui l'iterazione attraverso batch di campi definiti nello schema del connettore ed emetti getData richieste per i campi. Le richieste getData vengono eseguite con il parametro sampleExtraction impostato su true per indicare che le richieste di dati sono finalizzate al rilevamento semantico.
  3. In base al tipo di dati del campo e al formato del valore restituito dalla richiesta getData, identifica il tipo semantico del campo.

Opzioni per la gestione del rilevamento automatico del tipo semantico

Quando Data Studio esegue la funzione getData di un connettore della community ai fini del rilevamento semantico, la richiesta in entrata conterrà una proprietà sampleExtraction impostata su true. I dati restituiti dal connettore vengono utilizzati da Data Studio solo per identificare il tipo semantico del campo. Poiché il valore non verrà utilizzato per altri scopi, non richiede dati effettivi dall'origine esterna.

Esistono diversi modi per migliorare il rilevamento del tipo semantico nel codice:

  • Consigliato: passare valori predefiniti
    Restituisci un valore predefinito per ogni campo che rappresenti al meglio il tipo semantico del campo e che sia noto per essere rilevato correttamente da Data Studio. Ad esempio, se il tipo semantico di un campo è Paese, restituisci un valore come IT per l'Italia. Un altro vantaggio di questo approccio è che è molto più veloce, poiché non richiede l'invio di richieste HTTP al servizio di terze parti per i dati.

  • Restituisci solo n numero di record
    Se il servizio di terze parti da cui stai recuperando i dati supporta i limiti di riga quando richiedi i dati, restituisci un piccolo sottoinsieme di righe a Data Studio anziché l'intero set di dati. In questo modo, la quantità di dati da passare a Data Studio per ogni richiesta di rilevamento semantico sarà limitata.

  • Richiedi tutte le colonne e memorizza nella cache la risposta
    Se è possibile richiedere tutte le colonne per il servizio di terze parti da cui stai recuperando i dati, alla prima richiesta di rilevamento semantico ricevuta da Data Studio recupera tutte le colonne e memorizza nella cache i risultati. Per le richieste di rilevamento semantico successive, recupera i valori delle colonne dalla cache anziché effettuare ulteriori richieste HTTP al servizio di terze parti.

  • Non fare nulla di diverso
    Puoi scegliere di non implementare alcuna sistemazione specifica per le richieste in cui sampleExtraction è impostato su true. In questo modo, il processo di rilevamento semantico sarà più lento, poiché Data Studio dovrà recuperare tutti i dati per il processo di rilevamento semantico. Inoltre, ciò influirà sul tasso di richieste all'origine dati esterna, poiché verranno eseguite in parallelo molte richieste di rilevamento semantico.

Formati riconosciuti per il rilevamento automatico del tipo semantico

Data e ora
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Ora: epoca per secondi, micro, milli e nano.
Dati geografici