Fogli connessi consente di analizzare petabyte di dati direttamente all'interno di Fogli Google. Puoi collegare i tuoi fogli di lavoro a un data warehouse BigQuery ed eseguire l'analisi utilizzando strumenti familiari di Fogli, come tabelle pivot, grafici e formule.
Questa guida utilizza il set di dati pubblico Shakespeare
per mostrare come utilizzare Fogli connessi. Il set di dati contiene le seguenti informazioni:
Campo | Tipo | Descrizione |
---|---|---|
parola | STRING |
Una singola parola univoca (dove lo spazio vuoto rappresenta il delimitatore) estratta da un corpus. |
word_count | INTEGER |
Il numero di volte in cui questa parola compare in questo corpus. |
corpus | STRING |
L'opera da cui questa parola è stata estratta. |
corpus_date | INTEGER |
L'anno in cui è stato pubblicato il corpus. |
Se l'applicazione richiede dati di Fogli connessi, deve fornire un token OAuth 2.0 che conceda l'ambito bigquery.readonly
, oltre agli altri ambiti necessari per una normale richiesta dell'API Fogli Google. Per ulteriori informazioni, consulta Scegliere gli ambiti dell'API Fogli Google.
Gestire un'origine dati
Un'origine dati specifica una località esterna in cui vengono trovati i dati. L'origine dati viene quindi collegata al foglio di lavoro.
Aggiungere un'origine dati BigQuery
Per aggiungere un'origine dati, fornisci un elemento AddDataSourceRequest
utilizzando il metodo spreadsheets.batchUpdate
. Il corpo della richiesta deve specificare un campo dataSource
di tipo oggetto DataSource
.
"addDataSource":{
"dataSource":{
"spec":{
"bigQuery":{
"projectId":"PROJECT_ID",
"tableSpec":{
"tableProjectId":"bigquery-public-data",
"datasetId":"samples",
"tableId":"shakespeare"
}
}
}
}
}
Sostituisci PROJECT_ID con un ID progetto Google Cloud valido.
Dopo aver creato un'origine dati, viene creato un foglio DATA_SOURCE
associato per fornire un'anteprima di massimo 500 righe. L'anteprima non è disponibile
immediatamente. Viene attivata in modo asincrono un'esecuzione per importare i dati di BigQuery.
Il
AddDataSourceResponse
contiene i seguenti campi:
dataSource
: l'oggettoDataSource
creato.dataSourceId
è un ID univoco con ambito foglio di lavoro. Viene compilato e vi viene fatto riferimento per creare ogni oggettoDataSource
dall'origine dati.dataExecutionStatus
: lo stato di un'esecuzione che importa i dati BigQuery nel foglio di anteprima. Per ulteriori informazioni, consulta la sezione Stato esecuzione dati.
Aggiornare o eliminare un'origine dati
Utilizza il metodo
spreadsheets.batchUpdate
e fornisci una richiesta
UpdateDataSourceRequest
o
DeleteDataSourceRequest
di conseguenza.
Gestire gli oggetti dell'origine dati
Dopo aver aggiunto un'origine dati al foglio di lavoro, è possibile creare un oggetto dell'origine dati a partire da questa. Un oggetto dell'origine dati è un normale strumento di Fogli, come tabelle pivot, grafici e formule, che si integra con Fogli connessi per ottimizzare l'analisi dei dati.
Esistono quattro tipi di oggetti:
DataSource
tabellaDataSource
pivotTable- Grafico
DataSource
- Formula
DataSource
Aggiungere una tabella dell'origine dati
Noto come "estrazione" nell'editor di Fogli, l'oggetto tabella importa un dump statico dei dati dall'origine dati in Fogli. Come una tabella pivot, la tabella è specificata e ancorata alla cella in alto a sinistra.
Il seguente esempio di codice mostra come utilizzare il metodo
spreadsheets.batchUpdate
e un
UpdateCellsRequest
per creare una tabella dell'origine dati con massimo 1000 righe di due colonne (word
e
word_count
).
"updateCells":{
"rows":{
"values":[
{
"dataSourceTable":{
"dataSourceId":"DATA_SOURCE_ID",
"columns":[
{
"name":"word"
},
{
"name":"word_count"
}
],
"rowLimit":{
"value":1000
},
"columnSelectionType":"SELECTED"
}
}
]
},
"fields":"dataSourceTable"
}
Sostituisci DATA_SOURCE_ID con un ID univoco basato sul foglio di lavoro che identifica l'origine dati.
Dopo aver creato una tabella dell'origine dati, i dati non sono immediatamente disponibili. Nell'editor di Fogli, è visualizzata come anteprima. Devi aggiornare la tabella dell'origine dati per recuperare i dati BigQuery. Puoi specificare un RefreshDataSourceRequest
all'interno dello stesso batchUpdate
. Tieni presente che tutti gli oggetti dell'origine dati funzionano in modo simile.
Per saperne di più, consulta Aggiornare un oggetto dell'origine dati.
Una volta completato l'aggiornamento e recuperati i dati BigQuery, la tabella dell'origine dati viene compilata come mostrato di seguito:
Aggiungere una tabella pivot di origine dati
A differenza di una tabella pivot convenzionale, una tabella pivot dell'origine dati è supportata da un'origine dati e fa riferimento ai dati in base al nome della colonna. Il seguente esempio di codice mostra come utilizzare il metodo spreadsheets.batchUpdate
e UpdateCellsRequest
per creare una tabella pivot che mostra il conteggio totale delle parole per corpo.
"updateCells":{
"rows":{
"values":[
{
"pivotTable":{
"dataSourceId":"DATA_SOURCE_ID",
"rows":{
"dataSourceColumnReference":{
"name":"corpus"
},
"sortOrder":"ASCENDING"
},
"values":{
"summarizeFunction":"SUM",
"dataSourceColumnReference":{
"name":"word_count"
}
}
}
}
]
},
"fields":"pivotTable"
}
Sostituisci DATA_SOURCE_ID con un ID univoco basato sul foglio di lavoro che identifica l'origine dati.
Una volta recuperati i dati di BigQuery, la tabella pivot dell'origine dati viene completata come mostrato:
Aggiungere un grafico dell'origine dati
Il seguente esempio di codice mostra come utilizzare il metodo spreadsheets.batchUpdate
e un AddChartRequest
per creare un grafico dell'origine dati con chartType
di COLUMN, che mostra il conteggio totale delle parole per corpus.
"addChart":{
"chart":{
"spec":{
"title":"Corpus by word count",
"basicChart":{
"chartType":"COLUMN",
"domains":[
{
"domain":{
"columnReference":{
"name":"corpus"
}
}
}
],
"series":[
{
"series":{
"columnReference":{
"name":"word_count"
},
"aggregateType":"SUM"
}
}
]
}
},
"dataSourceChartProperties":{
"dataSourceId":"DATA_SOURCE_ID"
}
}
}
Sostituisci DATA_SOURCE_ID con un ID univoco basato sul foglio di lavoro che identifica l'origine dati.
Una volta recuperati i dati di BigQuery, il grafico dell'origine dati viene visualizzato come mostrato di seguito:
Aggiungere una formula dell'origine dati
Il seguente esempio di codice mostra come utilizzare il metodo spreadsheets.batchUpdate
e un UpdateCellsRequest
per creare una formula di origine dati per calcolare il conteggio medio delle parole.
"updateCells":{
"rows":[
{
"values":[
{
"userEnteredValue":{
"formulaValue":"=AVERAGE(shakespeare!word_count)"
}
}
]
}
],
"fields":"userEnteredValue"
}
Una volta recuperati i dati di BigQuery, la formula dell'origine dati viene compilata come mostrato di seguito:
Aggiornare un oggetto dell'origine dati
Puoi aggiornare un oggetto dell'origine dati per recuperare i dati più recenti da BigQuery
in base alle specifiche dell'origine dati e alle configurazioni degli oggetti attuali. Puoi utilizzare
il
metodo
spreadsheets.batchUpdate
per chiamare
RefreshDataSourceRequest
.
Quindi specifica uno o più riferimenti agli oggetti da aggiornare utilizzando l'oggetto DataSourceObjectReferences
.
Tieni presente che puoi creare e aggiornare gli oggetti dell'origine dati all'interno di una singola
richiesta batchUpdate
.
Stato di esecuzione dei dati
Quando crei origini dati o aggiorni gli oggetti delle origini dati, viene creata un'esecuzione in background per recuperare i dati da BigQuery e restituire una risposta contenente DataExecutionStatus
.
Se l'esecuzione viene avviata correttamente, DataExecutionState
di solito è nello stato RUNNING
.
Poiché il processo è asincrono, l'applicazione deve implementare un modello di polling per recuperare periodicamente lo stato degli oggetti dell'origine dati. Utilizza il metodo spreadsheets.get
finché lo stato non restituisce lo stato SUCCEEDED
o FAILED
. L'esecuzione
viene completata rapidamente nella maggior parte dei casi, ma dipende dalla complessità
dell'origine dati. In genere l'esecuzione non dura più di 10 minuti.
Argomenti correlati
- Scegliere gli ambiti dell'API Fogli Google
- Iniziare a utilizzare i dati BigQuery in Fogli Google
- Documentazione di BigQuery
- BigQuery: utilizzare Fogli connessi
- Tutorial video su Fogli connessi