Połączone arkusze umożliwiają analizowanie petabajtów danych bezpośrednio w Arkuszach Google. Możesz połączyć arkusze kalkulacyjne z hurtownią danych BigQuery lub Lookerem i przeprowadzić analizę za pomocą znanych narzędzi Arkuszy, takich jak tabele przestawne, wykresy i formuły.
Zarządzanie źródłem danych BigQuery
W tej sekcji używamy publicznego zbioru danych BigQueryShakespeare
, aby pokazać, jak korzystać z połączonych arkuszy. Zbiór danych zawiera te informacje:
Pole | Typ | Opis |
---|---|---|
słowo | STRING |
Pojedyncze unikalne słowo (gdzie separatorem jest biały znak) wyodrębnione z korpusu. |
word_count | INTEGER |
Liczba wystąpień tego słowa w korpusie. |
korpus, | STRING |
Dzieło, z którego zostało wyodrębnione to słowo. |
corpus_date | INTEGER |
Rok opublikowania tego korpusu. |
Jeśli aplikacja wysyła żądanie dotyczące danych połączonych arkuszy BigQuery, musi podać token OAuth 2.0, który przyznaje zakres bigquery.readonly
, oprócz innych zakresów wymaganych w przypadku zwykłego żądania interfejsu Google Sheets API. Więcej informacji znajdziesz w artykule Wybieranie zakresów interfejsu API Arkuszy Google.
Źródło danych określa zewnętrzne miejsce, w którym znajdują się dane. Źródło danych zostanie połączone z arkuszem kalkulacyjnym.
Dodawanie źródła danych BigQuery
Aby dodać źródło danych, podaj
AddDataSourceRequest
za pomocą metody
spreadsheets.batchUpdate
. W treści żądania należy podać pole dataSource
typu obiekt DataSource
.
"addDataSource":{
"dataSource":{
"spec":{
"bigQuery":{
"projectId":"PROJECT_ID",
"tableSpec":{
"tableProjectId":"bigquery-public-data",
"datasetId":"samples",
"tableId":"shakespeare"
}
}
}
}
}
Zastąp PROJECT_ID prawidłowym identyfikatorem projektu Google Cloud.
Po utworzeniu źródła danych tworzony jest powiązany arkuszDATA_SOURCE
, który zawiera podgląd maksymalnie 500 wierszy. Podgląd nie jest dostępny od razu. Wykonanie jest uruchamiane asynchronicznie w celu zaimportowania danych BigQuery.
AddDataSourceResponse
zawiera te pola:
dataSource
: utworzony obiektDataSource
.dataSourceId
to unikalny identyfikator w zakresie arkusza kalkulacyjnego. Jest on wypełniany i używany do tworzenia każdego obiektuDataSource
ze źródła danych.dataExecutionStatus
: Stan wykonania, które importuje dane BigQuery do arkusza podglądu. Więcej informacji znajdziesz w sekcji Stan wykonania danych.
Aktualizowanie i usuwanie źródła danych BigQuery
Użyj metody spreadsheets.batchUpdate
i prześlij żądanie UpdateDataSourceRequest
lub DeleteDataSourceRequest
.
Zarządzanie obiektami źródła danych BigQuery
Po dodaniu źródła danych do arkusza kalkulacyjnego można z niego utworzyć obiekt źródła danych. Obiekt źródła danych to zwykłe narzędzie Arkuszy, takie jak tabele przestawne, wykresy i formuły, które jest zintegrowane z Połączonymi arkuszami, aby ułatwiać analizę danych.
Istnieją 4 typy obiektów:
DataSource
tabelaDataSource
pivotTableDataSource
– wykresDataSource
formuła
Dodawanie tabeli źródła danych BigQuery
Obiekt tabeli, nazywany w edytorze Arkuszy „wyodrębnianiem”, importuje do Arkuszy statyczny zrzut danych ze źródła danych. Podobnie jak w przypadku tabeli przestawnej tabela jest określana i zakotwiczana w lewym górnym rogu komórki.
Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdate
i obiektu UpdateCellsRequest
utworzyć tabelę źródła danych z maksymalnie 1000 wierszy i 2 kolumnami (word
i word_count
).
"updateCells":{
"rows":{
"values":[
{
"dataSourceTable":{
"dataSourceId":"DATA_SOURCE_ID",
"columns":[
{
"name":"word"
},
{
"name":"word_count"
}
],
"rowLimit":{
"value":1000
},
"columnSelectionType":"SELECTED"
}
}
]
},
"fields":"dataSourceTable"
}
Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.
Po utworzeniu tabeli źródła danych dane nie są od razu dostępne. W edytorze Arkuszy jest on wyświetlany jako podgląd. Aby pobrać dane BigQuery, musisz odświeżyć tabelę źródła danych. Możesz określić RefreshDataSourceRequest
w ramach tego samego batchUpdate
. Pamiętaj, że wszystkie obiekty źródła danych działają podobnie.
Więcej informacji znajdziesz w artykule Odświeżanie obiektu źródła danych.
Po zakończeniu odświeżania i pobraniu danych z BigQuery tabela źródła danych zostanie wypełniona w ten sposób:
Dodawanie tabeli przestawnej źródła danych BigQuery
W przeciwieństwie do zwykłej tabeli przestawnej tabela przestawna źródła danych jest oparta na źródle danych i odwołuje się do danych według nazwy kolumny. Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdate
i UpdateCellsRequest
utworzyć tabelę przestawną z łączną liczbą słów w poszczególnych korpusach.
"updateCells":{
"rows":{
"values":[
{
"pivotTable":{
"dataSourceId":"DATA_SOURCE_ID",
"rows":{
"dataSourceColumnReference":{
"name":"corpus"
},
"sortOrder":"ASCENDING"
},
"values":{
"summarizeFunction":"SUM",
"dataSourceColumnReference":{
"name":"word_count"
}
}
}
}
]
},
"fields":"pivotTable"
}
Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.
Po pobraniu danych BigQuery tabela przestawna źródła danych zostanie wypełniona w sposób pokazany poniżej:
Dodawanie wykresu źródła danych BigQuery
Poniższy przykładowy kod pokazuje, jak użyć metody spreadsheets.batchUpdate
i AddChartRequest
, aby utworzyć wykres źródła danych z chartType
typu COLUMN, który pokazuje łączną liczbę słów w poszczególnych korpusach.
"addChart":{
"chart":{
"spec":{
"title":"Corpus by word count",
"basicChart":{
"chartType":"COLUMN",
"domains":[
{
"domain":{
"columnReference":{
"name":"corpus"
}
}
}
],
"series":[
{
"series":{
"columnReference":{
"name":"word_count"
},
"aggregateType":"SUM"
}
}
]
}
},
"dataSourceChartProperties":{
"dataSourceId":"DATA_SOURCE_ID"
}
}
}
Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.
Po pobraniu danych z BigQuery wykres źródła danych jest renderowany w sposób pokazany poniżej:
Dodawanie formuły źródła danych BigQuery
Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdate
i UpdateCellsRequest
utworzyć formułę źródła danych, która oblicza średnią liczbę słów.
"updateCells":{
"rows":[
{
"values":[
{
"userEnteredValue":{
"formulaValue":"=AVERAGE(shakespeare!word_count)"
}
}
]
}
],
"fields":"userEnteredValue"
}
Po pobraniu danych BigQuery formuła źródła danych zostanie wypełniona w ten sposób:
Odświeżanie obiektu źródła danych BigQuery
Możesz odświeżyć obiekt źródła danych, aby pobrać najnowsze dane z BigQuery na podstawie bieżących specyfikacji źródła danych i konfiguracji obiektu. Możesz użyć metody spreadsheets.batchUpdate
, aby wywołać RefreshDataSourceRequest
.
Następnie określ co najmniej 1 odwołanie do obiektu, który ma zostać odświeżony, używając DataSourceObjectReferences
object.
Pamiętaj, że możesz tworzyć i odświeżać obiekty źródła danych w ramach jednego żądania batchUpdate
.
Zarządzanie źródłem danych Looker
Z tego przewodnika dowiesz się, jak dodać źródło danych Looker, zaktualizować lub usunąć je, utworzyć na jego podstawie tabelę przestawną i odświeżyć ją.
Aplikacja, która wysyła żądanie dotyczące danych z połączonych arkuszy Lookera, będzie ponownie używać istniejącego połączenia konta Google z Lookerem.
Dodawanie źródła danych Looker
Aby dodać źródło danych, podaj
AddDataSourceRequest
za pomocą metody
spreadsheets.batchUpdate
. W treści żądania należy podać pole dataSource
typu obiekt DataSource
.
"addDataSource":{
"dataSource":{
"spec":{
"looker":{
"instance_uri":"INSTANCE_URI",
"model":"MODEL",
"explore":"EXPLORE"
}
}
}
}
Zastąp INSTANCE_URI, MODEL i EXPLORE odpowiednio prawidłowym identyfikatorem URI instancji Lookera, nazwą modelu i nazwą eksploracji.
Po utworzeniu źródła danych powstaje powiązany arkuszDATA_SOURCE
, który zawiera podgląd struktury wybranej eksploracji, w tym widoków, wymiarów, miar i opisów pól.
AddDataSourceResponse
zawiera te pola:
dataSource
: utworzony obiektDataSource
.dataSourceId
to unikalny identyfikator w zakresie arkusza kalkulacyjnego. Jest on wypełniany i używany do tworzenia każdego obiektuDataSource
ze źródła danych.dataExecutionStatus
: Stan wykonania, które importuje dane BigQuery do arkusza podglądu. Więcej informacji znajdziesz w sekcji Stan wykonania danych.
Aktualizowanie i usuwanie źródła danych Looker
Użyj metody spreadsheets.batchUpdate
i prześlij żądanie UpdateDataSourceRequest
lub DeleteDataSourceRequest
.
Zarządzanie obiektami źródła danych Looker
Po dodaniu źródła danych do arkusza kalkulacyjnego można z niego utworzyć obiekt źródła danych. W przypadku źródeł danych Looker możesz utworzyć tylko obiekt DataSource
pivotTable.
Nie można tworzyć DataSource
formuł, wyodrębniać danych ani tworzyć wykresów ze źródeł danych Lookera.
Odświeżanie obiektu źródła danych Looker
Możesz odświeżyć obiekt źródła danych, aby pobrać najnowsze dane z Lookera na podstawie bieżących specyfikacji źródła danych i konfiguracji obiektu. Możesz użyć metody spreadsheets.batchUpdate
, aby wywołać RefreshDataSourceRequest
.
Następnie określ co najmniej 1 odwołanie do obiektu, który ma zostać odświeżony, używając DataSourceObjectReferences
object.
Pamiętaj, że możesz tworzyć i odświeżać obiekty źródła danych w ramach jednego żądania batchUpdate
.
Stan wykonania danych
Gdy tworzysz źródła danych lub odświeżasz obiekty źródła danych, tworzone jest wykonanie w tle, które pobiera dane z BigQuery lub Lookera i zwraca odpowiedź zawierającą DataExecutionStatus
.
Jeśli wykonanie rozpocznie się prawidłowo, DataExecutionState
zwykle będzie w stanie RUNNING
.
Proces jest asynchroniczny, więc aplikacja powinna implementować model odpytywania, aby okresowo pobierać stan obiektów źródła danych. Używaj metody spreadsheets.get
, dopóki stan nie zwróci wartości SUCCEEDED
lub FAILED
.
W większości przypadków wykonanie trwa krótko, ale zależy od złożoności źródła danych. Zwykle wykonanie nie trwa dłużej niż 10 minut.
Powiązane artykuły
- Wybieranie zakresów interfejsu API Arkuszy Google
- Pierwsze kroki z danymi BigQuery w Arkuszach Google
- Dokumentacja BigQuery
- BigQuery: korzystanie z połączonych arkuszy
- Samouczek wideo dotyczący połączonych arkuszy
- Korzystanie z połączonych arkuszy w usłudze Looker
- Wprowadzenie do Lookera