Połączone arkusze

Połączone arkusze umożliwiają analizowanie petabajtów danych bezpośrednio w Arkuszach Google. Możesz połączyć arkusze kalkulacyjne z hurtownią danych BigQuery lub Lookerem i przeprowadzić analizę za pomocą znanych narzędzi Arkuszy, takich jak tabele przestawne, wykresy i formuły.

Zarządzanie źródłem danych BigQuery

W tej sekcji używamy publicznego zbioru danych BigQueryShakespeare, aby pokazać, jak korzystać z połączonych arkuszy. Zbiór danych zawiera te informacje:

Pole Typ Opis
słowo STRING Pojedyncze unikalne słowo (gdzie separatorem jest biały znak) wyodrębnione z korpusu.
word_count INTEGER Liczba wystąpień tego słowa w korpusie.
korpus, STRING Dzieło, z którego zostało wyodrębnione to słowo.
corpus_date INTEGER Rok opublikowania tego korpusu.

Jeśli aplikacja wysyła żądanie dotyczące danych połączonych arkuszy BigQuery, musi podać token OAuth 2.0, który przyznaje zakres bigquery.readonly, oprócz innych zakresów wymaganych w przypadku zwykłego żądania interfejsu Google Sheets API. Więcej informacji znajdziesz w artykule Wybieranie zakresów interfejsu API Arkuszy Google.

Źródło danych określa zewnętrzne miejsce, w którym znajdują się dane. Źródło danych zostanie połączone z arkuszem kalkulacyjnym.

Dodawanie źródła danych BigQuery

Aby dodać źródło danych, podaj AddDataSourceRequest za pomocą metody spreadsheets.batchUpdate. W treści żądania należy podać pole dataSource typu obiekt DataSource.

"addDataSource":{
   "dataSource":{
      "spec":{
         "bigQuery":{
            "projectId":"PROJECT_ID",
            "tableSpec":{
               "tableProjectId":"bigquery-public-data",
               "datasetId":"samples",
               "tableId":"shakespeare"
            }
         }
      }
   }
}

Zastąp PROJECT_ID prawidłowym identyfikatorem projektu Google Cloud.

Po utworzeniu źródła danych tworzony jest powiązany arkuszDATA_SOURCE, który zawiera podgląd maksymalnie 500 wierszy. Podgląd nie jest dostępny od razu. Wykonanie jest uruchamiane asynchronicznie w celu zaimportowania danych BigQuery.

AddDataSourceResponse zawiera te pola:

  • dataSource: utworzony obiekt DataSource. dataSourceId to unikalny identyfikator w zakresie arkusza kalkulacyjnego. Jest on wypełniany i używany do tworzenia każdego obiektu DataSource ze źródła danych.

  • dataExecutionStatus: Stan wykonania, które importuje dane BigQuery do arkusza podglądu. Więcej informacji znajdziesz w sekcji Stan wykonania danych.

Aktualizowanie i usuwanie źródła danych BigQuery

Użyj metody spreadsheets.batchUpdate i prześlij żądanie UpdateDataSourceRequest lub DeleteDataSourceRequest.

Zarządzanie obiektami źródła danych BigQuery

Po dodaniu źródła danych do arkusza kalkulacyjnego można z niego utworzyć obiekt źródła danych. Obiekt źródła danych to zwykłe narzędzie Arkuszy, takie jak tabele przestawne, wykresy i formuły, które jest zintegrowane z Połączonymi arkuszami, aby ułatwiać analizę danych.

Istnieją 4 typy obiektów:

  • DataSource tabela
  • DataSource pivotTable
  • DataSource – wykres
  • DataSource formuła

Dodawanie tabeli źródła danych BigQuery

Obiekt tabeli, nazywany w edytorze Arkuszy „wyodrębnianiem”, importuje do Arkuszy statyczny zrzut danych ze źródła danych. Podobnie jak w przypadku tabeli przestawnej tabela jest określana i zakotwiczana w lewym górnym rogu komórki.

Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdate i obiektu UpdateCellsRequest utworzyć tabelę źródła danych z maksymalnie 1000 wierszy i 2 kolumnami (wordword_count).

"updateCells":{
   "rows":{
      "values":[
         {
            "dataSourceTable":{
               "dataSourceId":"DATA_SOURCE_ID",
               "columns":[
                  {
                     "name":"word"
                  },
                  {
                     "name":"word_count"
                  }
               ],
               "rowLimit":{
                  "value":1000
               },
               "columnSelectionType":"SELECTED"
            }
         }
      ]
   },
   "fields":"dataSourceTable"
}

Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.

Po utworzeniu tabeli źródła danych dane nie są od razu dostępne. W edytorze Arkuszy jest on wyświetlany jako podgląd. Aby pobrać dane BigQuery, musisz odświeżyć tabelę źródła danych. Możesz określić RefreshDataSourceRequest w ramach tego samego batchUpdate. Pamiętaj, że wszystkie obiekty źródła danych działają podobnie. Więcej informacji znajdziesz w artykule Odświeżanie obiektu źródła danych.

Po zakończeniu odświeżania i pobraniu danych z BigQuery tabela źródła danych zostanie wypełniona w ten sposób:

Tabela źródła danych zawierająca dane z publicznego zbioru danych Shakespeare.

Dodawanie tabeli przestawnej źródła danych BigQuery

W przeciwieństwie do zwykłej tabeli przestawnej tabela przestawna źródła danych jest oparta na źródle danych i odwołuje się do danych według nazwy kolumny. Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdateUpdateCellsRequest utworzyć tabelę przestawną z łączną liczbą słów w poszczególnych korpusach.

"updateCells":{
   "rows":{
      "values":[
         {
            "pivotTable":{
               "dataSourceId":"DATA_SOURCE_ID",
               "rows":{
                  "dataSourceColumnReference":{
                     "name":"corpus"
                  },
                  "sortOrder":"ASCENDING"
               },
               "values":{
                  "summarizeFunction":"SUM",
                  "dataSourceColumnReference":{
                     "name":"word_count"
                  }
               }
            }
         }
      ]
   },
   "fields":"pivotTable"
    }

Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.

Po pobraniu danych BigQuery tabela przestawna źródła danych zostanie wypełniona w sposób pokazany poniżej:

Tabela przestawna źródła danych zawierająca dane z publicznego zbioru danych Shakespeare.

Dodawanie wykresu źródła danych BigQuery

Poniższy przykładowy kod pokazuje, jak użyć metody spreadsheets.batchUpdateAddChartRequest, aby utworzyć wykres źródła danych z chartType typu COLUMN, który pokazuje łączną liczbę słów w poszczególnych korpusach.

"addChart":{
   "chart":{
      "spec":{
         "title":"Corpus by word count",
         "basicChart":{
            "chartType":"COLUMN",
            "domains":[
               {
                  "domain":{
                     "columnReference":{
                        "name":"corpus"
                     }
                  }
               }
            ],
            "series":[
               {
                  "series":{
                     "columnReference":{
                        "name":"word_count"
                     },
                     "aggregateType":"SUM"
                  }
               }
            ]
         }
      },
      "dataSourceChartProperties":{
         "dataSourceId":"DATA_SOURCE_ID"
      }
   }
}

Zastąp DATA_SOURCE_ID unikalnym identyfikatorem w zakresie arkusza kalkulacyjnego, który identyfikuje źródło danych.

Po pobraniu danych z BigQuery wykres źródła danych jest renderowany w sposób pokazany poniżej:

Wykres źródła danych przedstawiający dane z publicznego zbioru danych Shakespeare.

Dodawanie formuły źródła danych BigQuery

Poniższy przykładowy kod pokazuje, jak za pomocą metody spreadsheets.batchUpdateUpdateCellsRequest utworzyć formułę źródła danych, która oblicza średnią liczbę słów.

"updateCells":{
   "rows":[
      {
         "values":[
            {
               "userEnteredValue":{
                  "formulaValue":"=AVERAGE(shakespeare!word_count)"
               }
            }
         ]
      }
   ],
   "fields":"userEnteredValue"
}

Po pobraniu danych BigQuery formuła źródła danych zostanie wypełniona w ten sposób:

Formuła źródła danych wyświetlająca dane z publicznego zbioru danych Szekspira.

Odświeżanie obiektu źródła danych BigQuery

Możesz odświeżyć obiekt źródła danych, aby pobrać najnowsze dane z BigQuery na podstawie bieżących specyfikacji źródła danych i konfiguracji obiektu. Możesz użyć metody spreadsheets.batchUpdate, aby wywołać RefreshDataSourceRequest. Następnie określ co najmniej 1 odwołanie do obiektu, który ma zostać odświeżony, używając DataSourceObjectReferences object.

Pamiętaj, że możesz tworzyć i odświeżać obiekty źródła danych w ramach jednego żądania batchUpdate.

Zarządzanie źródłem danych Looker

Z tego przewodnika dowiesz się, jak dodać źródło danych Looker, zaktualizować lub usunąć je, utworzyć na jego podstawie tabelę przestawną i odświeżyć ją.

Aplikacja, która wysyła żądanie dotyczące danych z połączonych arkuszy Lookera, będzie ponownie używać istniejącego połączenia konta Google z Lookerem.

Dodawanie źródła danych Looker

Aby dodać źródło danych, podaj AddDataSourceRequest za pomocą metody spreadsheets.batchUpdate. W treści żądania należy podać pole dataSource typu obiekt DataSource.

"addDataSource":{
   "dataSource":{
      "spec":{
         "looker":{
            "instance_uri":"INSTANCE_URI",
            "model":"MODEL",
            "explore":"EXPLORE"
         }
      }
   }
}

Zastąp INSTANCE_URI, MODEL i EXPLORE odpowiednio prawidłowym identyfikatorem URI instancji Lookera, nazwą modelu i nazwą eksploracji.

Po utworzeniu źródła danych powstaje powiązany arkuszDATA_SOURCE, który zawiera podgląd struktury wybranej eksploracji, w tym widoków, wymiarów, miar i opisów pól.

AddDataSourceResponse zawiera te pola:

  • dataSource: utworzony obiekt DataSource. dataSourceId to unikalny identyfikator w zakresie arkusza kalkulacyjnego. Jest on wypełniany i używany do tworzenia każdego obiektu DataSource ze źródła danych.

  • dataExecutionStatus: Stan wykonania, które importuje dane BigQuery do arkusza podglądu. Więcej informacji znajdziesz w sekcji Stan wykonania danych.

Aktualizowanie i usuwanie źródła danych Looker

Użyj metody spreadsheets.batchUpdate i prześlij żądanie UpdateDataSourceRequest lub DeleteDataSourceRequest.

Zarządzanie obiektami źródła danych Looker

Po dodaniu źródła danych do arkusza kalkulacyjnego można z niego utworzyć obiekt źródła danych. W przypadku źródeł danych Looker możesz utworzyć tylko obiekt DataSource pivotTable.

Nie można tworzyć DataSource formuł, wyodrębniać danych ani tworzyć wykresów ze źródeł danych Lookera.

Odświeżanie obiektu źródła danych Looker

Możesz odświeżyć obiekt źródła danych, aby pobrać najnowsze dane z Lookera na podstawie bieżących specyfikacji źródła danych i konfiguracji obiektu. Możesz użyć metody spreadsheets.batchUpdate, aby wywołać RefreshDataSourceRequest. Następnie określ co najmniej 1 odwołanie do obiektu, który ma zostać odświeżony, używając DataSourceObjectReferences object.

Pamiętaj, że możesz tworzyć i odświeżać obiekty źródła danych w ramach jednego żądania batchUpdate.

Stan wykonania danych

Gdy tworzysz źródła danych lub odświeżasz obiekty źródła danych, tworzone jest wykonanie w tle, które pobiera dane z BigQuery lub Lookera i zwraca odpowiedź zawierającą DataExecutionStatus. Jeśli wykonanie rozpocznie się prawidłowo, DataExecutionState zwykle będzie w stanie RUNNING.

Proces jest asynchroniczny, więc aplikacja powinna implementować model odpytywania, aby okresowo pobierać stan obiektów źródła danych. Używaj metody spreadsheets.get, dopóki stan nie zwróci wartości SUCCEEDED lub FAILED. W większości przypadków wykonanie trwa krótko, ale zależy od złożoności źródła danych. Zwykle wykonanie nie trwa dłużej niż 10 minut.