Informacje o danych i zapytaniach w Statystykach miejsc

Dane Statystyk miejsc

Statystyki miejsc udostępniają w BigQuery pełne i przykładowe zbiory danych.

Przykładowe zbiory danych mają umożliwić Ci wypróbowanie Statystyk miejsc, aby ocenić użyteczność i wartość tej usługi przed podjęciem decyzji o zakupie pełnego zbioru danych. Przykładowy zbiór danych zawiera tylko dane dotyczące samego miasta. Nie zawiera danych dotyczących otaczającego obszaru metropolitalnego.

Przykładowa lista zawiera dane dotyczące największego miasta w każdym z obsługiwanych krajów:

Amsterdam (NL) Helsinki (FI) Płowdiw (BG)
Ankara (TR) Hongkong (HK) Ar-Rifa (BH)
Arequipa (PE) Dżakarta (ID) Rzym (IT)
Ateny (GR) Dżudda (SA) Santiago (CL)
Bad Gastein (AT) Johannesburg (ZA) São Paulo (BR)
Berlin (DE) Kuala Lumpur (MY) Szardża (AE)
Brno (CZ) Lizbona (PT) Singapur (SG)
Bruksela (BE) Londyn (GB) Sztokholm (SE)
Bukareszt (RO) Lusail (QA) Sydney (AU)
Buenos Aires (AR) Madryt (ES) Tajpej (TW)
Pusan (KR) Manila (PH) Tel Awiw-Jafa (IL)
Kair (EG) Medellín (CO) Tokio (JP)
Chiang Mai (TH) Meksyk (MX) Toronto (CA)
Kopenhaga (DK) Mumbai (IN) Warszawa (PL)
Cork (IE) Nowy Jork (US) Wellington (NZ)
Debreczyn (HU) Oslo (NO) Zurych (CH)
Hanoi (VN) Paryż (FR)

Pełne zbiory danych zawierają dane dotyczące każdego obsługiwanego kraju i trzeba je kupić. Jeśli chcesz zarejestrować się w Statystykach miejsc, wypełnij formularz zgłoszenia. Tylko subskrybent danych musi poprosić o dostęp do zbioru danych Statystyk miejsc. Gdy subskrypcja jest aktywna w projekcie BigQuery, każdy użytkownik mający dostęp do tego projektu może wysyłać zapytania do danych Statystyk miejsc.

Każdy zbiór danych dotyczący kraju ma własną listę, którą musisz subskrybować osobno. Więcej informacji o subskrybowaniu listy znajdziesz w artykule Konfigurowanie Statystyk miejsc.

Schematy zbiorów danych

Schemat zbioru danych miejsc dla każdego kraju składa się z 2 części:

Jeśli na przykład pracujesz ze zbiorem danych dla Hiszpanii (ES), odwołuj się zarówno do schematu podstawowego, jak i do schematu specyficznego dla Hiszpanii.

Schemat zbioru danych marek definiuje 3 pola:

  • id: identyfikator marki.
  • name: nazwa marki, np. „Hertz” lub „Chase”.
  • category: kategoria najwyższego poziomu marki, np. „Stacja benzynowa”, „Jedzenie i napoje” lub „Obiekty noclegowe”.

Wysyłanie zapytań do danych Statystyk miejsc

Statystyki miejsc oferują 2 sposoby wysyłania zapytań do zbiorów danych:

  • Wysyłanie zapytań do zbioru danych bezpośrednio za pomocą SQL: wykonuj standardowe zapytania SQL BigQuery w tabelach zbioru danych. Zapewnia to największą elastyczność w przypadku złożonego filtrowania, łączenia z własnymi danymi, analiz niestandardowych i obsługi dodatkowych funkcji agregacji poza COUNT, takich jak AVG, SUM i GROUP BY. Zobacz dokumentację.
  • Wysyłanie zapytań do zbioru danych za pomocą funkcji Places Count: funkcje Places Count to predefiniowane, zoptymalizowane zapytania SQL, które są wykonywane bezpośrednio w BigQuery i upraszczają typowe zadania pobierania danych. Umożliwiają uzyskanie bardziej szczegółowych informacji, np. zwracają identyfikatory miejsc, aby można było wyszukać szczegółowe informacje o poszczególnych miejscach. Zobacz dokumentację.

Zapytania bezpośrednie

Bezpośrednie wysyłanie zapytań do danych wymusza próg agregacji. Wynik jest zwracany tylko wtedy, gdy zapytanie agreguje co najmniej 5 miejsc. Jeśli na przykład kryteria wyszukiwania dają wynik 0, 1, 2, 3 lub 4, wynik jest pomijany w odpowiedzi. Na przykład zapytanie o łączną liczbę restauracji w danym obszarze zwróci odpowiedź tylko wtedy, gdy łączna liczba będzie wynosić co najmniej 5. W przeciwnym razie nie zostanie zwrócona żadna odpowiedź.

Zapytania do funkcji Places Count

Funkcje Places Count mogą zwracać listę identyfikatorów miejsc, których można użyć do wyszukiwania informacji o poszczególnych miejscach za pomocą innych usług GMP, takich jak Places API i Places UI Kit.

Funkcje Places Count nie wymuszają progu agregacji, ale zamiast tego wymuszają minimalny obszar wyszukiwania o wymiarach 40,0 m na 40,0 m (1600 m2). Oznacza to, że dopóki zapytanie jest większe niż minimalny obszar wyszukiwania, zawsze otrzymasz wynik, nawet jeśli nie ma miejsc pasujących do zapytania.

Kiedy wysyłać zapytania do danych bezpośrednio, a kiedy używać funkcji

Wysyłaj zapytania do danych bezpośrednio, jeśli nie potrzebujesz małych liczb wyników, chcesz uzyskać statystyki wykraczające poza liczby, takie jak AVG, SUM lub COUNTIF, albo jeśli musisz wykonywać bardziej złożone zapytania, np. łączyć zbiory danych.

Wysyłaj zapytania za pomocą funkcji, jeśli chcesz się dowiedzieć, czy liczba wyników jest mała lub wynosi 0, albo jeśli musisz pobrać informacje o poszczególnych miejscach, takie jak nazwa lub adres miejsca.

W tej tabeli znajdziesz szczegółowe porównanie różnic między zapytaniami bezpośrednimi a funkcjami Places Count.

Funkcje Places Count Bezpośrednie zapytania do zbioru danych
Korzyści
  • Zwracają identyfikatory miejsc, których można używać do wysyłania zapytań do innych interfejsów API.
  • Mogą zwracać dowolną liczbę.
  • Są zoptymalizowane pod kątem wydajności i niskich kosztów przetwarzania.
  • Są proste w użyciu. Nie musisz pisać złożonych zapytań.
  • Sprawdzają parametry wejściowe i zwracają błąd, co ułatwia korzystanie z nich i debugowanie.
  • Umożliwiają wykonywanie złożonych zapytań, takich jak zaawansowane filtrowanie i łączenie.
  • Nie wymuszają minimalnego obszaru wyszukiwania.
  • Obsługują dodatkowe funkcje agregacji poza COUNT, takie jak AVG, SUM i GROUP BY.
Interfejs 4 predefiniowane funkcje SQL, które generują statystyki COUNT: pojedyncza liczba, liczba według typu, liczba według lokalizacji geograficznej, liczba według komórki H3. Argumenty są przekazywane do funkcji za pomocą JSON_OBJECT. Napisz własny kod SQL, aby uruchamiać funkcje agregacji, takie jak COUNT, COUNT_IF, SUM i AVG.. Dodatkowe statystyki można generować za pomocą JOIN, GROUP BY, WHERE i innych.
Ograniczenia Wymuszają minimalny obszar wyszukiwania o wymiarach 40,0 m na 40,0 m (1600 m2). Funkcja zwraca wynik nawet wtedy, gdy liczba agregacji jest mniejsza niż 5, o ile spełniony jest minimalny obszar wyszukiwania. Wyniki z liczbami mniejszymi niż 5 są pomijane (tzn. wiersz jest wykluczany).
Obsługiwane filtry atrybutów Parametry filtrów funkcji Places Count obsługują te same filtry atrybutów co zapytania bezpośrednie, z wyjątkiem:
  • id miejsca
  • Komponenty adresu
  • Godziny otwarcia
  • Opcje ładowania pojazdów elektrycznych
  • Marki
Obsługiwany jest pełny schemat.