Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

데이터 세트를 직접 쿼리

Places Insights 데이터에 직접 액세스하려면 장소에 관한 집계된 유용한 정보를 반환하는 BigQuery에서 SQL 쿼리를 작성합니다 . 결과는 쿼리에 지정된 검색 기준의 데이터 세트에서 반환됩니다.

5 미만의 수를 가져와야 하는 경우 대신 장소 수 함수 를 사용하는 것이 좋습니다. 이러한 함수는 0을 포함한 모든 수를 반환할 수 있지만 최소 검색 영역은 40.0m x 40.0m (1600m²)로 적용합니다. 직접 쿼리해야 하는 경우와 함수를 사용해야 하는 경우에 대해 자세히 알아보세요.

쿼리 기본사항

다음 이미지는 쿼리의 기본 형식을 보여줍니다.

쿼리의 기본 형식입니다.

쿼리의 각 부분은 아래에서 자세히 설명합니다.

쿼리 요구사항

데이터 세트에서 직접 실행되는 SQL 쿼리는 데이터 세트를 지정하고 SELECT 절에 WITH AGGREGATION_THRESHOLD를 포함해야 합니다. 이 절이 없으면 쿼리가 실패합니다.

이 예시에서는 places_insights___us.places를 지정하여 미국 데이터 세트를 쿼리합니다.

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`

프로젝트 이름 지정 (선택사항)

필요에 따라 쿼리에 프로젝트 이름을 포함할 수 있습니다. 프로젝트 이름을 지정하지 않으면 쿼리가 기본적으로 활성 프로젝트로 설정됩니다.

서로 다른 프로젝트에서 이름이 같은 데이터 세트를 연결했거나 활성 프로젝트 외부의 테이블을 쿼리하는 경우 프로젝트 이름을 포함하는 것이 좋습니다.

예를 들어 [project name].[dataset name].places입니다.

집계 함수 지정

아래 예시는 지원되는 BigQuery 집계 함수를 보여줍니다. 이 쿼리는 뉴욕시 엠파이어 스테이트 빌딩의 반경 1,000m 내에 있는 모든 장소의 평점을 집계하여 평점 통계를 생성합니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(id) AS place_count,
  APPROX_COUNT_DISTINCT(rating) as distinct_ratings,
  COUNTIF(rating > 4.0) as good_rating_count,
  LOGICAL_AND(rating <= 5) as all_ratings_equal_or_below_five,
  LOGICAL_OR(rating = 5) as any_rating_exactly_five,
  AVG(rating) as avg_rating,
  SUM(user_rating_count) as rating_count,
  COVAR_POP(rating, user_rating_count) as rating_covar_pop,
  COVAR_SAMP(rating, user_rating_count) as rating_covar_samp,
  STDDEV_POP(rating) as rating_stddev_pop,
  STDDEV_SAMP(rating) as rating_stddev_samp,
  VAR_POP(rating) as rating_var_pop,
  VAR_SAMP(rating) as rating_var_samp,
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
  AND business_status = "OPERATIONAL"

위치 제한 지정

위치 제한을 지정하지 않으면 데이터 집계가 전체 데이터 세트에 적용됩니다. 일반적으로 특정 영역을 검색하기 위해 위치 제한을 지정합니다. 이 예시 쿼리는 뉴욕시 엠파이어 스테이트 빌딩을 중심으로 반경이 1, 000m인 대상 제한을 지정합니다.

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)

다각형을 사용하여 검색 영역을 지정할 수 있습니다. 다각형을 사용하는 경우 다각형의 점은 다각형의 첫 번째 점이 마지막 점과 동일한 폐쇄 루프를 정의해야 합니다.

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_CONTAINS(ST_GEOGFROMTEXT("""POLYGON((-73.985708 40.75773,-73.993324 40.750298,
                                      -73.9857 40.7484,-73.9785 40.7575,
                                      -73.985708 40.75773))"""), point)

다음 예시에서는 연결된 점의 선을 사용하여 검색 영역을 정의하고 선 주위의 검색 반경을 100m로 설정합니다. 선은 Routes API에서 계산한 이동 경로와 유사합니다. 경로는 차량, 자전거 또는 보행자를 위한 경로일 수 있습니다.

DECLARE route GEOGRAPHY;

SET route = ST_GEOGFROMTEXT("""LINESTRING(-73.98903537033028 40.73655649223003,
                                          -73.93580216278471 40.80955538843361)""");

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(route, point, 100)

장소 데이터 세트 필드로 필터링

데이터 세트 스키마에 정의된 필드를 기반으로 검색을 구체화합니다. 장소 regular_opening_hours, price_level, 고객 rating과 같은 데이터 세트 필드를 기반으로 결과를 필터링합니다.

관심 있는 국가의 데이터 세트 스키마에 정의된 데이터 세트의 필드를 참조합니다. 각 국가의 데이터 세트 스키마는 다음 두 부분으로 구성됩니다.

모든 국가의 데이터 세트에 공통적인 핵심 스키마
해당 국가에 고유한 스키마 구성요소를 정의하는 국가별 스키마

예를 들어 쿼리에는 쿼리의 필터링 기준을 정의하는 WHERE 절이 포함될 수 있습니다.

다음 예시에서는 rating이 4.0 이상이고 allows_dogs가 true로 설정된 business_status가 OPERATIONAL인 tourist_attraction 유형의 장소에 대한 집계 데이터를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND 'tourist_attraction' IN UNNEST(types)
AND business_status = "OPERATIONAL"
AND rating >= 4.0
AND allows_dogs = true

다음 쿼리는 전기자동차 충전소가 8개 이상인 장소의 결과를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

장소 기본 유형 및 장소 유형으로 필터링

데이터 세트의 각 장소에는 다음이 포함될 수 있습니다.

장소 유형에 정의된 유형에서 연결된 단일 기본 유형 입니다. 예를 들어 기본 유형은 mexican_restaurant 또는 steak_house일 수 있습니다. 쿼리에서 primary_type을 사용하여 장소의 기본 유형에 따라 결과를 필터링합니다.
여러 유형 값은 장소 유형에 정의된 유형에서 연결됩니다. 예를 들어 레스토랑에는 다음 유형이 있을 수 있습니다. seafood_restaurant, restaurant, food, point_of_interest, establishment. 쿼리에서 types를 사용하여 장소와 연결된 유형 목록에 따라 결과를 필터링합니다.

다음 쿼리는 spa로도 기능하는 기본 유형이 skin_care_clinic인 모든 장소의 결과를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  'spa' IN UNNEST(types)
  AND 'skin_care_clinic' = primary_type

장소 ID로 필터링

아래 예시는 5개 장소의 평균 평점을 계산합니다. 장소는 place_id로 식별됩니다.

DECLARE place_ids ARRAY<STRING>;
SET place_ids = ['ChIJPQOh8YVZwokRE2WsbZI4tOk', 'ChIJibtT3ohZwokR7tX0gp0nG8U',
                 'ChIJdfD8moVZwokRO6vxjXAtoWs', 'ChIJsdNONuFbwokRLM-yuifjb8k',
                 'ChIJp0gKoClawokR0txqrcaEkFc'];
SELECT WITH AGGREGATION_THRESHOLD
 AVG(rating) as avg_rating,
FROM
  `PROJECT_NAME.places_insights___us.places`,
  UNNEST(place_ids) place_id
WHERE
  id = place_id;

특정 장소 ID 필터링

쿼리에서 장소 ID 배열을 제외할 수도 있습니다.

장소 ID 찾기를 사용하거나 Places API를 프로그래매틱 방식으로 사용하여 텍스트 검색 (신규) 요청을 실행하여 원하는 장소 ID를 찾을 수 있습니다.

아래 예시에서 쿼리는 호주 시드니의 2000 우편번호 에 있는 카페의 수를 찾습니다. 이 카페는 표시되지 않는 excluded_cafes 배열에 있습니다. 이러한 쿼리는 비즈니스 소유자가 자체 비즈니스를 수에서 제외하려는 경우 유용할 수 있습니다.

WITH excluded_cafes AS (
  -- List the specific place IDs to exclude from the final count
  SELECT * FROM UNNEST([
    'ChIJLTcYGz-uEmsRmazk9oMnP5w', 'ChIJeWDDDNOvEmsRF8SMPUwPbhw',
    'ChIJKdaKHbmvEmsRSdxq_1O05bU'
  ]) AS place_id
)

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `places_insights___au.places` AS places
-- Perform a LEFT JOIN to identify which places are in the exclusion list
LEFT JOIN
  excluded_cafes ON places.id = excluded_cafes.place_id
WHERE
  -- Filter for specific place type and postal code
  places.primary_type = 'cafe'
  AND '2000' IN UNNEST(places.postal_code_names)
  -- Keep only the rows where the join failed (meaning the ID was NOT in the list)
  AND excluded_cafes.place_id IS NULL;

미리 정의된 데이터 값으로 필터링

많은 데이터 세트 필드에는 미리 정의된 값이 있습니다. 예를 들면 다음과 같습니다.

price_level 필드는 다음과 같은 미리 정의된 값을 지원합니다.
- PRICE_LEVEL_FREE
- PRICE_LEVEL_INEXPENSIVE
- PRICE_LEVEL_MODERATE
- PRICE_LEVEL_EXPENSIVE
- PRICE_LEVEL_VERY_EXPENSIVE
business_status 필드는 다음과 같은 미리 정의된 값을 지원합니다.
- OPERATIONAL
- CLOSED_TEMPORARILY
- CLOSED_PERMANENTLY
- FUTURE_OPENING

이 예시에서 쿼리는 뉴욕시 엠파이어 스테이트 빌딩의 반경 1, 000m 내에 있는 business_status가 OPERATIONAL인 모든 꽃집의 수를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND business_status = "OPERATIONAL"
AND 'florist' IN UNNEST(types)

영업시간으로 필터링

이 예시에서는 금요일 해피아워가 있는 지리적 영역의 모든 장소 수를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`,
UNNEST(regular_opening_hours_happy_hour.friday) AS friday_hours
WHERE '17:00:00' BETWEEN friday_hours.start_time AND friday_hours.end_time
AND ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000);

지역 (주소 구성요소)으로 필터링

장소 데이터 세트에는 정치적 경계를 기반으로 결과를 필터링하는 데 유용한 주소 구성요소 집합도 포함되어 있습니다. 각 주소 구성요소는 텍스트 코드 이름 (예: 뉴욕시의 우편번호 10002) 또는 상응하는 우편번호 ID의 장소 ID(ChIJm5NfgIBZwokR6jLqucW0ipg)로 식별됩니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  '10002' IN UNNEST(postal_code_names)
  --- 'ChIJm5NfgIBZwokR6jLqucW0ipg'  IN UNNEST(postal_code_ids) -- same filter as above using postal code ID

전기자동차 충전으로 필터링

이 예시에서는 전기자동차 충전기가 8개 이상인 장소의 수를 제공합니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

이 예시에서는 급속 충전을 지원하는 Tesla 충전기가 10개 이상 있는 장소의 수를 집계합니다.

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`, UNNEST(ev_charge_options.connector_aggregation) as connectors
WHERE
  connectors.type ='EV_CONNECTOR_TYPE_TESLA'
  AND connectors.max_charge_rate_kw >= 50
  AND connectors.count >= 10

결과 그룹 반환

지금까지 표시된 쿼리는 쿼리의 집계 수가 포함된 결과를 단일 행으로 반환합니다. GROUP BY 연산자를 사용하여 그룹화 기준에 따라 응답에서 여러 행을 반환할 수도 있습니다.

참고: GROUP BY 작업을 GB의 postal_code_names 에서는 실행할 수 없습니다.

예를 들어 다음 쿼리는 검색 영역에 있는 각 장소의 기본 유형별로 그룹화된 결과를 반환합니다.

SELECT WITH AGGREGATION_THRESHOLD
  primary_type,
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.99992071622756, 40.71818785986936), point, 1000)
GROUP BY primary_type

이 이미지는 이 쿼리의 출력 예시를 보여줍니다.

기본 유형별로 결과를 그룹화하기 위한 쿼리 결과입니다.

이 예시에서는 장소 테이블을 정의합니다. 그런 다음 각 장소에 대해 인근 레스토랑(1, 000m 이내)의 수를 계산합니다.

WITH my_locations AS (
  SELECT 'Location 1' AS name, ST_GEOGPOINT(-74.00776440888504, 40.70932825380786) AS location
  UNION ALL
  SELECT 'Location 2' AS name, ST_GEOGPOINT(-73.98257192833559, 40.750738934863215) AS location
  UNION ALL
  SELECT 'Location 3' AS name, ST_GEOGPOINT(-73.94701794263223, 40.80792954838445)  AS location
)
SELECT WITH AGGREGATION_THRESHOLD
  l.name,
  COUNT(*) as count
FROM
  `PROJECT_NAME.places_insights___us.places`
JOIN
   my_locations l
ON
  ST_DWITHIN(l.location, p.point, 1000)
WHERE
  primary_type = "restaurant"
  AND business_status = "OPERATIONAL"
GROUP BY
  l.name