Google 会使用 AI 技术将内容翻译成您偏好的语言。AI 翻译可能包含错误。

直接查询数据集

如需直接访问地点数据分析数据，您可以在 BigQuery 中编写 SQL 查询，以返回有关地点的汇总数据分析。结果会根据查询中指定的搜索条件从数据集中返回。

如果您需要获取小于 5 的数量，请考虑改用地点数量函数。这些函数可以返回任何数量（包括 0），但会强制执行 40.0 米 x 40.0 米（1600 平方米）的最小搜索区域。详细了解何时直接查询，何时使用函数。

查询基础知识

下图显示了查询的基本格式：

查询的基本格式。

下文将更详细地介绍查询的各个部分。

查询要求

直接对数据集执行的 SQL 查询必须指定数据集，并在 SELECT 子句中包含 WITH AGGREGATION_THRESHOLD。如果没有此参数，查询将会失败。

此示例指定了 places_insights___us.places，以查询美国的数据集。

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`

指定项目名称（可选）

您也可以选择在查询中添加项目名称。如果您未指定项目名称，则查询将默认针对活动项目。

如果您在不同项目中关联了名称相同的数据集，或者要查询活跃项目之外的表，则可能需要添加项目名称。

例如 [project name].[dataset name].places。

指定聚合函数

以下示例展示了受支持的 BigQuery 聚合函数。此查询会汇总纽约市帝国大厦方圆 1,000 米内的所有地点评分，以生成评分统计信息：

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(id) AS place_count,
  APPROX_COUNT_DISTINCT(rating) as distinct_ratings,
  COUNTIF(rating > 4.0) as good_rating_count,
  LOGICAL_AND(rating <= 5) as all_ratings_equal_or_below_five,
  LOGICAL_OR(rating = 5) as any_rating_exactly_five,
  AVG(rating) as avg_rating,
  SUM(user_rating_count) as rating_count,
  COVAR_POP(rating, user_rating_count) as rating_covar_pop,
  COVAR_SAMP(rating, user_rating_count) as rating_covar_samp,
  STDDEV_POP(rating) as rating_stddev_pop,
  STDDEV_SAMP(rating) as rating_stddev_samp,
  VAR_POP(rating) as rating_var_pop,
  VAR_SAMP(rating) as rating_var_samp,
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
  AND business_status = "OPERATIONAL"

指定位置限制

如果您未指定位置限制，则数据汇总将应用于整个数据集。通常，您会指定位置限制条件来搜索特定区域。此示例查询指定了以纽约市帝国大厦为中心、半径为 1, 000 米的目标限制。

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)

您可以使用多边形指定搜索区域。使用多边形时，多边形的点必须定义一个闭环，其中多边形的第一个点与最后一个点相同：

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_CONTAINS(ST_GEOGFROMTEXT("""POLYGON((-73.985708 40.75773,-73.993324 40.750298,
                                      -73.9857 40.7484,-73.9785 40.7575,
                                      -73.985708 40.75773))"""), point)

在下一个示例中，您将使用一条由相连的点组成的线来定义搜索区域，并将搜索半径设置为该线周围 100 米。该线条类似于 Routes API 计算的出行路线。路线可能适用于车辆、自行车或步行者：

DECLARE route GEOGRAPHY;

SET route = ST_GEOGFROMTEXT("""LINESTRING(-73.98903537033028 40.73655649223003,
                                          -73.93580216278471 40.80955538843361)""");

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(route, point, 100)

按地点数据集字段过滤

根据数据集架构定义的字段优化搜索。根据数据集字段（例如地点 regular_opening_hours、price_level 和客户 rating）过滤结果。

引用由您感兴趣的国家/地区的数据集架构定义的任何字段。每个国家/地区的数据集架构都包含两部分：

所有国家/地区的数据集通用的核心架构。
一种特定于国家/地区的架构，用于定义特定于相应国家/地区的架构组件。

例如，您的查询可以包含一个 WHERE 子句，用于定义查询的过滤条件。

在以下示例中，您将返回类型为 tourist_attraction、business_status 为 OPERATIONAL、rating 大于或等于 4.0 且 allows_dogs 设置为 true 的地点的汇总数据：

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND 'tourist_attraction' IN UNNEST(types)
AND business_status = "OPERATIONAL"
AND rating >= 4.0
AND allows_dogs = true

以下查询会返回至少有 8 个电动车辆充电站的地点：

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

按地点主要类型和地点类型过滤

数据集中的每个地点都可以有：

与地点类型定义的类型相关联的单个主要类型。例如，主要类型可以是 mexican_restaurant 或 steak_house。在查询中使用 primary_type 可按地点的主要类型过滤结果。
与地点类型定义的类型关联的多种类型的值。例如，某餐厅可能具有以下类型：seafood_restaurant、restaurant、food、point_of_interest、establishment。在查询中使用 types 可根据与地点相关联的类型列表过滤结果。

以下查询会返回主要类型为 skin_care_clinic 且同时用作 spa 的所有地点结果：

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  'spa' IN UNNEST(types)
  AND 'skin_care_clinic' = primary_type

按地点 ID 过滤

以下示例计算了 5 个地点的平均评分。这些地点通过其 place_id 进行标识。

DECLARE place_ids ARRAY<STRING>;
SET place_ids = ['ChIJPQOh8YVZwokRE2WsbZI4tOk', 'ChIJibtT3ohZwokR7tX0gp0nG8U',
                 'ChIJdfD8moVZwokRO6vxjXAtoWs', 'ChIJsdNONuFbwokRLM-yuifjb8k',
                 'ChIJp0gKoClawokR0txqrcaEkFc'];
SELECT WITH AGGREGATION_THRESHOLD
 AVG(rating) as avg_rating,
FROM
  `PROJECT_NAME.places_insights___us.places`,
  UNNEST(place_ids) place_id
WHERE
  id = place_id;

滤除特定地点 ID

您还可以从查询中排除 Place ID 数组。

您可以使用地点 ID 查找工具查找所需的地点 ID，也可以通过以编程方式使用 Places API 执行文本搜索（新）请求来查找。

在以下示例中，查询会查找澳大利亚悉尼邮政编码为 2000 的区域内未出现在 excluded_cafes 数组中的咖啡馆数量。对于想要从统计中排除自己业务的企业主来说，此类查询可能很有用。

WITH excluded_cafes AS (
  -- List the specific place IDs to exclude from the final count
  SELECT * FROM UNNEST([
    'ChIJLTcYGz-uEmsRmazk9oMnP5w', 'ChIJeWDDDNOvEmsRF8SMPUwPbhw',
    'ChIJKdaKHbmvEmsRSdxq_1O05bU'
  ]) AS place_id
)

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `places_insights___au.places` AS places
-- Perform a LEFT JOIN to identify which places are in the exclusion list
LEFT JOIN
  excluded_cafes ON places.id = excluded_cafes.place_id
WHERE
  -- Filter for specific place type and postal code
  places.primary_type = 'cafe'
  AND '2000' IN UNNEST(places.postal_code_names)
  -- Keep only the rows where the join failed (meaning the ID was NOT in the list)
  AND excluded_cafes.place_id IS NULL;

按预定义的数据值过滤

许多数据集字段都具有预定义的值。例如

price_level 字段支持以下预定义值：
- PRICE_LEVEL_FREE
- PRICE_LEVEL_INEXPENSIVE
- PRICE_LEVEL_MODERATE
- PRICE_LEVEL_EXPENSIVE
- PRICE_LEVEL_VERY_EXPENSIVE
business_status 字段支持以下预定义值：
- OPERATIONAL
- CLOSED_TEMPORARILY
- CLOSED_PERMANENTLY
- FUTURE_OPENING

在此示例中，查询会返回纽约市帝国大厦方圆 1, 000 米内 business_status 为 OPERATIONAL 的所有花店的数量：

SELECT WITH AGGREGATION_THRESHOLD
COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`
WHERE
ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000)
AND business_status = "OPERATIONAL"
AND 'florist' IN UNNEST(types)

按营业时间过滤

在此示例中，返回地理区域内所有提供周五欢乐时光的场所的数量：

SELECT WITH AGGREGATION_THRESHOLD COUNT(*) AS count
FROM `PROJECT_NAME.places_insights___us.places`,
UNNEST(regular_opening_hours_happy_hour.friday) AS friday_hours
WHERE '17:00:00' BETWEEN friday_hours.start_time AND friday_hours.end_time
AND ST_DWITHIN(ST_GEOGPOINT(-73.9857, 40.7484), point, 1000);

按区域（地址组成部分）过滤

我们的地点数据集还包含一组地址组成部分，可用于根据政治边界过滤结果。每个地址组成部分都由其文本代号（例如纽约市的邮政编码为 10002）或等效邮政编码 ID 的地点 ID (ChIJm5NfgIBZwokR6jLqucW0ipg) 标识。

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  '10002' IN UNNEST(postal_code_names)
  --- 'ChIJm5NfgIBZwokR6jLqucW0ipg'  IN UNNEST(postal_code_ids) -- same filter as above using postal code ID

按电动汽车充电站过滤

此示例提供至少有 8 个电动汽车充电桩的场所数量：

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ev_charge_options.connector_count > 8;

此示例用于统计至少有 10 个支持快速充电的 Tesla 充电桩的地点数量：

SELECT WITH AGGREGATION_THRESHOLD
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`, UNNEST(ev_charge_options.connector_aggregation) as connectors
WHERE
  connectors.type ='EV_CONNECTOR_TYPE_TESLA'
  AND connectors.max_charge_rate_kw >= 50
  AND connectors.count >= 10

返回结果组

到目前为止，我们展示的查询会在结果中返回一行，其中包含查询的汇总计数。您还可以使用 GROUP BY 运算符根据分组条件在响应中返回多行。

注意： 不允许对 GB 中的 postal_code_names 执行 GROUP BY 操作。

例如，以下查询返回的结果按搜索区域中每个地点的主要类型进行分组：

SELECT WITH AGGREGATION_THRESHOLD
  primary_type,
  COUNT(*) AS count
FROM
  `PROJECT_NAME.places_insights___us.places`
WHERE
  ST_DWITHIN(ST_GEOGPOINT(-73.99992071622756, 40.71818785986936), point, 1000)
GROUP BY primary_type

此图片显示了此查询的示例输出：

按主要类型对结果进行分组的查询结果。

在此示例中，您定义了一个位置表。然后，针对每个位置，计算附近餐厅的数量（即 1, 000 米范围内的餐厅）：

WITH my_locations AS (
  SELECT 'Location 1' AS name, ST_GEOGPOINT(-74.00776440888504, 40.70932825380786) AS location
  UNION ALL
  SELECT 'Location 2' AS name, ST_GEOGPOINT(-73.98257192833559, 40.750738934863215) AS location
  UNION ALL
  SELECT 'Location 3' AS name, ST_GEOGPOINT(-73.94701794263223, 40.80792954838445)  AS location
)
SELECT WITH AGGREGATION_THRESHOLD
  l.name,
  COUNT(*) as count
FROM
  `PROJECT_NAME.places_insights___us.places`
JOIN
   my_locations l
ON
  ST_DWITHIN(l.location, p.point, 1000)
WHERE
  primary_type = "restaurant"
  AND business_status = "OPERATIONAL"
GROUP BY
  l.name