PLACES_COUNT_PER_TYPE_V2 函数

PLACES_COUNT_PER_TYPE_V2 函数会返回一个 BigQuery 表,其中包含多个输入地理位置的地点数量和地点 ID 示例(按地点类型细分)。此函数旨在通过接受地理位置的输入表形参来实现高效的批量处理。您可以通过输入表提供地理位置,并以数组形式指定地点类型。

语法

SELECT * FROM `PROJECT_NAME.LINKED_DATASET_NAME.PLACES_COUNT_PER_TYPE_V2`(
  TABLE input_geographies,
  target_types,
  filters
)

参数

  • PROJECT_NAME:您的 Google Cloud 项目的名称。
  • LINKED_DATASET_NAME:包含地点数据分析函数的 BigQuery 数据集的名称(例如 places_insights___us)。
  • input_geographies:包含要分析的地理位置的 BigQuery 表。此表必须包含以下列:
    • geo_id (STRING):每个地理位置的唯一标识符。
    • geo (GEOGRAPHY):表示相应区域的 BigQuery GEOGRAPHY 对象。可以是点、多边形或其他地理位置类型。
  • target_types (ARRAY<STRING>):您要获取数量的地点类型字符串数组。如果地点与 types 数组中列出的任何类型匹配,而不仅仅是 primary_type,则会被计入。
  • filters (JSON):一个 JSON 对象,包含用于进一步过滤地点的键值对。请参阅过滤参数

输出表架构

PLACES_COUNT_PER_TYPE_V2 函数返回包含以下列的表:

列名称 数据类型 说明
geo_id STRING 输入地理位置的唯一标识符(来自 input_geographies 表)。
input_geography GEOGRAPHY 来自 input_geographies 表的原始地理位置对象。
place_type STRING 相应行所代表的 target_types 数组中的地点类型。
place_count INTEGER 地理位置内或附近与 place_type 和其他过滤条件匹配的地点数量。
sample_place_ids ARRAY<STRING> 一个数组,其中包含最多 250 个符合相应类型和地理位置条件的地点 ID。

输出将包含 target_types 数组中指定的每个 geo_idplace_type 组合对应的一行,即使数量为零也是如此。

运作方式

该函数会处理 input_geographies 表中提供的每个地理位置。 对于每个地理位置,该函数会统计符合 target_types 数组中列出的任何类型的地点,并且还满足 filters JSON 对象中的所有条件。结果会按每个 geo_idtarget_types 中的每种类型进行汇总和细分。

示例:统计纽约市各县不同类型餐馆的数量

此示例生成了一个表格,其中包含纽约市三个县的“餐厅”“咖啡馆”和“酒吧”类型的数量。

SELECT geo_id, input_geography, place_type, place_count
FROM `PROJECT_NAME.places_insights___us.PLACES_COUNT_PER_TYPE_V2`(
  (
    SELECT county_name AS geo_id,
           ST_SIMPLIFY(county_geom, 100) AS geo
    FROM
      `bigquery-public-data.geo_us_boundaries.counties`
    WHERE
      state_fips_code = "36"  -- New York State
      AND county_name IN ("Queens", "Kings", "New York")
  ),
  ['restaurant', 'cafe', 'bar'],  -- target_types
  JSON_OBJECT(
      'business_status', ['OPERATIONAL']
  )
);

结果将是一个包含 9 行(3 个县 * 3 种类型)的表格。每行将显示每个县内的“餐厅”“咖啡馆”或“酒吧”场所的数量。如果您将 Place ID 添加到 SELECT 语句中,还可以包含示例 Place ID。

纽约各县的“按类型统计地点数量”函数的结果。

使用 PLACES_COUNT_PER_TYPE_V2 的优势

PLACES_COUNT_PER_TYPE_V2 具有多项关键优势,尤其是在与旧版 PLACES_COUNT_PER_TYPE 函数相比时:

  • 地理位置的批处理:与一次处理一个地理位置的 PLACES_COUNT_PER_TYPE 不同,PLACES_COUNT_PER_TYPE_V2 接受 TABLE 的输入地理位置。这样,您就可以在单个查询中分析并获取多个地理位置(点、多边形)的特定类型数量,而无需进行多次函数调用。
  • 增强的性能和可伸缩性:通过获取表格输入,PLACES_COUNT_PER_TYPE_V2 可以利用 BigQuery 优化的地理空间联接和并行处理功能,同时处理所有提供的地理位置。这样一来,在处理大量地理位置时,性能会显著提升,可伸缩性也会更好。
  • 包含零计数:返回批次中特定区域内未找到的类型的计数为 0 的行,确保所有类型-地理位置组合的结果集完整。