出于隐私保护方面的考虑,我们会限制可在广告数据中心内使用的 SQL 函数。
标量函数
允许使用除以下函数之外的所有标量函数:
ERRORST_AREAST_ASBINARYST_ASGEOJSONST_ASTEXTST_BOUNDARYST_CENTROIDST_CENTROID_AGGST_CLOSESTPOINTST_CLUSTERDBSCANST_CONTAINSST_CONVEXHULLST_COVEREDBYST_COVERSST_DIFFERENCEST_DIMENSIONST_DISJOINTST_DISTANCEST_DUMPST_DWITHINST_EQUALSST_GEOGFROMGEOJSONST_GEOGFROMTEXTST_GEOGFROMWKBST_GEOGPOINTST_GEOGPOINTFROMGEOHASHST_GEOHASHST_INTERSECTIONST_INTERSECTSST_INTERSECTSBOXST_ISCOLLECTIONST_ISEMPTYST_LENGTHST_MAKELINEST_MAKEPOLYGONST_MAKEPOLYGONORIENTEDST_MAXDISTANCEST_NPOINTSST_NUMPOINTSST_PERIMETERST_SIMPLIFYST_SNAPTOGRIDST_TOUCHESST_UNIONST_UNION_AGGST_WITHINST_XST_Y
分析查询
对于汇总分析查询,我们会限制使用用于合并多用户数据的函数。如果只是处理单个用户的数据,则允许使用所有汇总和分析函数。有关详情,请参阅下文的用户级汇总。
汇总函数
| 函数 | 是否支持? |
|---|---|
ANY_VALUE |
支持 |
APPROX_QUANTILES |
否 |
APPROX_TOP_COUNT |
否 |
APPROX_TOP_SUM |
否 |
ARRAY_AGG |
否 |
ARRAY_CONCAT_AGG |
否 |
AVG |
是 |
BIT_AND |
否 |
BIT_OR |
否 |
BIT_XOR |
否 |
COUNT |
是 |
COUNTIF |
是 |
LOGICAL_AND |
是 |
LOGICAL_OR |
是 |
MAX |
是 |
MIN |
是 |
SUM |
是 |
CORR |
是 |
COVAR_POP |
是 |
COVAR_SAMP |
是 |
STDDEV_POP |
是 |
STDDEV_SAMP |
是 |
STDDEV |
是 |
STRING_AGG |
否 |
VAR_POP |
是 |
VAR_SAMP |
是 |
VARIANCE |
是 |
APPROX_COUNT_DISTINCT |
支持 |
分析函数
限制使用所有分析函数。
HyperLogLog++ 函数
广告数据中心支持 HyperLogLog++ (HLL++) 函数。不过,这类函数使用的专门数据类型有更多限制。
支持的类型
| 类型 | 说明 |
|---|---|
ADH.USER_HLL |
由 ADH.USER_ID 类型的值汇总而成的概要数据结构 |
ADH.BYTE_HLL |
由任何非 ID 类型的值汇总而成的概要数据结构 |
这些类型支持合并和提取基数估算值,但不支持直接转换为任何其他类型。它们无法从广告数据中心内直接导出,必须使用 HLL_COUNT.EXTRACT 或 HLL_COUNT.MERGE 才能得到查询输出结果。
HLL 概要数据结构可跨多个汇总层进行基数估算,但请注意,在广告数据中心,这类数据结构与 COUNT(DISTINCT) 相比在单层中并没有带来实质性的性能改进。
支持的函数
| 函数名称 | 支持的类型 | 返回值类型 |
|---|---|---|
HLL_COUNT.EXTRACT
|
ADH.USER_HLL、ADH.BYTE_HLL |
INT64
|
HLL_COUNT.INIT
|
所有标准支持类型、ADH.USER_ID |
ADH.USER_ID 输出类型为 ADH.USER_HLL,其他为 ADH.BYTE_HLL |
HLL_COUNT.INITNT.MERGE
|
ADH.USER_HLL、ADH.BYTE_HLL |
INT64
|
HLL_COUNT.MERGE_PARTIAL
|
ADH.USER_HLL、ADH.BYTE_HLL |
与输入类型相同 |
限制
噪音注入:使用噪音注入运行查询时,不支持 HLL++ 函数。
用户级汇总
我们允许在按 user_id 进行分组或划分的 SELECT 语句中使用所有汇总函数和分析函数。为此,该语句前面的所有联接都必须以 user_id 为联接条件,从而清楚表明是在用户级别保留数据,如下例中所示:
CREATE TABLE paths AS (
SELECT ARRAY_AGG(campaign_id ORDER BY query_id.time_usec) AS path
FROM
adh.google_ads_impressions
LEFT JOIN adh.google_ads_creative_conversions
USING(query_id, user_id)
GROUP BY user_id)
用户名单查询
用户名单查询允许使用汇总函数,不支持使用分析函数。