پرس و جوهای پیشرفته

درخواست‌های پیشرفته در این صفحه برای داده‌های صادرات رویداد BigQuery برای Google Analytics 4 اعمال می‌شود. اگر به دنبال همان منبع برای Universal Analytics هستید، به کتاب آشپزی BigQuery برای Universal Analytics مراجعه کنید. قبل از اینکه موارد پیشرفته را امتحان کنید، ابتدا پرس و جوهای اساسی را امتحان کنید.

محصولات خریداری شده توسط مشتریانی که محصول خاصی را خریداری کرده اند

پرس و جو زیر نشان می دهد که چه محصولات دیگری توسط مشتریانی که محصول خاصی را خریداری کرده اند خریداری کرده اند. این مثال فرض نمی‌کند که محصولات به همان ترتیب خریداری شده‌اند.

مثال بهینه‌سازی شده به ویژگی‌های اسکریپت نویسی BigQuery برای تعریف متغیری متکی است که اعلام می‌کند چه مواردی باید فیلتر شوند. در حالی که این کارایی را بهبود نمی بخشد، این رویکرد خواناتری برای تعریف متغیرها در مقایسه با ایجاد یک جدول مقدار واحد با استفاده از عبارت WITH است. پرس و جو ساده شده از روش دوم با استفاده از عبارت WITH استفاده می کند.

پرس و جو ساده شده یک لیست جداگانه از "خریداران محصول A" ایجاد می کند و با آن داده ها پیوند می دهد. درعوض، پرس و جو بهینه شده، فهرستی از تمام مواردی را ایجاد می کند که کاربر در بین سفارشات با استفاده از تابع ARRAY_AGG خریداری کرده است. سپس با استفاده از عبارت WHERE بیرونی، لیست‌های خرید در همه کاربران برای target_item فیلتر می‌شوند و فقط موارد مرتبط نشان داده می‌شوند.

ساده شده

-- Example: Products purchased by customers who purchased a specific product.
--
-- `Params` is used to hold the value of the selected product and is referenced
-- throughout the query.

WITH
 Params AS (
  -- Replace with selected item_name or item_id.
  SELECT 'Google Navy Speckled Tee' AS selected_product
 ),
 PurchaseEvents AS (
  SELECT
   user_pseudo_id,
   items
  FROM
   -- Replace table name.
   `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*`
  WHERE
   -- Replace date range.
   _TABLE_SUFFIX BETWEEN '20201101' AND '20210131'
   AND event_name = 'purchase'
 ),
 ProductABuyers AS (
  SELECT DISTINCT
   user_pseudo_id
  FROM
   Params,
   PurchaseEvents,
   UNNEST(items) AS items
  WHERE
   -- item.item_id can be used instead of items.item_name.
   items.item_name = selected_product
 )
SELECT
 items.item_name AS item_name,
 SUM(items.quantity) AS item_quantity
FROM
 Params,
 PurchaseEvents,
 UNNEST(items) AS items
WHERE
 user_pseudo_id IN (SELECT user_pseudo_id FROM ProductABuyers)
 -- item.item_id can be used instead of items.item_name
 AND items.item_name != selected_product
GROUP BY 1
ORDER BY item_quantity DESC;

بهینه شده است

-- Optimized Example: Products purchased by customers who purchased a specific product.

-- Replace item name
DECLARE target_item STRING DEFAULT 'Google Navy Speckled Tee';

SELECT
 IL.item_name AS item_name,
 SUM(IL.quantity) AS quantity
FROM
 (
  SELECT
   user_pseudo_id,
   ARRAY_AGG(STRUCT(item_name, quantity)) AS item_list
  FROM
   -- Replace table
   `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*`, UNNEST(items)
  WHERE
   -- Replace date range
   _TABLE_SUFFIX BETWEEN '20201201' AND '20201210'
   AND event_name = 'purchase'
  GROUP BY
   1
 ),
 UNNEST(item_list) AS IL
WHERE
 target_item IN (SELECT item_name FROM UNNEST(item_list))
 -- Remove the following line if you want the target_item to appear in the results
 AND target_item != IL.item_name
GROUP BY
 item_name
ORDER BY
 quantity DESC;

میانگین مبلغی که در هر جلسه خرید توسط کاربر خرج شده است

پرس و جو زیر میانگین پولی را که در هر جلسه توسط هر کاربر خرج می شود نشان می دهد. این فقط جلساتی را در نظر می گیرد که کاربر در آن خرید انجام داده است.

-- Example: Average amount of money spent per purchase session by user.

WITH
 events AS (
  SELECT
   session.value.int_value AS session_id,
   COALESCE(spend.value.int_value, spend.value.float_value, spend.value.double_value, 0.0)
    AS spend_value,
   event.*

  -- Replace table name
  FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*` AS event
  LEFT JOIN UNNEST(event.event_params) AS session
   ON session.key = 'ga_session_id'
  LEFT JOIN UNNEST(event.event_params) AS spend
   ON spend.key = 'value'

  -- Replace date range
  WHERE _TABLE_SUFFIX BETWEEN '20201101' AND '20210131'
 )
SELECT
 user_pseudo_id,
 COUNT(DISTINCT session_id) AS session_count,
 SUM(spend_value) / COUNT(DISTINCT session_id) AS avg_spend_per_session_by_user
FROM events
WHERE event_name = 'purchase' and session_id IS NOT NULL
GROUP BY user_pseudo_id

آخرین شناسه و شماره جلسه برای کاربران

جستار زیر لیستی از آخرین ga_session_id و ga_session_number از 4 روز گذشته را برای لیستی از کاربران ارائه می دهد. شما می توانید یک لیست user_pseudo_id یا یک لیست user_id ارائه دهید.

user_pseudo_id

-- Get the latest ga_session_id and ga_session_number for specific users during last 4 days.

-- Replace timezone. List at https://en.wikipedia.org/wiki/List_of_tz_database_time_zones.
DECLARE REPORTING_TIMEZONE STRING DEFAULT 'America/Los_Angeles';

-- Replace list of user_pseudo_id's with ones you want to query.
DECLARE USER_PSEUDO_ID_LIST ARRAY<STRING> DEFAULT
 [
  '1005355938.1632145814', '979622592.1632496588', '1101478530.1632831095'];

CREATE TEMP FUNCTION GetParamValue(params ANY TYPE, target_key STRING)
AS (
 (SELECT `value` FROM UNNEST(params) WHERE key = target_key LIMIT 1)
);

CREATE TEMP FUNCTION GetDateSuffix(date_shift INT64, timezone STRING)
AS (
 (SELECT FORMAT_DATE('%Y%m%d', DATE_ADD(CURRENT_DATE(timezone), INTERVAL date_shift DAY)))
);

SELECT DISTINCT
 user_pseudo_id,
 FIRST_VALUE(GetParamValue(event_params, 'ga_session_id').int_value)
  OVER (UserWindow) AS ga_session_id,
 FIRST_VALUE(GetParamValue(event_params, 'ga_session_number').int_value)
  OVER (UserWindow) AS ga_session_number
FROM
 -- Replace table name.
 `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*`
WHERE
 user_pseudo_id IN UNNEST(USER_PSEUDO_ID_LIST)
 AND RIGHT(_TABLE_SUFFIX, 8)
  BETWEEN GetDateSuffix(-3, REPORTING_TIMEZONE)
  AND GetDateSuffix(0, REPORTING_TIMEZONE)
WINDOW UserWindow AS (PARTITION BY user_pseudo_id ORDER BY event_timestamp DESC);

شناسه کاربر

-- Get the latest ga_session_id and ga_session_number for specific users during last 4 days.

-- Replace timezone. List at https://en.wikipedia.org/wiki/List_of_tz_database_time_zones.
DECLARE REPORTING_TIMEZONE STRING DEFAULT 'America/Los_Angeles';

-- Replace list of user_id's with ones you want to query.
DECLARE USER_ID_LIST ARRAY<STRING> DEFAULT ['<user_id_1>', '<user_id_2>', '<user_id_n>'];

CREATE TEMP FUNCTION GetParamValue(params ANY TYPE, target_key STRING)
AS (
 (SELECT `value` FROM UNNEST(params) WHERE key = target_key LIMIT 1)
);

CREATE TEMP FUNCTION GetDateSuffix(date_shift INT64, timezone STRING)
AS (
 (SELECT FORMAT_DATE('%Y%m%d', DATE_ADD(CURRENT_DATE(timezone), INTERVAL date_shift DAY)))
);

SELECT DISTINCT
 user_pseudo_id,
 FIRST_VALUE(GetParamValue(event_params, 'ga_session_id').int_value)
  OVER (UserWindow) AS ga_session_id,
 FIRST_VALUE(GetParamValue(event_params, 'ga_session_number').int_value)
  OVER (UserWindow) AS ga_session_number
FROM
 -- Replace table name.
 `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*`
WHERE
 user_id IN UNNEST(USER_ID_LIST)
 AND RIGHT(_TABLE_SUFFIX, 8)
  BETWEEN GetDateSuffix(-3, REPORTING_TIMEZONE)
  AND GetDateSuffix(0, REPORTING_TIMEZONE)
WINDOW UserWindow AS (PARTITION BY user_pseudo_id ORDER BY event_timestamp DESC);