Эта страница переведена с помощью Cloud Translation API.

Отчет об экспериментах

Существует два основных способа составления отчетов об экспериментах:

Прямое предоставление отчетов по эксперименту : Запрос к ресурсу experiment для получения метрик. Этот вариант предоставляет метрики для контрольной и экспериментальной групп в одном ответе, а также данные статистического сравнения, такие как прирост и p-значения. Это единственный способ сообщить о результатах экспериментов, проводимых в рамках кампании .
Отчеты по кампаниям : Запрос метрик к ресурсу campaign с использованием параметра campaign.experiment_type для различения базовой и экспериментальной кампаний. Эта опция доступна только для экспериментов, в которых используются отдельные контрольные и экспериментальные кампании, например, для экспериментов, управляемых системой .

Данное руководство в первую очередь посвящено непосредственному составлению отчетов по результатам экспериментов, что совместимо со всеми типами экспериментов, поддерживающими отчетность.

Непосредственное представление результатов эксперимента

Вы можете напрямую запрашивать данные experiment , чтобы получить показатели производительности и статистические сравнения между контрольной и экспериментальной группами.

Показатели и статистическая значимость

Для основных показателей, таких как клики, показы, стоимость, конверсии и ценность конверсии, ресурс experiment предоставляет как показатели экспериментальной группы (например, metrics.clicks ), так и показатели контрольной группы (например, metrics.control_clicks ) в одной строке.

Также имеются поля, которые помогут оценить статистическую значимость любых различий между группами:

metrics.*_p_value : Вероятность того, что наблюдаемые результаты произошли бы, если бы эксперимент фактически не оказал никакого влияния на показатель. Более низкое значение p указывает на более высокую статистическую значимость.
metrics.*_point_estimate : Оценочный процентный прирост (положительный или отрицательный) по данной метрике для экспериментальной группы по сравнению с контрольной группой. Вместе с margin_of_error они описывают доверительный интервал с заданным уровнем доверия для оцениваемой разницы. Оцениваемая величина — (экспериментальная группа / контрольная группа - 1). Точечная оценка — это центр доверительного интервала.
metrics.*_margin_of_error : Радиус доверительного интервала, центрированного в точке point_estimate . Он рассчитывается для заданного уровня доверия, который зависит от типа эксперимента.

В ресурсе experiment поддерживаются следующие основные поля метрик, включая значение для экспериментальной группы, значение для контрольной группы и перечисленные ранее статистические поля:

clicks
impressions
cost_micros
conversions
cost_per_conversion
conversion_value
conversion_value_per_cost

В частности, для преобразований статистические поля доступны через следующие поля absolute_change , а не в виде относительных значений:

metrics.conversions_absolute_change_p_value : Значение p для нулевой гипотезы о том, что эксперимент не оказывает влияния на абсолютное изменение конверсий. Диапазон значений от 0 до 1.
metrics.conversions_absolute_change_point_estimate : Точечная оценка при расчете влияния эксперимента на абсолютное изменение конверсий.
metrics.conversions_absolute_change_margin_of_error : Погрешность при оценке влияния эксперимента на абсолютное изменение конверсий.

Для получения помощи в составлении корректных запросов к experiment ресурсу используйте инструмент Google Ads Query Builder .

Пример запроса

Следующий GAQL-запрос извлекает ключевые метрики для эксперимента:

SELECT
  experiment.experiment_id,
  experiment.name,
  experiment.type,
  metrics.clicks,
  metrics.control_clicks,
  metrics.clicks_point_estimate,
  metrics.clicks_margin_of_error,
  metrics.clicks_p_value,
  metrics.conversions,
  metrics.control_conversions,
  metrics.conversions_absolute_change_point_estimate,
  metrics.conversions_absolute_change_margin_of_error,
  metrics.conversions_absolute_change_p_value
FROM experiment
WHERE experiment.experiment_id = EXPERIMENT_ID

Интерпретация результатов

Для определения статистически значимых результатов эксперимента можно использовать поля p-значения, точечной оценки и погрешности. Например, если значение p-значения для conversions_absolute_change_p_value ниже выбранного вами порога (например, 0,05 для 95% доверительного интервала), а разница между значением p- conversions_absolute_change_point_estimate и conversions_absolute_change_margin_of_error больше нуля, это указывает на то, что экспериментальная группа показывает значительно лучшие результаты по конверсиям, чем контрольная.

Вот фрагмент кода на Python, демонстрирующий, как оценивать результаты на основе p-значения и оценок коэффициента подъема:

Java

private void evaluateExperiment(
    GoogleAdsClient googleAdsClient, long customerId, GoogleAdsRow row) {
  Metrics metrics = row.getMetrics();
  String experimentResourceName = row.getExperiment().getResourceName();

  // 1. Evaluate conversion success as a primary success signal if available.
  // - Point Estimate: Represents the estimated average lift or difference in conversions.
  // - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error
  //   provided by the API is calculated for a preset confidence level which is set based on the
  //   experiment type.
  // - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0,
  //   we have statistical significance that performance has improved.
  double convPValue = metrics.getConversionsAbsoluteChangePValue();
  double convLift = metrics.getConversionsAbsoluteChangePointEstimate();
  double convError = metrics.getConversionsAbsoluteChangeMarginOfError();
  double convLowerBound = convLift - convError;

  if (convPValue <= P_VALUE_THRESHOLD) {
    if (convLowerBound > 0) {
      System.out.printf(
          "Significant Success: Conversions increased. Even at the lower bound, the lift is %.2f."
              + " Promoting changes.%n",
          convLowerBound);
      promoteExperiment(googleAdsClient, customerId, experimentResourceName);
      return;
    } else if ((convLift + convError) < 0) {
      System.out.printf(
          "Significant Decline: Even the upper bound (%.2f) is below zero. Ending experiment.%n",
          convLift + convError);
      endExperiment(googleAdsClient, customerId, experimentResourceName);
      return;
    }
  }

  // 2. Fall back to evaluating click metrics if conversions are inconclusive.
  double clickPValue = metrics.getClicksPValue();
  double clickLift = metrics.getClicksPointEstimate();
  double clickError = metrics.getClicksMarginOfError();
  double clickLowerBound = clickLift - clickError;

  if (clickPValue <= P_VALUE_THRESHOLD && clickLowerBound > 0) {
    System.out.printf("Click volume is significantly up (+%.1f%%).%n", clickLift * 100);

    // Graduation is only supported for separate campaign experiments, not
    // intra-campaign experiments where there is no separate treatment campaign.
    ExperimentType experimentType = row.getExperiment().getType();
    if (experimentType != ExperimentType.ADOPT_BROAD_MATCH_KEYWORDS
        && experimentType != ExperimentType.ADOPT_AI_MAX) {
      System.out.println("Graduating treatment campaign for further manual analysis.");
      graduateExperiment(googleAdsClient, customerId, experimentResourceName);
    } else {
      System.out.println(
          "Intra-campaign trial detected: graduation is not supported. Continuing to run the"
              + " experiment to gather more conversion data.");
    }
  } else {
    // 3. Print status if no action was taken.
    System.out.printf(
        "Inconclusive: No significant lift in Conversions (p=%.2f) or Clicks (p=%.2f). Current"
            + " estimated lift: %.2f +/- %.2f. Allowing the experiment to continue running.%n",
        convPValue, clickPValue, convLift, convError);
  }
}
EvaluateAndUpdateExperiment.java

C#

private static void EvaluateExperiment(GoogleAdsClient client, long customerId, GoogleAdsRow row)
{
    // This function evaluates performance metrics and immediately takes action
    // to update the experiment's status (promote, end, or graduate) if
    // statistical significance thresholds are met.
    var metrics = row.Metrics;
    string experimentResourceName = row.Experiment.ResourceName;

    bool hasConvMetrics = metrics.HasConversionsAbsoluteChangePValue
        && metrics.HasConversionsAbsoluteChangePointEstimate
        && metrics.HasConversionsAbsoluteChangeMarginOfError;

    bool hasClickMetrics = metrics.HasClicksPValue
        && metrics.HasClicksPointEstimate
        && metrics.HasClicksMarginOfError;

    // 1. Evaluate conversion success as a primary success signal if available.
    // - Point Estimate: Represents the estimated average lift or difference in conversions.
    // - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error
    //   provided by the API is calculated for a preset confidence level which is set based on
    //   the experiment type.
    // - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0,
    //   we have statistical significance that performance has improved.
    if (hasConvMetrics)
    {
        double convPValue = metrics.ConversionsAbsoluteChangePValue;
        double convLift = metrics.ConversionsAbsoluteChangePointEstimate;
        double convError = metrics.ConversionsAbsoluteChangeMarginOfError;
        double convLowerBound = convLift - convError;

        if (convPValue <= P_VALUE_THRESHOLD)
        {
            if (convLowerBound > 0)
            {
                Console.WriteLine(
                    $"Significant Success: Conversions increased. Even at the lower" +
                    $" bound, the lift is {convLowerBound:F2}. Promoting changes.");
                PromoteExperiment(client, customerId, experimentResourceName);
                return;
            }
            else if ((convLift + convError) < 0)
            {
                Console.WriteLine(
                    $"Significant Decline: Even the upper bound ({convLift + convError:F2}) " +
                    $"is below zero. Ending experiment.");
                EndExperiment(client, customerId, experimentResourceName);
                return;
            }
        }
    }

    // 2. Evaluate click volume as a secondary signal.
    // This is helpful as an early indicator or for lower-volume accounts.
    if (hasClickMetrics)
    {
        double clickPValue = metrics.ClicksPValue;
        double clickLift = metrics.ClicksPointEstimate;
        double clickError = metrics.ClicksMarginOfError;
        double clickLowerBound = clickLift - clickError;

        if (clickPValue <= P_VALUE_THRESHOLD && clickLowerBound > 0)
        {
            // We have a directional winner: high confidence in more traffic,
            // but not enough data to confirm conversion impact yet.
            Console.WriteLine(
                $"Click volume is significantly up (+{clickLift * 100:F1}%).");

            // Graduation is only supported for separate campaign experiments, not
            // intra-campaign experiments where there is no separate treatment campaign.
            if (row.Experiment.Type != ExperimentType.AdoptBroadMatchKeywords
                && row.Experiment.Type != ExperimentType.AdoptAiMax)
            {
                Console.WriteLine("Graduating treatment campaign for further manual analysis.");
                GraduateExperiment(client, customerId, experimentResourceName);
            }
            else
            {
                Console.WriteLine(
                    "Intra-campaign trial detected: graduation is not supported. " +
                    "Continuing to run the experiment to gather more conversion data.");
            }
            return;
        }
    }

    // 3. Print status if no action was taken.
    if (hasConvMetrics || hasClickMetrics)
    {
        string convStatus = hasConvMetrics
            ? $"Conversions (p={metrics.ConversionsAbsoluteChangePValue:F2}, " +
              $"lift={metrics.ConversionsAbsoluteChangePointEstimate:F2} +/- " +
              $"{metrics.ConversionsAbsoluteChangeMarginOfError:F2})"
            : "Conversions (not populated)";

        string clickStatus = hasClickMetrics
            ? $"Clicks (p={metrics.ClicksPValue:F2}, " +
              $"lift={metrics.ClicksPointEstimate:F2} +/- " +
              $"{metrics.ClicksMarginOfError:F2})"
            : "Clicks (not populated)";

        Console.WriteLine(
            $"Inconclusive: No significant action taken. {convStatus}, {clickStatus}. " +
            "Allowing the experiment to continue running.");
    }
    else
    {
        Console.WriteLine(
            "Conversion and click performance metrics are not yet populated. " +
            "Allowing the experiment to continue running.");
    }
}EvaluateAndUpdateExperiment.cs

PHP

This example is not yet available in PHP; you can take a look at the other languages.

Python

def evaluate_experiment(
    client: GoogleAdsClient, customer_id: str, row: GoogleAdsRow
) -> None:
    """Evaluates the performance of the experiment and updates it accordingly
    (for example, promotes, ends, or graduates).

    Checks conversion and click metrics against statistical significance thresholds
    to determine the appropriate action to take on the experiment.

    Args:
        client: an initialized GoogleAdsClient instance.
        customer_id: a client customer ID.
        row: a GoogleAdsRow containing the experiment and metrics.
    """
    # This function evaluates performance metrics and immediately takes action
    # to update the experiment's status (promote, end, or graduate) if
    # statistical significance thresholds are met.
    metrics = row.metrics
    experiment_resource_name = row.experiment.resource_name

    has_conv_metrics = (
        "conversions_absolute_change_p_value" in metrics
        and "conversions_absolute_change_point_estimate" in metrics
        and "conversions_absolute_change_margin_of_error" in metrics
    )
    has_click_metrics = (
        "clicks_p_value" in metrics
        and "clicks_point_estimate" in metrics
        and "clicks_margin_of_error" in metrics
    )

    # 1. Evaluate conversion success as a primary success signal if available.
    # - Point Estimate: Represents the estimated average lift or difference in conversions.
    # - Margin of Error: Outlines the confidence interval bounds. Note that the margin_of_error provided by the API is calculated for a preset confidence level which is set based on the experiment type.
    # - Lower Bound: (Point Estimate - Margin of Error). If this value is above 0,
    #   we have statistical significance that performance has improved.
    if has_conv_metrics:
        conv_p_value = metrics.conversions_absolute_change_p_value
        conv_lift = metrics.conversions_absolute_change_point_estimate
        conv_error = metrics.conversions_absolute_change_margin_of_error
        conv_lower_bound = conv_lift - conv_error

        if conv_p_value <= P_VALUE_THRESHOLD:
            if conv_lower_bound > 0:
                print(
                    "Significant Success: Conversions increased. Even at the lower"
                    f" bound, the lift is {conv_lower_bound:.2f}. Promoting"
                    " changes."
                )
                promote_experiment(
                    client, customer_id, experiment_resource_name
                )
                return
            elif (conv_lift + conv_error) < 0:
                print(
                    "Significant Decline: Even the upper bound"
                    f" ({conv_lift + conv_error:.2f}) is below zero. Ending"
                    " experiment."
                )
                end_experiment(client, customer_id, experiment_resource_name)
                return

        # 2. Evaluate click volume as a secondary signal.
        # This is helpful as an early indicator or for lower-volume accounts.
        click_p_value = metrics.clicks_p_value
        click_lift = metrics.clicks_point_estimate
        click_error = metrics.clicks_margin_of_error
        click_lower_bound = click_lift - click_error

        if click_p_value <= P_VALUE_THRESHOLD and click_lower_bound > 0:
            # We have a directional winner: high confidence in more traffic,
            # but not enough data to confirm conversion impact yet.
            print(f"Click volume is significantly up (+{click_lift*100:.1f}%).")

            # Graduation is only supported for separate campaign experiments, not
            # intra-campaign experiments where there is no separate treatment campaign.
            experiment_type_name = row.experiment.type_.name
            if (
                experiment_type_name != "ADOPT_BROAD_MATCH_KEYWORDS"
                and experiment_type_name != "ADOPT_AI_MAX"
            ):
                print(
                    "Graduating treatment campaign for further manual analysis."
                )
                graduate_experiment(
                    client, customer_id, experiment_resource_name
                )
            else:
                print(
                    "Intra-campaign trial detected: graduation is not supported. "
                    "Continuing to run the experiment to gather more conversion data."
                )
            return

    # 3. Print status if no action was taken.
    if has_conv_metrics or has_click_metrics:
        conv_status = (
            f"Conversions (p={metrics.conversions_absolute_change_p_value:.2f}, "
            f"lift={metrics.conversions_absolute_change_point_estimate:.2f} +/- "
            f"{metrics.conversions_absolute_change_margin_of_error:.2f})"
            if has_conv_metrics
            else "Conversions (not populated)"
        )
        click_status = (
            f"Clicks (p={metrics.clicks_p_value:.2f}, "
            f"lift={metrics.clicks_point_estimate:.2f} +/- "
            f"{metrics.clicks_margin_of_error:.2f})"
            if has_click_metrics
            else "Clicks (not populated)"
        )
        print(
            f"Inconclusive: No significant action taken. {conv_status}, {click_status}."
            " Allowing the experiment to continue running."
        )
    else:
        print(
            "Conversion and click performance metrics are not yet populated. "
            "Allowing the experiment to continue running."
        )evaluate_and_update_experiment.py

Руби

This example is not yet available in Ruby; you can take a look at the other languages.

Perl

This example is not yet available in Perl; you can take a look at the other languages.

локон

Примечание: Хотя здесь не приводится прямой пример REST-кода для этого шага, вы можете сделать это с помощью ручного REST-запроса.

Обратитесь к документации по REST-интерфейсу Google Ads API и справочным страницам по конкретным методам. Вам потребуется сформировать полезную нагрузку JSON на основе определений протоколов.

Основные ресурсы:

Использование REST
Структура REST-интерфейса
Сопоставление полей JSON
Для получения информации о конкретном сервисе и методе обратитесь к справочнику по REST API .

Преимущества по сравнению с отчетностью по итогам кампании.

Прямое формирование отчетов по экспериментам имеет ряд преимуществ по сравнению с запросом отчетов по кампаниям по отдельности:

Централизованные метрики : Получение метрик для контрольной и экспериментальной групп в одной строке.
Данные о статистической достоверности : содержат рассчитанные значения p, точечные оценки и погрешности.
Эффективность : Устраняет необходимость вручную объединять или сравнивать результаты из нескольких отчетов.
Поддержка внутри кампании : это единственный способ сравнить контрольную и экспериментальную группы в рамках экспериментов внутри кампании, когда трафик разделяется внутри одной кампании.

Отчеты о ходе кампании

Для экспериментов, создающих отдельные кампании для обработки (например, SEARCH_CUSTOM ), вы можете запросить ресурс campaign и использовать campaign.experiment_type для идентификации BASE (контрольных) и EXPERIMENT (экспериментальных) кампаний. Этот подход полезен, если вам необходимо сегментировать метрики на более детальном уровне (например, по группе объявлений или ключевому слову) или просмотреть метаданные кампании, недоступные в ресурсе experiment . Однако он требует ручного выполнения сравнений производительности и статистических расчетов.

Для сравнения вариантов внутрикампанийных экспериментов нельзя использовать отчеты на уровне кампании, поскольку разделение трафика происходит внутри одной кампании. Запрос campaign для внутрикампанийного эксперимента возвращает только агрегированные итоги.

Передовые методы

Выберите подходящий уровень доверия : установка более низкого порогового значения p-значения может быстрее дать ориентиры, особенно при небольших бюджетах или объемах конверсии. 95%-ный уровень доверия (p-значение <= 0,05) считается академическим стандартом и может быть предпочтительнее для получения более точных результатов в течение более длительного периода времени.
Проводите эксперименты достаточно долго : проводите эксперименты как минимум 4 недели, чтобы учесть еженедельные циклы производительности, задержки конверсии и периоды обучения.
Дайте время на адаптацию : для кампаний с автоматическим назначением ставок или тестированием новых функций игнорируйте данные за первые 1-2 недели, чтобы дать время моделям назначения ставок и уровням трафика перенастроиться в соответствии с распределением трафика.
Используйте разделение трафика 50/50 : как правило, это самый быстрый способ добиться статистически значимых результатов.
Заранее спланируйте : установите дату начала эксперимента на 3-7 дней вперед, чтобы учесть время на проверку и утверждение рекламы.
В рамках одной кампании можно проводить только один эксперимент за раз.

Эксперименты с комплексом агитационных кампаний

Асинхронные ошибки

Отчет об экспериментах Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.