Como trabalhar com ruídos

Saiba como trabalhar, contabilizar e reduzir o impacto do ruído nos relatórios agregáveis.

Antes de começar

Antes de continuar, para entender melhor o que é o ruído e o impacto dele, consulte Noções básicas sobre ruído em relatórios de resumo.

Seus controles de ruído

Embora não seja possível controlar diretamente o ruído adicionado aos relatórios agregáveis, há etapas que você pode seguir para minimizar os efeitos. As seções a seguir explicam essas estratégias.

Aumentar para o orçamento de contribuição

Como explicado em "Como entender o ruído", o ruído aplicado ao valor de resumo de cada chave é baseado na escala de 0 a 65.536 (0 a CONTRIBUTION_BUDGET).

A distribuição de ruído é baseada no orçamento.

Por isso, para maximizar o indicador em relação ao ruído, é necessário ampliar cada valor antes de defini-lo como um valor agregável, ou seja, multiplicar cada valor por um determinado fator, o fator de escalonamento, sem exceder o orçamento de contribuição.

Ruído relativo com e sem escalonamento.

Como calcular um fator de escalonamento

O fator de escalonamento representa o quanto você quer dimensionar um determinado valor agregável. O valor precisa ser o orçamento de contribuição dividido pelo valor máximo agregável para uma determinada chave.

Determinar o fator de escalonamento com base no orçamento de contribuição.

Por exemplo, vamos supor que os anunciantes queiram saber o valor total de compra. Você sabe que o valor máximo esperado de uma compra individual é de US $2.000, com exceção de algumas exceções que você decide ignorar:

  • Calcule o fator de escalonamento:
    • Para maximizar a proporção sinal-ruído, é necessário dimensionar esse valor para 65.536 (o orçamento de contribuição).
    • Isso resulta em um fator de escalonamento de 65.536 / 2.000 aproximadamente 32x. Na prática, é possível arredondar esse fator para cima ou para baixo.
  • Aumente os valores antes da agregação. Para cada R$1 de compra, aumente em 32 a métrica rastreada. Por exemplo, para uma compra de R$120, defina um valor agregável de 120*32 = 3.840.
  • Reduza os valores após a agregação. Depois de receber o relatório de resumo com o valor da compra somado de vários usuários, reduza o valor do resumo usando o fator de escalonamento usado antes da agregação. No exemplo, usamos um fator de escala de pré-agregação 32, então precisamos dividir o valor do resumo recebido no relatório de resumo por 32. Portanto, se o valor de compra resumido para uma determinada chave no relatório de resumo for 76.800, o valor de compra resumido (com ruído) será 76.800/32 = US $2.400.

Dividir seu orçamento

Se você tem várias metas de medição (por exemplo, contagem e valor de compra), convém dividir o orçamento entre elas.

Nesse caso, os fatores de escalonamento vão ser diferentes para valores agregáveis diferentes, dependendo do máximo esperado de um determinado valor agregável.

Leia os detalhes em Noções básicas sobre as chaves de agregação.

Por exemplo, digamos que você acompanhe a contagem e o valor da compra e que decida alocar seu orçamento igualmente.

65.536 / 2 = 32.768 podem ser alocados por tipo de medição e origem.

  • Número de compras:
    • Você está acompanhando somente uma compra, por isso o número máximo de compras para uma determinada conversão é 1.
    • Portanto, você decide definir seu fator de escalonamento para a contagem de compras como 32.768 / 1 = 32.768.
  • Valor de compra:
    • Vamos supor que o valor de compra máximo esperado de qualquer compra individual seja de US $2.000.
    • Portanto, você decide definir seu fator de escalonamento para o valor de compra como 32.768 / 2.000 = 16,384 ou aproximadamente 16.

Chaves de agregação mais grosseiras melhoram a proporção sinal-ruído

Como as chaves aproximadas capturam mais eventos de conversão do que as chaves granulares, essas chaves geralmente geram valores de resumo mais altos.

Os valores de resumo mais altos são menos afetados pelo ruído do que os valores mais baixos. O ruído nesses valores provavelmente será menor em relação a esse valor.

Os valores coletados com chaves mais aproximadas provavelmente são relativamente menos barulhentos do que aqueles coletados com chaves mais granulares.

Exemplo

Se manter tudo igual, uma chave que rastreia o valor de compra globalmente (somada em todos os países) vai gerar um valor de compra de resumo mais alto (e uma contagem de conversões resumidas) mais alta do que uma chave que rastreia conversões no nível de um país.

Portanto, o ruído relativo no valor total de compra de um país específico será maior do que o ruído relativo no valor total de compra de todos os países.

Da mesma forma, se todo o restante for considerado igual, o valor total de compra de sapatos será menor do que o valor de compra total de todos os itens (incluindo sapatos).

Portanto, o ruído relativo no valor total de compra dos sapatos será maior do que o ruído relativo no valor total de compra de todos os itens.

Impacto de ruído com chaves granulares em comparação a chaves aproximadas.

Somar valores resumidos (agregações) também soma o ruído

Ao somar seus valores de resumo dos relatórios de resumo para acessar dados de nível mais alto, você também soma o ruído desses valores de resumo.

O grau de ruído com chaves granulares com consolidações em comparação com chaves aproximadas sem consolidações

Vejamos duas abordagens diferentes: - Abordagem A: você inclui um ID de região geográfica nas chaves. Os relatórios de resumo expõem as chaves no nível do ID geográfico, cada uma associada ao valor resumido da compra no nível de um ID de área geográfica específico. — Abordagem B: você não inclui o ID de região geográfica nas chaves. Os relatórios de resumo expõem diretamente o valor resumido de compra de todos os IDs / locais de região.

Para acessar o valor de compra no nível do país: - Com a abordagem A, você soma os valores de resumo do nível de identificação geográfica e, portanto, também o ruído. É provável que isso acrescente mais ruído ao valor final de compra no nível do geo-ID. - Com a abordagem B, você olha diretamente para os dados expostos nos relatórios de resumo. O ruído foi adicionado apenas uma vez a esses dados.

Portanto, o valor de compra resumido para um determinado ID geográfico provavelmente será mais barulhento com a abordagem A.

Da mesma forma, incluir uma dimensão no nível do CEP nas chaves provavelmente vai gerar resultados com mais ruído do que usar chaves mais aproximadas com uma dimensão no nível da região.

A agregação durante períodos mais longos aumenta a proporção sinal-ruído

Solicitar relatórios de resumo com menos frequência significa que cada valor de resumo provavelmente será maior do que se você solicitasse relatórios com mais frequência. É provável que mais conversões ocorram em períodos mais longos.

Como mencionado anteriormente, quanto maior o valor do resumo, menor provavelmente será o ruído relativo. Portanto, solicitar relatórios de resumo com menos frequência resulta em uma proporção sinal para ruído maior (melhor).

Solicitar relatórios de resumo com menos frequência aumenta a proporção sinal/ruído

Aqui está um exemplo para ilustrar:

  • Se você solicitar relatórios de resumo por hora com mais de 24 horas e, em seguida, somar o valor do resumo de cada relatório por hora para acessar dados do dia, o ruído será adicionado 24 vezes.
  • Em um relatório de resumo diário, o ruído é adicionado apenas uma vez.

Maior épsilon, menor ruído

Quanto maior o valor do épsilon, menor o ruído e menor a proteção de privacidade.

Como aproveitar a filtragem e a eliminação de duplicação

Uma parte importante da alocação de orçamento entre chaves diferentes é entender quantas vezes um determinado evento pode ocorrer. Por exemplo, talvez um anunciante queira somente uma compra por clique, mas tenha interesse em até três conversões de "visualização da página de produtos". Para oferecer suporte a esses casos de uso, você também pode aproveitar os seguintes recursos da API que permitem controlar quantos relatórios são gerados e quais conversões são contadas:

Experimentando com épsilon

As adtechs podem definir o épsilon como um valor maior que 0 e até 64. Esse intervalo permite testes flexíveis. Valores menores de épsilon oferecem maior proteção de privacidade. Recomendamos que você comece com épsilon=10.

Recomendações para o experimento

Recomendamos o seguinte: - Comece com épsilon = 10. - Caso isso cause problemas de utilidade significativas, aumente o épsilon gradualmente. - Compartilhar seus comentários sobre pontos de inflexão específicos que você possa encontrar em relação à usabilidade dos dados.

Interaja e compartilhe feedback

Participe e experimente essa API.

Próximas etapas