Descripción general
En la página, se explica cómo configurar los DAG tcrm_bq_to_ga
o tcrm_gcs_to_ga
y cómo preparar los datos.
Google Analytics se utiliza para realizar un seguimiento de la actividad en el sitio web, como la duración de las sesiones, las páginas por sesión, el porcentaje de rebote, etc., de las personas que usan el sitio, junto con la información sobre la fuente del tráfico.
Para obtener más información, consulta la Descripción general del Protocolo de medición
Configurar variables de Airflow
Crear nuevas variables de DAG necesarias de tcrm_bq_to_ga
En la siguiente tabla, se indica qué variables son necesarias para ejecutar el DAG tcrm_bq_to_ga
. Solo necesitas configurar estas variables si planeas usar BigQuery como la fuente de datos.
Nombre de la variable | Valor predeterminado | Información de la variable |
---|---|---|
bq_dataset_id
|
my_dataset
|
El nombre del conjunto de datos de BigQuery que contiene los datos. |
bq_table_id
|
my_table
|
El nombre de la tabla de BigQuery que contiene los datos. |
ga_tracking_id |
UA-123456789-1 |
ID de seguimiento de Google Analytics |
Crear nuevas variables de DAG necesarias de tcrm_gcs_to_ga
En la siguiente tabla, se indica qué variables son necesarias para ejecutar el DAG tcrm_gcs_to_ga
. Solo necesitas configurar estas variables si planeas usar Google Cloud Storage como fuente de datos.
Nombre de la variable | Valor de ejemplo | Información de la variable |
---|---|---|
gcs_bucket_name |
my_bucket |
Nombre del bucket de Cloud Storage. |
gcs_bucket_prefix
|
folder/sub_folder
|
La ruta a la carpeta de datos dentro del bucket. |
gcs_content_type
(opcional) |
JSON o CSV
|
Tipo de contenido de Cloud Storage |
ga_tracking_id |
UA-123456789-1 |
ID de seguimiento de Google Analytics |
Prepara datos para enviar a Google Analytics
NOTA: Consulta la API del Protocolo de medición{target="_blank"} para conocer los requisitos detallados.
Para enviar sus datos a Google Analytics, puede elegir entre las siguientes 3 opciones:
Desde BigQuery mediante el DAG
tcrm_bq_to_ga
en formato de tabla SQL.Desde Google Cloud Storage mediante el DAG
tcrm_gcs_to_ga
en formato JSON.{"cid": "12345.67890", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "300" } {"cid": "12345.67891", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "301" } {"cid": "12345.67892", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "302" } {"cid": "12345.67893", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "303" }
Desde Google Cloud Storage mediante el DAG
tcrm_gcs_to_ga
en formato CSV.cid,t,ec,ea,el,ev 12345.67890,event,video,play,holiday,300 12345.67891,event,video,play,holiday,301 12345.67892,event,video,play,holiday,302 12345.67893,event,video,play,holiday,303
Ejecuta tu DAG
En la consola de Airflow, haga clic en la opción DAGs
en la barra de menú superior. Busca el DAG que deseas ejecutar en la lista de la izquierda. Luego, para ejecutarla, haz clic en el botón Play
que se encuentra a la derecha de la lista.
Lee los registros del DAG
Consulta Leer los registros del DAG en las Preguntas frecuentes.