DAG de Google Analytics

Descripción general

En la página, se explica cómo configurar los DAG tcrm_bq_to_ga o tcrm_gcs_to_ga y cómo preparar los datos.

Google Analytics se utiliza para realizar un seguimiento de la actividad en el sitio web, como la duración de las sesiones, las páginas por sesión, el porcentaje de rebote, etc., de las personas que usan el sitio, junto con la información sobre la fuente del tráfico.

Para obtener más información, consulta la Descripción general del Protocolo de medición

Configurar variables de Airflow

Crear nuevas variables de DAG necesarias de tcrm_bq_to_ga

En la siguiente tabla, se indica qué variables son necesarias para ejecutar el DAG tcrm_bq_to_ga. Solo necesitas configurar estas variables si planeas usar BigQuery como la fuente de datos.

Nombre de la variable Valor predeterminado Información de la variable
bq_dataset_id my_dataset El nombre del conjunto de datos de BigQuery que contiene los datos.
bq_table_id my_table El nombre de la tabla de BigQuery que contiene los datos.
ga_tracking_id UA-123456789-1 ID de seguimiento de Google Analytics

Crear nuevas variables de DAG necesarias de tcrm_gcs_to_ga

En la siguiente tabla, se indica qué variables son necesarias para ejecutar el DAG tcrm_gcs_to_ga. Solo necesitas configurar estas variables si planeas usar Google Cloud Storage como fuente de datos.

Nombre de la variable Valor de ejemplo Información de la variable
gcs_bucket_name my_bucket Nombre del bucket de Cloud Storage.
gcs_bucket_prefix folder/sub_folder La ruta a la carpeta de datos dentro del bucket.
gcs_content_type (opcional) JSON o CSV Tipo de contenido de Cloud Storage
ga_tracking_id UA-123456789-1 ID de seguimiento de Google Analytics

Prepara datos para enviar a Google Analytics

NOTA: Consulta la API del Protocolo de medición{target="_blank"} para conocer los requisitos detallados.

Para enviar sus datos a Google Analytics, puede elegir entre las siguientes 3 opciones:

  1. Desde BigQuery mediante el DAG tcrm_bq_to_ga en formato de tabla SQL.

  2. Desde Google Cloud Storage mediante el DAG tcrm_gcs_to_ga en formato JSON.

    {"cid": "12345.67890", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "300" }
    {"cid": "12345.67891", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "301" }
    {"cid": "12345.67892", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "302" }
    {"cid": "12345.67893", "t":"event", "ec": "video", "ea": "play", "el": "holiday", "ev": "303" }
    
  3. Desde Google Cloud Storage mediante el DAG tcrm_gcs_to_ga en formato CSV.

    cid,t,ec,ea,el,ev
    12345.67890,event,video,play,holiday,300
    12345.67891,event,video,play,holiday,301
    12345.67892,event,video,play,holiday,302
    12345.67893,event,video,play,holiday,303
    

Ejecuta tu DAG

En la consola de Airflow, haga clic en la opción DAGs en la barra de menú superior. Busca el DAG que deseas ejecutar en la lista de la izquierda. Luego, para ejecutarla, haz clic en el botón Play que se encuentra a la derecha de la lista.

Lee los registros del DAG

Consulta Leer los registros del DAG en las Preguntas frecuentes.