Cómo recopilar datos: Comprueba tu comprensión

En las siguientes preguntas, haz clic en la flecha deseada para verificar tu respuesta:

Supongamos que estás trabajando en un modelo de aprendizaje automático relacionado con la publicidad y deseas predecir la inversión de los anunciantes para enero. Tienes límites sobre la cantidad de datos que puedes almacenar en el disco, por lo que debes usar solo un subconjunto de datos disponibles. Puedes usar todos los datos más recientes, que corresponden al mes anterior de diciembre. Otra persona te sugiere muestras de datos durante el último año. ¿Cuál podría ser mejor y por qué?
Datos del mes anterior (diciembre)
Si bien estos datos son más recientes, es posible que se vean influenciados por los efectos estacionales de la inversión de los anunciantes antes de las festividades de diciembre.
Datos de muestra a lo largo del año
Si bien estos datos son antiguos, es menos probable que se vean afectados por los efectos estacionales de la inversión de los anunciantes antes de las festividades de diciembre.
Quieres mostrar videos que los usuarios quieren mirar. Usas los videos que vieron en YouTube como sello discográfico. ¿Esta etiqueta es directa o derivada?
Derivado
Esta etiqueta se deriva porque no es la predicción exacta que deseas hacer. Quizás el usuario abrió el video, pero lo cerró poco después. Este evento cuenta como una vista aunque el usuario no haya visto el video. En algunos casos, una opción heurística como esta puede ser la única opción, pero ten en cuenta el tipo de etiqueta (directa o derivada) y cómo limita tus predicciones.
Directo
Si bien esa etiqueta puede generar una predicción precisa la mayor parte del tiempo, no es la predicción exacta que deseas realizar.