Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Introducción
Este módulo comienza con una pregunta guía.
Elige una de las siguientes respuestas:
Si tuvieras que priorizar la mejora de una de las siguientes áreas en tu proyecto de aprendizaje automático, ¿cuál tendría el mayor impacto?
Mejora la calidad de tu conjunto de datos
Los datos tienen prioridad sobre todo.
La calidad y el tamaño del conjunto de datos son mucho más importantes de lo que
el algoritmo más brillante que usas para crear tu modelo.
Aplicar una función de pérdida más inteligente para entrenar tu modelo
Una mejor función de pérdida puede ayudar
a que un modelo se entrene más rápido,
sigue siendo un segundo elemento de esta lista.
Esta es una pregunta aún más sugestiva:
Adivina: En tu proyecto de aprendizaje automático, ¿cuánto tiempo
sueles invertir en la preparación
y transformación de los datos?
Más de la mitad del tiempo del proyecto
Sí, quienes practican el AA dedican la mayor parte de su tiempo
a la construcción de conjuntos de datos y a la ingeniería de atributos.
Menos de la mitad del tiempo del proyecto
Planifica más. Por lo general, el 80% del tiempo de un proyecto de aprendizaje automático se dedica a la construcción de conjuntos de datos y a la transformación de datos.
En este módulo, aprenderás más sobre las características de los conjuntos de datos del aprendizaje automático y cómo preparar tus datos para garantizar resultados de alta calidad cuando entrenes y evalúes tu modelo.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-07-27 (UTC)"],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]