Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Introducción
Este módulo comienza con una pregunta sugestiva.
Elige una de las siguientes respuestas:
Si tuvieras que priorizar la mejora de una de las siguientes áreas
en tu proyecto de aprendizaje automático, que tendría
impacto?
Mejora la calidad de tu conjunto de datos
Los datos tienen prioridad sobre todo.
La calidad y el tamaño del conjunto de datos son mucho más importantes de lo que
el algoritmo más brillante que usas para crear tu modelo.
Aplicar una función de pérdida más inteligente para entrenar tu modelo
Una mejor función de pérdida puede ayudar
a que un modelo se entrene más rápido,
sigue siendo un segundo elemento de esta lista.
Y aquí hay una pregunta aún más sugerente:
Adivina: En tu proyecto de aprendizaje automático, ¿cuánto tiempo
sueles invertir en la preparación
y transformación de los datos?
Más de la mitad del tiempo del proyecto
Sí, los profesionales del AA pasan la mayor parte de su tiempo.
en la construcción de conjuntos de datos
y la ingeniería de atributos.
Menos de la mitad del tiempo del proyecto
Planifica más. Por lo general, un 80% de las veces se dedica al aprendizaje
el proyecto se dedica a crear conjuntos de datos y transformar datos.
En este módulo, obtendrás más información sobre las características del aprendizaje automático.
conjuntos de datos y cómo prepararlos para garantizar resultados de alta calidad cuando
entrenar y evaluar tu modelo.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2024-08-13 (UTC)"],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]