Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Los profesionales del AA pasan mucho más tiempo evaluando, limpiando y transformando
de datos que en la creación de modelos.
Los datos son tan importantes que este curso dedica tres unidades enteras al tema:
Esta unidad se centra en
datos numéricos,
es decir, números enteros o valores de punto flotante
que se comportan como números. Es decir, son aditivos, contables, ordenados,
etcétera. La siguiente unidad se centra en
datos categóricos, que pueden
incluir números que se comporten como categorías. La tercera unidad se centra en cómo
Preparar tus datos para garantizar resultados de alta calidad durante el entrenamiento y la evaluación
para tu modelo.
Estos son algunos ejemplos de datos numéricos:
Temperatura
Peso
Cantidad de ciervos que pasan el invierno en una reserva natural
Por el contrario, los códigos postales de EE.UU., a pesar de
son números de cinco o nueve dígitos, no se comportan como números ni representan
y las relaciones matemáticas. El código postal 40004 (en el condado de Nelson, Kentucky) es
no el doble del código postal 20002 (en Washington, D.C.). Estos números
representan categorías, específicamente, áreas geográficas y se consideran
datos categóricos.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2024-08-13 (UTC)"],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]