Datos numéricos verdaderos
puedan multiplicarse de manera significativa. Por ejemplo, considera un
que predice el valor de una vivienda en función de su área.
Ten en cuenta que un modelo útil para evaluar los precios de las casas suele basarse en
centenas de atributos. Dicho esto, si todo lo demás es igual, una casa de 200 metros cuadrados debería tener aproximadamente el doble de valor que una casa idéntica de 100 metros cuadrados.
A menudo, debes representar los atributos que contienen valores enteros como datos categóricos en lugar de datos numéricos. Por ejemplo, considera una solicitud
en el que los valores son números enteros. Si representas esto,
de forma numérica en lugar de categórico, le pedirás al modelo
para encontrar una relación numérica
entre distintos códigos postales. Es decir, le estás diciendo al modelo que trate el código postal 20004 como una señal dos veces (o la mitad) más grande que el código postal 10002. La representación de códigos postales como datos categóricos le permite al modelo
ponderar cada código postal individual por separado.
Codificación
Codificación significa convertir datos categóricos o de otro tipo en vectores numéricos con los que un modelo puede entrenarse. Esta conversión es necesaria porque los modelos solo pueden entrenarse con valores de punto flotante; no pueden entrenarse con cadenas como "dog" o "maple". En este módulo, se explican los diferentes
métodos de codificación para datos categóricos.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-07-27 (UTC)"],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]