Datos numéricos verdaderos
puedan multiplicarse de manera significativa. Por ejemplo, considera un
que predice el valor de una casa en función de su área.
Ten en cuenta que un modelo útil para evaluar los precios de las casas generalmente se basa en
cientos de funciones. Dicho esto, si todo lo demás permanece constante, una casa de 200 cuadrados
metros deberían ser aproximadamente el doble de valor que una casa idéntica de 100 cuadrados
metros.
A menudo, debes representar atributos que contienen valores enteros como
datos categóricos en vez de datos numéricos. Por ejemplo, considera un mensaje
en el que los valores son números enteros. Si representas esto,
de forma numérica en lugar de categórico, le pedirás al modelo
para encontrar una relación numérica
entre diferentes códigos postales. Es decir, le estás indicando al modelo
Trata el código postal 20004 como el doble (o la mitad) de un indicador que el código postal
10,002. La representación de códigos postales como datos categóricos le permite al modelo
ponderar cada código postal individual por separado.
Codificación
Codificación significa convertir datos categóricos o de otro tipo en vectores numéricos.
con las que se puede entrenar un modelo. Esta conversión es necesaria porque los modelos pueden
solo se entrena con valores de punto flotante. modelos no se pueden entrenar con cadenas como
"dog" o "maple". En este módulo, se explican los diferentes
métodos de codificación para datos categóricos.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2024-08-13 (UTC)"],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]