Transformación de datos numéricos

Es posible que debas aplicar dos tipos de transformaciones a datos numéricos:

  • Normalización: transforma datos numéricos a la misma escala que otros datos numéricos.
  • Agrupamiento: transformación de datos numéricos (generalmente continuos) en datos categóricos

¿Por qué normalizar atributos numéricos?

Te recomendamos normalizar un conjunto de datos que tenga atributos numéricos que abarquen rangos muy distintos (por ejemplo, edad e ingresos). Cuando diferentes atributos tienen diferentes rangos, el descenso de gradientes puede rebotar y ralentizar la convergencia. Los optimizadores como Adagrad y Adam protegen contra este problema mediante la creación de una tasa de aprendizaje efectiva independiente para cada función.

También recomendamos normalizar un único atributo numérico que abarque un rango amplio, como &población de ciudad. Si no normalizas la función “población de ciudad”, entrenar el modelo puede generar errores de NaN. Lamentablemente, los optimizadores como Adagrad y Adam no pueden evitar los errores de NaN cuando hay una gran variedad de valores en un solo atributo.