Como transformar dados numéricos

Talvez seja necessário aplicar dois tipos de transformações aos dados numéricos:

  • Normalização: transforma dados numéricos na mesma escala de outros dados numéricos.
  • Bucketing: transforma dados numéricos (geralmente contínuos) em dados categóricos.

Por que normalizar atributos numéricos?

Recomendamos normalizar um conjunto de dados que tenha atributos numéricos que cobrem intervalos diferentes (por exemplo, idade e renda). Quando diferentes atributos têm intervalos diferentes, o gradiente descendente pode "retirar" e atrasar a convergência. Os otimizadores como Adagrad e Adam protegem contra esse problema criando uma taxa de aprendizado efetiva separada para cada recurso.

Também recomendamos a normalização de um atributo numérico que abranja uma ampla faixa, como "população da cidade." Se você não normalizar o atributo de população da cidade, treinar o modelo poderá gerar erros de NaN. Os otimizadores, como Adagrad e Adam, não podem evitar erros de NaN quando há uma grande variedade de valores em um único recurso.