Como trabalhar com dados numéricos

os profissionais de ML passam muito mais tempo avaliando, limpando e transformando do que criar modelos. Os dados são tão importantes que este curso dedica três unidades inteiras ao assunto:

O foco desta unidade é dados numéricos; ou seja, números inteiros ou valores de ponto flutuante que se comportam como números. Ou seja, elas são aditiva, contável, ordenada e assim por diante. A próxima unidade se concentra em dados categóricos, que podem incluir números que se comportam como categorias. A terceira unidade se concentra em como preparar seus dados para garantir resultados de alta qualidade ao treinar e avaliar seu modelo.

Exemplos de dados numéricos incluem:

  • Temperatura
  • Peso
  • O número de veados hibernando em uma reserva natural

Por outro lado, os CEPs dos EUA, apesar de serem números de cinco ou nove dígitos, não se comportam como números nem representam relações matemáticas. O código postal 40004 (em Nelson County, Kentucky) não é o dobro do código postal 20002 (em Washington, D.C.). Esses números representam categorias, especificamente áreas geográficas, e são consideradas dados categóricos.