Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
os profissionais de ML passam muito mais tempo avaliando, limpando e transformando
do que criar modelos.
Os dados são tão importantes que este curso dedica três unidades inteiras ao assunto:
O foco desta unidade é
dados numéricos;
ou seja, números inteiros ou valores de ponto flutuante
que se comportam como números. Ou seja, elas são aditiva, contável, ordenada
e assim por diante. A próxima unidade se concentra em
dados categóricos, que podem
incluir números que se comportam como categorias. A terceira unidade se concentra em como
preparar seus dados para garantir resultados de alta qualidade ao treinar e avaliar
seu modelo.
Exemplos de dados numéricos incluem:
Temperatura
Peso
O número de veados hibernando em uma reserva natural
Por outro lado, os CEPs dos EUA, apesar de serem números de cinco ou nove dígitos, não se comportam como números nem representam relações matemáticas. O código postal 40004 (em Nelson County, Kentucky) não é o dobro do código postal 20002 (em Washington, D.C.). Esses números
representam categorias, especificamente áreas geográficas, e são consideradas
dados categóricos.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-07-27 UTC."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]