Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
os profissionais de ML passam muito mais tempo avaliando, limpando e transformando
do que criar modelos.
Os dados são tão importantes que este curso dedica três unidades inteiras ao tópico:
O foco desta unidade é
dados numéricos;
ou seja, números inteiros ou valores de ponto flutuante
que se comportam como números. Ou seja, eles são aditivos, contáveis, ordenados,
e assim por diante. A próxima unidade aborda
dados categóricos, que podem
incluir números que se comportam como categorias. A terceira unidade se concentra em como
preparar seus dados para garantir resultados de alta qualidade ao treinar e avaliar
seu modelo.
Exemplos de dados numéricos incluem:
Temperatura
Peso
O número de cervos passando o inverno em uma reserva natural
Por outro lado, os códigos postais dos EUA,
sendo números de cinco ou nove dígitos, não se comportam como números nem representam
relações matemáticas. O código postal 40004 (no Condado de Nelson, Kentucky) é
não duas vezes a quantidade do código postal 20002 (em Washington, DC). Esses números
representam categorias, especificamente áreas geográficas, e são consideradas
dados categóricos.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-13 UTC."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]