Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Introdução
Este módulo começa com uma pergunta sugestiva.
Escolha uma das seguintes respostas:
Se você tiver que priorizar a melhoria de uma das áreas a seguir
no projeto de machine learning, que teria a maior
impacto?
Como melhorar a qualidade do seu conjunto de dados
Os dados superam tudo.
A qualidade e o tamanho do conjunto de dados são muito mais importantes do que
algoritmo brilhante que você usa para criar seu modelo.
Como aplicar uma função de perda mais inteligente para treinar o modelo
Verdadeiro. Uma função de perda melhor pode ajudar um modelo a treinar mais rapidamente, mas
ainda está a um segundo item da lista.
E aqui vai uma pergunta ainda mais sugestiva:
Tente adivinhar: em seu projeto de machine learning, quanto tempo
você normalmente gasta com preparação e transformação de dados?
Mais da metade do tempo do projeto
Sim, os profissionais de ML passam a maior parte do tempo.
a construção de conjuntos de dados e a
engenharia de atributos.
Menos da metade do tempo do projeto
Planeje mais! Normalmente, 80% do tempo em um modelo
projeto é gasto construindo conjuntos de dados e transformando dados.
Neste módulo, você vai saber mais sobre as características do machine learning
conjuntos de dados e como prepará-los para garantir resultados de alta qualidade ao
para treinar e avaliar seu modelo.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-13 UTC."],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]