Dados numéricos verdadeiros
podem ser multiplicadas de modo significativo. Por exemplo, considere um
que prevê o valor de uma casa com base na área dela.
Um modelo útil para avaliar preços de imóveis normalmente depende
centenas de atributos. Dito isso, com todo o resto sendo igual, uma casa de 200 m2
metros deve ser aproximadamente duas vezes mais valioso do que uma casa idêntica com 100 metros quadrados
metros.
Muitas vezes, você deve representar atributos que contenham valores inteiros como
dados categóricos em vez de numéricos. Por exemplo, considere um
atributo de código em que os valores são números inteiros. Se você representa esse
de modo numérico, em vez de categórico, pede ao modelo
para encontrar uma relação numérica
entre códigos postais diferentes. Ou seja, você está dizendo ao modelo para
considerar o código postal 20004 como duas vezes (ou metade) um sinal grande como o código postal
10002 Representar códigos postais como dados categóricos permite que o modelo
ponderar cada código postal separadamente.
Codificação
Codificação significa converter dados categóricos ou outros dados em vetores numéricos
em que um modelo pode ser treinado. Essa conversão é necessária porque os modelos podem
Treinar somente em valores de ponto flutuante. os modelos não podem ser treinados com strings como
"dog" ou "maple". Este módulo explica diferentes
e de codificação de tipos de dados
para dados categóricos.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-13 UTC."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]