Dados numéricos verdadeiros
podem ser multiplicadas de modo significativo. Por exemplo, considere um modelo que prevê o valor de uma casa com base na área dela.
Um modelo útil para avaliar preços de imóveis normalmente depende
centenas de atributos. Dito isso, se tudo mais for igual, uma casa de 200 metros quadrados precisa ter o dobro do valor de uma casa idêntica de 100 metros quadrados.
Muitas vezes, é necessário representar os atributos que contêm valores inteiros como
dados categóricos em vez de numéricos. Por exemplo, considere um recurso de código postal em que os valores são números inteiros. Se você representar esse atributo de forma numérica em vez de categórica, vai pedir ao modelo para encontrar uma relação numérica entre diferentes CEPs. Ou seja, você está dizendo ao modelo para
considerar o código postal 20004 como duas vezes (ou metade) um sinal grande como o código postal
10002 A representação de códigos postais como dados categóricos permite que o modelo
pese cada código postal individualmente.
Codificação
Codificação significa converter dados categóricos ou outros dados em vetores numéricos
que um modelo pode treinar. Essa conversão é necessária porque os modelos podem
Treinar somente em valores de ponto flutuante. os modelos não podem ser treinados com strings como
"dog" ou "maple". Este módulo explica diferentes
de codificação para dados categóricos.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-07-27 UTC."],[[["\u003cp\u003eThis module focuses on differentiating between categorical and numerical data within machine learning.\u003c/p\u003e\n"],["\u003cp\u003eYou will learn how to represent categorical data using one-hot vectors and address common issues associated with it.\u003c/p\u003e\n"],["\u003cp\u003eThe module covers encoding techniques for converting categorical data into numerical vectors suitable for model training.\u003c/p\u003e\n"],["\u003cp\u003eFeature crosses, a method for combining categorical features to capture interactions, are also discussed.\u003c/p\u003e\n"],["\u003cp\u003eIt is assumed you have prior knowledge of introductory machine learning and working with numerical data.\u003c/p\u003e\n"]]],[],null,[]]