Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Cruzamentos de atributos mais complexos
Agora vamos testar algumas combinações avançadas do cruzamento de atributos.
O conjunto de dados neste Playground
se exercitar parece um pouco barulhento
de dardos, com os pontos azuis no meio e
os pontos laranjas em um anel externo.
Clique no ícone de adição para conferir uma explicação sobre a visualização do modelo.
Cada exercício do Playground exibe uma visualização
estado do modelo. Por exemplo, aqui está uma visualização:
Observe o seguinte sobre a visualização do modelo:
Cada eixo representa um recurso específico. Em caso de spam versus não spam,
os recursos podem ser a contagem de palavras e o número de destinatários dos
e-mail.
Cada ponto representa os valores de atributo de um exemplo dos dados, como
um e-mail.
A cor do ponto representa a classe a que o exemplo pertence.
Por exemplo, os pontos azuis podem representar e-mails que não são spam, enquanto o
os pontos laranjas podem representar e-mails de spam.
A cor de fundo representa a previsão do modelo sobre onde os exemplos
dessa cor deve ser encontrada. Um plano de fundo azul ao redor de um ponto azul
significa que o modelo está prevendo corretamente esse exemplo. Por outro lado,
um fundo laranja em torno de um ponto azul significa que o modelo está
de prever esse exemplo incorretamente.
Os tons de azul e laranja do plano de fundo são dimensionados. Por exemplo, o lado esquerdo
a visualização fica em azul constante, mas, gradualmente, fica branca no centro
da visualização. Pense na intensidade da cor como um sinal
a confiança do modelo em seu palpite. Portanto, o azul sólido significa que o modelo
tem muita confiança no palpite, e a cor azul indica que o modelo
está menos confiante. (A visualização do modelo mostrada na figura está
um trabalho de previsão ruim.)
Use a visualização para avaliar o progresso do seu modelo.
("Excelente: a maioria dos pontos azuis tem um fundo azul" ou
"Ah, não! Os pontos azuis têm um fundo laranja.")
Além das cores, Playground
também exibe numericamente a perda atual do modelo.
("Oh, não! A perda aumenta em vez de descer.")
Tarefa 1:execute este modelo linear conforme fornecido. Dedique um ou dois minutos (mas não
mais tempo) testando diferentes configurações de taxa de aprendizado para tentar encontrar
nenhuma melhoria. Um modelo linear pode produzir resultados eficazes para
neste conjunto de dados?
Tarefa 2:agora tente adicionar recursos de vários produtos, como
x1x2, tentando otimizar a performance.
Quais recursos ajudam mais?
Qual é o melhor desempenho possível?
Tarefa 3: quando você tiver um bom modelo, examine a saída dele
superfície (mostrada pela cor de fundo).
Ele parece um modelo linear?
Como você descreveria o modelo?
As respostas aparecem logo abaixo do exercício.
Clique no ícone de adição para a resposta à Tarefa 1.
Não. Um modelo linear não pode modelar efetivamente esse conjunto de dados. Reduzindo
a taxa de aprendizado reduz a perda, mas a perda ainda converge
um valor muito alto
inaceitavelmente.
Clique no ícone de adição para receber uma resposta à Tarefa 2.
Os conjuntos de dados do Playground são gerados aleatoriamente. Consequentemente,
respostas nem sempre vão concordar exatamente com a sua. Na verdade, se você
regenerar o conjunto de dados entre as execuções, seus próprios resultados nem sempre
concordar exatamente com suas execuções anteriores. Dito isso, você terá um melhor
resultados fazendo o seguinte:
Usando x12 e x22 como
cruzamentos de atributos. (Adicionar x1x2 como um cruzamento de atributos
não parece ajudar.)
Reduzindo a taxa de aprendizado, talvez para 0,001.
Clique no ícone de adição para receber uma resposta à Tarefa 3.
A superfície de saída do modelo não parece um modelo linear. Em vez disso,
parece elíptico.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-22 UTC."],[],[]]