Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Conjuntos de treinamento e de teste
Voltamos ao Playground para experimentar os conjuntos de treinamento
e conjuntos de teste.
Clique no ícone de adição para conferir um lembrete do que significam os pontos laranja e azuis.
Na visualização:
Cada ponto azul significa um exemplo de uma classe de dados (por exemplo,
spam).
Cada ponto laranja significa um exemplo de outra classe de dados (por
exemplo, não é spam).
A cor de fundo representa a previsão do modelo sobre onde os exemplos
dessa cor deve ser encontrada. Um plano de fundo azul ao redor de um ponto azul
significa que o modelo está prevendo corretamente esse exemplo. Por outro lado,
um fundo laranja em torno de um ponto azul significa que o modelo está
uma previsão incorreta para o exemplo.
Este exercício apresenta um conjunto de teste e um de treinamento, ambos extraídos
no mesmo conjunto de dados. Por padrão, a visualização mostra apenas o
definido. Se você também quiser ver o conjunto de teste, clique em
a caixa de seleção Mostrar dados do teste logo abaixo da visualização. Na
a visualização, observe a seguinte distinção:
Os exemplos de treinamento têm um contorno branco.
Os exemplos de teste têm um contorno preto.
Tarefa 1: execute o Playground com as configurações fornecidas
seguinte:
Clique no botão "Executar/Pausar":
Observe a mudança nos valores de perda de teste e perda de treinamento.
Quando os valores de Perda de teste e Perda de treinamento param de mudar
ou alterar apenas uma vez por vez, pressione o botão Executar/Pausar
novamente para pausar o Playground.
.
Observe o delta entre a perda de teste e a perda de treinamento. Tentaremos reduzir esse problema
nas tarefas a seguir.
Deixe o Playground ser executado por pelo menos 150 períodos.
O delta entre a perda de teste e a perda do treinamento é menor ou
com essa nova taxa de aprendizado? O que acontece se você modificar ambos
Taxa de aprendizado e
tamanho do lote?
Tarefa opcional 3:usar um controle deslizante chamado Porcentagem dos dados de treinamento
permite controlar a proporção de dados de treinamento para testar dados. Por exemplo:
quando definido como 90%, 90% dos dados são usados para o conjunto de treinamento
os 10% restantes são usados para o conjunto de teste.
Faça o seguinte:
Reduza a "porcentagem dos dados de treinamento". de 50% para 10%.
Teste a taxa de aprendizado e o tamanho do lote, fazendo anotações
descobertas.
.
Alterar a porcentagem dos dados de treinamento altera o valor ideal
de machine learning que você descobriu na Tarefa 2? Se sim, por quê?
Clique no ícone de adição para a resposta à Tarefa 1.
Com a taxa de aprendizado definida como 3 (a configuração inicial),
A perda de teste é significativamente maior do que a perda de treinamento.
Clique no ícone de adição para receber a resposta da Tarefa 2.
Ao reduzir a taxa de aprendizado (por exemplo, para 0,001),
A perda de teste cai para um valor muito mais próximo da perda de treinamento. Na maioria das execuções,
aumentar o tamanho do lote não influencia a perda ou o teste do treinamento
significativamente a perda. No entanto, em uma pequena porcentagem de execuções, o aumento
O tamanho do lote para 20 ou mais faz com que a perda de teste caia um pouco.
abaixo da perda do treinamento.
Os conjuntos de dados do Playground são gerados aleatoriamente. Consequentemente,
respostas nem sempre vão concordar exatamente com a sua.
Clique no ícone de adição para receber a resposta da Tarefa 3.
Redução drástica da porcentagem de dados de treinamento de 50% para 10%
reduz o número de pontos de dados no conjunto de treinamento. Com tão poucos dados,
o tamanho do lote e a taxa de aprendizado altos fazem com que o modelo de treinamento pule
caoticamente (pulando repetidamente sobre o ponto mínimo).
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-22 UTC."],[],[]]