Treinamento estático vs. dinâmico

Em termos gerais, há duas maneiras de treinar um modelo:

  • Um modelo estático é treinado off-line. Ou seja, treinamos o modelo exatamente uma vez e usamos esse modelo treinado por um tempo.
  • Um modelo dinâmico é treinado on-line. Ou seja, os dados entram continuamente no sistema e os incorporamos ao modelo por meio de atualizações contínuas.

Treinamento estático x dinâmico

Modelo estático - treinado off-line

Modelo estático - treinado off-line

Modelo dinâmico: treinado on-line

Modelo estático - treinado off-line

  • Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.

Modelo dinâmico: treinado on-line

Modelo estático - treinado off-line

  • Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
  • Ainda requer monitoramento de entradas

Modelo dinâmico: treinado on-line

Modelo estático - treinado off-line

  • Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
  • Ainda requer monitoramento de entradas
  • É fácil deixar isso ficar desatualizado

Modelo dinâmico: treinado on-line

Modelo estático - treinado off-line

  • Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
  • Ainda requer monitoramento de entradas
  • É fácil deixar isso ficar desatualizado

Modelo dinâmico: treinado on-line

  • Continue alimentando os dados de treinamento ao longo do tempo e sincronize regularmente a versão atualizada.
  • Use a validação progressiva em vez de treinamento e teste em lote.

Modelo estático - treinado off-line

  • Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
  • Ainda requer monitoramento de entradas
  • É fácil deixar isso ficar desatualizado

Modelo dinâmico: treinado on-line

  • Continue alimentando os dados de treinamento ao longo do tempo e sincronize regularmente a versão atualizada.
  • Use a validação progressiva em vez de treinamento e teste em lote
  • Precisa de recursos de monitoramento, reversão de modelo e quarentena de dados
  • Adapta-se às mudanças, evitando problemas de inatividade

Resumo da aula em vídeo

De um modo geral, os seguintes pontos dominam a decisão de treinamento estático versus dinâmico:

  • Os modelos estáticos são mais fáceis de criar e testar.
  • Os modelos dinâmicos se adaptam às mudanças de dados. O mundo é um lugar altamente mutável. É improvável que as previsões de vendas criadas com base nos dados do ano passado sejam bem-sucedidas na previsão dos resultados do próximo ano.

Se o conjunto de dados realmente não muda com o tempo, escolha o treinamento estático, porque é mais barato de criar e manter do que o treinamento dinâmico. No entanto, muitas fontes de informações realmente mudam com o tempo, mesmo aquelas com recursos que você considera tão constantes quanto, por exemplo, o nível do mar. Moral: mesmo com treinamento estático, você ainda precisa monitorar a mudança dos dados de entrada.

Por exemplo, considere um modelo treinado para prever a probabilidade de os usuários comprarem flores. Devido à pressão de tempo, o modelo é treinado apenas uma vez, usando um conjunto de dados do comportamento de compra de flores durante julho e agosto. Em seguida, o modelo é enviado para exibir previsões em produção, mas nunca é atualizado. O modelo funciona bem por vários meses, mas faz previsões terríveis perto do Dia dos Namorados porque o comportamento do usuário durante esse período muda drasticamente.