Visão geral de depuração de modelos de ML

Você depura seu modelo de ML para que ele funcione. Quando o modelo estiver funcionando, você otimizará a qualidade dele para a prontidão da produção. Esta seção abrange as etapas de depuração e otimização.

Qual é a diferença entre a depuração de ML?

Antes de analisar a depuração de ML, vamos entender o que diferencia os modelos de depuração dos programas típicos. Ao contrário dos programas típicos, a baixa qualidade em um modelo de ML não implica a presença de um bug. Em vez disso, para depurar o desempenho ruim de um modelo, investigue uma variedade mais ampla de causas do que na programação tradicional.

Por exemplo, veja a seguir algumas causas de um desempenho ruim do modelo:

  • Os atributos não têm poder preditivo.
  • Os hiperparâmetros são definidos como valores não ideais.
  • Os dados contêm erros e anomalias.
  • O código de engenharia de atributos contém bugs.

A depuração de modelos de ML é complicada pelo tempo que leva para executar seus experimentos. Devido aos ciclos de iteração mais longos e ao maior espaço de erro, a depuração de modelos de ML é um desafio único.

Processo de desenvolvimento de modelos de ML

Se você seguir as práticas recomendadas para desenvolver seu modelo de ML, a depuração do seu modelo de ML será mais simples. Essas práticas recomendadas são as seguintes:

  1. Comece com um modelo simples que use um ou dois atributos. Começar com um modelo simples e depurável ajuda a restringir as várias causas possíveis para um desempenho ruim do modelo.
  2. Para que seu modelo funcione, teste diferentes atributos e valores de hiperparâmetros. Mantenha o modelo o mais simples possível para simplificar a depuração.
  3. Otimize o modelo testando essas alterações de maneira iterativa:
    • adição de atributos
    • ajuste de hiperparâmetros
    • aumentando a capacidade do modelo
  4. Após cada alteração no modelo, revise suas métricas e verifique se a qualidade do modelo aumenta. Caso contrário, depure seu modelo conforme descrito neste curso.
  5. À medida que você faz iterações, adicione complexidade ao seu modelo de maneira lenta e incremental.