Ao implementar um modelo, comece com algo simples. A maior parte do trabalho em ML está no lado dos dados, então executar um pipeline completo para um modelo complexo é mais difícil do que iterar no modelo em si. Depois de configurar o pipeline de dados e implementar um modelo simples que usa alguns recursos, você pode iterar na criação de um modelo melhor.
Modelos simples fornecem uma boa referência, mesmo que você não os lance. Na verdade, usar um modelo simples provavelmente é melhor do que você imagina. Começar com algo simples ajuda a determinar se um modelo complexo é justificado ou não.
Treinar seu próprio modelo em vez de usar um já treinado
Os modelos treinados existem para vários casos de uso e oferecem muitas vantagens. No entanto, os modelos treinados só funcionam quando o rótulo e os atributos correspondem exatamente ao seu conjunto de dados. Por exemplo, se um modelo treinado usa 25 recursos e seu conjunto de dados inclui apenas 24 deles, é provável que o modelo faça previsões incorretas.
Normalmente, os profissionais de ML usam subseções correspondentes de entradas de um modelo treinado para ajustar ou fazer o aprendizado por transferência. Se não houver um modelo treinado para seu caso de uso específico, use subseções de um modelo treinado ao treinar o seu.
Para informações sobre modelos treinados, consulte
Monitoramento
Durante a definição do problema, considere a infraestrutura de monitoramento e alerta necessária para a solução de ML.
Implantação do modelo
Em alguns casos, um modelo recém-treinado pode ser pior do que o modelo atualmente em produção. Se for, você vai querer impedir que ele seja lançado na produção e receber um alerta de que a implantação automatizada falhou.
Desvio de treinamento para exibição
Se algum dos atributos de entrada usados para inferência tiver valores fora do intervalo de distribuição dos dados usados no treinamento, você vai receber um alerta, porque é provável que o modelo faça previsões ruins. Por exemplo, se o modelo foi treinado para prever temperaturas em cidades equatoriais no nível do mar, o sistema de veiculação vai alertar você sobre dados recebidos com latitudes e longitudes e/ou altitudes fora do intervalo em que o modelo foi treinado. Por outro lado, o sistema de veiculação precisa alertar você se o modelo estiver fazendo previsões fora do intervalo de distribuição observado durante o treinamento.
Servidor de inferência
Se você estiver fornecendo inferências por um sistema RPC, monitore o servidor RPC e receba um alerta se ele parar de fornecer inferências.