Implementare un modello

Quando implementi un modello, inizia con semplicità. La maggior parte del lavoro in ML viene sui dati, quindi eseguire una pipeline completa per un modello complesso è più difficile che eseguire l'iterazione sul modello stesso. Dopo aver configurato la pipeline di dati e implementato un modello semplice che utilizza alcune funzionalità, puoi eseguire l'iterazione per creare un modello migliore.

I modelli semplici sono una buona base di riferimento, anche se non alla fine avviarli. Infatti, utilizzare un modello semplice probabilmente è meglio di quanto pensi. Iniziare in modo semplice aiuta a determinare se un modello complesso è giustificato o meno.

Addestra il tuo modello e non utilizzane uno preaddestrato

Esistono molti modelli preaddestrati per una varietà di casi d'uso e offrono molti vantaggi. Tuttavia, i modelli preaddestrati funzionano davvero solo quando l'etichetta e le funzionalità corrispondono esattamente al tuo set di dati. Ad esempio, se un modello preaddestrato utilizza 25 funzionalità e il tuo set di dati ne include solo 24, è molto probabile che il modello preaddestrato faccia previsioni errate.

Solitamente, i professionisti del machine learning utilizzano sottosezioni corrispondenti di input di un modello preaddestrato per il perfezionamento o il trasferimento di apprendimento. Se non esiste un modello preaddestrato per il tuo caso d'uso specifico, valuta la possibilità di utilizzare le sottosezioni di un modello preaddestrato quando addestra il tuo.

Per informazioni sui modelli preaddestrati, consulta

Monitoring

Durante la definizione dei problemi, prendi in considerazione l'infrastruttura di monitoraggio e avviso di cui ha bisogno la tua soluzione ML.

Deployment dei modelli

In alcuni casi, un modello appena addestrato potrebbe essere inferiore a quello attualmente in produzione. In questo caso, dovrai impedire che venga rilasciato in produzione e ricevere un avviso che ti informa che il deployment automatico non è riuscito.

Disallineamento addestramento/produzione

Se una delle funzionalità in entrata utilizzate per l'inferenza ha valori che non rientrano nell'intervallo di distribuzione dei dati utilizzati nell'addestramento, ti consigliamo di ricevere un avviso, perché è probabile che il modello faccia previsioni errate. Ad esempio, se il tuo modello è stato addestrato per prevedere le temperature per le città equatoriali a livello del mare, il tuo sistema di pubblicazione dovrebbe avvisarti della presenza di dati in entrata con latitudini e longitudini e/o altitudini al di fuori dell'intervallo su cui è stato addestrato il modello. Al contrario, il sistema di pubblicazione dovrebbe avvisarti se il modello fa previsioni che non rientrano nell'intervallo di distribuzione osservato durante l'addestramento.

Server di inferenza

Se fornisci inferenze tramite un sistema RPC, ti consigliamo di monitorare il server RPC stesso e di ricevere un avviso se smette di fornire inferenze.