Implémenter un modèle

Lorsque vous implémentez un modèle, commencez par le plus simple. La majeure partie du travail de ML se situe du côté des données. Il est donc plus difficile de faire fonctionner un pipeline complet pour un modèle complexe que d'itérer sur le modèle lui-même. Après avoir configuré votre pipeline de données et implémenté un modèle simple qui utilise quelques fonctionnalités, vous pouvez itérer pour créer un meilleur modèle.

Les modèles simples constituent une bonne référence, même si vous ne les lancez pas. En fait, l'utilisation d'un modèle simple est probablement plus efficace que vous ne le pensez. Commencer par un modèle simple vous aide à déterminer si un modèle complexe est même justifié.

Entraîner votre propre modèle ou utiliser un modèle déjà entraîné

Il existe des modèles entraînés pour différents cas d'utilisation et ils offrent de nombreux avantages. Toutefois, les modèles entraînés ne fonctionnent vraiment que lorsque le libellé et les caractéristiques correspondent exactement à votre ensemble de données. Par exemple, si un modèle entraîné utilise 25 caractéristiques et que votre ensemble de données n'en inclut que 24, le modèle entraîné produira probablement de mauvaises prédictions.

En règle générale, les professionnels du ML utilisent des sous-sections correspondantes des entrées d'un modèle entraîné pour le réglage fin ou l'apprentissage par transfert. Si aucun modèle entraîné n'existe pour votre cas d'utilisation particulier, envisagez d'utiliser des sous-sections d'un modèle entraîné lorsque vous entraînez le vôtre.

Pour en savoir plus sur les modèles entraînés, consultez

Surveillance

Lors de la formulation du problème, tenez compte de l'infrastructure de surveillance et d'alerte dont votre solution de ML a besoin.

Déploiement du modèle

Dans certains cas, un modèle nouvellement entraîné peut être moins performant que le modèle actuellement en production. Si c'est le cas, vous devez empêcher sa mise en production et recevoir une alerte indiquant que votre déploiement automatisé a échoué.

Décalage entraînement/livraison

Si l'une des caractéristiques entrantes utilisées pour l'inférence présente des valeurs qui ne se trouvent pas dans la plage de distribution des données utilisées pour l'entraînement, vous devez être alerté, car il est probable que le modèle effectue de mauvaises prédictions. Par exemple, si votre modèle a été entraîné pour prédire les températures des villes équatoriales au niveau de la mer, votre système de diffusion doit vous alerter des données entrantes avec des latitudes et des longitudes, et/ou des altitudes en dehors de la plage sur laquelle le modèle a été entraîné. À l'inverse, le système de diffusion doit vous alerter si le modèle effectue des prédictions en dehors de la plage de distribution observée lors de l'entraînement.

Serveur d'inférence

Si vous fournissez des inférences via un système RPC, vous devez surveiller le serveur RPC lui-même et recevoir une alerte s'il cesse de fournir des inférences.