Explorez les options ci-dessous.
L'inférence dynamique (en ligne) implique des prédictions à la demande. C'est-à-dire que, dans le cadre de l'inférence en ligne, nous plaçons le modèle entraîné sur un serveur et envoyons des requêtes d'inférence, si nécessaire. Parmi les affirmations suivantes sur l'inférence dynamique, lesquelles sont vraies ?
Vous pouvez fournir des prédictions pour tous les éléments possibles.
Oui, c'est un avantage de l'inférence en ligne. Une requête reçoit une note. L'inférence en ligne gère les distributions de longue traîne (qui contiennent de nombreux éléments rares), comme l'espace de toutes les phrases possibles écrites dans les critiques de films.
Vous pouvez procéder à la validation des prédictions avant qu'elles ne soient utilisées.
En général, il n'est pas possible d'effectuer une post-vérification de toutes les prédictions avant qu'elles ne soient utilisées, car elles sont effectuées à la demande. Vous pouvez toutefois surveiller les qualités de la prédiction agrégée pour fournir un certain niveau de vérification d'intégrité, mais ces alertes ne signalent les alarmes incendie qu'une fois l'incendie déjà propagé.
Vous devez surveiller attentivement les signaux d'entrée.
Oui. Les signaux peuvent changer soudainement en raison de problèmes en amont, ce qui nuit à nos prédictions.
Lorsque vous effectuez des inférences en ligne, vous n'avez pas à vous soucier de la latence des prédictions (délai entre les prédictions) que pour l'inférence hors connexion.
La latence des prédictions est souvent une préoccupation majeure pour l'inférence en ligne.
Malheureusement, vous ne pouvez pas nécessairement résoudre les problèmes de latence des prédictions en ajoutant des serveurs d'inférence.