Une architecture courante pour les systèmes de recommandation comprend les composants suivants:
- génération de candidats
- par lot
- reclassement
Génération de candidats
Dans cette première étape, le système démarre à partir d'un corpus potentiellement volumineux et génère un sous-ensemble de candidats beaucoup plus petit. Par exemple, le générateur de candidats sur YouTube réduit des milliards de vidéos à des centaines, voire des milliers. Le modèle doit évaluer rapidement les requêtes compte tenu de l'immense taille du corpus. Un modèle donné peut fournir plusieurs générateurs de candidats, chacun désignant un sous-ensemble différent de candidats.
Notation
Ensuite, un autre modèle marque et classe les candidats afin de sélectionner l'ensemble d'éléments (par ordre de 10) à présenter à l'utilisateur. Comme ce modèle évalue un sous-ensemble relativement petit d'éléments, le système peut utiliser un modèle plus précis basé sur des requêtes supplémentaires.
Reclassement
Enfin, le système doit prendre en compte des contraintes supplémentaires pour le classement final. Par exemple, le système supprime les éléments que l'utilisateur n'a pas aimés ou augmente le score d'un contenu plus récent. Le reclassement peut également contribuer à garantir la diversité, la fraîcheur et l'équité.
Nous aborderons chacune de ces étapes au cours de la leçon et donnerons des exemples issus de différents systèmes de recommandation, tels que YouTube.