Notation

Après la génération du candidat, un autre modèle marque et classe les candidats générés pour sélectionner l'ensemble d'éléments à afficher. Le système de recommandation peut comporter plusieurs générateurs de candidats qui utilisent différentes sources, par exemple:

Exemples
  • Articles associés d'un modèle de factorisation matricielle
  • Fonctionnalités utilisateur prises en compte pour la personnalisation.
  • Éléments locaux ou distingués, c'est-à-dire prenant en compte les informations géographiques.
  • Articles populaires ou tendance
  • Un graphe de réseau social, c'est-à-dire les éléments que vos amis ont aimés ou recommandés

Le système combine ces différentes sources dans un pool commun de candidats, qui sont ensuite évalués par un seul modèle et classés en fonction de ce score. Par exemple, le système peut entraîner un modèle à prédire la probabilité qu'un utilisateur regarde une vidéo sur YouTube en fonction des éléments suivants:

  • Fonctionnalités de requête (historique des vidéos regardées, langue, pays, heure, etc.)
  • fonctionnalités vidéo (titre, tags, intégration de vidéos, etc.)

Le système peut ensuite classer les vidéos dans le pool de candidats en fonction de la prédiction du modèle.

Pourquoi ne pas laisser le candidat du générateur générer des scores ?

Étant donné que les générateurs de candidats calculent un score (comme la mesure de similarité dans l'espace de représentation vectorielle), vous pouvez être tenté de les utiliser pour effectuer également le classement. Cependant, vous devez éviter cette pratique pour les raisons suivantes:

  • Certains systèmes reposent sur plusieurs générateurs de candidats. Les scores de ces différents générateurs peuvent ne pas être comparables.
  • Avec un pool de candidats plus petit, le système peut se permettre d'utiliser plus de caractéristiques et un modèle plus complexe pouvant mieux capturer le contexte.

Choisir une fonction d'objectif pour l'évaluation

Comme vous vous en souvenez peut-être de l'introduction au problème des cadres de ML, le ML peut agir comme un génie malicieux: il est très heureux d'apprendre l'objectif que vous fournissez, mais vous devez faire attention à ce que vous voulez. Cette qualité malicieuse s'applique également aux systèmes de recommandation. Le choix de la fonction d'attribution de scores peut avoir un impact considérable sur le classement des articles et, à terme, sur la qualité des recommandations.

Exemple:

Cliquez sur les icônes Plus pour découvrir le résultat de l'utilisation de chaque objectif.

Image de la page d'accueil du Google Play Store affichant les nouveaux jeux et les jeux mis à jour, ainsi que les applications recommandées, avec les éléments inférieurs en surbrillance.

Biais positionnel dans l'évaluation

Les éléments qui apparaissent à une position inférieure à l'écran sont moins susceptibles d'enregistrer un clic que ceux qui apparaissent plus haut. Toutefois, lorsque vous évaluez des vidéos, le système ne sait généralement pas où un lien vers la vidéo apparaîtra à l'écran. Interroger le modèle avec toutes les positions possibles est trop coûteux. Même si l'interrogation de plusieurs positions était possible, le système ne trouverait toujours pas un classement cohérent pour plusieurs scores de classement.

Solutions

  • Créez des classements indépendants de la position.
  • Classez tous les candidats comme s'ils étaient en première position sur l'écran.