Glossaire du machine learning: systèmes de recommandation

Cette page contient les termes du glossaire des systèmes de recommandation. Pour consulter tous les termes du glossaire, cliquez ici.

C

génération de candidats

#recsystems

Ensemble initial de recommandations choisi par un système de recommandation. Prenons l'exemple d'une librairie proposant 100 000 ouvrages. La phase de génération de candidats crée une liste bien plus restreinte de livres appropriés pour un utilisateur particulier, par exemple 500. Mais même 500 livres, c'est beaucoup trop à recommander à un utilisateur. Les phases suivantes, plus onéreuses, d'un système de recommandation (comme le score et le reclassement) réduisent ces 500 à un ensemble de recommandations beaucoup plus petit et plus utile.

filtrage collaboratif

#recsystems

Effectuer des prédictions concernant les centres d'intérêt d'un utilisateur en fonction des centres d'intérêt de nombreux autres utilisateurs Le filtrage collaboratif est souvent utilisé dans les systèmes de recommandation.

I

matrice des éléments

#recsystems

Dans les systèmes de recommandation, une matrice de vecteurs de représentation vectorielle continue générés par la factorisation matricielle, qui contient des signaux latents pour chaque élément. Chaque ligne de la matrice éléments contient la valeur d'une seule caractéristique latente pour tous les éléments. Prenons l'exemple d'un système de recommandation de films. Chaque colonne de la matrice éléments représente un seul film. Les signaux latents peuvent représenter des genres ou être des signaux plus difficiles à interpréter impliquant des interactions complexes entre des genres, des stars, l'âge du film et d'autres facteurs.

La matrice éléments a le même nombre de colonnes que la matrice cible qui est factorisée. Par exemple, avec un système de recommandation de films qui évalue 10 000 titres de films, la matrice éléments comportera 10 000 colonnes.

items

#recsystems

Dans un système de recommandation, les entités recommandées par un système. Par exemple, les vidéos sont les articles recommandés par un magasin de vidéos, tandis que les livres sont les articles recommandés par une librairie.

M

factorisation matricielle

#recsystems

En mathématiques, mécanisme permettant de trouver les matrices dont le produit scalaire se rapproche d'une matrice cible.

Dans les systèmes de recommandation, la matrice cible contient souvent des notes sur les éléments. Par exemple, la matrice cible d'un système de recommandation de films peut se présenter comme suit, où les entiers positifs sont les notes des visiteurs et 0 signifie que l'utilisateur n'a pas noté le film:

  Casablanca L'histoire de Philadelphie Black Panther Wonder Woman La Cité de la peur
Utilisateur 1 5,0 3,0 0.0 2.0 0.0
Utilisateur 2 4.0 0.0 0.0 1,0 5,0
Utilisateur 3 3,0 1,0 4.0 5,0 0.0

Le système de recommandation de films vise à prédire les notes des utilisateurs pour les films sans classification. Par exemple, l'utilisateur 1 va-t-il aimer Black Panther ?

Une approche pour les systèmes de recommandation consiste à utiliser la factorisation matricielle pour générer les deux matrices suivantes:

  • Matrice utilisateur, définie sous la forme nombre d'utilisateurs X nombre de dimensions de la représentation vectorielle.
  • Une matrice éléments, définie sous la forme nombre de dimensions de la représentation vectorielle X nombre d'éléments.

Par exemple, l'utilisation de la factorisation matricielle sur nos trois utilisateurs et cinq éléments pourrait générer la matrice utilisateurs et la matrice éléments suivantes:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Le produit scalaire de la matrice utilisateurs et de la matrice éléments génère une matrice de recommandations qui contient non seulement les notes originales des utilisateurs, mais aussi des prédictions pour les films que chaque utilisateur n'a pas vus. Prenons l'exemple de la note utilisateur 1 de Casablanca, qui était de 5, 0. Le produit scalaire correspondant à cette cellule dans la matrice de recommandations devrait normalement se situer autour de 5, 0.

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Plus important encore, l'utilisateur 1 va-t-il aimer Black Panther ? En prenant le produit scalaire correspondant à la première ligne et à la troisième colonne, vous obtenez une note prédite de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La factorisation matricielle génère généralement une matrice utilisateurs et une matrice éléments qui, ensemble, sont nettement plus compactes que la matrice cible.

R

système de recommandation

#recsystems

Système qui sélectionne pour chaque utilisateur un ensemble relativement petit d'éléments souhaitables dans un corpus volumineux. Par exemple, un système de recommandation de vidéos peut recommander deux vidéos d'un corpus de 100 000 vidéos, en sélectionnant Casablanca et The Philadelphia Story pour un utilisateur, et Wonder Women et Black Panther pour un autre. Un système de recommandation de vidéos peut baser ses recommandations sur des facteurs tels que:

  • Films que des utilisateurs similaires ont notés ou regardés
  • Genre, réalisateurs, acteurs, catégorie démographique cible...

reclassement

#recsystems

Étape finale d'un système de recommandation au cours duquel les éléments notés peuvent être réévalués selon un autre algorithme (généralement non issu du ML). Le reclassement évalue la liste des éléments générés par la phase d'évaluation en effectuant les actions suivantes:

  • Éliminer les articles que l'utilisateur a déjà achetés
  • Optimiser le score des éléments les plus récents.

S

par lot

#recsystems

Partie d'un système de recommandation qui fournit une valeur ou un classement pour chaque élément produit par la phase de génération de candidats.

U

matrice utilisateurs

#recsystems

Dans les systèmes de recommandation, un vecteur de représentation vectorielle continue généré par la factorisation matricielle, qui contient des signaux latents sur les préférences utilisateur. Chaque ligne de la matrice utilisateurs contient des informations sur l'intensité relative de divers signaux latents pour un seul utilisateur. Prenons l'exemple d'un système de recommandation de films. Dans ce système, les signaux latents de la matrice utilisateurs peuvent représenter l'intérêt de chaque utilisateur pour des genres particuliers ou être des signaux plus difficiles à interpréter impliquant des interactions complexes entre plusieurs facteurs.

La matrice utilisateurs comporte une colonne pour chaque caractéristique latente et une ligne pour chaque utilisateur. Autrement dit, la matrice utilisateurs a le même nombre de lignes que la matrice cible qui est factorisée. Par exemple, avec un système de recommandation de films pour 1 000 000 d'utilisateurs, la matrice utilisateurs comportera 1 000 000 lignes.

W

moindres carrés alternés pondérés (WALS)

#recsystems

Algorithme permettant de minimiser la fonction d'objectif lors de la factorisation matricielle dans les systèmes de recommandation, ce qui permet de pondérer les exemples manquants. La méthode WALS minimise l'erreur quadratique pondérée entre la matrice d'origine et la reconstruction en alternant entre la correction de la factorisation des lignes et celle de la factorisation des colonnes. Chacune de ces optimisations peut être résolue par l'optimisation convexe. Pour en savoir plus, consultez le cours sur les systèmes de recommandation.