Glossaire du machine learning: systèmes de recommandation

Cette page contient les termes du glossaire des systèmes de recommandation. Pour consulter tous les termes du glossaire, cliquez ici.

C

génération de candidats

#recsystems

Ensemble initial de recommandations sélectionnées par un système de recommandation. Prenons l'exemple d'une librairie proposant 100 000 titres. La phase de génération de candidats crée une liste bien plus restreinte de livres appropriés pour un utilisateur particulier, par exemple 500. Cependant, même 500 livres, c'est beaucoup trop à recommander à un utilisateur. Par la suite, les phases plus coûteuses et plus onéreuses d'un système de recommandation (comme le score et le reclassement), le nombre de recommandations est réduit à 5 pour obtenir un ensemble de recommandations bien plus petit et plus utile.

filtrage collaboratif

#recsystems

Prédictions sur les centres d'intérêt d'un utilisateur en fonction de ceux de nombreux autres utilisateurs Le filtrage collaboratif est souvent utilisé dans les systèmes de recommandation.

I

matrice éléments

#recsystems

Dans les systèmes de recommandation, une matrice de vecteurs de représentation vectorielle continue générée par la factorisation matricielle contenant des signaux latents sur chaque élément. Chaque ligne de la matrice éléments contient la valeur d'une seule caractéristique latente pour tous les éléments. Prenons l'exemple d'un système de recommandation de films. Chaque colonne de la matrice représente un seul film. Les signaux latents peuvent représenter des genres ou des signaux plus difficiles à interpréter impliquant des interactions complexes entre les genres, les stars, l'âge du film et d'autres facteurs.

La matrice éléments possède le même nombre de colonnes que la matrice cible qui est factorisée. Par exemple, dans le cas d'un système de recommandation de films évaluant 10 000 titres de films, la matrice éléments comportera 10 000 colonnes.

items

#recsystems

Dans un système de recommandation, les entités recommandées par un système. Par exemple, les vidéos sont les éléments recommandés par un magasin de vidéos, tandis que les livres sont les éléments recommandés par une librairie.

M

factorisation matricielle

#recsystems

En mathématiques, un mécanisme permettant de trouver les matrices dont le produit scalaire équivaut à une matrice cible.

Dans les systèmes de recommandation, la matrice cible contient souvent les notes des utilisateurs sur les éléments. Par exemple, la matrice cible d'un système de recommandation de films peut se présenter comme suit, où les entiers positifs sont les notes des utilisateurs et 0 signifie que l'utilisateur n'a pas évalué le film:

  Casablanca L'histoire de Philadelphie Black Panther Wonder Woman La Cité de la peur
Utilisateur 1 5,0 3,0 0.0 2,0 0.0
Utilisateur 2 4.0 0.0 0.0 1,0 5,0
Utilisateur 3 3,0 1,0 4.0 5,0 0.0

Le système de recommandation de films vise à prédire les notes des utilisateurs pour les films non classés. Par exemple, l'utilisateur 1 va-t-il aimer Black Panther ?

Une approche pour les systèmes de recommandation consiste à utiliser la factorisation matricielle pour générer les deux matrices suivantes:

  • Matrice utilisateur, définie sous la forme nombre d'utilisateurs X nombre de dimensions de la représentation vectorielle.
  • Matrice d'éléments, définie sous la forme nombre de dimensions de la représentation vectorielle X nombre d'éléments.

Par exemple, la factorisation matricielle sur nos trois utilisateurs et cinq éléments pourrait produire la matrice utilisateurs et la matrice éléments suivantes:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Le produit scalaire de la matrice utilisateurs et de la matrice éléments génère une matrice de recommandations contenant non seulement les notes d'origine de l'utilisateur, mais également des prédictions pour les films que chaque utilisateur n'a pas vus. Prenons l'exemple de l'utilisateur 1 Casablanca, qui a été noté 5, 0. Le produit scalaire correspondant à cette cellule dans la matrice de recommandations devrait normalement se situer autour de 5,0, soit:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Plus important encore, l'utilisateur 1 va-t-il aimer Black Panther ? Prendre le produit scalaire correspondant à la première ligne et à la troisième colonne génère une note prédite de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La factorisation matricielle produit généralement une matrice utilisateurs et une matrice éléments qui, ensemble, sont beaucoup plus compactes que la matrice cible.

R

système de recommandation

#recsystems

Système qui sélectionne pour chaque utilisateur un ensemble relativement petit d'éléments souhaitables dans un grand corpus. Par exemple, un système de recommandation de vidéos peut recommander deux vidéos d'un corpus de 100 000 vidéos, en sélectionnant Casablanca et The Philadelphia Story pour un utilisateur, et Wonder Women et Black Panther pour un autre. Un système de recommandation de vidéos peut baser ses recommandations sur des facteurs tels que:

  • Films que des utilisateurs similaires ont notés ou regardés
  • Genre, réalisateurs, acteurs, catégorie démographique cible...

reclassement

#recsystems

Étape finale d'un système de recommandation, au cours duquel les éléments notés peuvent être réévalués selon un autre algorithme (généralement non basé sur le ML). Le reclassement évalue la liste des éléments générés par la phase de score, en prenant par exemple les mesures suivantes:

  • Éliminer les articles que l'utilisateur a déjà achetés.
  • Boostez le score des éléments les plus récents.

S

par lot

#recsystems

Partie d'un système de recommandation qui fournit une valeur ou un classement pour chaque élément produit par la phase de génération de candidats.

U

matrice utilisateurs

#recsystems

Dans les systèmes de recommandation, un vecteur de représentation vectorielle continue généré par la factorisation matricielle contient des signaux latents sur les préférences utilisateur. Chaque ligne de la matrice utilisateurs contient des informations sur l'intensité relative de divers signaux latents pour un seul utilisateur. Prenons l'exemple d'un système de recommandation de films. Dans ce système, les signaux latents de la matrice utilisateur peuvent représenter l'intérêt de chaque utilisateur pour des genres spécifiques ou être des signaux plus difficiles à interpréter impliquant des interactions complexes entre plusieurs facteurs.

La matrice utilisateurs comporte une colonne pour chaque caractéristique latente et une ligne pour chaque utilisateur. Autrement dit, la matrice utilisateur comporte le même nombre de lignes que la matrice cible qui est factorisée. Par exemple, dans le cas d'un système de recommandation de films pour 1 000 000 utilisateurs, la matrice utilisateurs comportera 1 000 000 lignes.

 W

Petits carrés alternatifs pondérés (WALS)

#recsystems

Algorithme permettant de minimiser la fonction objectif lors de la factorisation matricielle dans les systèmes de recommandation, ce qui permet de sous-pondérer les exemples manquants. La méthode WALS minimise l'erreur quadratique pondérée entre la matrice d'origine et la reconstruction en effectuant une altération entre la factorisation des lignes et la factorisation des colonnes. Chacune de ces optimisations peut être résolue par l'optimisation convexe des moindres carrés. Pour en savoir plus, consultez le cours sur les systèmes de recommandation.