Représentations vectorielles continues : l'objectif du filtrage collaboratif

Le filtrage collaboratif consiste à effectuer des prévisions sur les centres d'intérêt d'un utilisateur en fonction des centres d'intérêt de nombreux autres utilisateurs. Prenons l'exemple d'une recommandation de film. Supposons que nous disposions de 1 000 000 utilisateurs et de la liste des films que chaque utilisateur a regardés (à partir d'un catalogue de 500 000 films). Notre objectif est de recommander des films aux utilisateurs.

Pour ce faire, il faut procéder avec méthode et déterminer quels films sont similaires. Nous pouvons le faire en intégrant les films dans un espace de faible dimension conçu de sorte que les films similaires soient proches les uns des autres.

Avant de décrire la manière dont nous pouvons former la représentation vectorielle continue, nous identifierons d'abord le type de propriétés que nous voulons lui donner et la manière dont nous allons représenter les données d'apprentissage pour l'entraîner.

Disposer les films sur une droite graduée à une dimension

Pour acquérir une connaissance intuitive des représentations vectorielles continues, sur une feuille de papier, essayez de disposer les films suivants sur une droite graduée à une dimension, de sorte que les films les plus proches les uns des autres soient les plus clairement associés :

Film Classification Description
Bleu R Une veuve fait le deuil de son mari et de sa fille après leur mort dans un accident de voiture.
The Dark Knight Rises PG-13 Batman cherche à empêcher la destruction nucléaire de Gotham City dans cette suite de The Dark Knight, imprégnée de l'univers de DC Comics.
Harry Potter à l'école des sorciers PG Un orphelin réalise qu'il est magicien et entre à l'école de Poudlard, où il mène sa première bataille contre le Seigneur des Ténèbres, Lord Voldemort.
Les Indestructibles PG Une famille de super-héros contraints de prendre leur retraite en banlieue reprend du service pour empêcher Syndrome et son robot assassin de profiter de la compétition de super-héros pour anéantir la ville.
Shrek PG Un sympathique ogre et son meilleur ami l'âne partent en mission pour sauver la princesse Fiona, retenue prisonnière dans son château par un dragon.
Star Wars PG Luke Skywalker et Han Solo s'allient avec deux droïdes pour sauver princesse Leia et la galaxie.
Les Triplettes de Belleville PG-13 Lorsque Champion, un cycliste professionnel, est enlevé pendant le Tour de France, sa grand-mère et un chien en surpoids traversent l'Atlantique pour le sauver, avec l'aide d'un trio de chanteurs de jazz grisonnants.
Memento R Un homme frappé d'amnésie cherche désespérément à résoudre le meurtre de sa femme en se tatouant des indices sur le corps.

Disposer les films dans un espace à deux dimensions

Essayez d'effectuer le même exercice que ci-dessus, en disposant cette fois les mêmes films dans un espace à deux dimensions.