Explorez les options ci-dessous.

Imaginons qu'un magasin de chaussures en ligne souhaite créer un modèle de ML supervisé offrant des recommandations personnalisées aux utilisateurs. Autrement dit, le modèle recommandera certaines paires de chaussures à Marty et différentes paires de chaussures à Jeanne. Le système va générer des données d'entraînement à l'aide des données antérieures sur le comportement des utilisateurs. Parmi les affirmations suivantes, lesquelles sont vraies ?
La pointure de chaussure est une caractéristique utile.
La pointure de la chaussure est un signal quantifiable qui, selon toute probabilité, aura un impact important sur la probabilité que l'utilisateur apprécie les chaussures recommandées. Par exemple, si Marty porte une pointure 42, son modèle ne doit pas lui recommander de pointure 42.
La beauté des chaussures est une fonctionnalité utile.
Les caractéristiques correctes sont concrètes et quantifiables. La beauté est un concept trop vague pour être une caractéristique utile. La beauté combine probablement certaines caractéristiques concrètes, telles que le style et les couleurs. Le style et la couleur sont de meilleures caractéristiques que la beauté.
"L'utilisateur a cliqué sur la description de la chaussure" est une étiquette utile.
Les utilisateurs veulent probablement en savoir plus sur les chaussures qu'ils aiment. Par conséquent, les clics constituent une métrique observable et quantifiable pouvant servir d'étiquette d'entraînement. Étant donné que nos données d'entraînement sont basées sur le comportement antérieur des utilisateurs, nos étiquettes doivent être déterminées à partir de comportements objectifs tels que des clics fortement corrélés aux préférences utilisateur.
Le terme "chaussures qu'un utilisateur adore" est un libellé utile.
L'adoration n'est pas une métrique observable et quantifiable. La meilleure solution consiste à rechercher des métriques de proxy observables pour l'adoration.