Mesures de similarité: testez vos connaissances

Graphique montrant les points a, b et c par rapport à un point central.
Dans l'image ci-dessus, si vous souhaitez que "b" soit plus semblable à "a" que "b", c'est "c". Quelle mesure devez-vous choisir ?
Produit scalaire
Bonne réponse ! Le produit scalaire est proportionnel au cosinus et à la longueur des vecteurs. Ainsi, même si le cosinus est plus élevé pour "b" et "c", plus la longueur de "a" est élevée, plus "a" et "b" sont similaires à "b" et "c".
Cosinus
Le cosinus dépend uniquement de l'angle entre les vecteurs, et le petit angle \(\theta_{bc}\) rend \(\cos(\theta_{bc})\) plus grand que \(\cos(\theta_{ab})\).
Distance euclidienne
La distance \(\vec{bc}\) est inférieure à \(\vec{ab}\) le "b" ressemble plus à "c" qu'à "a".
Vous calculez la similarité pour les clips musicaux. La longueur des vecteurs de représentation vectorielle continue de clips musicaux est proportionnelle à leur popularité. Vous choisissez maintenant le produit scalaire au lieu du cosinus pour calculer la similarité. Quelles sont les similitudes entre les clips musicaux ?
Les vidéos populaires deviennent plus semblables à toutes les vidéos en général.
Étant donné que le produit scalaire est affecté par la longueur des deux vecteurs, la grande longueur des vecteurs de vidéos populaires les rend plus semblables à toutes les vidéos.
Les vidéos populaires deviennent plus semblables aux autres vidéos populaires.
Rappelez-vous que le produit scalaire est calculé comme suit : \(|a||b|\cos(\theta)\). En supposant que "a" soit un clip musical populaire, nous savons que sa durée de représentation vectorielle, \(|a|\), est supérieure à celle des vidéos peu populaires. Une longueur plus élevée permet d'augmenter le nombre de points, quelle que soit la valeur de \(|b|\). Par conséquent, les vidéos populaires ressemblent davantage à toutes les autres vidéos, pas seulement aux autres vidéos populaires.
Les vidéos populaires deviennent moins semblables aux vidéos moins populaires.
Étant donné que le produit scalaire augmente avec la longueur des vecteurs et que les vidéos les plus populaires ont une longueur de vecteur élevée, la mesure de similarité augmentera, et non moins.
Aucun changement.
La longueur du vecteur est affectée par la longueur du vecteur et la longueur du vecteur principal dans les vidéos populaires vont modifier la mesure de similarité.
Dans le même scénario que la question précédente, supposons que vous passiez au cosinus à partir du produit scalaire. Quelles sont les similitudes entre les clips musicaux ?
Les vidéos populaires deviennent moins semblables aux vidéos moins populaires.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, les grandes représentations vectorielles continues de vidéos populaires ne contribuent pas à la similarité. Par conséquent, passer au cosinus à partir d'un produit pointu réduit la similitude avec les vidéos populaires.
Les vidéos populaires deviennent plus similaires que les autres.
Le cosinus n'est pas affecté par les longueurs des vecteurs. Par conséquent, le fait de remplacer un produit par point entraîne la diminution des similitudes pour toutes les vidéos populaires.
Aucun changement.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, son utilisation entraînera des similitudes.