Меры сходства: проверьте свое понимание

График, показывающий точки a, b и c относительно центральной точки.
На изображении выше, если вы хотите, чтобы «b» было больше похоже на «a», чем «b» на «c», какую меру выбрать?
Скалярное произведение
Правильный! Скалярное произведение пропорционально как косинусу, так и длинам векторов. Таким образом, хотя косинус выше для «b» и «c», большая длина «a» делает «a» и «b» более похожими, чем «b» и «c».
Косинус
Косинус зависит только от угла между векторами, и меньший угол \(\theta_{bc}\) делает \(\cos(\theta_{bc})\) больше, чем \(\cos(\theta_{ab})\).
Евклидово расстояние
Расстояние \(\vec{bc}\) меньше, чем \(\vec{ab}\) , что делает «b» более похожим на «c», чем на «a».
Вы рассчитываете сходство для музыкальных клипов. Длина векторов встраивания музыкальных клипов пропорциональна их популярности. Теперь вы выбираете скалярное произведение вместо косинуса для вычисления сходства. Как меняется сходство между музыкальными клипами?
Популярные видео становятся более похожими на все видео в целом.
Поскольку на скалярное произведение влияет длина обоих векторов, большая длина вектора популярных видео сделает их более похожими на все видео.
Популярные видео становятся более похожими только на другие популярные видео.
Напомним, что скалярное произведение вычисляется как \(|a||b|\cos(\theta)\). Предполагая, что «a» — это популярное музыкальное видео, мы знаем, что длина его встраивания \(|a|\)больше, чем у непопулярных видео. Большая длина увеличивает скалярное произведение независимо от значения \(|b|\). Следовательно, популярные видео становятся более похожими на все другие видео, а не только на другие популярные видео.
Популярные видео становятся менее похожими , чем менее популярные видео.
Поскольку скалярное произведение увеличивается с увеличением длины вектора, а популярные видео имеют большую длину вектора, мера подобия будет увеличиваться, а не уменьшаться.
Без изменений.
На скалярное произведение влияет длина вектора, а большая длина вектора популярных видео изменит меру сходства.
В том же сценарии, что и в предыдущем вопросе, предположим, что вы переключаетесь на косинус со скалярного произведения. Как меняется сходство между музыкальными клипами?
Популярные видео становятся менее похожими , чем менее популярные видео.
Поскольку косинус не зависит от длины вектора, большая длина вектора вложений популярных видео не способствует сходству. Таким образом, переход от скалярного произведения к косинусу снижает сходство популярных видео.
Популярные видео становятся более похожими , чем менее популярные видео.
Длина вектора не влияет на косинус, поэтому переход от скалярного произведения приведет к уменьшению сходства для всех популярных видео.
Без изменений.
Поскольку косинус не зависит от длины вектора, использование косинуса приведет к разным сходствам.