Ventajas y desventajas del filtrado colaborativo

Ventajas

No se requieren conocimientos del dominio

No necesitamos tener conocimiento del dominio porque las incorporaciones se aprenden automáticamente.

Serendipia

El modelo puede ayudar a los usuarios a descubrir nuevos intereses. Por separado, es posible que el sistema de AA no sepa que el usuario está interesado en un elemento determinado, pero el modelo aún puede recomendarlo porque hay usuarios similares interesados en ese elemento.

Buen punto de partida

Hasta cierto punto, el sistema solo necesita la matriz de comentarios para entrenar un modelo de factorización de matrices. En particular, el sistema no necesita funciones contextuales. En la práctica, esto se puede usar como uno de varios generadores de candidatos.

Desventajas

No se pueden procesar elementos nuevos

La predicción del modelo para un par determinado (usuario, elemento) es el producto escalar de las incorporaciones correspondientes. Por lo tanto, si un elemento no se ve durante el entrenamiento, el sistema no puede crear una incorporación para él ni consultar el modelo con este elemento. Este problema suele llamarse inicio en frío. Sin embargo, las siguientes técnicas pueden abordar el problema de inicio en frío en cierta medida:

  • Proyección en WALS. Dado un elemento nuevo \(i_0\) que no se ve en el entrenamiento, si el sistema tiene algunas interacciones con los usuarios, puede calcular fácilmente una incorporación \(v_{i_0}\) para este elemento sin tener que volver a entrenar todo el modelo. El sistema simplemente tiene que resolver la siguiente ecuación o la versión ponderada:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    La ecuación anterior corresponde a una iteración en WALS: las incorporaciones del usuario se mantienen fijas y el sistema resuelve la incorporación del elemento \(i_0\). Lo mismo se puede hacer con un usuario nuevo.

  • Heurística para generar incorporaciones de elementos nuevos. Si el sistema no tiene interacciones, puede aproximar su incorporación mediante un promedio de las incorporaciones de elementos de la misma categoría, del mismo usuario que sube videos (en YouTube), etcétera.

Es difícil incluir funciones complementarias para la consulta o el elemento.

Los atributos adicionales son cualquier característica que supere el ID de consulta o del elemento. Para las recomendaciones de películas, las características laterales pueden incluir el país o la edad. Incluir características laterales disponibles mejora la calidad del modelo. Aunque puede no ser fácil incluir características adicionales en WALS,: una generalización de WALS lo hace posible.

Para generalizar WALS, aumenta la matriz de entrada con atributos mediante la definición de una matriz de bloques \(\bar A\), en la que:

  • El bloque (0, 0) es la matriz de comentarios original \(A\).
  • El bloque (0, 1) es una codificación de varios elementos de las funciones del usuario.
  • El bloque (1, 0) es una codificación de varios elementos de las características del elemento.