Keuntungan Pemfilteran &Kekurangan Kolaborasi

Kelebihan

Tidak memerlukan pengetahuan domain

Kita tidak memerlukan pengetahuan domain karena penyematan dipelajari secara otomatis.

Serendipitas

Model dapat membantu pengguna menemukan minat baru. Secara terpisah, sistem ML mungkin tidak tahu apakah pengguna tertarik dengan item tertentu, tetapi model mungkin masih merekomendasikannya karena pengguna serupa tertarik pada item tersebut.

Titik awal yang baik

Sampai batas tertentu, sistem hanya memerlukan matriks masukan untuk melatih model faktorisasi matriks. Secara khusus, sistem tidak memerlukan fitur kontekstual. Dalam praktiknya, hal ini dapat digunakan sebagai salah satu dari beberapa generator kandidat.

Kekurangan

Tidak dapat menangani item baru

Prediksi model untuk pasangan (pengguna, item) tertentu adalah produk titik dari penyematan yang sesuai. Jadi, jika item tidak terlihat selama pelatihan, sistem tidak dapat membuat penyematan untuk item tersebut dan tidak dapat melakukan kueri model dengan item ini. Masalah ini sering disebut masalah cold start. Namun, teknik berikut dapat mengatasi masalah start cold hingga batas tertentu:

  • Proyeksi di WALS. Mengingat item baru \(i_0\) yang tidak terlihat dalam pelatihan, jika sistem memiliki beberapa interaksi dengan pengguna, sistem dapat dengan mudah menghitung penyematan \(v_{i_0}\) untuk item ini tanpa harus melatih kembali seluruh model. Sistem hanya perlu menyelesaikan persamaan atau versi berbobot berikut:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    Persamaan sebelumnya berhubungan dengan satu iterasi di WALS: penyematan pengguna tetap bersifat tetap, dan sistem akan memecahkan masalah penyematan item \(i_0\). Hal yang sama dapat dilakukan untuk pengguna baru.

  • Heuristik untuk menghasilkan sematan item baru. Jika sistem tidak memiliki interaksi, sistem dapat memperkirakan penyematannya dengan merata-rata penyematan item dari kategori yang sama, dari uploader yang sama (di YouTube), dan seterusnya.

Sulit menyertakan fitur samping untuk kueri/item

Fitur samping adalah setiap fitur di luar kueri atau ID item. Untuk rekomendasi film, fitur samping mungkin menyertakan negara atau usia. Menyertakan fitur samping yang tersedia akan meningkatkan kualitas model. Meskipun mungkin tidak mudah untuk menyertakan fitur samping di WALS, generalisasi WALS memungkinkan hal ini.

Untuk menggeneralisasi WALS, tambahkan matriks input dengan fitur dengan menentukan matriks blok \(\bar A\), dengan:

  • Blok (0, 0) adalah matriks masukan asli \(A\).
  • Blok (0, 1) adalah encoding multi-hot dari fitur pengguna.
  • Blok (1, 0) adalah encoding multi-hot dari fitur item.