Glosarium Machine Learning: Sistem Rekomendasi

Halaman ini berisi istilah glosarium Sistem Rekomendasi. Untuk semua istilah glosarium, klik di sini.

C

pembuatan kandidat

#recsystems

Kumpulan rekomendasi awal yang dipilih oleh sistem rekomendasi. Misalnya, pertimbangkan toko buku yang menawarkan 100.000 judul. Fase pembuatan kandidat membuat daftar buku yang cocok yang jauh lebih kecil untuk pengguna tertentu, misalnya 500. Namun, 500 buku terlalu banyak untuk direkomendasikan kepada pengguna. Fase berikutnya dari sistem rekomendasi yang lebih mahal (seperti skor dan peringkat ulang) mengurangi 500 tersebut menjadi kumpulan rekomendasi yang lebih kecil dan lebih berguna.

pemfilteran kolaboratif

#recsystems

Membuat prediksi tentang minat salah satu pengguna berdasarkan minat banyak pengguna lainnya. Pemfilteran kolaboratif sering digunakan di sistem rekomendasi.

I

matriks item

#recsystems

Dalam sistem rekomendasi, matriks vektor sematan yang dihasilkan oleh faktorisasi matriks yang menyimpan sinyal laten tentang setiap item. Setiap baris matriks item memiliki nilai fitur laten tunggal untuk semua item. Misalnya, pertimbangkan sistem rekomendasi film. Setiap kolom dalam matriks item mewakili satu film. Sinyal laten mungkin merepresentasikan genre, atau mungkin sinyal yang lebih sulit ditafsirkan yang melibatkan interaksi kompleks antara genre, bintang, usia film, atau faktor lainnya.

Matriks item memiliki jumlah kolom yang sama dengan matriks target yang sedang difaktorkan. Misalnya, dalam sistem rekomendasi film yang mengevaluasi 10.000 judul film, matriks item akan memiliki 10.000 kolom.

item

#recsystems

Dalam sistem rekomendasi, entitas yang direkomendasikan oleh sistem. Misalnya, video adalah item yang direkomendasikan toko video, sedangkan buku adalah item yang direkomendasikan toko buku.

S

faktorisasi matriks

#recsystems

Dalam matematika, mekanisme untuk menemukan matriks yang produk titiknya mendekati matriks target.

Dalam sistem rekomendasi, matriks target sering kali menahan rating pengguna pada item. Misalnya, matriks target untuk sistem rekomendasi film mungkin terlihat seperti berikut, dengan bilangan bulat positif adalah rating pengguna dan 0 berarti pengguna tidak menilai film:

  Casablanca Kisah Palembang Black Panther Wanita Ajaib Fiksi Pulp
Pengguna.1 5,0 3.0 0,0 2.0 0,0
Pengguna 2 4.0 0,0 0,0 1.0 5,0
Pengguna 3 3.0 1.0 4.0 5,0 0,0

Sistem rekomendasi film bertujuan untuk memprediksi rating pengguna untuk film tanpa rating. Misalnya, apakah Pengguna 1 akan menyukai Black Panther?

Salah satu pendekatan untuk sistem rekomendasi adalah menggunakan faktorisasi matriks untuk menghasilkan dua matriks berikut:

  • Matriks pengguna, dibentuk dari jumlah pengguna X jumlah dimensi penyematan.
  • Matriks item, dibentuk sebagai jumlah dimensi penyematan X jumlah item.

Misalnya, menggunakan faktorisasi matriks pada tiga pengguna dan lima item kita dapat menghasilkan matriks pengguna dan matriks item berikut:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Produk titik dari matriks pengguna dan matriks item menghasilkan matriks rekomendasi yang tidak hanya berisi rating pengguna asli, tetapi juga prediksi film yang belum dilihat oleh setiap pengguna. Misalnya, pertimbangkan nilai Pengguna 1 untuk Casablanca, yaitu 5,0. Produk titik yang sesuai dengan sel tersebut dalam matriks rekomendasi diharapkan bernilai sekitar 5,0, dan nilainya adalah:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Yang terpenting, apakah Pengguna 1 akan menyukai Black Panther? Mengambil produk titik yang sesuai dengan baris pertama dan kolom ketiga menghasilkan prediksi rating 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Faktorisasi matriks biasanya menghasilkan matriks pengguna dan matriks item yang, secara signifikan, lebih ringkas daripada matriks target.

R

sistem rekomendasi

#recsystems

Sistem yang memilih set item yang diinginkan dari korpus besar untuk setiap pengguna. Misalnya, sistem rekomendasi video mungkin merekomendasikan dua video dari korpus yang berisi 100.000 video, yang memilih Casablanca dan The Plaza Story untuk satu pengguna, serta Wonder Women dan Black Panther untuk pengguna lainnya. Sistem rekomendasi video mungkin mendasarkan rekomendasinya pada faktor-faktor seperti:

  • Film yang telah diberi rating atau ditonton oleh pengguna serupa.
  • Genre, sutradara, aktor, demografi target...

peringkat ulang

#recsystems

Tahap akhir dari sistem rekomendasi, saat item yang diberi skor dapat dinilai ulang menurut beberapa algoritme (biasanya, non-ML) lainnya. Penentuan peringkat ulang mengevaluasi daftar item yang dihasilkan oleh fase skor, yang mengambil tindakan seperti:

  • Menghilangkan item yang telah dibeli pengguna.
  • Meningkatkan skor item yang lebih baru.

M

penskoran

#recsystems

Bagian dari sistem rekomendasi yang memberikan nilai atau peringkat untuk setiap item yang dihasilkan oleh fase pembuatan kandidat.

U

matriks pengguna

#recsystems

Dalam sistem rekomendasi, vektor tersemat yang dihasilkan oleh faktorisasi matriks yang menyimpan sinyal tersembunyi tentang preferensi pengguna. Setiap baris matriks pengguna menyimpan informasi tentang kekuatan relatif berbagai sinyal laten untuk satu pengguna. Misalnya, pertimbangkan sistem rekomendasi film. Dalam sistem ini, sinyal laten dalam matriks pengguna mungkin merepresentasikan minat setiap pengguna dalam genre tertentu, atau mungkin sinyal yang lebih sulit ditafsirkan yang melibatkan interaksi kompleks di berbagai faktor.

Matriks pengguna memiliki kolom untuk setiap fitur laten dan baris untuk setiap pengguna. Artinya, matriks pengguna memiliki jumlah baris yang sama dengan matriks target yang sedang difaktorkan. Misalnya, dalam sistem rekomendasi film untuk 1.000.000 pengguna, matriks pengguna akan memiliki 1.000.000 baris.

W

Kotak Terkecil Terbalik (WALS)

#recsystems

Algoritme untuk meminimalkan fungsi objektif selama faktorisasi matriks dalam sistem rekomendasi, yang memungkinkan pembobotan untuk contoh yang hilang. WALS meminimalkan bobot error kuadrat antara matriks asli dan rekonstruksi dengan beralih antara memperbaiki faktorisasi baris dan faktorisasi kolom. Setiap pengoptimalan ini dapat diselesaikan dengan pengoptimalan konveks kuadrat terkecil. Untuk mengetahui detailnya, lihat kursus Sistem Rekomendasi.