Słowniczek z systemami uczącymi się: systemy rekomendacji

Ta strona zawiera terminy z glosariusza systemów rekomendacji. Aby zobaczyć wszystkie terminy ze glosariusza, kliknij tutaj.

C

generowanie kandydatów

#recsystems

Początkowy zestaw rekomendacji wybrany przez system rekomendacji. Weźmy za przykład księgarnię, która oferuje 100 000 książek. Na tym etapie tworzona jest znacznie krótsza lista książek odpowiednich dla danego użytkownika, np. 500. Nawet 500 książek to za dużo, żeby je polecić użytkownikowi. Kolejne, droższe etapy systemu rekomendacji (np. ocena i ponowne pozycjonowanie) zmniejszają liczbę tych 500 rekomendacji do znacznie mniejszego i bardziej przydatnego zestawu rekomendacji.

filtrowanie w ramach współpracy

#recsystems

Prognozowanie zainteresowań jednego użytkownika na podstawie zainteresowań wielu innych użytkowników. W systemach rekomendacji często stosuje się filtrowanie wspólne.

I

macierz elementów

#recsystems

W systemach rekomendacji macierz wektorów umieszczania wygenerowanych w ramach rozkładu macierzy, która przechowuje ukryte sygnały dotyczące każdego elementu. Każdy wiersz tablicy elementów zawiera wartość pojedynczej funkcji utajonej dla wszystkich elementów. Weźmy na przykład system rekomendacji filmów. Każda kolumna w tablicy elementów odpowiada jednemu filmowi. Sygnały te mogą reprezentować gatunki lub być trudne do zinterpretowania, ponieważ wiążą się ze złożonymi interakcjami między gatunkiem, gwiazdami, wiekiem filmowym lub innymi czynnikami.

Macierz elementów ma taką samą liczbę kolumn jak macierz docelowa, która jest uwzględniana na czynniki. Na przykład w systemie rekomendacji filmów, który ocenia 10 000 tytułów filmów, macierz elementów będzie zawierać 10 000 kolumn.

items

#recsystems

W systemie rekomendacji encje rekomendowane przez system. Na przykład filmy to produkty rekomendowane przez sklep wideo, a książki – książki.

P

rozłożenie macierzy

#recsystems

W matematyce jest to mechanizm znajdowania matryc, których iloczyn skalarny jest zbliżony do macierzy docelowej.

W systemach rekomendacji tablica docelowa często zawiera oceny użytkowników dotyczące produktów. Na przykład tablica docelowa systemu rekomendacji filmów może wyglądać mniej więcej tak:

  Casablanca Historia Filadelfii Czarna Pantera Wonder Woman Pulp fiction
Użytkownik 1 5,0 3,0 0.0 2,0 0.0
Użytkownik 2 4.0 0.0 0.0 1.0 5,0
Użytkownik 3 3,0 1.0 4.0 5,0 0.0

System rekomendacji filmów przewiduje oceny użytkowników w przypadku filmów bez oceny. Czy Użytkownik 1 polubi na przykład Czarna Pantera?

Jednym ze sposobów stosowanych w systemach rekomendacji jest zastosowanie rozkładu macierzy do wygenerowania tych 2 matryc:

Na przykład zastosowanie rozkładu matrycy na 3 użytkownikach i 5 elementach może przynieść taką macierz użytkowników i elementy:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Iloczyn skalarny macierzy użytkownika i matrycy produktów tworzy macierz rekomendacji zawierającą nie tylko oryginalne oceny użytkowników, ale także prognozy dotyczące filmów, których użytkownik jeszcze nie widział. Weźmy na przykład ocenę Casablanca dla użytkownika 1, czyli 5, 0. Iloczyn skalarny odpowiadający tej komórce w tablicy rekomendacji powinien mieścić się w przedziale 5.0 i jest:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Co ważniejsze, czy Użytkownik 1 polubi Czarną Panterę? Przyjmując iloczyn skalarny odpowiadający pierwszemu wierszowi i trzeciej kolumnie, otrzymujemy prognozowaną ocenę 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Rozkład matrycy powoduje zwykle macierz użytkowników i elementów, które razem są znacznie bardziej kompaktowe niż macierz docelowa.

R

system rekomendacji

#recsystems

System, który wybiera dla każdego użytkownika stosunkowo mały zbiór pożądanych elementów z dużego korpusu. System rekomendacji filmów może na przykład polecić 2 filmy ze 100 tysięcy filmów – w przypadku jednego użytkownika wybrać Casablanca i The Philadelphia Story, a drugiego – Wonder Woman i Czarna Pantera. System rekomendacji filmów może opierać swoje rekomendacje na takich czynnikach jak:

  • Filmy ocenione lub obejrzane przez podobnych użytkowników.
  • Gatunek, reżyserzy, aktorzy, docelowa grupa demograficzna...

ponowne pozycjonowanie

#recsystems

Ostatni etap systemu rekomendacji, w którym ocenione elementy mogą zostać ponownie ocenione zgodnie z innym algorytmem (zwykle niesystemem uczącym się). Ponowne pozycjonowanie ocenia listę elementów wygenerowanych na etapie oceny i podejmuje działania takie jak:

  • Eliminowanie produktów, które użytkownik już kupił.
  • Poprawa wyniku nowszych produktów.

S

ocena

#recsystems

Część systemu rekomendacji, która podaje wartość lub ranking każdego elementu wytworzonego na etapie generowania kandydatów.

U

macierz użytkowników

#recsystems

W systemach rekomendacji jest to wektor umieszczania generowany przez rozbicie macierzy, który przechowuje ukryte sygnały dotyczące preferencji użytkownika. Każdy wiersz w tablicy użytkowników zawiera informacje o względnej skuteczności różnych ukrytych sygnałów danego użytkownika. Weźmy na przykład system rekomendacji filmów. W tym systemie sygnały ukryte w tablicy użytkownika mogą reprezentować zainteresowania użytkownika konkretnymi gatunkami lub mogą być trudniejsze do zinterpretowania sygnałów, które wiążą się ze złożonymi interakcjami obejmującymi wiele czynników.

Macierz użytkowników zawiera kolumnę dla każdej funkcji ukrytej i po jednym wierszu dla każdego użytkownika. Oznacza to, że macierz użytkowników ma taką samą liczbę wierszy jak macierz docelowa, która jest uwzględniana na czynniki. Na przykład w systemie rekomendacji filmów obejmujących 1 000 000 użytkowników tablica użytkowników będzie zawierała 1 000 000 wierszy.

Ś

Naprzemienne ważone najmniejsze kwadraty (WALS)

#recsystems

Algorytm minimalizujący funkcję celu podczas fabrykacji macierzy w systemach rekomendacji, który umożliwia zmniejszenie wagi brakujących przykładów. WALS minimalizuje ważony błąd kwadratowy między oryginalną macierzą a rekonstrukcją, naprzemiennie między naprawieniem rozkładu wierszy a rozkładaniem kolumn na czynniki pierwsze. Każdą z tych optymalizacji można rozwiązać za pomocą optymalizacji wypukłej jak najmniejszych kwadratów. Więcej informacji znajdziesz w kursie dotyczącym systemów rekomendacji.