Glossario del machine learning: sistemi dei consigli

Questa pagina contiene i termini del glossario di Recommendation Systems. Per tutti i termini del glossario, fai clic qui.

C

generazione di candidati

#recsystems

L'insieme iniziale di consigli scelti da un sistema di consigli. Prendiamo come esempio una libreria che offre 100.000 titoli. La fase di generazione dei candidati crea un elenco molto più ridotto di libri adatti a un determinato utente, ad esempio 500. Ma anche 500 libri sono troppi da consigliare a un utente. Le fasi successive e più costose di un sistema di suggerimenti (come il punteggio e il riranking) le riducono da 500 a un insieme di suggerimenti molto più ridotto e più utile.

filtro collaborativo

#recsystems

Fare previsioni sugli interessi di un utente in base a quelli di molti altri utenti. I filtri collaborativi vengono spesso utilizzati nei sistemi di suggerimenti.

I

matrice degli elementi

#recsystems

Nei sistemi di suggerimenti, una matrice di vettori di incorporamento generati dalla fattorizzazione matriciale che contengono indicatori latenti su ogni elemento. Ogni riga della matrice di elementi contiene il valore di una singola caratteristica latente per tutti gli elementi. Ad esempio, prendi in considerazione un sistema di consigli sui film. Ogni colonna nella matrice degli elementi rappresenta un singolo filmato. Gli indicatori latenti potrebbero rappresentare i generi o essere più difficili da interpretare che comportano interazioni complesse tra genere, star, era del cinema o altri fattori.

La matrice degli elementi ha lo stesso numero di colonne della matrice target che viene fattorizzata. Ad esempio, se un sistema di consigli sui film valuta 10.000 titoli, la matrice di elementi avrà 10.000 colonne.

items

#recsystems

In un sistema di consigli, indica le entità consigliate da un sistema. Ad esempio, i video sono gli articoli consigliati da un video store, mentre i libri sono gli articoli consigliati.

L

fattorizzazione matriciale

#recsystems

In matematica, un meccanismo per trovare le matrici il cui prodotto scalare si avvicina a una matrice target.

Nei sistemi di consigli, la matrice di destinazione include spesso le valutazioni degli utenti sugli elementi. Ad esempio, la matrice target per un sistema di consigli sui film potrebbe avere il seguente aspetto, in cui i numeri interi positivi sono valutazioni degli utenti e 0 indica che l'utente non ha valutato il film:

  Casablanca La storia di Philadelphia Black Panther Wonder Woman Pulpfiction
Utente 1 5,0 3,0 0.0 2.0 0.0
Utente 2 4.0 0.0 0.0 1,0 5,0
Utente 3 3,0 1,0 4.0 5,0 0.0

Il sistema di consigli sui film ha lo scopo di prevedere le valutazioni degli utenti per i film senza classificazione. Ad esempio, l'utente 1 piace Black Panther?

Un approccio per i sistemi di suggerimenti è utilizzare la fattorizzazione matriciale per generare le due matrici seguenti:

  • Una matrice utente, formata dal numero di utenti moltiplicato per il numero di dimensioni di incorporamento.
  • Una matrice di elementi, formattata in base al numero di dimensioni di incorporamento per il numero di elementi.

Ad esempio, l'utilizzo della fattorizzazione matriciale sui nostri 3 utenti e 5 elementi potrebbe restituire la seguente matrice utente e quella degli articoli:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Il prodotto scalare della matrice utenti e della matrice degli elementi restituisce una matrice di suggerimenti che contiene non solo le valutazioni originali degli utenti, ma anche le previsioni per i film che ogni utente non ha visto. Ad esempio, considera la valutazione dell'utente 1 di Casablanca, che era 5,0. Il prodotto scalare corrispondente a quella cella nella matrice dei suggerimenti dovrebbe essere pari a circa 5,0, ed è:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Ma soprattutto, all'Utente 1 piace Black Panther? Considerando il prodotto scalare corrispondente alla prima riga e alla terza colonna, si ottiene una valutazione prevista di 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La fattorizzazione matriciale in genere genera una matrice utente e una matrice di articoli che, insieme, sono molto più compatte rispetto alla matrice di destinazione.

R

sistema di suggerimenti

#recsystems

un sistema che seleziona per ogni utente un insieme relativamente piccolo di elementi desiderabili da un corpus di grandi dimensioni. Ad esempio, un sistema di consigli per i video potrebbe consigliare due video tratto da un corpus di 100.000 video, selezionando Casablanca e La storia di Filadelfia per un utente e Wonder Woman e Black Panther per un altro. Un sistema di consigli per i video potrebbe basare i consigli su fattori quali:

  • Film che utenti simili hanno valutato o guardato da utenti simili.
  • Genere, registi, attori, gruppo demografico target...

riclassificazione

#recsystems

La fase finale di un sistema di suggerimenti, durante il quale gli elementi con punteggio possono essere valutati nuovamente in base ad altri algoritmi (in genere non ML). Il nuovo ranking valuta l'elenco di elementi generati dalla fase di punteggio, intraprendendo azioni come:

  • Eliminazione degli articoli già acquistati dall'utente.
  • Aumento del punteggio degli elementi più recenti.

S

calcolo punteggio

#recsystems

La parte di un sistema di consigli che fornisce un valore o un ranking per ogni elemento prodotto dalla fase di generazione di candidati.

U

matrice utente

#recsystems

Nei sistemi di suggerimenti, un vettore di incorporamento generato dalla fattorizzazione matriciale contenente indicatori latenti sulle preferenze dell'utente. Ogni riga della matrice utente contiene informazioni sulla potenza relativa di vari indicatori latenti per un singolo utente. Ad esempio, prendi in considerazione un sistema di consigli sui film. In questo sistema, gli indicatori latenti nella matrice utenti potrebbero rappresentare l'interesse di ciascun utente in determinati generi oppure essere indicatori più difficili da interpretare che implicano interazioni complesse tra più fattori.

La matrice utente ha una colonna per ogni funzionalità latente e una riga per ogni utente. In altre parole, la matrice utente ha lo stesso numero di righe della matrice target che viene fattorizzata. Ad esempio, se viene fornito un sistema di suggerimenti sui film per 1.000.000 di utenti, la matrice utente avrà 1.000.000 di righe.

M

Minimo quadrati alternati ponderati (WALS)

#recsystems

Un algoritmo per ridurre al minimo la funzione obiettivo durante la scomposizione matriciale nei sistemi di suggerimenti, che consente una riduzione della ponderazione degli esempi mancanti. WALS riduce al minimo l'errore quadrato ponderato tra la matrice originale e la ricostruzione alternando la correzione della fattorizzazione delle righe e la fattorizzazione della colonna. Ognuna di queste ottimizzazioni può essere risolta mediante l'ottimizzazione convessa dei minimi quadrati. Per maggiori dettagli, consulta il corso sui sistemi di suggerimenti.