Glossario del machine learning: sistemi di suggerimenti

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Questa pagina contiene i termini nel glossario dei sistemi di suggerimenti. Per tutti i termini del glossario, fai clic qui.

C

generazione dei candidati

#recsystems

L'insieme iniziale di consigli scelti da un sistema di consigli. Prendi ad esempio una libreria che offre 100.000 titoli. Nella fase di generazione dei candidati viene creato un elenco di libri più ristretto per un determinato utente, ad esempio 500. Ma persino 500 libri sono troppi per essere consigliati a un utente. Le fasi successive e più costose di un sistema di suggerimenti (ad esempio punteggio e re-ranking) riducono i risultati di 500 a un insieme di consigli molto più piccolo e utile.

filtro collaborativo

#recsystems

Fare previsioni sugli interessi di un utente in base agli interessi di molti altri utenti. Il filtro collaborativo viene spesso utilizzato nei sistemi di consigli.

I

matrice di elementi

#recsystems

Nei sistemi di consigli, una matrice di vettori di incorporamento generati dalla fattorizzazione matrice che contiene segnali latenti su ogni elemento. Ogni riga della matrice degli elementi contiene il valore di una singola funzionalità latente per tutti gli elementi. Ad esempio, prendi in considerazione un sistema di consigli sui film. Ogni colonna nella matrice degli elementi rappresenta un singolo filmato. Gli indicatori latenti potrebbero rappresentare generi o essere più difficili da interpretare e che implicano interazioni complesse tra generi, stelle, età dei film o altri fattori.

La matrice degli elementi ha lo stesso numero di colonne della matrice target che viene presa in considerazione. Ad esempio, considerato che un sistema di consigli film valuta 10.000 titoli di film, la matrice degli elementi avrà 10.000 colonne.

items

#recsystems

In un sistema di consigli, le entità consigliate dal sistema. Ad esempio, i video sono gli elementi consigliati da un negozio di video, mentre i libri sono quelli consigliati da una libreria.

M

fattorizzazione matrice

#recsystems

In matematica, un meccanismo per trovare le matrici i cui prodotti con punti sono approssimativi a una matrice target.

Nei sistemi di consigli, la matrice target spesso contiene le valutazioni degli utenti su elementi. Ad esempio, la matrice di destinazione per un sistema di suggerimenti di film potrebbe avere il seguente aspetto, dove i numeri interi positivi sono valutazioni degli utenti e 0 significa che l'utente non ha valutato il film:

  Casablanca La storia di Philadelphia Black Panther Wonder Woman Polpa di fantascienza
Utente 1 5,0 3,0 0.0 2,0 0.0
Utente 2 4.0 0.0 0.0 1,0 5,0
Utente 3 3,0 1,0 4.0 5,0 0.0

Il sistema di consigli sui film mira a prevedere le valutazioni degli utenti per i film non classificati. ad esempio User Panther.

Un approccio per i sistemi di suggerimenti consiste nell'utilizzare la fattorizzazione a matrice per generare le seguenti due matrici:

  • Una matrice utente, modellata come il numero di utenti X il numero di dimensioni di incorporamento.
  • Una matrice di elementi, modellata come il numero di dimensioni di incorporamento X il numero di elementi.

Ad esempio, l'utilizzo della fattorizzazione matrice sui nostri tre utenti e cinque elementi potrebbe produrre la seguente matrice utente e la seguente matrice di elementi:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Il prodotto punto della matrice degli utenti e della matrice degli elementi restituisce una matrice dei suggerimenti che contiene non solo le valutazioni utente originali, ma anche le previsioni per i film che ogni utente non ha visto. Ad esempio, prendi in considerazione la valutazione di Casablanca, indicata da 5,0. Il prodotto in punti corrispondente a quella cella nella matrice dei consigli dovrebbe essere circa 5, 0 e dovrebbe essere:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Aspetto ancora più importante, l'utente 1 come Black Panther? Se il prodotto punto corrisponde alla prima riga e alla terza colonna, si ottiene un punteggio previsto di 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La fattorizzazione matrice, in genere, restituisce una matrice utente e una matrice elemento che, insieme, sono molto più compatte della matrice target.

R

sistema di suggerimenti

#recsystems

Un sistema che seleziona per ciascun utente un insieme relativamente piccolo di elementi desiderabili provenienti da un grande corpus. Ad esempio, un sistema di consigli video potrebbe consigliare due video da un corpus di 100.000 video, selezionando Casablanca e The Philadelphia Story per un utente e Wonder Woman e Black Panther per un altro. Un sistema di consigli video potrebbe basare i suoi consigli su fattori quali:

  • Film che utenti simili hanno valutato o guardato.
  • Genere, registi, attori, dati demografici target...

nuovo ranking

#recsystems

La fase finale di un sistema di suggerimenti, durante cui gli elementi con punteggio possono essere rivalutati secondo un altro algoritmo (in genere non ML). Il ranking valuta l'elenco degli elementi generati dalla fase di punteggio ed esegue azioni quali:

  • Eliminazione di articoli già acquistati dall'utente.
  • Migliorare il punteggio degli articoli più recenti.

S

calcolo punteggio

#recsystems

La parte di un sistema di consigli che fornisce un valore o un ranking per ogni elemento prodotto dalla fase di selezione dei candidati.

U

matrice utente

#recsystems

Nei sistemi di consigli, un vettore di incorporamento generato dalla fattorizzazione matrice che contiene indicatori latenti sulle preferenze dell'utente. Ogni riga della matrice utente contiene le informazioni sulla forza relativa di vari indicatori latenti per un singolo utente. Ad esempio, prendi in considerazione un sistema di consigli sui film. In questo sistema, gli indicatori latenti nella matrice degli utenti potrebbero rappresentare l'interesse di ciascun utente per determinati generi o essere più difficili da interpretare, che prevedono interazioni complesse in più fattori.

La matrice utente contiene una colonna per ogni funzionalità latente e una riga per ogni utente. In altre parole, la matrice utente ha lo stesso numero di righe della matrice target che viene presa in considerazione. Ad esempio, considerato un sistema di consigli sui film per 1.000.000, la matrice degli utenti avrà 1.000.000 di righe.

W

Piazza minima (WALS) alternata ponderata

#recsystems

Un algoritmo per ridurre al minimo la funzione dell'obiettivo durante la fattorizzazione matrice nei sistemi di suggerimento, che consente una ponderazione inferiore degli esempi mancanti. WALS riduce al minimo l'errore al quadrato ponderato tra la matrice originale e la ricostruzione, alternando la correzione della fattorizzazione della riga e della colonna. Ognuna di queste ottimizzazioni può essere risolta con l'ottimizzazione convessa dei minimi quadrati. Per maggiori dettagli, consulta il corso sui sistemi di consigli.