Glossar zum maschinellen Lernen: Empfehlungssysteme

Diese Seite enthält Begriffe aus dem Glossar von Empfehlungssystemen. Alle Glossarbegriffe finden Sie hier.

C

Kandidatengenerierung

#recsystems

Die ersten Empfehlungen, die von einem Empfehlungssystem ausgewählt wurden. Nehmen wir als Beispiel einen Buchladen mit 100.000 Titeln. In der Phase der Kandidatengenerierung wird eine viel kleinere Liste geeigneter Bücher für einen bestimmten Nutzer erstellt, z. B. 500. Aber auch 500 Bücher sind viel zu viele, um sie einem Nutzer zu empfehlen. Durch weitere, teurere Phasen eines Empfehlungssystems (z. B. Bewertung und Reranking) lassen sich diese 500 auf einen viel kleineren Satz von Empfehlungen reduzieren.

Gemeinsames Filtern

#recsystems

Vorhersagen zu den Interessen eines Nutzers auf Grundlage der Interessen vieler anderer Nutzer. Die gemeinsame Filterung wird häufig in Empfehlungssystemen verwendet.

I

Elementmatrix

#recsystems

In Empfehlungssystemen eine Matrix von Einbettungsvektoren, die durch die Matrixfaktorisierung generiert werden und die latente Signale zu jedem Element enthält. Jede Zeile der Elementmatrix enthält den Wert eines einzelnen latenten Merkmals für alle Elemente. Nehmen wir als Beispiel ein Empfehlungssystem für Filme. Jede Spalte in der Elementmatrix steht für einen einzelnen Film. Die latenten Signale können Genres sein oder schwer zu interpretierende Signale enthalten, die komplexe Interaktionen zwischen Genre, Stars, Filmalter oder anderen Faktoren umfassen.

Die Elementmatrix hat dieselbe Anzahl von Spalten wie die Zielmatrix, die faktorisiert wird. Bei einem Filmempfehlungssystem, das 10.000 Filmtitel bewertet, hat die Elementmatrix beispielsweise 10.000 Spalten.

items

#recsystems

In einem Empfehlungssystem die Entitäten, die ein System empfiehlt. Beispielsweise sind Videos die Artikel, die in einem Videoshop empfohlen werden, während Bücher die Artikel sind, die von einer Buchhandlung empfohlen werden.

M

Matrixfaktorisierung

#recsystems

In Mathematik ein Mechanismus zum Auffinden der Matrizen, deren Punktprodukt eine Zielmatrix annähert.

In Empfehlungssystemen enthält die Zielmatrix häufig Nutzerbewertungen für Elemente. Die Zielmatrix für ein Filmempfehlungssystem könnte beispielsweise folgendermaßen aussehen, wobei die positiven Ganzzahlen Nutzerbewertungen und 0 bedeuten, dass der Nutzer den Film nicht bewertet hat:

  Casablanca Die Geschichte von Philadelphia Black Panther Wunderfrau Pulp Fiction
Nutzer 1 5 3 0.0 2 0.0
Nutzer 2 4.0 0.0 0.0 1 5
Nutzer 3 3 1 4.0 5,0 0.0

Das Empfehlungssystem für Filme zielt darauf ab, Nutzerbewertungen für Filme ohne Altersfreigabe vorherzusagen. Hat Nutzer 1 zum Beispiel Black Panther?

Ein Ansatz für Empfehlungssysteme ist die Verwendung der Matrixfaktorisierung, um die folgenden zwei Matrizen zu generieren:

  • Eine Nutzermatrix, die aus der Anzahl der Nutzer × der Anzahl der Einbettungsdimensionen besteht.
  • Eine Elementmatrix, die die Anzahl der Einbettungsdimensionen × die Anzahl der Elemente definiert.

Die Verwendung der Matrixfaktorisierung für unsere drei Nutzer und fünf Elemente könnte beispielsweise die folgende Nutzer- und Elementmatrix ergeben:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Das Punktprodukt der Nutzer- und Artikelmatrix ergibt eine Empfehlungsmatrix, die nicht nur die ursprünglichen Nutzerbewertungen, sondern auch Vorhersagen für die Filme enthält, die die einzelnen Nutzer nicht gesehen haben. Nehmen wir als Beispiel die Bewertung Casablanca von Nutzer 1 mit 5,0. Das Punktprodukt, das dieser Zelle in der Empfehlungsmatrix entspricht, sollte hoffentlich etwa 5,0 betragen und ist:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Und was noch wichtiger ist: Nutzer 1 wie Black Panther? Wenn Sie das Punktprodukt der ersten Zeile und der dritten Spalte nehmen, erhalten Sie eine vorhergesagte Bewertung von 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Die Matrixfaktorisierung ergibt in der Regel eine Nutzer- und eine Elementmatrix, die zusammen wesentlich kompakter sind als die Zielmatrix.

R

Empfehlungssystem

#recsystems

Ein System, das für jeden Nutzer einen relativ kleinen Satz von gewünschten Elementen aus einem großen Korpus auswählt. Ein Videoempfehlungssystem könnte beispielsweise zwei Videos aus einem Korpus von 100.000 Videos empfehlen und für einen Nutzer Casablanca und die The Philadelphia Story und für einen anderen Wonder Woman und Black Panther auswählen. Videoempfehlungen basieren unter anderem auf folgenden Faktoren:

  • Filme, die von ähnlichen Nutzern bewertet oder angesehen wurden
  • Genre, Regisseure, Schauspieler, demografische Ausrichtung

Reranking

#recsystems

Die letzte Phase eines Empfehlungssystems, in dem bewertete Elemente nach einem anderen Algorithmus (in der Regel ein ML-Algorithmus) neu bewertet werden können. Beim Reranking wird die Liste der Elemente ausgewertet, die in der Phase Scoreing generiert wurden. Dabei werden folgende Aktionen ausgeführt:

  • Artikel entfernen, die der Nutzer bereits gekauft hat
  • Die Anzahl neuer Artikel wird erhöht.

S

Bewertung

#recsystems

Der Teil eines Empfehlungssystems, der einen Wert oder ein Ranking für jedes in der Phase Kandidatengenerierung erstellte Element liefert.

U

Nutzermatrix

#recsystems

In Empfehlungssystemen ein Einbettungsvektor, der durch die Matrixfaktorisierung generiert wird und latente Signale zu Nutzereinstellungen enthält. Jede Zeile der Nutzermatrix enthält Informationen zur relativen Stärke verschiedener latenter Signale für einen einzelnen Nutzer. Nehmen wir als Beispiel ein Empfehlungssystem für Filme. In diesem System können die latenten Signale in der Nutzermatrix das Interesse jedes Nutzers an bestimmten Genres darstellen oder sind möglicherweise schwerer zu interpretierende Signale, die komplexe Interaktionen über mehrere Faktoren hinweg umfassen.

Die Nutzermatrix enthält eine Spalte für jedes latente Feature und eine Zeile für jeden Nutzer. Das heißt, die Nutzermatrix hat dieselbe Anzahl von Zeilen wie die Zielmatrix, die faktorisiert wird. Bei einem Filmempfehlungssystem für 1.000.000 Nutzer enthält die Nutzermatrix beispielsweise 1.000.000 Zeilen.

W

Gewichtete abwechselnde quadratische Quadrate (WALS)

#recsystems

Ein Algorithmus zum Minimieren der Zielfunktion während der Matrixfaktorisierung in Empfehlungssystemen, der eine Gewichtung der fehlenden Beispiele ermöglicht. WALS minimiert den gewichteten quadratischen Fehler zwischen der ursprünglichen Matrix und der Rekonstruktion durch Wechseln zwischen dem Korrigieren der Zeilenfaktorisierung und der Spaltenfaktorisierung. Jede dieser Optimierungen kann durch die minimale Quadratzahl Convex-Optimierung gelöst werden. Weitere Informationen finden Sie im Kurs zu Empfehlungssystemen.