Reranking

In der letzten Phase eines Empfehlungssystems kann das System die Kandidaten neu bewerten, um zusätzliche Kriterien oder Einschränkungen zu berücksichtigen. Ein Ansatz für das Neuranking besteht darin, Filter zu verwenden, die einige Kandidaten entfernen.

Ein weiterer Ansatz für das Ranking besteht darin, die vom Ranking zurückgegebene Punktzahl manuell zu transformieren.

In diesem Abschnitt werden Aktualität, Vielfalt und Fairness kurz erläutert. Diese Faktoren gehören unter anderem dazu, das Empfehlungssystem zu verbessern. Bei einigen dieser Faktoren müssen oft verschiedene Phasen des Prozesses geändert werden. Jeder Abschnitt enthält Lösungen, die Sie einzeln oder gemeinsam anwenden können.

Aktualität

Die meisten Empfehlungssysteme zielen darauf ab, die neuesten Nutzungsinformationen wie den aktuellen Nutzerverlauf und die neuesten Elemente einzubeziehen. Wenn das Modell immer aktuell ist, kann es bessere Empfehlungen geben.

Lösungen

  • Führen Sie das Training so oft wie möglich aus, um die neuesten Trainingsdaten zu erhalten. Wir empfehlen einen Warmstart des Trainings, damit das Modell nicht von Grund auf neu lernen muss. Ein Warmstart kann die Trainingszeit erheblich verkürzen. Starte bei der Matrixfaktorisierung beispielsweise die Einbettungen für Elemente, die in der vorherigen Instanz des Modells vorhanden waren, auf Warmstart.
  • Erstellen Sie einen durchschnittlichen Nutzer, der neue Nutzer in Matrixfaktorisierungsmodellen darstellt. Sie müssen nicht für jeden Nutzer dieselbe Einbettung verwenden. Sie können also Nutzercluster basierend auf Nutzerfunktionen erstellen.
  • Verwenden Sie einen DNN-Wert wie ein Softmax-Modell oder ein Modell mit zwei Türmen. Da das Modell Featurevektoren als Eingabe verwendet, kann es für eine Abfrage oder ein Element ausgeführt werden, das während des Trainings nicht verwendet wurde.
  • Dokumentalter als Funktion hinzufügen. Beispielsweise kann YouTube das Alter eines Videos oder den Zeitpunkt der letzten Wiedergabe als Feature hinzufügen.

Ein Bild von vier empfohlenen Videos über Eulen.

Vielseitigkeit

Wenn das System immer Elemente empfiehlt, die der Abfrageeinbettung am nahsten sind, ähneln sich die Kandidaten in der Regel sehr. Diese mangelnde Vielfalt kann die Nutzerfreundlichkeit oder die Langeweile beeinträchtigen. Wenn YouTube beispielsweise nur Videos empfiehlt, die dem Video sehr ähnlich sind, das sich der Nutzer gerade ansieht, z. B. nichts anderes als Eulenvideos (wie in der Abbildung zu sehen), wird der Nutzer das Interesse wahrscheinlich schnell verlieren.

Lösungen

  • Trainieren Sie mehrere Kandidatengeneratoren mit verschiedenen Quellen.
  • Trainieren Sie mithilfe verschiedener Zielfunktionen mehrere Ranger.
  • Platziere Elemente nach Genre oder anderen Metadaten neu, um Vielfalt zu gewährleisten.

Fairness

Ihr Modell sollte alle Nutzer fair behandeln. Achten Sie daher darauf, dass Ihr Modell keine unbewussten Verzerrungen aus den Trainingsdaten lernt.

Lösungen

  • Verschiedene Blickwinkel in Design und Entwicklung einbeziehen.
  • ML-Modelle mit umfassenden Datasets trainieren Fügen Sie Hilfsdaten hinzu, wenn Ihre Daten zu dünnbesetzt sind, z. B. wenn die Kategorien unterrepräsentiert sind.
  • Verfolgen Sie Messwerte (z. B. Genauigkeit und absolute Fehler) für jede demografische Gruppe, um Verzerrungen zu berücksichtigen.
  • Erstellen Sie separate Modelle für unterversorgte Gruppen.