Inhaltsbasierte Filter

Bei der inhaltsbasierten Filterung werden Elementfunktionen verwendet, um andere Elemente basierend auf früheren Aktionen oder anstößigem Feedback zu empfehlen, die dem Nutzer ähnlich sind.

Zur Veranschaulichung der inhaltsbasierten Filterung lassen Sie uns einige Funktionen für den Google Play Store manuell entwickeln. Die folgende Abbildung zeigt eine Merkmalsmatrix, in der jede Zeile eine Anwendung und jede Spalte ein Merkmal darstellt. Zu den Funktionen gehören Kategorien (z. B. Bildung, Freizeit, Gesundheit), Publisher der App und viele andere. Zur Vereinfachung nehmen wir an, dass diese Feature-Matrix binär ist: Ein Wert ungleich null bedeutet, dass die Anwendung dieses Feature hat.

Außerdem repräsentieren Sie den Nutzer im selben Featurebereich. Einige der nutzerbezogenen Funktionen können explizit vom Nutzer bereitgestellt werden. Ein Nutzer wählt beispielsweise in seinem Profil „Unterhaltungs-Apps“ aus. Andere Funktionen können basierend auf den Apps, die sie zuvor installiert haben, implizit sein. Der Nutzer hat beispielsweise eine andere von Science R Us veröffentlichte App installiert.

Das Modell sollte Artikel empfehlen, die für diesen Nutzer relevant sind. Dazu müssen Sie zuerst einen Ähnlichkeitsmesswert auswählen (z. B. Punktprodukt). Anschließend müssen Sie das System so einrichten, dass jedes Kandidatenelement gemäß diesem Ähnlichkeitsmesswert bewertet wird. Beachten Sie, dass die Empfehlungen spezifisch für diesen Nutzer sind, da das Modell keine Informationen über andere Nutzer verwendet hat.

Bild einer Matrix mit einem Nutzer und Apps, die möglicherweise empfohlen werden

Punktprodukt als Ähnlichkeitsmesswert verwenden

Betrachte den Fall, dass die Nutzereinbettung \(x\) und die Anwendungseinbettung \(y\) beide Binärvektoren sind. Seit\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)wird ein Merkmal, das sowohl in \(x\) als auch in \(y\) angezeigt wird, zur Summe 1 beigetragen. Mit anderen Worten: \(\langle x, y \rangle\) ist die Anzahl der Features,die in beiden Vektoren gleichzeitig aktiv sind. Ein Produkt mit hohem Punkt weist dann auf gebräuchlichere Merkmale hin und damit auf eine höhere Ähnlichkeit.

Selbst ausprobieren

Berechnen Sie das Punktprodukt für jede App im vorherigen App-Problem. Anhand dieser Informationen können Sie dann die folgende Frage beantworten:

Welche App sollten wir empfehlen?
Die von Science R Us entwickelte Lern-App.
Das stimmt. Dieser Artikel hat mit 2 den höchsten Punktwert. Unsere Nutzer mögen wissenschaftliche und pädagogische Apps.
Die Health-App von Healthcare.
Diese App erzielt eine 1. Das ist nicht die schlechteste Empfehlung, die unser System machen kann, aber es ist sicher nicht die beste.
Die zwanglose App von TimeWastr.
Diese App hat eigentlich das niedrigste Punktprodukt bei 0. Unser Nutzer ist nicht an Casual Apps wie Spielen interessiert.