Sehen Sie sich die folgenden Optionen an.
Ein Beispiel: Ein Onlineshop für Schuhe möchte ein Modell für betreutes ML erstellen, das Nutzern personalisierte Schuhempfehlungen liefert. Das heißt, dass Marty bestimmte Schuhpaare und Janet verschiedene Schuhe empfehlen. Das System verwendet Verlaufsdaten zum Nutzerverhalten, um Trainingsdaten zu generieren. Welche der folgenden Aussagen ist richtig?
„Schuhgröße“ ist eine nützliche Funktion.
„Schuhgröße“ ist ein quantifizierbares Signal, das sich stark darauf auswirkt, ob dem Nutzer die empfohlenen Schuhe gefallen. Wenn Marty beispielsweise eine Größe von 9 trägt, sollte das Modell Schuhe der Größe 7 nicht empfehlen.
„Schuh-Beauty“ ist eine nützliche Funktion.
Gute Merkmale sind konkret und quantifizierbar.
Beauty ist zu vage, um als nützliche Funktion zu dienen.
Schönheit ist wahrscheinlich eine Mischung aus bestimmten Betonelementen, wie Stil und Farbe. Stil und Farbe wären in jedem Fall besser als Schönheit.
Der Nutzer hat auf die Beschreibung des Schuhs geklickt und ist ein nützliches Label.
Nutzer möchten wahrscheinlich nur mehr über diese Schuhe erfahren, die ihnen gefallen. Klicks von Nutzern sind daher ein beobachtbarer, quantifizierbarer Messwert, der ein gutes Trainingslabel sein kann. Da unsere Trainingsdaten aus dem bisherigen Nutzerverhalten abgeleitet werden, müssen unsere Labels von objektivem Verhalten wie Klicks abgeleitet werden, die in hohem Maße mit den Nutzereinstellungen zusammenhängen.
„Schuhe, die ein Nutzer liebt“ ist ein nützliches Label.
„Adoration“ ist kein beobachtbarer, quantifizierbarer Messwert. Am besten suchen wir nach beobachtbaren Proxymesswerten für die Dekoration.