Datenerhebung: Wissenstest

Klicken Sie bei den folgenden Fragen auf den gewünschten Pfeil, um Ihre Antwort zu prüfen:

Angenommen, Sie arbeiten an einem werbebezogenen Modell für maschinelles Lernen und möchten die Ausgaben der Werbetreibenden für Januar vorhersagen. Die Datenmenge, die Sie auf einem Laufwerk speichern können, ist begrenzt. Daher dürfen Sie nur einen Teil der verfügbaren Daten nutzen. Sie können alle aktuellen Daten aus dem vorherigen Dezember verwenden. Eine andere Person empfiehlt, Daten aus dem letzten Jahr zu verwenden. Was könnte besser sein und warum?
Daten aus dem Vormonat (Dezember)
Diese Daten sind zwar aktueller, können jedoch von den saisonalen Auswirkungen der Ausgaben von Werbetreibenden vor den Feiertagen im Dezember beeinflusst werden.
Stichproben der Daten über das ganze Jahr
Diese Daten sind zwar alt, aber es ist unwahrscheinlicher, dass sie durch die saisonalen Auswirkungen der Ausgaben von Werbetreibenden vor den Feiertagen im Dezember beeinflusst werden.
Sie möchten Videos präsentieren, die sich Nutzer ansehen möchten. Du verwendest Videos, die sie sich auf YouTube angesehen haben, als Label. Ist dieses Label direkt oder abgeleitet?
Abgeleitet
Dieses Label wird abgeleitet, da es sich nicht um die genaue Vorhersage handelt, die Sie ausführen möchten. Eventuell hat der Nutzer das Video geöffnet, dann aber geschlossen. Dieses Ereignis wird als Aufruf gezählt, obwohl der Nutzer das Video nicht angesehen hat. In einigen Fällen ist eine solche Heuristik die einzige Option, aber Sie sollten sich über Ihren Labeltyp (direkt oder abgeleitet) und die Einschränkung Ihrer Vorhersagen informieren.
Direkt
Dieses Label kann in den meisten Fällen zu einer genauen Vorhersage führen, es ist jedoch nicht die genaue Vorhersage, die Sie ausführen möchten.