Zbiory danych, uogólnianie i nadmierne dopasowanie – sprawdź swoją wiedzę

  1. Która z tych opcji jest przykładem nieruchomego zbioru danych?

  2. Przygotowujesz się do wytrenowania modelu do prognozowania ceny sprzedaży używanych samochodów za pomocą zbioru danych zawierającego te funkcje: year, model i mileage. Po sprawdzeniu zbioru danych stwierdzasz, że w 150 z 2500 przykładów brakuje wartości przebiegu. Która z tych opcji jest Twoim rozsądnym działaniem? (Wybierz wszystkie pasujące odpowiedzi)

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  3. Trenujesz model rekomendacji filmów w usłudze streamingowej, aby przewidywać nastawienie użytkowników do danego filmu. Które z poniższych etykiet mogą być odpowiednimi etykietami zastępczymi dla etykiety „Użytkownikowi podobał się film”? (Można wybrać kilka odpowiedzi).

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  4. Prawda czy fałsz: wytrenowanie modelu aż do osiągnięcia niskiej wartości straty na danych testowych to dobry sposób na uniknięcie nadmiernego dopasowania.

  5. Uzupełnij to pole w tym zdaniu:
    Regularizacja poprawia zdolność modelu do uogólniania na nowe dane przez nałożenie kary na ___ podczas trenowania.