Zbiory danych, uogólnianie i nadmierne dopasowanie – sprawdź swoją wiedzę

Która z tych opcji jest przykładem nieruchomego zbioru danych?

Wskaźniki opadów deszczu w Seattle w stanie Waszyngton

Katalog nut z symfonii Beethovena

Słowa najczęściej używane w spamie

Codzienna sprzedaż biletów w kinie

Przygotowujesz się do wytrenowania modelu do prognozowania ceny sprzedaży używanych samochodów za pomocą zbioru danych zawierającego te funkcje: `year`, `model` i `mileage`. Po sprawdzeniu zbioru danych stwierdzasz, że w 150 z 2500 przykładów brakuje wartości przebiegu. Która z tych opcji jest Twoim rozsądnym działaniem? (Wybierz wszystkie pasujące odpowiedzi)

Wybierz tyle odpowiedzi, ile uważasz za stosowne.

Usuwam te 150 przykładów ze zbioru danych

Usunięcie kolumny mileage ze zbioru danych i trenowanie modelu tylko na podstawie roku i modelu

Wstawianie wartości 0 do wszystkich pustych pól przebiegu

Określamy szacunkową wartość mileage dla każdego pustego pola przez pomnożenie wieku samochodu przez średni roczny przebieg wszystkich samochodów w zbiorze danych

Trenujesz model rekomendacji filmów w usłudze streamingowej, aby przewidywać nastawienie użytkowników do danego filmu. Które z poniższych etykiet mogą być odpowiednimi etykietami zastępczymi dla etykiety „Użytkownikowi podobał się film”? (Można wybrać kilka odpowiedzi).

Wybierz tyle odpowiedzi, ile uważasz za stosowne.

Użytkownik zapisał film na liście „Chcę obejrzeć”.

Użytkownik kliknął „Rozpocznij oglądanie filmu”.

Użytkownik polecił film innemu użytkownikowi.

Użytkownik przyznał filmowi 5 gwiazdek.

Prawda czy fałsz: wytrenowanie modelu aż do osiągnięcia niskiej wartości straty na danych testowych to dobry sposób na uniknięcie nadmiernego dopasowania.

Prawda

Fałsz

Uzupełnij to pole w tym zdaniu:
Regularizacja poprawia zdolność modelu do uogólniania na nowe dane przez nałożenie kary na ___ podczas trenowania.

Nieprawidłowe prognozy

Tempo uczenia się

złożoność

Gradient gradientowy

Która z tych opcji jest przykładem nieruchomego zbioru danych?

Trenujesz model rekomendacji filmów w usłudze streamingowej, aby przewidywać nastawienie użytkowników do danego filmu. Które z poniższych etykiet mogą być odpowiednimi etykietami zastępczymi dla etykiety „Użytkownikowi podobał się film”? (Można wybrać kilka odpowiedzi).

Prawda czy fałsz: wytrenowanie modelu aż do osiągnięcia niskiej wartości straty na danych testowych to dobry sposób na uniknięcie nadmiernego dopasowania.

Uzupełnij to pole w tym zdaniu: Regularizacja poprawia zdolność modelu do uogólniania na nowe dane przez nałożenie kary na ___ podczas trenowania.

Uzupełnij to pole w tym zdaniu:
Regularizacja poprawia zdolność modelu do uogólniania na nowe dane przez nałożenie kary na ___ podczas trenowania.