Zestawy treningowe i testowe
Wracamy do Playground, aby eksperymentować z zestawami treningowymi
i zbiory testowe.
Aby przypomnieć sobie, co oznaczają pomarańczowe i niebieskie kropki, kliknij ikonę plusa.
W wizualizacji:
- Każdy niebieski punkt oznacza jedną przykładową klasę danych (np.
spam).
- Każda pomarańczowa kropka oznacza jeden przykład innej klasy danych (na przykład
np. nie spam).
- Kolor tła reprezentuje przewidywane miejsce występowania przykładów
taki kolor. Niebieskie tło wokół niebieskiej kropki
oznacza, że model poprawnie przewiduje ten przykład. I odwrotnie:
pomarańczowe tło wokół niebieskiej kropki oznacza, że model
niepoprawna prognoza dla tego przykładu.
To ćwiczenie zawiera zarówno zbiór testowy, jak i treningowy,
taki sam zbiór danych. Domyślnie wizualizacja pokazuje tylko trenowanie
ustawiony. Jeśli chcesz wyświetlić również zestaw testowy, kliknij
pole wyboru Pokaż dane testowe tuż pod wizualizacją. W
pamiętaj o tym rozróżnieniu:
- Przykłady treningowe mają biały kontur.
- Przykłady testowe mają czarny kontur.
Zadanie 1. Uruchom Playground z podanymi ustawieniami, wykonując
:
- Kliknij przycisk Uruchom/Wstrzymaj:

- Obserwuj zmianę wartości straty testowej i trenowania.
- Gdy wartości utraty testu i trenowania przestają się zmieniać
lub zmieniać tylko raz na jakiś czas, naciśnij przycisk Uruchom/Wstrzymaj
aby wstrzymać działanie Playground.
.
Zwróć uwagę na różnicę między utratą testową a utratą trenowania. Postaramy się ograniczyć
w następujących zadaniach.
Zadanie 2. Wykonaj te czynności:
- Naciśnij przycisk Resetuj.

- Zmień Nauka
konw.
- Naciśnij przycisk Uruchom/Wstrzymaj:
- Pozwól Playground działać przez co najmniej 150 epoek.
Czy różnica między utratą testową a utratą trenowania jest mniejsza, czy
wyższy przy nowym tempie uczenia się? Co się stanie, jeśli zmodyfikujesz oba
Tempo uczenia się
rozmiaru wsadu?
Opcjonalne zadanie 3. Suwak z etykietą Procent danych treningowych
pozwala kontrolować odsetek danych treningowych do testowania. Przykład:
po ustawieniu na 90% 90% danych jest używanych przez zbiór treningowy,
pozostałych 10% zostanie wykorzystane na potrzeby zbioru testowego.
Wykonaj te czynności:
- Zmniejsz „Procent danych treningowych” od 50% do 10%.
- Eksperymentuj z tempem uczenia się i rozmiarem wsadu, robiąc notatki
wyniki.
.
Czy zmiana odsetka danych treningowych zmienia optymalną
ustawienia, które udało Ci się znaleźć w zadaniu 2? Jeżeli tak, dlaczego?
Kliknij ikonę plusa, aby odpowiedzieć na zadanie 1.
Gdy tempo uczenia się jest ustawione na 3 (ustawienie początkowe),
Strata testu jest znacznie większa niż utrata trenowania.
Kliknij ikonę plusa, aby odpowiedzieć na zadanie 2.
Zmniejszając tempo uczenia się (np.do 0, 001),
Utrata testów spada do wartości znacznie bliższej utracie podczas trenowania. W większości biegów
zwiększenie rozmiaru wsadu nie ma wpływu na trenowanie ani test
ich znaczne straty. Jednak w niewielkim odsetku uruchomień wzrost
Wielkość wsadu do co najmniej 20 powoduje nieco spadek utraty testu
poniżej wartości Straty trenowania.
Zbiory danych Playground są generowane losowo. W związku z tym nasze
odpowiedzi nie zawsze muszą być całkowicie zgodne z Twoimi.
Kliknij ikonę plusa, aby odpowiedzieć na zadanie 3.
Znaczne zmniejszenie procentu danych treningowych z 50% do 10%.
zmniejsza liczbę punktów danych w zbiorze treningowym. Przy tak małej ilości danych
duży rozmiar wsadu i wysokie tempo uczenia się powodują przeskoki modelu trenowania
chaotycznie (wielokrotne przeskakiwanie przez minimalny punkt).