Zestaw walidacji

Partycjonowanie zbioru danych do zbioru treningowego i testowego pozwala ocenić, czy dany model dobrze uogólni się na nowe dane. Jednak używanie tylko 2 partycji może nie wystarczyć do przeprowadzenia wielu rund dostrajania hiperparametrów.

Weryfikacja

Schemat przepływu pracy składający się z 3 etapów. 1. Wytrenuj model na zbiorze treningowym. 2. Ocena modelu na zbiorze testowym. 3. Dostosowanie modelu na podstawie wyników z zestawu testowego. Powtórz punkty 1, 2 i 3, aby ostatecznie wybrać model, który najlepiej sprawdza się na zbiorze testowym.
Poziomy pasek podzielony na 3 części: 70% zbiór do trenowania, 15% – zbiór do walidacji, a 15% zbiór testowy
Przepływ pracy jest podobny do tego na Rysunku 1. Jedyna różnica jest taka, że zamiast oceniać model na podstawie zbioru testowego, przepływ pracy porównuje go ze zbiorem walidacji. Następnie, gdy zbiór treningowy i walidacja
w większym lub mniejszym stopniu zgadzają się z nimi, potwierdź model w zbiorze testowym.