W tej sekcji zdefiniujemy główne elementy składowe danych, które wykorzystamy do oceny modeli klasyfikacji. Ale najpierw:
Powieść Aesop: chłopiec, który wykrzyknął wilka (skompresowany)
Olbrzywy chłopiec znudzi się stadem miasta. Aby się bawić, krzyczy: „Wiolu!" nawet, gdy nie widać tutaj żadnego wilka. Mieszkańcy wioski biegają, aby chronić stado, ale potem wściekają się, gdy zorientują się, że chłopcy żartują.
[Powtórzenie poprzedniego akapitu N razy]
Pewnej nocy sam chłopiec wkleja stado na zewnątrz i wywołuje morzu: „Wilczy!” Mieszkańcy wsi odmawiają się po raz kolejny, aby zostać oszukani i zostać w swoich domach. Wygłodzony wilk zmienia stada kociołków w kotlety jagnięciny. Miasto głoduje. Napady paniki.
Utwórz takie definicje:
- "Wolf" to klasa pozytywnego wyniku.
- "Żaden wilk nie jest klasą negatywną.
Nasz model & prognozowania wilków można podsumować za pomocą tabeli pomyłek 2 x 2, która przedstawia wszystkie 4 możliwe efekty:
True dodatnie (TP):
|
Fałszywy dodatni:
|
Fałszywy wynik FN:
|
Prawidłowe wykluczenie (TN):
|
prawda: to wynik, w którym model prawidłowoprzewiduje klasę dodatnią. Analogicznie rzeczywista wartość ujemna to wynik, w którym model prawidłowo prognozuje klasę ujemną.
Fałszywy wynik to wynik, który model nieprawidłowo prognozuje klasę pozytywną. Fałsz oznacza, że model nieprawidłowo prognozuje klasę ujemną.
W kolejnych sekcjach przyjrzymy się sposób oceny modeli klasyfikacji na podstawie danych pochodzących z tych 4 wyników.