Sprawdź swoją wiedzę

Poniżej znajdziesz pytania, które pomogą Ci utrwalić Twoją wiedzę na temat podstawowych pojęć związanych z systemami uczącymi się.

Moc predykcyjna

Modele nadzorowanych systemów uczących się są trenowane przy użyciu zbiorów danych z przykładami oznaczonymi etykietami. Model uczy się prognozować etykietę na podstawie cech. Jednak nie każda funkcja w zbiorze danych ma moc prognozowania. W niektórych przypadkach tylko kilka elementów jest prognozowanych dla etykiety. W poniższym zbiorze danych użyj ceny jako etykiety, a pozostałe kolumny jako funkcji.

Przykład oznaczonych etykietami atrybutów samochodu.

Które 3 cechy są według Ciebie największymi prognozami dotyczącymi ceny samochodu?
Marka_modelu, rok, mile
Marka/model, rok i przebieg samochodu należą prawdopodobnie do najsilniejszych prognoz dotyczących ceny.
Kolor, wysokość, marka_modelu.
Wysokość i kolor samochodu nie są mocnym prognozowaniem ceny samochodu.
Mile, skrzynia biegów, marka_modelu.
Skrzynia biegów nie jest głównym elementem prognozy ceny.
Rozmiar_opony, rozstaw_kół, rok.
Rozmiar opon i rozstaw kół nie są dobrym prognozą ceny samochodu.

Nauka nadzorowana i nienadzorowana

W zależności od problemu zastosujesz metodę nadzorowaną lub nienadzorowaną. Jeśli na przykład wiesz już, którą wartość lub kategorię chcesz wygenerować, użyj nauki nadzorowanej. Jeśli jednak chcesz sprawdzić, czy Twój zbiór danych zawiera segmenty lub grupy powiązanych przykładów, skorzystaj z uczenia się nienadzorowanego.

Załóżmy, że masz zbiór danych o użytkownikach witryny zakupowej online, który zawiera następujące kolumny:

Obraz przedstawiający wiersz atrybutów klienta.

Chcesz się dowiedzieć, jacy użytkownicy odwiedzają stronę internetową. Czy wykorzystasz w tym przypadku naukę nadzorowaną czy nienadzorowaną?
Uczenie się bez nadzoru.
Chcemy, aby model grupował grupy powiązanych klientów, więc wykorzystujemy uczenie się nienadzorowane. Gdy model połączył użytkowników, utworzyliśmy własne nazwy dla każdego klastra, na przykład „poszukiwacze rabatów”, „łowcy okazji”, „surferzy”, „lojalni” i „łapacze”.
Nadzorowane uczenie się, ponieważ próbuję przewidzieć, do której klasy należy użytkownik.
W nadzorowanym procesie uczenia się zbiór danych musi zawierać etykietę, którą próbujesz przewidzieć. W zbiorze danych nie ma etykiety odwołującej się do kategorii użytkownika.

Załóżmy, że masz zbiór danych zużycia energii dla domów zawierający te kolumny:

Obraz przedstawiający wiersz atrybutów domu.

Jakiego rodzaju ML użyjesz do prognozowania liczby kilowatogodzin zużycia rocznie przez nowo wybudowany dom?
Nauczanie nadzorowane.
Nadzorowane trenowanie na przykładach oznaczonych etykietami. W tym zbiorze danych „kilowatogodzinna zużyta roczna wartość” będzie etykietą, ponieważ jest to wartość, którą model ma prognozować. Cechy te to „Powierzchnia całkowita”, „Lokalizacja” i „Rok budowy”.
Uczenie się bez nadzoru.
Uczenie się nienadzorowane wykorzystuje przykłady bez etykiet. W tym przykładzie etykietą „kilowatogodzinna zużyta rocznie” byłaby etykieta, ponieważ jest to wartość, którą model ma prognozować.

Załóżmy, że masz zbiór danych dotyczących lotów zawierający te kolumny:

Obraz wiersza danych dotyczących lotu.

Chcesz przewidzieć koszt biletu autobusowego. Czy użyjesz regresji czy klasyfikacji?
Regresja
Wynikiem modelu regresji jest wartość liczbowa.
Klasyfikacja
Dane wyjściowe modelu klasyfikacji to wartość dyskretna, zwykle słowo. W tym przypadku koszt biletu autobusowego jest wartością liczbową.
Czy na podstawie zbioru danych możesz wytrenować model klasyfikacji tak, aby sklasyfikował koszt biletu autobusowego jako „wysoki”, „średni” lub „niski”?
Tak, ale najpierw musimy przekonwertować wartości liczbowe w kolumnie coach_ticket_cost na wartości kategorialne.
Model klasyfikacji można utworzyć na podstawie zbioru danych. Wykonaj na przykład to:
  1. Znajdź średni koszt biletu z lotniska wylotu na lotnisko docelowe.
  2. Określ progi zawierające wartości „wysokie”, „średnie” i „niskie”.
  3. Porównaj prognozowany koszt z progami i podaj kategorię, do której należy wartość.
Nie. Utworzenie modelu klasyfikacji nie jest możliwe. Wartości coach_ticket_cost są numeryczne, a nie kategorialne.
Przy odrobinie pracy możesz utworzyć model klasyfikacji.
Nie. Modele klasyfikacji służą do prognozowania tylko 2 kategorii, np. spam lub not_spam. Model ten musiałby przewidzieć 3 kategorie.
Modele klasyfikacji mogą prognozować wiele kategorii. Nazywamy je wieloklasowymi modelami klasyfikacji.

Trenowanie i ocena

Po wytrenowaniu modelu oceniamy go za pomocą zbioru danych z przykładami oznaczonymi etykietami i porównujemy przewidywaną wartość modelu z rzeczywistą wartością etykiety.

Wybierz 2 najlepsze odpowiedzi na pytanie.

Jeśli prognozy modelu są odległe, co możesz zrobić, aby je poprawić?
Wytrenuj model ponownie, ale używaj tylko funkcji, które według Ciebie mają najsilniejszą moc prognozowania.
Ponowne trenowanie modelu z mniejszą liczbą funkcji, ale o większej skuteczności prognoz, może pomóc w uzyskaniu modelu umożliwiającego uzyskanie lepszych prognoz.
Nie można naprawić modelu, którego prognozy są odległe.
Można naprawić model, który ma wyłączone prognozy. Większość modeli wymaga kilku rund trenowania, zanim wygenerują przydatne prognozy.
Wytrenuj model ponownie przy użyciu większego i bardziej różnorodnego zbioru danych.
Modele trenowane na zbiorach danych z większą liczbą przykładów i szerszym zakresem wartości mogą generować lepsze prognozy, ponieważ model ma lepsze uogólnione rozwiązanie dotyczące relacji między cechami a etykietą.
Spróbuj innej metody trenowania. Na przykład jeśli używasz metody nadzorowanej, wypróbuj metodę nienadzorowaną.
Inna metoda trenowania nie zapewni lepszych prognoz.

Możesz teraz wykonać kolejny krok w pracy z systemami uczącymi się:

  • People + AI Guidebook (Przewodnik dla ludzi + AI). Jeśli szukasz zestawu metod, sprawdzonych metod i przykładów przedstawionych przez pracowników Google, ekspertów branżowych i badania akademickie dotyczące korzystania z systemów uczących się.

  • Problem z umieszczaniem w ramkach. Jeśli szukasz sprawdzonego sposobu tworzenia modeli ML i unikania typowych błędów,

  • Szybkie szkolenie z systemów uczących się Jeśli chcesz zdobyć szczegółową wiedzę o systemach uczących się w praktyce.