Dati categorici: esercizi incrociati di caratteristiche

Playground è un'applicazione interattiva che consente di manipolare vari aspetti dell'addestramento e del test di un modello di machine learning. Con Playground puoi selezionare le funzionalità e regolare gli iperparametri, e poi scoprire in che modo le tue scelte influiscono su un modello.

Questa pagina contiene due esercizi Playground.

Esercizio 1: un incrocio di caratteristiche di base

Per questo esercizio, concentrati sulle seguenti parti dell'interfaccia utente di Playground:

  • Sotto FEATURES, sono elencate le tre potenziali caratteristiche del modello:
    • x1
    • x2
    • x1x2
  • Sotto OUTPUT, vedrai un quadrato contenente punti arancioni e blu. Immagina di essere in una foresta quadrata, dove i punti arancioni contrassegnano la posizione degli alberi malati, mentre i punti blu contrassegnano la la posizione degli alberi sani.
  • Se osservi attentamente, tra FEATURES e OUTPUT vedrai tre linee tratteggiate sottili che collegano ogni elemento all'output. La larghezza di ogni linea tratteggiata simboleggia il peso attualmente associato a ogni funzionalità. Queste linee sono molto deboli perché la ponderazione iniziale di ciascuna caratteristica è inizializzata a 0. Man mano che l'intensità aumenta o diminuisce, lo stesso accade per lo spessore di queste linee.

Attività 1: esplora Playground nel seguente modo:

  1. Fai clic sulla linea sottile che collega la caratteristica x1 all'output. Viene visualizzato un popup.
  2. Nella finestra popup, inserisci il peso: 1.0.
  3. Premi Invio.

Tieni presente quanto segue:

  • La linea tratteggiata per x1 diventa più spessa man mano che il peso aumenta. da 0 a 1,0.
  • Viene visualizzato uno sfondo arancione e blu.
    • Lo sfondo arancione indica le supposizioni del modello sulla posizione degli alberi malati.
    • Lo sfondo blu indica le supposizioni del modello sulla posizione degli alberi sani. Il modello sta facendo un lavoro pessimo: circa la metà delle ipotesi del modello sbagliato.
  • Poiché il peso è 1,0 per x1 e 0 per le altre caratteristiche, il modello corrisponde esattamente ai valori di x1.

Attività 2: modifica il peso di una o di tutte e tre le caratteristiche in modo che (i colori di sfondo) riesce a prevedere in modo efficace alberi. La soluzione viene visualizzata appena sotto Playground.



Esercizio 2: incrocio di caratteristiche più sofisticato

Per il secondo esercizio, osserva la disposizione dei punti arancioni (alberi malati) e punti blu (alberi integri) nel modello di output, notando quanto segue:

  • I punti formano motivi approssimativamente sferici.
  • La disposizione dei punti è rumorosa; ad esempio, noterai punti azzurri occasionali nella sfera esterna di punti arancioni. Di conseguenza, anche un grande modello è improbabile che preveda correttamente ogni punto.

Attività 1: esplora l'interfaccia utente di Playground nel seguente modo:

  1. Fai clic sul pulsante Esegui/Metti in pausa, ovvero un triangolo bianco all'interno di un cerchio nero. Playground inizierà ad addestrare il modello; osservare il contatore delle epoche aumenta.
  2. Dopo che il sistema è stato addestrato per almeno 300 epoche, premi lo stesso pulsante di esecuzione/pausa per mettere in pausa l'addestramento.
  3. Guarda il modello. Il modello sta facendo buone previsioni? In altre parole, i punti blu sono generalmente circondati da uno sfondo blu e i punti arancioni sono generalmente circondati da uno sfondo arancione?
  4. Esamina il valore di Perdita test, visualizzato appena sotto OUTPUT. È questo un valore più vicino a 1,0 (perdita maggiore) o più vicino a 0 (perdita inferiore)?
  5. Reimposta Playground premendo la freccia sinuosa a sinistra dell' Pulsante Esegui/Pausa.

Attività 2: crea un modello migliore seguendo questi passaggi:

  1. Seleziona o deseleziona qualsiasi combinazione delle cinque possibili funzionalità.
  2. Regola il tasso di apprendimento.
  3. Addestra il sistema per almeno 500 epoche.
  4. Esaminare il valore di "Test loss". Si può ottenere una perdita di test inferiore a 0,2?

Le soluzioni vengono visualizzate sotto Playground.