Dati categorici: esercizi incrociati di caratteristiche

Playground è un'applicazione interattiva che ti consente di manipolare vari aspetti dell'addestramento e del test di un modello di machine learning. Con Playground, puoi selezionare le funzionalità e regolare gli iperparametri, per poi scoprire in che modo le tue scelte influenzano un modello.

Questa pagina contiene due esercizi che utilizzano i widget Playground incorporati sotto le istruzioni.

Esercizio 1: un incrocio di caratteristiche di base

Per questo esercizio, concentrati sulle seguenti parti dell'interfaccia utente di Playground:

  • Sotto FUNZIONALITÀ, nota le tre potenziali funzionalità del modello:
    • x1
    • x2
    • x1x2
  • Sotto OUTPUT, vedrai un quadrato contenente punti arancioni e blu. Immagina di guardare una foresta quadrata, dove i punti arancioni indicano la posizione degli alberi malati e i punti blu la posizione degli alberi sani.
  • Tra FEATURES e OUTPUT, se guardi molto da vicino, vedrai tre linee tratteggiate deboli che collegano ogni funzionalità all'output. La larghezza di ogni linea tratteggiata simboleggia il peso attualmente associato a ciascuna caratteristica. Queste linee sono molto deboli perché il peso iniziale per ogni funzionalità è inizializzato su 0. Man mano che il peso aumenta o diminuisce, anche lo spessore di queste linee cambierà.

Attività 1: esplora Playground procedendo nel seguente modo:

  1. Fai clic sulla linea sottile che collega la funzionalità x1 all'output. Viene visualizzato un popup.
  2. Nel popup, inserisci il peso 1.0.
  3. Premi Invio.

Tieni presente quanto segue:

  • La linea tratteggiata per x1 diventa più spessa man mano che il peso aumenta da 0 a 1.0.
  • Ora viene visualizzato uno sfondo arancione e blu.
    • Lo sfondo arancione indica le ipotesi del modello su dove si trovano gli alberi malati.
    • Lo sfondo blu indica le ipotesi del modello su dove si trovano gli alberi sani. Il modello sta facendo un lavoro pessimo: circa la metà delle ipotesi del modello sono sbagliate.
  • Poiché il peso è 1,0 per x1 e 0 per le altre caratteristiche, il modello corrisponde esattamente ai valori di x1.

Attività 2: modifica i pesi di una o tutte e tre le caratteristiche in modo che il modello (i colori di sfondo) preveda correttamente gli alberi malati e sani. La soluzione viene visualizzata appena sotto Playground.



Esercizio 2: un incrocio di caratteristiche più sofisticato

Per il secondo esercizio, esamina la disposizione dei punti arancioni (alberi malati) e dei punti blu (alberi sani) nel modello di output, notando quanto segue:

  • I punti formano pattern approssimativamente sferici.
  • La disposizione dei punti è irregolare. Ad esempio, nota i punti blu occasionali nella sfera esterna di punti arancioni. Di conseguenza, è improbabile che anche un ottimo modello preveda correttamente ogni punto.

Attività 1: esplora l'interfaccia utente di Playground procedendo nel seguente modo:

  1. Fai clic sul pulsante Esegui/Pausa, un triangolo bianco all'interno di un cerchio nero. Playground inizierà ad addestrare il modello. Osserva l'aumento del contatore delle epoche.
  2. Dopo che il sistema si è addestrato per almeno 300 epoche, premi lo stesso pulsante Esegui/Metti in pausa per sospendere l'addestramento.
  3. Guarda il modello. Il modello fa previsioni accurate? In altre parole, i punti blu sono generalmente circondati da uno sfondo blu e i punti arancioni sono generalmente circondati da uno sfondo arancione?
  4. Esamina il valore di Test loss (Perdita test), che viene visualizzato appena sotto OUTPUT. Questo valore è più vicino a 1,0 (perdita maggiore) o a 0 (perdita minore)?
  5. Reimposta Playground premendo la freccia curva a sinistra del pulsante Esegui/Pausa.

Attività 2: crea un modello migliore procedendo nel seguente modo:

  1. Seleziona o deseleziona qualsiasi combinazione delle cinque funzionalità possibili.
  2. Regola il tasso di apprendimento.
  3. Addestra il sistema per almeno 500 epoche.
  4. Esamina il valore di Test loss. Puoi ottenere una perdita dei dati di test inferiore a 0,2?

Le soluzioni vengono visualizzate sotto Playground.