ML Practicum: classificazione delle immagini

Verifica la comprensione: convoluzione

A una mappa delle funzionalità di input bidimensionale 4x4 viene applicato un filtro convoluzionale bidimensionale 3x3 (non viene aggiunto alcun padding):

Qual è la forma della mappa delle caratteristiche di output?
2x2
Quando il filtro 3x3 scorre sulla mappa delle funzionalità 4x4, ci sono 4 posizioni uniche in cui può essere posizionato, il che genera una mappa delle funzionalità di output 2x2: Animazione che mostra un filtro convoluzionale 3x3 che scorre su una mappa delle caratteristiche 4x4.
           Esistono 4 posizioni uniche in cui è possibile inserire il filtro 3x3, ognuna corrispondente a
           uno dei 4 elementi nella mappa delle funzionalità di output 2x2.
3x3
Sebbene il filtro stesso sia 3x3, la mappa delle caratteristiche di output è più piccola perché ci sono meno di 9 (3 x 3) posizioni possibili in cui il filtro può essere posizionato sulla mappa delle caratteristiche di input 4x4.
4x4
Per generare una mappa delle funzionalità di output con le stesse dimensioni della mappa delle funzionalità di input senza padding, il filtro convoluzionale deve avere una forma 1x1. Un filtro più grande di 1x1 produrrà una mappa delle caratteristiche di output più piccola della mappa delle caratteristiche di input. Poiché il nostro filtro è 3x3, la mappa delle caratteristiche di output deve essere più piccola di 4x4.