Explora las opciones que aparecen a continuación.
Las distintas ciudades de California
son muy diferentes
precios de la vivienda.
Suponga que tiene la tarea de crear un modelo para predecir esos precios. ¿Cuál de los
los siguientes conjuntos de atributos o combinaciones de atributos
relaciones específicas de una ciudad entre
roomsPerPerson y
el precio de la vivienda?
Tres atributos discretos separados: [binned latitude],
[longitud discreta], [ambientesPorPersona discretos]
La discretización es útil porque permite que el modelo aprenda no lineal
relaciones dentro de un solo atributo. Sin embargo, existe una ciudad en
más de una dimensión, por lo que aprender
relaciones específicas de cada ciudad
requiere latitud y longitud que se crucen.
Una combinación de atributos: [latitud X longitud X
roomsPerPerson]
En este ejemplo, combinar atributos con valores reales no es una buena idea.
La combinación del valor real de, por ejemplo, la latitud con
habitacionesPorPersona habilita un cambio del 10% en un atributo (p. ej., latitud)
a un cambio del 10% en el otro atributo (por ejemplo,
habitacionesPorPersona).
Una combinación de atributos: [latitud discreta X longitud discreta X discretizada
roomsPerPerson]
La combinación de latitud discretizada con longitud discretizada permite la
para aprender los efectos específicos de la ciudad de ambientesPorPersona.
La discretización impide que un cambio en la latitud produzca el mismo resultado.
como un cambio en la longitud. Según el nivel de detalle de
las discretizaciones, esta combinación de atributos podría aprender
efectos específicos del vecindario o incluso de bloques.
Dos combinaciones de atributos: [latitud discreta X ambientesPorPersona discretos]
y [longitud discreta X ambientesPorPersona discretos].
La discretización es una buena idea; sin embargo, una ciudad es la conjunción de
latitud y longitud, de manera que las combinaciones de atributos separadas evitan
a partir del aprendizaje
de precios específicos de cada ciudad.