Explora las opciones que aparecen a continuación.

Las distintas ciudades de California son muy diferentes precios de la vivienda. Suponga que tiene la tarea de crear un modelo para predecir esos precios. ¿Cuál de los los siguientes conjuntos de atributos o combinaciones de atributos relaciones específicas de una ciudad entre roomsPerPerson y el precio de la vivienda?
Tres atributos discretos separados: [binned latitude], [longitud discreta], [ambientesPorPersona discretos]
La discretización es útil porque permite que el modelo aprenda no lineal relaciones dentro de un solo atributo. Sin embargo, existe una ciudad en más de una dimensión, por lo que aprender relaciones específicas de cada ciudad requiere latitud y longitud que se crucen.
Una combinación de atributos: [latitud X longitud X roomsPerPerson]
En este ejemplo, combinar atributos con valores reales no es una buena idea. La combinación del valor real de, por ejemplo, la latitud con habitacionesPorPersona habilita un cambio del 10% en un atributo (p. ej., latitud) a un cambio del 10% en el otro atributo (por ejemplo, habitacionesPorPersona).
Una combinación de atributos: [latitud discreta X longitud discreta X discretizada roomsPerPerson]
La combinación de latitud discretizada con longitud discretizada permite la para aprender los efectos específicos de la ciudad de ambientesPorPersona. La discretización impide que un cambio en la latitud produzca el mismo resultado. como un cambio en la longitud. Según el nivel de detalle de las discretizaciones, esta combinación de atributos podría aprender efectos específicos del vecindario o incluso de bloques.
Dos combinaciones de atributos: [latitud discreta X ambientesPorPersona discretos] y [longitud discreta X ambientesPorPersona discretos].
La discretización es una buena idea; sin embargo, una ciudad es la conjunción de latitud y longitud, de manera que las combinaciones de atributos separadas evitan a partir del aprendizaje de precios específicos de cada ciudad.