Confira as opções abaixo.
As cidades da Califórnia têm uma diferença significativa
preços de imóveis.
Suponha que você precise criar um modelo para prever valores de moradias. Qual das
conjuntos de atributos ou cruzamentos de atributos podem aprender
relações específicas de cidade entre
roomsPerPerson e
o preço da casa?
Três atributos agrupados por classes: [latitude agrupada por classes],
[longitude agrupada por classes], [quartos por pessoa agrupados por classes]
A criação de agrupamentos por classes é boa porque permite que o modelo aprenda recursos
relações em um único atributo. No entanto, uma cidade existe
mais de uma dimensão, então aprender relações específicas da cidade
exige o cruzamento de latitude e longitude.
Um cruzamento de atributos: [latitude X longitude X
roomsPerPerson]
Neste exemplo, cruzar atributos com valor real não é uma boa ideia.
Cruzar o valor real da latitude com
O RoomPerPerson permite uma alteração de 10% em um atributo (por exemplo, latitude).
para ser equivalente a uma mudança de 10% no outro atributo (digamos,
quartos por pessoa).
Um cruzamento de atributos: [latitude agrupada por classes X longitude agrupada por classes X agrupada
roomsPerPerson]
O cruzamento da latitude por classes com a longitude agrupada por classes permite que
para aprender os efeitos de quartos por pessoa específicos da cidade.
O agrupamento por classes impede que uma alteração na latitude produza o mesmo resultado
como uma mudança na longitude. Dependendo da granularidade
os agrupamentos, esse cruzamento de atributos pode aprender informações específicas de uma cidade
efeitos específicos do bairro ou mesmo do bloco.
Dois cruzamentos de atributos: [latitude agrupada por classes X quartos agrupados por pessoa]
e [longitude agrupada por classes X quartos por pessoa agrupados por classes]
Agrupamento por classes é uma boa ideia. No entanto, uma cidade é a conjunção de
latitude e longitude. Assim, cruzamentos de atributos separados impedem que o
com base nos preços específicos das cidades.