Zapoznaj się z tymi opcjami.
Różne miasta w Kalifornii wyraźnie się różnią
ceny nieruchomości.
Załóżmy, że musisz utworzyć model do prognozowania cen nieruchomości. Który z poniższych
można dowiedzieć się więcej o tych zestawach cech lub krzyżowych cechach,
zależności między miastami a
roomsPerPerson
ceny nieruchomości?
Trzy osobne przypisane obiekty: [binned latitude],
[binned longitude], [binned roomPerPerson]
Powiązanie jest dobre, ponieważ pozwala modelowi uczyć się nielinii
relacji w obrębie danej cechy. Jednak miasto istnieje w
więcej niż 1 wymiar, aby poznawać zależności między miastami
wymaga podania szerokości i długości geograficznej.
Jeden krzyżyk: [szerokość X długość geograficzna X
roomsPerPerson]
W tym przykładzie przekraczanie cech rzeczywistych wartości nie jest dobrym pomysłem.
Przekroczenie rzeczywistej wartości, na przykład szerokości geograficznej,
RoomPerPerson włącza 10-procentową zmianę w 1 obiekcie (np. szerokości geograficznej)
to odpowiednik 10% zmiany innej cechy (np.
RoomPerPerson).
Krzyżowa cecha: [binned width X binned longitude X binned
roomsPerPerson]
Przecięcie szerokości geograficznej i długości geograficznej powoduje, że:
aby poznać wpływ parametru „roomPerPerson” na poszczególne miasta.
Binning zapobiega zmianie szerokości geograficznej wywołującej ten sam wynik
jako zmianę długości geograficznej. W zależności od szczegółowości
w kontenerach, ten krzyż może nauczyć się
z najbliższych okolic, a nawet blokad.
Krzyżujące się dwie cechy: [binned latitude X binned RoomPerPerson]
i [binned longitude X binned RoomPerPerson]
Dobrym pomysłem jest Binning, jednak miasto to łącznik
szerokości i długości geograficznej, przez co oddzielne krzyżówki
na podstawie cen w poszczególnych miastach.