Zapoznaj się z tymi opcjami.

Różne miasta w Kalifornii wyraźnie się różnią ceny nieruchomości. Załóżmy, że musisz utworzyć model do prognozowania cen nieruchomości. Który z poniższych można dowiedzieć się więcej o tych zestawach cech lub krzyżowych cechach, zależności między miastami a roomsPerPerson ceny nieruchomości?
Trzy osobne przypisane obiekty: [binned latitude], [binned longitude], [binned roomPerPerson]
Powiązanie jest dobre, ponieważ pozwala modelowi uczyć się nielinii relacji w obrębie danej cechy. Jednak miasto istnieje w więcej niż 1 wymiar, aby poznawać zależności między miastami wymaga podania szerokości i długości geograficznej.
Jeden krzyżyk: [szerokość X długość geograficzna X roomsPerPerson]
W tym przykładzie przekraczanie cech rzeczywistych wartości nie jest dobrym pomysłem. Przekroczenie rzeczywistej wartości, na przykład szerokości geograficznej, RoomPerPerson włącza 10-procentową zmianę w 1 obiekcie (np. szerokości geograficznej) to odpowiednik 10% zmiany innej cechy (np. RoomPerPerson).
Krzyżowa cecha: [binned width X binned longitude X binned roomsPerPerson]
Przecięcie szerokości geograficznej i długości geograficznej powoduje, że: aby poznać wpływ parametru „roomPerPerson” na poszczególne miasta. Binning zapobiega zmianie szerokości geograficznej wywołującej ten sam wynik jako zmianę długości geograficznej. W zależności od szczegółowości w kontenerach, ten krzyż może nauczyć się z najbliższych okolic, a nawet blokad.
Krzyżujące się dwie cechy: [binned latitude X binned RoomPerPerson] i [binned longitude X binned RoomPerPerson]
Dobrym pomysłem jest Binning, jednak miasto to łącznik szerokości i długości geograficznej, przez co oddzielne krzyżówki na podstawie cen w poszczególnych miastach.