Przekształcanie danych liczbowych

Może być konieczne użycie 2 rodzajów przekształceń danych liczbowych:

  • Normalizowanie – przekształcanie danych liczbowych do tej samej skali co inne dane liczbowe.
  • Gromadzenie danych – przekształcanie danych liczbowych (zwykle w trybie ciągłym) w dane kategorialne.

Dlaczego normalizuje funkcje liczbowe?

Zdecydowanie zalecamy znormalizowanie zbioru danych obejmującego funkcje liczbowe, które obejmują wyraźnie różne zakresy (np. wiek i dochód). Gdy różne funkcje mają różne zakresy, spadek gradientu może &odbijać{0}, a spowalniać konwersację. Optymalizator, taki jak Adagrad i Adam, chroni przed tym problemem przez utworzenie oddzielnej efektywnej nauki.

Zalecamy również normalizację jednej funkcji liczbowej, która obejmuje szeroki zakres, np. &populację miasta." Jeśli nie znormalizujesz cechy &populacja miasta, trenowanie modelu może spowodować błędy NaN. Niestety optymalizatorzy tacy jak Adagrad i Adam nie mogą popełnić błędów NaN, gdy w jednej funkcji występuje wiele wartości.