Поздравляем с завершением подготовки данных и проектирования функций для машинного обучения!
Теперь вы должны лучше понимать, как:
- Признайте относительное влияние качества и размера данных на алгоритмы.
- Установите обоснованные и реалистичные ожидания относительно времени, необходимого для преобразования данных.
- Объясните типичный процесс сбора и преобразования данных в рамках общего рабочего процесса машинного обучения.
- Соберите необработанные данные и создайте набор данных.
- Выборка и разделение набора данных с учетом несбалансированных данных.
- Преобразование числовых и категориальных данных.