Наборы данных, обобщение и переобучение: проверьте свои знания

  1. Что из перечисленного является примером стационарного набора данных?

  2. Вы готовитесь к обучению модели для прогнозирования продажной цены подержанных автомобилей, используя набор данных, содержащий следующие функции: year , model и mileage . Изучив набор данных, вы обнаружите, что значения пробега отсутствуют в 150 из 2500 примеров. Какой из следующих вариантов было бы разумно предпринять? (Выберите все, что подходит)

    Выбирайте столько ответов, сколько считаете нужным.

  3. Вы обучаете модель рекомендаций фильмов стримингового сервиса прогнозировать мнение пользователей о конкретном фильме. Какие из следующих вариантов были бы разумными заменителями фразы «Пользователю понравился фильм»? (Выберите все подходящие варианты)

    Выбирайте столько ответов, сколько считаете нужным.

  4. Верно или неверно: Обучение модели до достижения низкого значения функции потерь на тестовых данных — хороший способ предотвратить переобучение.

  5. Заполните пропуск в следующем предложении:
    Регуляризация улучшает способность вашей модели обобщать новые данные, наказывая ___ во время обучения.