Изучите варианты ниже.
Мы рассмотрели процесс использования тестового набора и обучающего набора для запуска итераций разработки модели. На каждой итерации мы тренировались на обучающих данных и оценивали тестовые данные, используя результаты оценки тестовых данных, чтобы направлять выбор и изменения различных гиперпараметров модели, таких как скорость обучения и функции. Что-то не так с этим подходом? (Выберите только один ответ.)
Совершенно нормально, мы тренируемся на обучающих данных и оцениваем отдельные пропущенные тестовые данные.
На самом деле здесь есть одна тонкая проблема. Подумайте о том, что могло бы произойти, если бы мы сделали много-много итераций этой формы.
Выполнение многих циклов этой процедуры может привести к неявному соответствию особенностям нашего конкретного набора тестов.
Да, в самом деле! Чем чаще мы оцениваем данный набор тестов, тем больше мы рискуем неявно переобучиться этому одному набору тестов. Далее мы рассмотрим лучший протокол.
Это вычислительно неэффективно. Мы должны просто выбрать набор гиперпараметров по умолчанию и жить с ними для экономии ресурсов.
Хотя такого рода итерации обходятся дорого, они являются важной частью разработки модели. Настройки гиперпараметров могут иметь огромное значение для качества модели, и мы всегда должны выделять определенное количество времени и вычислительных ресурсов, чтобы гарантировать максимально возможное качество.