Machine Learning | Google for Developers

Перегляньте варіанти нижче.

Ми розглянули, як використовувати набори даних для тестування й навчання, щоб керувати ітераціями розробки моделі. Під час кожної ітерації ми тренували модель на навчальних даних і оцінювали її результати роботи з тестовими даними, а потім на основі результатів оцінювання вибирали й коригували різні гіперпараметри, зокрема швидкість навчання й ознаки. Чи є в цьому підході недолік? (Виберіть лише одну відповідь.)

Усе гаразд, модель тренується на навчальних даних, а оцінюється на окремих тестових даних, які використовуються лише для цього.

Власне, є маленький недолік. Подумайте, що може статися, якщо зробити багато таких ітерацій.

Багато циклів цієї процедури може спричинити неявне пристосування моделі до особливостей конкретного набору для тестування.

Так, дійсно! Що частіше ми оцінюємо модель на певному наборі тестових даних, то більше ризикуємо неявно пристосувати її до нього. Далі ми розглянемо кращий протокол.

Це неефективно з погляду обчислень. Слід просто створити стандартний набір гіперпараметрів і працювати з ними, щоб заощадити ресурси.

Такі ітерації вимагають великих витрат, проте вони є критично важливою частиною розробки моделі. Налаштування гіперпараметрів можуть суттєво вплинути на якість моделі, і ми завжди маємо виділяти певну кількість часу й обчислювальних ресурсів, щоб переконатися, що отримуємо найкращу можливу якість.