Швидкість навчання й збіжність
Це перша з кількох вправ в інтерактивному середовищі. Інтерактивне середовище – програма, розроблена спеціально для цього курсу, щоб допомогти вивчати принципи машинного навчання. У кожну таку вправу із цього курсу включено вбудований екземпляр інтерактивного середовища з попередньо встановленими параметрами.
Для кожної вправи в інтерактивному середовищі генерується набір даних. Його мітка має два можливих значення. Ви можете уявити, що це "спам" і "не спам" або "здорові дерева" й "хворі дерева". Мета більшості вправ – налаштувати різні гіперпараметри, щоб створити модель, яка успішно класифікує (відокремлює або розрізняє) ці значення мітки. Зверніть увагу, що в більшості наборів даних є певна кількість шумів, через які неможливо успішно класифікувати кожен приклад.
Інтерфейс, доступний у цій вправі, складається з трьох кнопок:
| Значок | Назва | Опис |
|---|---|---|
|
|
Скинути | Скидає ітерації до 0. Скидає всі значення ваги, які модель уже вивчила. |
|
|
Крок | Переходить на одну ітерацію вперед. З кожною ітерацією модель змінюється – непомітно або кардинально. |
|
|
Згенерувати повторно | Генерує новий набір даних. Не скидає ітерації. |
У цій першій вправі інтерактивного середовища ви поекспериментуєте зі швидкістю навчання, виконавши два завдання.
Завдання 1. Зверніть увагу на меню Швидкість навчання у верхньому правому куті інтерактивного середовища. Зазначена швидкість навчання (3) дуже висока. Поспостерігайте, як вона впливає на вашу модель, натиснувши кнопку "Крок" 10 або 20 разів. Зверніть увагу на те, як кардинально змінюється візуалізація моделі після кожної ранньої ітерації. Можливо, ви навіть побачите певну нестабільність після того, як модель ніби досягла збіжності. Також зверніть увагу на лінії, проведені від x1 і x2 до візуалізації моделі. Параметри ваги ліній означають вагу цих ознак у моделі. Тобто жирна лінія вказує на велику вагу.
Завдання 2. Виконайте такі кроки:
- натисніть кнопку Скинути;
- знизьте показник Швидкість навчання;
- натисніть кнопку "Крок" кілька разів.
Як нижча швидкість навчання вплинула на збіжність моделі? Проаналізуйте кількість кроків, необхідних для її досягнення, а також те, наскільки цей процес плавний і стабільний. Поекспериментуйте зі ще меншими значеннями швидкості навчання. Можете виявити швидкість навчання, яка буде занизькою, щоб приносити користь? (Коментар до цього запитання наведено під вправою.)