Перша нейронна мережа

Мета цієї вправи – навчати нашу першу невелику нейронну мережу. За допомогою нейронних мереж можна вивчати нелінійні моделі без використання явних поєднань ознак.

Завдання 1. У наведеній моделі дві вхідні ознаки об’єднано в один нейрон. Чи здатна ця модель вивчати нелінійні відношення? Запустіть її, щоб підтвердити свої здогадки.

Завдання 2. Спробуйте збільшити кількість нейронів у прихованому шарі з 1 до 2, а також змінити лінійну функцію активації на нелінійну, наприклад ReLU. Чи вдасться вам створити модель, яка здатна вивчати нелінійні відношення? Чи може вона ефективно моделювати дані?

Завдання 3. Спробуйте збільшити кількість нейронів у прихованому шарі з 2 до 3, використовуючи нелінійну функцію активації, таку як ReLU. Чи може модель ефективно моделювати дані? Як змінюється якість моделі з кожним запуском?

Завдання 4. Продовжуйте експериментувати, додаючи або видаляючи приховані шари й нейрони в кожному шарі. Також можете змінювати швидкість навчання, регуляризацію і інші параметри навчання. Яку найменшу кількість нейронів і шарів можна використати, щоб втрати при тестуванні становили 0,177 або менше?

Чи впливає збільшення розміру моделі на те, як вона пристосовується або як швидко збігається? Чи впливає це на те, як часто при збіжності отримується модель, що дає гарні результати? Для прикладу спробуйте архітектуру, указану нижче.

  • Перший прихований шар із трьома нейронами.
  • Другий прихований шар із трьома нейронами.
  • Третій прихований шар із двома нейронами.

(Відповіді наведено відразу під вправою.)