Интерпретация кривых потерь

Машинное обучение было бы легким делом, если бы все наши кривые потерь выглядели так, когда мы впервые обучали нашу модель:

График, показывающий идеальную кривую потерь при обучении модели машинного обучения. Кривая потерь отображает потери по оси Y в зависимости от количества шагов обучения по оси X. По мере увеличения количества шагов обучения потери начинаются высокими, затем экспоненциально уменьшаются и в конечном итоге выравниваются, достигая минимальных потерь.

Но на самом деле кривые потерь могут быть довольно сложными для интерпретации. Используйте свое понимание кривых потерь, чтобы ответить на следующие вопросы.

1. Моя модель не тренируется!

Ваш друг Мел и вы продолжаете работать над предсказателем внешности единорога. Вот ваша первая кривая потерь.

График кривой потерь с теми же осями, что и предыдущий график. Здесь потери не выравниваются, а хаотично увеличиваются и уменьшаются, так что сюжет колеблется.

Опишите проблему и то, как Мэл может ее решить:

2. Моя потеря взорвалась!

Мэл показывает вам другую кривую. Что здесь происходит и как она может это исправить? Напишите свой ответ ниже.

График кривой потерь, показывающий, как потери уменьшаются до определенного количества шагов обучения, а затем внезапно увеличиваются с дальнейшими шагами обучения.

3. Мои показатели противоречивы!

Мэл хочет, чтобы вы взяли другую кривую. Что происходит и как она может это исправить? Напишите свой ответ ниже.

На изображении показаны два графика. График слева показывает идеальную кривую потерь. График справа показывает, что показатель отзыва остается равным 0 даже при увеличении количества шагов обучения.

Опишите проблему и то, как Мэл может ее решить:

4. Потери при тестировании чертовски высоки!

Мел показывает вам кривые потерь для обучения и тестирования наборов данных и спрашивает: «Что не так?» Напишите свой ответ ниже.

График кривой потерь, показывающий расхождение между потерями при обучении и тестировании по мере обучения модели.

Опишите проблему и то, как Мэл может ее решить:

5. Моя модель застревает

Вы терпеливы, когда через несколько дней Мел возвращается с еще одной кривой. Что здесь происходит и как Мэл может это исправить?

График кривой потерь, показывающий, что потери начинают сходиться по мере обучения, но затем отображаются повторяющиеся модели, которые выглядят как прямоугольная волна.

Опишите проблему и то, как Мэл может ее решить:

Это работает!

"Теперь все работает отлично!" — восклицает Мэл. Она торжествующе откидывается на спинку стула и глубоко вздыхает. Изгиб выглядит великолепно, и вы сияете от достижений. Мел и вы обсудите следующие дополнительные проверки для проверки вашей модели.

  • реальные показатели
  • базовые линии
  • абсолютная потеря для проблем регрессии
  • другие показатели для задач классификации
  • График, показывающий сходящуюся кривую потерь.