Эта страница переведена с помощью Cloud Translation API.

Логистическая регрессия: потери и регуляризация

Модели логистической регрессии обучаются с использованием того же процесса, что и модели линейной регрессии , с двумя ключевыми отличиями:

В моделях логистической регрессии в качестве функции потерь используется логарифмическая функция потерь (Log Loss) вместо квадратичной функции потерь (Square Loss) .
Применение регуляризации имеет решающее значение для предотвращения переобучения .

В следующих разделах эти два аспекта рассматриваются более подробно.

Потери логарифма

В модуле линейной регрессии вы использовали квадратичную функцию потерь (также называемую функцией потерь _L2 ). Квадратичная функция потерь хорошо подходит для линейной модели, где скорость изменения выходных значений постоянна. Например, для линейной модели $y' = b + 3x_1$ каждый раз, когда вы увеличиваете входное значение $x_1$ на 1, выходное значение $y'$ увеличивается на 3.

Однако скорость изменения модели логистической регрессии не постоянна. Как вы видели в разделе «Вычисление вероятности» , сигмоидная кривая имеет S-образную, а не линейную форму. Когда значение логарифма отношения шансов ($z$) ближе к 0, небольшие увеличения $z$ приводят к гораздо большим изменениям $y$, чем когда $z$ является большим положительным или отрицательным числом. В следующей таблице показаны выходные данные сигмоидной функции для входных значений от 5 до 10, а также соответствующая точность, необходимая для учета различий в результатах.

вход	логистический выход	требуемая точность цифр
5	0,993	3
6	0,997	3
7	0,999	3
8	0.9997	4
9	0.9999	4
10	0.99998	5

Если использовать квадратичную функцию потерь для вычисления ошибок сигмоидной функции, то по мере приближения выходного значения к 0 и 1 потребуется больше памяти для сохранения точности, необходимой для отслеживания этих значений.

Вместо этого, функцией потерь для логистической регрессии является Log Loss . Уравнение для расчета Log Loss возвращает логарифм величины изменения, а не просто расстояние от данных до прогноза. Log Loss рассчитывается следующим образом:

$\text{Log Loss} = -\frac{1}{N}\sum_{i=1}^{N} [y_i\log(y_i') + (1 - y_i)\log(1 - y_i')]$

где:

$N$ — это количество размеченных примеров в наборе данных.
$i$ является индексом примера в наборе данных (например, $(x_3, y_3)$(это третий пример в наборе данных)
$y_i$ это метка для $i$Пример. Поскольку это логистическая регрессия, $y_i$ должно быть либо 0, либо 1.
$y_i'$ Это предсказание вашей модели для... $i$th пример (где-то между 0 и 1), учитывая набор признаков в $x_i$.

Нажмите на значок, чтобы узнать больше о потерях древесины.

Эта форма функции логарифмической потери вычисляет среднюю логарифмическую потерю по всем точкам в наборе данных. Использование средней логарифмической потери (в отличие от общей логарифмической потери) желательно на практике, поскольку это позволяет нам разделить настройку размера пакета и скорости обучения.

Регуляризация в логистической регрессии

Регуляризация , механизм, снижающий сложность модели во время обучения, чрезвычайно важна в моделировании логистической регрессии. Без регуляризации асимптотический характер логистической регрессии будет постоянно стремиться к нулю в случаях, когда модель имеет большое количество признаков. Следовательно, большинство моделей логистической регрессии используют одну из следующих двух стратегий для снижения сложности модели:

_L2- регуляризация
Ранняя остановка : ограничение количества тренировочных этапов, позволяющее прекратить тренировки, когда потери веса еще не прекратились.

Центр поддержки

Вычисление вероятности (10 мин)

Проверьте свои знания (10 мин)

Логистическая регрессия: потери и регуляризация Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

Потери логарифма

Нажмите на значок, чтобы узнать больше о потерях древесины.

Регуляризация в логистической регрессии

Логистическая регрессия: потери и регуляризация