Эта страница переведена с помощью Cloud Translation API.

Классификация: проверьте свое понимание (точность, точность, полнота)

Точность

Изучите варианты ниже.

В каком из следующих сценариев высокое значение точности предполагает, что модель машинного обучения работает хорошо?

Смертельное, но излечимое заболевание поражает 0,01% населения. Модель машинного обучения использует симптомы как признаки и предсказывает это заболевание с точностью 99,99%.

Точность здесь плохой показатель. В конце концов, даже «глупая» модель, которая всегда предсказывает «не болен», все равно будет точной на 99,99%. Ошибочное предсказание «не болен» для человека, который на самом деле болен, может быть смертельным.

Дорогой роботизированный цыпленок пересекает очень загруженную дорогу тысячу раз в день. Модель машинного обучения оценивает схемы движения и предсказывает, когда эта курица сможет безопасно перейти улицу с точностью 99,99%.

Значение точности 99,99% на очень оживленной дороге убедительно свидетельствует о том, что модель ML намного лучше, чем случайность. Однако в некоторых условиях цена даже небольшого количества ошибок все еще слишком высока. Точность 99,99% означает, что дорогого цыпленка нужно будет менять в среднем каждые 10 дней. (Курица также может нанести значительный ущерб автомобилям, в которые она врезается.)

В игре в рулетку шарик падает на вращающееся колесо и в конечном итоге попадает в один из 38 слотов. Используя визуальные характеристики (вращение мяча, положение колеса в момент падения мяча, высоту мяча над колесом), модель машинного обучения может предсказать слот, в который приземлится мяч, с точностью до 4%. .

Эта модель машинного обучения делает прогнозы намного лучше, чем случайность; случайное предположение было бы правильным в 1/38 случаев, что дает точность 2,6%. Хотя точность модели составляет «всего» 4%, преимущества успеха намного перевешивают недостатки неудачи.

Точность

Изучите варианты ниже.

Рассмотрим модель классификации, которая разделяет электронную почту на две категории: «спам» и «не спам». Если вы повысите порог классификации, что произойдет с точностью?

Однозначно увеличивать.

Повышение порога классификации обычно увеличивает точность; однако не гарантируется монотонное увеличение точности при повышении порога.

Вероятно увеличение.

В общем, повышение порога классификации уменьшает количество ложных срабатываний, тем самым повышая точность.

Вероятно снижение.

Однозначно уменьшать.

Отзывать

Изучите варианты ниже.

Рассмотрим модель классификации, которая разделяет электронную почту на две категории: «спам» и «не спам». Если поднять порог классификации, что будет с памятью?

Всегда увеличивать.

Повышение порога классификации вызовет оба следующих явления:

Количество истинных срабатываний уменьшится или останется прежним.
Количество ложноотрицательных результатов увеличится или останется прежним.

Таким образом, отзыв никогда не увеличится.

Всегда уменьшайте или оставайтесь на прежнем уровне.

Повышение нашего порога классификации приведет к тому, что количество истинных положительных результатов уменьшится или останется прежним, а количество ложных отрицательных результатов увеличится или останется прежним. Таким образом, припоминание либо останется постоянным, либо уменьшится.

Всегда оставаться постоянным.

Точность и отзыв

Изучите варианты ниже.

Рассмотрим две модели — A и B — каждая из которых оценивает один и тот же набор данных. Какое из следующих утверждений верно?

Если модель A имеет лучшую точность, чем модель B, то модель A лучше.

Хотя более высокая точность — это хорошо, она может быть достигнута за счет значительного снижения отзыва. В общем, нам нужно рассматривать как точность, так и полноту вместе, или сводные показатели, такие как AUC, о которых мы поговорим далее.

Если модель A лучше запоминает, чем модель B, то модель A лучше.

Хотя лучший отзыв — это хорошо, он может быть достигнут за счет значительного снижения точности. В общем, нам нужно рассматривать как точность, так и полноту вместе, или сводные показатели, такие как AUC, о которых мы поговорим далее.

Если модель A имеет лучшую точность и лучший отзыв, чем модель B, то модель A, вероятно, лучше.

В общем, модель, которая превосходит другую модель как по точности, так и по полноте, вероятно, является лучшей моделью. Очевидно, нам нужно убедиться, что сравнение выполняется в точке точности/отзыва, которая полезна на практике, чтобы это имело смысл. Например, предположим, что наша модель обнаружения спама должна иметь точность не менее 90%, чтобы быть полезной и избегать ненужных ложных тревог. В этом случае сравнение одной модели с точностью {20 %, полнота 99 %} с другой моделью с точностью {15 %, полнота 98 %} не особенно информативна, поскольку ни одна из моделей не соответствует требованию точности 90 %. Но с учетом этого предостережения это хороший способ подумать о сравнении моделей при использовании точности и полноты.

Центр помощи

Точность и отзыв

ROC-кривая и AUC