分类:阈值

逻辑回归会返回一个概率。您可以按原样使用返回的概率(例如,用户点击此广告的可能性为 0.00023),或将返回的概率转换为二元值(例如,此电子邮件为垃圾邮件)。

针对特定电子邮件返回 0.9995 的逻辑回归模型会预测其很可能是垃圾邮件。相反,同一逻辑回归模型中预测分数为 0.0003 的另一封电子邮件很可能不是垃圾邮件。但是,如果预测分数为 0.6 的电子邮件呢?为了将逻辑回归值映射到二元类别,您必须定义分类阈值(也称为决策阈值)。如果邮件数量超过该阈值,则表示“垃圾邮件”;如果值低于该阈值,则表示“非垃圾邮件”。 人们很容易认为分类阈值应始终为 0.5,但阈值取决于具体问题,因此您必须调整阈值。

以下部分详细介绍了可用于评估分类模型预测结果的指标,以及更改分类阈值对这些预测结果的影响。