分類: しきい値の設定

ロジスティック回帰は確率を返します。返された確率をそのまま使用できます(たとえば、ユーザーがこの広告をクリックする可能性が 0.00023 の場合)。返された確率を 2 進数値に変換することもできます(たとえば、このメールは迷惑メールです)。

特定のメールに対して 0.9995 を返すロジスティック回帰モデルは、迷惑メールの可能性が非常に高いと予測しています。逆に、同じロジスティック回帰モデルで予測スコアが 0.0003 である別のメール メッセージは、迷惑メールではない可能性が高いです。予測スコアが 0.6 のメールについてはどうでしょうか。ロジスティック回帰値を 2 つのカテゴリにマッピングするには、分類しきい値決定しきい値ともいう)を定義する必要があります。このしきい値を超える値は「スパム」であることを示します。以下の値は「スパムではない」です。分類しきい値は常に 0.5 にする必要があると思われるかもしれませんが、しきい値は問題に依存するため、調整する必要があります。

以下のセクションでは、分類モデルの予測の評価に使用できる指標と、分類しきい値の変更が予測に与える影響を示します。