以下のオプションをご検討ください。
メールを 2 つのカテゴリに分割する分類モデルについて考えてみましょう。
「Spam」[迷惑メールではない]を選択します分類しきい値を引き上げると、
どうなるでしょうか
確実に増やしましょう
分類しきい値を大きくすると、通常は適合率が向上します。
ただし、精度が単調に向上することは
自動的に適用されます
おそらく増加するでしょう。
一般に、分類しきい値を上げると、誤検出が
適合率も向上します。
おそらく減少するでしょう。
一般に、分類しきい値を上げると、誤検出が
適合率も向上します。
確実に減らす
一般に、分類しきい値を上げると、誤検出が
適合率も向上します。
以下のオプションをご検討ください。
メールを 2 つのカテゴリに分割する分類モデルについて考えてみましょう。
「Spam」[迷惑メールではない]を選択します分類しきい値を引き上げると、
どうなるでしょうか
常に増やします。
分類しきい値を引き上げると、次の両方が発生します。
<ph type="x-smartling-placeholder">
- </ph>
- 真陽性の数が減少または減少する 変わりません。
- 偽陰性の数が増加または減少し、 変わりません。
減らすか、そのままにします。
分類しきい値を引き上げると、分類のしきい値を
真陽性が減少するか同じになるように変更し
増加させるか変わらないかを考えます。したがって、次のようになります。
再現率は一定になるか減少します
常に一定に保つ。
分類しきい値を引き上げると、分類のしきい値を
真陽性の割合が減るか維持され
増加させるか変わらないかを考えます。したがって、次のようになります。
再現率は一定になるか減少します
以下のオプションをご検討ください。
同じデータセットを評価する 2 つのモデル(A と B)について考えてみましょう。
次の説明のうち、正しいものを 1 つ選択してください。
モデル A の精度がモデル B よりも高い場合、
モデル A の方が優れています。
精度が向上すると良いが、その代償が伴う可能性がある
再現率が大幅に低下します一般的には、
適合率と再現率の両方を算出したり、AUC などのサマリー指標を使用したりできます。
これについては次に説明します
モデル A の再現率がモデル B より優れている場合、モデル A の再現率は
向上します
再現率の向上は良いことですが、
精度が大幅に落ちることになります。一般的に、
適合率と再現率を一緒に確認することも、サマリー指標を
AUC などです。
モデル A の適合率と再現率がモデル B より優れている場合、
モデル A の方がおそらく適切です。
一般的に、両方の側面で別のモデルより優れたパフォーマンスを発揮するモデルは、
適合率と再現率のモデルの方がおそらく優れています。明らかに、
同じタイミングで比較を
このために実際に役立つ適合率 / 再現率の点
意味があります。たとえば、Google のスパム検出モデルが
90% 以上の精度が必要です
不要な誤検知を排除できます。この例では
1 つのモデルを {20% の適合率、99% の再現率} で
{適合率 15%、再現率 98%} は特に有益ではないので、
どちらのモデルも 90% の精度の要件を満たしません。注意点として
この方法は、モデルを使用する際のモデルの比較を
適合率と再現率です