طبقه بندی: آستانه

رگرسیون لجستیک یک احتمال را برمی گرداند. می توانید از احتمال برگشتی "همانطور که هست" استفاده کنید (مثلاً احتمال کلیک کاربر روی این تبلیغ 0.00023 است) یا احتمال برگشتی را به یک مقدار باینری تبدیل کنید (مثلاً این ایمیل اسپم است).

یک مدل رگرسیون لجستیک که 0.9995 را برای یک پیام ایمیل خاص برمی گرداند، پیش بینی می کند که احتمال اسپم بودن آن بسیار زیاد است. برعکس، پیام ایمیل دیگری با امتیاز پیش‌بینی 0.0003 در همان مدل رگرسیون لجستیک به احتمال زیاد اسپم نیست. با این حال، در مورد یک پیام ایمیل با امتیاز پیش بینی 0.6 چطور؟ به منظور ترسیم یک مقدار رگرسیون لجستیک به یک دسته باینری، باید یک آستانه طبقه بندی (که آستانه تصمیم نیز نامیده می شود) تعریف کنید. مقدار بالاتر از این آستانه نشان دهنده "هرزنامه" است. مقدار زیر نشان دهنده "نه هرزنامه" است. وسوسه انگیز است که فرض کنیم آستانه طبقه بندی همیشه باید 0.5 باشد، اما آستانه ها به مشکل وابسته هستند و بنابراین مقادیری هستند که باید آنها را تنظیم کنید.

بخش‌های زیر نگاهی دقیق‌تر به معیارهایی دارد که می‌توانید برای ارزیابی پیش‌بینی‌های یک مدل طبقه‌بندی استفاده کنید، و همچنین تأثیر تغییر آستانه طبقه‌بندی بر این پیش‌بینی‌ها.