بخش های بعدی این دو ملاحظات را عمیق تر مورد بحث قرار می دهد.
از دست دادن گزارش
در ماژول رگرسیون خطی ، از تلفات مربعی (که از دست دادن L 2 نیز نامیده می شود) به عنوان تابع ضرر استفاده کردید. تلفات مربعی برای یک مدل خطی که در آن نرخ تغییر مقادیر خروجی ثابت است به خوبی کار می کند. به عنوان مثال، با توجه به مدل خطی $y' = b + 3x_1$، هر بار که مقدار ورودی $x_1$ را 1 افزایش می دهید، مقدار خروجی $y'$ 3 افزایش می یابد.
با این حال، نرخ تغییر یک مدل رگرسیون لجستیک ثابت نیست . همانطور که در محاسبه یک احتمال دیدید، منحنی سیگموئید به جای خطی، s شکل است. وقتی مقدار log-odds ($z$) به 0 نزدیکتر است، افزایشهای کوچک در $z$ منجر به تغییرات بسیار بزرگتری به $y$ میشود تا زمانی که $z$ یک عدد مثبت یا منفی بزرگ است. جدول زیر خروجی تابع سیگموئید را برای مقادیر ورودی از 5 تا 10 و همچنین دقت متناظر مورد نیاز برای ثبت تفاوت در نتایج را نشان می دهد.
ورودی
خروجی لجستیک
ارقام مورد نیاز دقت
5
0.993
3
6
0.997
3
7
0.999
3
8
0.9997
4
9
0.9999
4
10
0.99998
5
اگر از مجذور تلفات برای محاسبه خطاها برای تابع سیگموئید استفاده میکردید، چون خروجی به 0 و 1 نزدیکتر و نزدیکتر میشد، برای حفظ دقت لازم برای ردیابی این مقادیر به حافظه بیشتری نیاز دارید.
در عوض، تابع ضرر برای رگرسیون لجستیک Log Loss است. معادله Log Loss لگاریتم بزرگی تغییر را به جای فاصله بین داده تا پیشبینی برمیگرداند. Log Los به صورت زیر محاسبه می شود:
\((x,y)\in D\) مجموعه داده ای است که شامل نمونه های برچسب گذاری شده زیادی است که عبارتند از \((x,y)\) جفت
\(y\) برچسب در یک مثال برچسب زده شده است. از آنجایی که این رگرسیون لجستیک است، هر مقدار از \(y\) باید 0 یا 1 باشد.
\(y'\) با توجه به مجموعه ویژگیهای موجود، پیشبینی مدل شما (جایی بین 0 و 1) است \(x\).
منظم سازی در رگرسیون لجستیک
منظمسازی ، مکانیزمی برای جریمه کردن پیچیدگی مدل در طول آموزش، در مدلسازی رگرسیون لجستیک بسیار مهم است. بدون منظمسازی، ماهیت مجانبی رگرسیون لجستیک در مواردی که مدل دارای تعداد زیادی ویژگی است، ضرر را به سمت صفر نگه میدارد. در نتیجه، اکثر مدلهای رگرسیون لجستیک از یکی از دو استراتژی زیر برای کاهش پیچیدگی مدل استفاده میکنند:
تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی.
[[["درک آسان","easyToUnderstand","thumb-up"],["مشکلم را برطرف کرد","solvedMyProblem","thumb-up"],["غیره","otherUp","thumb-up"]],[["اطلاعاتی که نیاز دارم وجود ندارد","missingTheInformationINeed","thumb-down"],["بیشازحد پیچیده/ مراحل بسیار زیاد","tooComplicatedTooManySteps","thumb-down"],["قدیمی","outOfDate","thumb-down"],["مشکل ترجمه","translationIssue","thumb-down"],["مشکل کد / نمونهها","samplesCodeIssue","thumb-down"],["غیره","otherDown","thumb-down"]],["تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی."],[[["Logistic regression models are trained similarly to linear regression models but use Log Loss instead of squared loss and require regularization."],["Log Loss is used in logistic regression because the rate of change isn't constant, requiring varying precision levels unlike squared loss used in linear regression."],["Regularization, such as L2 regularization or early stopping, is crucial in logistic regression to prevent overfitting due to the model's asymptotic nature."]]],[]]