عبور از عرض؟
قبل از تماشای ویدیو یا خواندن مستندات، لطفاً این تمرین را تکمیل کنید که استفاده بیش از حد از تلاقی های ویژگی را بررسی می کند.
وظیفه 1: مدل را همانطور که هست اجرا کنید، با تمام ویژگی های محصول متقابل داده شده. آیا هیچ شگفتی در نحوه مطابقت مدل با داده ها وجود دارد؟ مشکل چیست؟
وظیفه 2: سعی کنید ویژگی های مختلف محصولات متقابل را حذف کنید تا عملکرد را بهبود بخشید (البته فقط اندکی). چرا حذف ویژگی ها باعث بهبود عملکرد می شود؟
(پاسخ ها درست در زیر تمرین ظاهر می شوند.)
برای پاسخ به کار 1 روی نماد مثبت کلیک کنید.
با کمال تعجب، مرز تصمیم گیری مدل به نوعی عجیب به نظر می رسد. به طور خاص، یک ناحیه در سمت چپ بالا وجود دارد که به رنگ آبی اشاره دارد، حتی اگر هیچ پشتیبانی قابل مشاهده ای برای آن در داده ها وجود ندارد.
به ضخامت نسبی پنج خطی که از INPUT تا OUTPUT اجرا می شوند توجه کنید. این خطوط وزن نسبی پنج ویژگی را نشان می دهد. خطوطی که از X 1 و X 2 سرچشمه میگیرند بسیار ضخیمتر از خطوطی هستند که از صلیبهای ویژگی میآیند. بنابراین، تلاقی های ویژگی نسبت به ویژگی های معمولی (تقاطع نشده) به مدل کمک می کنند.
برای پاسخ به Task 2 روی نماد مثبت کلیک کنید.
حذف تمام تلاقیهای ویژگی مدل معقولتری به دست میدهد (دیگر مرز منحنی حاکی از تطبیق بیش از حد وجود ندارد) و باعث میشود ضرر تست همگرا شود.
پس از 1000 تکرار، از دست دادن تست باید کمی کمتر از زمانی باشد که تلاقی ویژگیها در حال بازی بودند (اگرچه نتایج شما ممکن است بسته به مجموعه دادهها کمی متفاوت باشد).
داده های این تمرین اساسا داده های خطی به اضافه نویز هستند. اگر از مدلی بسیار پیچیده استفاده کنیم، مانند مدلی با ضربدرهای زیاد، به آن فرصت میدهیم تا با نویز در دادههای آموزشی تطبیق یابد، که اغلب به قیمت عملکرد بد مدل در دادههای آزمایشی تمام میشود.