این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

صلیب های ویژه: تمرینات زمین بازی

معرفی صلیب های ویژگی

آیا یک ویژگی متقاطع واقعاً یک مدل را قادر می‌سازد تا داده‌های غیرخطی را مطابقت دهد؟ برای فهمیدن این موضوع، این تمرین را امتحان کنید.

وظیفه: سعی کنید با تغییر دستی وزن سه ویژگی ورودی زیر، مدلی ایجاد کنید که نقاط آبی را از نقاط نارنجی جدا کند:

x ₁
x ₂
x ₁ x ₂ (یک متقاطع ویژگی)

برای تغییر دستی وزنه:

روی خطی که FEATURES را به OUTPUT متصل می کند کلیک کنید. یک فرم ورودی ظاهر می شود.
یک مقدار ممیز شناور را در آن فرم ورودی تایپ کنید.
Enter را فشار دهید.

توجه داشته باشید که رابط این تمرین حاوی دکمه Step نیست. به این دلیل است که این تمرین به طور مکرر یک مدل را آموزش نمی دهد. بلکه به صورت دستی وزن های "نهایی" مدل را وارد می کنید.

(پاسخ ها درست در زیر تمرین ظاهر می شوند.)

برای پاسخ روی نماد مثبت کلیک کنید.

w ₁ = 0
w ₂ = 0
x ₁ x ₂ = 1 (یا هر مقدار مثبت)

اگر مقدار منفی را برای متقاطع ویژگی وارد کنید، مدل نقاط آبی را از نقاط نارنجی جدا می کند اما پیش بینی ها کاملاً اشتباه خواهد بود. یعنی مدل برای نقاط آبی رنگ نارنجی و برای نقاط نارنجی رنگ آبی را پیش بینی می کند.

صلیب های ویژگی های پیچیده تر

حالا بیایید با چند ترکیب ترکیبی از ویژگی های پیشرفته بازی کنیم. مجموعه داده‌ها در این تمرین زمین بازی کمی شبیه به یک گلوله پر سر و صدا از بازی دارت است، با نقاط آبی در وسط و نقاط نارنجی در یک حلقه بیرونی.

برای توضیح تصویرسازی مدل، روی نماد مثبت کلیک کنید.

هر تمرین Playground تصویری از وضعیت فعلی مدل را نشان می دهد. به عنوان مثال، در اینجا یک تجسم وجود دارد:

در مورد تجسم مدل به موارد زیر توجه کنید:

هر محور نشان دهنده یک ویژگی خاص است. در مورد هرزنامه در مقابل غیر هرزنامه، ویژگی ها می تواند تعداد کلمات و تعداد گیرندگان ایمیل باشد.
توجه: مقادیر محور مناسب به داده های ویژگی بستگی دارد. مقادیر محور نشان داده شده در بالا برای تعداد کلمات یا تعداد گیرندگان معنی ندارد، زیرا هیچ کدام نمی توانند منفی باشند.
هر نقطه مقادیر ویژگی را برای یک نمونه از داده ها، مانند ایمیل، ترسیم می کند.
رنگ نقطه نشان دهنده کلاسی است که مثال به آن تعلق دارد. به عنوان مثال، نقاط آبی می تواند نشان دهنده ایمیل های غیر اسپم باشد در حالی که نقاط نارنجی می توانند نشان دهنده ایمیل های هرزنامه باشند.
رنگ پس زمینه نشان دهنده پیش بینی مدل از جایی است که نمونه هایی از آن رنگ باید پیدا شود. پس زمینه آبی اطراف یک نقطه آبی به این معنی است که مدل به درستی آن مثال را پیش بینی می کند. برعکس، یک پس‌زمینه نارنجی در اطراف یک نقطه آبی به این معنی است که مدل به اشتباه آن مثال را پیش‌بینی می‌کند.
رنگ های آبی و نارنجی پس زمینه کوچک شده اند. به عنوان مثال، سمت چپ تصویر به رنگ آبی یکدست است اما به تدریج در مرکز تجسم به رنگ سفید محو می شود. شما می توانید قدرت رنگ را به عنوان نشان دهنده اطمینان مدل در حدس خود در نظر بگیرید. بنابراین آبی یکدست به این معنی است که مدل در مورد حدس خود بسیار مطمئن است و آبی روشن به این معنی است که مدل اعتماد به نفس کمتری دارد. (تجسم مدل نشان داده شده در شکل، کار پیش بینی ضعیفی را انجام می دهد.)

از تجسم برای قضاوت در مورد پیشرفت مدل خود استفاده کنید. ("عالی—بیشتر نقاط آبی پس زمینه آبی دارند" یا "اوه نه! نقاط آبی پس زمینه نارنجی دارند.") فراتر از رنگ ها، Playground افت فعلی مدل را نیز به صورت عددی نمایش می دهد. ("اوه نه! ضرر به جای پایین آمدن بالا می رود.")

وظیفه 1: این مدل خطی را همانطور که داده شد اجرا کنید. یک یا دو دقیقه (اما نه دیگر) را صرف تنظیمات مختلف نرخ یادگیری کنید تا ببینید آیا می‌توانید پیشرفت‌هایی پیدا کنید. آیا یک مدل خطی می تواند نتایج موثری برای این مجموعه داده ایجاد کند؟

وظیفه 2: اکنون سعی کنید ویژگی های متقابل محصولی مانند x ₁ x ₂ را اضافه کنید و سعی کنید عملکرد را بهینه کنید.

کدام ویژگی بیشتر کمک می کند؟
بهترین عملکردی که می توانید داشته باشید چیست؟

وظیفه 3: هنگامی که یک مدل خوب دارید، سطح خروجی مدل (که با رنگ پس زمینه نشان داده شده است) را بررسی کنید.

آیا شبیه مدل خطی است؟
مدل را چگونه توصیف می کنید؟

(پاسخ ها درست در زیر تمرین ظاهر می شوند.)

برای پاسخ به وظیفه 1 روی نماد مثبت کلیک کنید.

خیر. یک مدل خطی نمی تواند به طور موثر این مجموعه داده را مدل کند. کاهش نرخ یادگیری، ضرر را کاهش می دهد، اما از دست دادن همچنان در یک مقدار غیر قابل قبول بالا همگرا می شود.

برای پاسخ به Task 2 روی نماد مثبت کلیک کنید.

مجموعه داده های زمین بازی به صورت تصادفی تولید می شوند. در نتیجه، پاسخ های ما ممکن است همیشه دقیقاً با پاسخ شما مطابقت نداشته باشد. در واقع، اگر مجموعه داده‌ها را بین اجراها بازسازی کنید، نتایج شما همیشه دقیقاً با اجراهای قبلی شما مطابقت نخواهد داشت. گفته شد، با انجام کارهای زیر نتایج بهتری خواهید گرفت:

استفاده از هر دو x ₁ ² و x ₂ ² به عنوان تلاقی ویژگی. (افزودن x ₁ x ₂ به عنوان متقاطع ویژگی کمکی به نظر نمی رسد.)
کاهش نرخ یادگیری ، شاید به 0.001 .

برای پاسخ به وظیفه 3 روی نماد مثبت کلیک کنید.

سطح خروجی مدل شبیه مدل خطی نیست. بلکه بیضوی به نظر می رسد.

مرکز کمک

قبلی

عبور از بردارهای تک داغ

بعدی

تمرین برنامه نویسی