زمینه: مدل مولد چیست؟

"تولید کننده" در نام "شبکه متخاصم مولد" به چه معناست؟ " تولید کننده" دسته ای از مدل های آماری را توصیف می کند که با مدل های افتراقی در تضاد است.

غیر رسمی:

  • مدل های مولد می توانند نمونه های داده جدیدی تولید کنند.
  • مدل های تمایز بین انواع مختلف نمونه های داده تمایز قائل می شوند.

یک مدل زایشی می‌تواند عکس‌های جدیدی از حیوانات ایجاد کند که شبیه حیوانات واقعی هستند، در حالی که یک مدل متمایز می‌تواند سگ را از گربه تشخیص دهد. GAN ها تنها یک نوع مدل مولد هستند.

به طور رسمی تر، با توجه به مجموعه ای از نمونه های داده X و مجموعه ای از برچسب های Y:

  • مدل‌های مولد احتمال مشترک p(X, Y) یا فقط p(X) را در صورت عدم وجود برچسب دریافت می‌کنند.
  • مدل‌های متمایز احتمال شرطی p(Y | X) را دریافت می‌کنند.

یک مدل تولیدی شامل توزیع خود داده است و به شما می گوید که یک مثال مشخص چقدر محتمل است. به عنوان مثال، مدل‌هایی که کلمه بعدی را در یک دنباله پیش‌بینی می‌کنند، معمولاً مدل‌های مولد هستند (معمولاً بسیار ساده‌تر از GAN) زیرا می‌توانند یک احتمال را به دنباله‌ای از کلمات اختصاص دهند.

یک مدل تبعیض‌آمیز این سؤال را نادیده می‌گیرد که آیا یک نمونه معین محتمل است یا خیر، و فقط به شما می‌گوید که چقدر احتمال دارد یک برچسب برای نمونه اعمال شود.

توجه داشته باشید که این یک تعریف بسیار کلی است. انواع مختلفی از مدل های تولیدی وجود دارد. GAN ها تنها یک نوع مدل مولد هستند.

احتمالات مدلسازی

هیچ‌یک از مدل‌ها نباید عددی را که یک احتمال را نشان می‌دهد برگرداند. شما می توانید توزیع داده ها را با تقلید از آن توزیع مدل کنید.

به عنوان مثال، یک طبقه‌بندی‌کننده متمایز مانند درخت تصمیم می‌تواند یک نمونه را بدون تخصیص احتمال به آن برچسب برچسب‌گذاری کند. چنین طبقه‌بندی‌کننده‌ای همچنان یک مدل خواهد بود، زیرا توزیع همه برچسب‌های پیش‌بینی‌شده، توزیع واقعی برچسب‌ها را در داده‌ها مدل می‌کند.

به طور مشابه، یک مدل تولیدی می‌تواند یک توزیع را با تولید داده‌های «جعلی» متقاعدکننده که به نظر می‌رسد از آن توزیع گرفته شده است، مدل‌سازی کند.

مدل های مولد سخت هستند

مدل‌های مولد نسبت به مدل‌های متمایز مشابه با کار دشوارتری مقابله می‌کنند. مدل های مولد باید بیشتر مدل کنند.

یک مدل تولیدی برای تصاویر ممکن است همبستگی هایی مانند "چیزهایی که شبیه قایق هستند احتمالاً در نزدیکی چیزهایی که شبیه آب هستند ظاهر می شوند" و "چشم ها بعید است روی پیشانی ظاهر شوند" را ثبت کند. اینها توزیع های بسیار پیچیده ای هستند.

در مقابل، یک مدل متمایز ممکن است تفاوت بین "قایق بادبانی" یا "قایق بادبانی نه" را فقط با جستجوی چند الگوی گویا بیاموزد. می‌تواند بسیاری از همبستگی‌هایی را که مدل مولد باید درست انجام دهد نادیده بگیرد.

مدل‌های متمایز سعی می‌کنند مرزهایی را در فضای داده ترسیم کنند، در حالی که مدل‌های مولد سعی می‌کنند نحوه قرارگیری داده‌ها در سراسر فضا را مدل کنند. به عنوان مثال، نمودار زیر مدل های متمایز و مولد ارقام دست نویس را نشان می دهد:

دو نمودار، یکی با برچسب "مدل افتراقی" و دیگری با برچسب "مدل مولد". هر دو نمودار همان چهار نقطه داده را نشان می دهند. هر نقطه با تصویر رقم دست نویسی که نشان دهنده آن است برچسب گذاری شده است. در نمودار متمایز، یک خط نقطه چین وجود دارد که دو نقطه داده را از دو نقطه باقی مانده جدا می کند. ناحیه بالای خط نقطه چین 'y=0' و ناحیه زیر خط با 'y=1' برچسب گذاری شده است. در نمودار مولد دو دایره نقطه چین در اطراف دو جفت نقطه رسم شده است. دایره بالایی دارای برچسب 'y=0' و دایره پایینی با برچسب 'y=1' است

شکل 1: مدل های متمایز و مولد ارقام دست نویس.

مدل تمایز سعی می کند با کشیدن خطی در فضای داده تفاوت بین 0 و 1 های دست نویس را تشخیص دهد. اگر خط را به درستی دریافت کند، می‌تواند 0ها را از 1 تشخیص دهد بدون اینکه نیازی به مدل‌سازی دقیقاً جایی باشد که نمونه‌ها در فضای داده در دو طرف خط قرار می‌گیرند.

در مقابل، مدل مولد سعی می کند با تولید ارقامی که نزدیک به همتایان واقعی خود در فضای داده قرار می گیرند، 1 و 0 قانع کننده تولید کند. باید توزیع را در سراسر فضای داده مدل کند.

GAN ها روشی موثر برای آموزش چنین مدل های غنی برای شبیه سازی یک توزیع واقعی ارائه می دهند. برای درک نحوه عملکرد آنها، باید ساختار اصلی یک GAN را درک کنیم.

درک خود را بررسی کنید: مدل های مولد در مقابل تبعیض

شما برای 1000 نفر امتیاز IQ دارید. شما توزیع نمرات IQ را با روش زیر مدل می کنید:
  1. سه تاس شش طرفه بریزید.
  2. رول را در یک w ثابت ضرب کنید.
  3. 100 بار تکرار کنید و میانگین تمام نتایج را در نظر بگیرید.
شما مقادیر مختلفی را برای w امتحان می کنید تا زمانی که نتیجه روش شما با میانگین نمرات IQ واقعی برابر شود. آیا مدل شما یک مدل مولد است یا یک مدل افتراقی؟
مدل مولد
درست: با هر رول شما به طور موثر ضریب هوشی یک فرد خیالی را ایجاد می کنید. علاوه بر این، مدل تولیدی شما این واقعیت را نشان می‌دهد که نمرات IQ به طور معمول توزیع می‌شوند (یعنی بر روی یک منحنی زنگ).
مدل تبعیض آمیز
نادرست: یک مدل تمایز مشابه سعی می کند بین انواع مختلف نمرات IQ تمایز قائل شود. به عنوان مثال، یک مدل تبعیض آمیز ممکن است سعی کند IQ را به عنوان جعلی یا واقعی طبقه بندی کند.
اطلاعات کافی برای گفتن نیست
این مدل در واقع با تعریف یکی از دو نوع مدل ما مطابقت دارد.
یک مدل زمانی یک احتمال را برمی گرداند که شما یک نمونه داده به آن بدهید. آیا این مدل یک مدل مولد است یا یک مدل افتراقی؟
مدل مولد
یک مدل تولیدی می تواند احتمال نمونه و همچنین احتمال یک برچسب کلاس را تخمین بزند.
مدل تبعیض آمیز
یک مدل افتراقی می تواند احتمال تعلق یک نمونه به یک کلاس را تخمین بزند.
اطلاعات کافی برای گفتن نیست
هر دو مدل مولد و افتراقی می توانند احتمالات را تخمین بزنند (اما مجبور نیستند).