شبکه های عصبی چند کلاسه

پیش از این، با مدل‌های طبقه‌بندی باینری مواجه بودید که می‌توانستند یکی از دو گزینه ممکن را انتخاب کنند، مانند:

  • ایمیل داده شده هرزنامه است یا هرزنامه نیست.
  • تومور داده شده بدخیم یا خوش خیم است.

در این ماژول، طبقه‌بندی چند کلاسه را بررسی می‌کنیم که می‌تواند از چندین احتمال انتخاب کند. مثلا:

  • آیا این سگ یک بیگل، یک سگ شکاری یا یک سگ شکاری است؟
  • آیا این گل زنبق سیبری، زنبق هلندی، زنبق با پرچم آبی یا زنبق ریشدار کوتوله است؟
  • آیا آن هواپیما بوئینگ 747، ایرباس 320، بوئینگ 777 یا امبرائر 190 است؟
  • آیا این تصویر یک سیب، خرس، آب نبات، سگ یا تخم مرغ است؟

برخی از مشکلات چند طبقه در دنیای واقعی مستلزم انتخاب از بین میلیون ها کلاس جداگانه است. به عنوان مثال، یک مدل طبقه بندی چند کلاسه را در نظر بگیرید که می تواند تصویر تقریباً هر چیزی را شناسایی کند.

شبکه های عصبی چند کلاسه

  • رگرسیون لجستیک احتمالات مفیدی برای مسائل کلاس باینری می دهد.
    • هرزنامه / غیر هرزنامه
    • کلیک کنید / کلیک نکنید
  • در مورد مشکلات چند طبقه چطور؟
    • سیب، موز، ماشین، متخصص قلب، ...، علامت پیاده روی، گورخر، باغ وحش
    • قرمز، نارنجی، زرد، سبز، آبی، نیلی، بنفش
    • حیوانی، گیاهی، معدنی
  • یک خروجی منحصر به فرد برای هر کلاس ممکن ایجاد کنید
  • آن را با سیگنال «کلاس من» در مقابل «همه کلاس‌های دیگر» آموزش دهید
  • می تواند در یک شبکه عمیق یا با مدل های جداگانه انجام دهد
یک شبکه عصبی با پنج لایه پنهان و پنج لایه خروجی.
  • یک محدودیت اضافی اضافه کنید: خروجی همه گره‌های یک در مقابل همه را باید به 1.0 جمع کنید.
  • محدودیت اضافی به همگرایی سریع آموزش کمک می کند
  • به علاوه، اجازه می دهد تا خروجی ها به عنوان احتمالات تفسیر شوند
یک شبکه عصبی عمیق با یک لایه ورودی، دو لایه پنهان غیر توصیفی، سپس یک لایه Softmax، و در نهایت یک لایه خروجی با تعداد گره های مشابه لایه Softmax.
  • طبقه بندی چند کلاسه، تک برچسبی:
    • یک مثال ممکن است تنها عضو یک کلاس باشد.
    • محدودیتی که کلاس ها متقابلاً انحصاری هستند، ساختار مفیدی است.
    • برای رمزگذاری این در از دست دادن مفید است.
    • برای تمام کلاس های ممکن از یک افت softmax استفاده کنید.
  • طبقه بندی چند کلاسه، چند برچسبی:
    • یک مثال ممکن است عضوی از بیش از یک کلاس باشد.
    • هیچ محدودیت اضافی برای عضویت در کلاس برای بهره برداری وجود ندارد.
    • یک ضرر رگرسیون لجستیک برای هر کلاس ممکن.
  • سافت مکس کامل
    • نیروی بی رحم؛ برای همه کلاس ها محاسبه می کند.
  • سافت مکس کامل
    • نیروی بی رحم؛ برای همه کلاس ها محاسبه می کند.
  • نمونه گیری کاندید
    • برای همه برچسب‌های مثبت محاسبه می‌شود، اما فقط برای یک نمونه تصادفی از منفی‌ها.