جاسازی ها

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

تعبیه فضای نسبتاً کم بعدی است که می توانید بردارهای با ابعاد بالا را در آن ترجمه کنید. جاسازی‌ها انجام یادگیری ماشینی را در ورودی‌های بزرگ مانند بردارهای پراکنده که کلمات را نشان می‌دهند، آسان‌تر می‌کنند. در حالت ایده‌آل، تعبیه برخی از معنایی ورودی را با قرار دادن ورودی‌های معنایی مشابه نزدیک به هم در فضای تعبیه‌سازی به تصویر می‌کشد. تعبیه را می توان آموخت و مجدداً در مدل ها استفاده کرد.

جاسازی ها

  • ورودی: 1,000,000 فیلم که 500,000 کاربر برای تماشا انتخاب کرده اند
  • وظیفه: فیلم ها را به کاربران توصیه کنید

برای حل این مشکل به روشی نیاز است تا مشخص شود کدام فیلم ها شبیه یکدیگر هستند.

فهرستی از فیلم‌های مرتب شده در یک خط از چپ به راست. از چپ شروع می شود، «شرک»، «شگفت انگیزان»، «سه قلوهای بلویل»، «هری پاتر»، «جنگ ستارگان»، «بلیو»، «شوالیه تاریکی برمی خیزد» و «یادگار»

همان فهرست فیلم‌های موجود در اسلاید قبلی، اما در دو بعد مرتب شده‌اند، برای مثال «شرک» در سمت چپ و بالای «شگفت‌انگیزان» است.

مشابه نمودار قبلی اما با محور و برچسب برای هر ربع. چینش فیلم ها به این صورت است: در ربع اول، سمت راست، بلاک باسترهای بزرگسال شامل «جنگ ستارگان» و «شوالیه تاریکی برمی خیزد» به همراه فیلم های «قهرمان» و «ببر خیزان، اژدهای پنهان» اضافه شده است. ربع فیلم های پرفروش بزرگسال. ربع دوم، پایین سمت راست، خانه هنری بزرگسالان است که حاوی فیلم‌های «Bleu» و «Memento» است و «زندگی بیداری» به ربع خانه هنری بزرگسالان اضافه شده است. سومین ربع پایین سمت چپ، خانه هنری کودکان است و شامل فیلم «سه قلوهای بلویل» است و «والاس و گرومیت» به ربع خانه هنری کودکان اضافه شده است. چهارمین و آخرین ربع در بالا سمت چپ، بلاک‌باسترهای کودکان شامل «شرک»، «شگفت‌انگیزان» و «هری پاتر» است و فیلم «مدرسه راک» به ربع بلاک‌باسترهای کودکان اضافه شده است.

همان چیدمان اسلاید آخر. 'Shrek' و 'Bleu' به عنوان نمونه هایی از مختصات آنها در صفحه تعبیه 2 بعدی برجسته شده اند.

  • فرض می کند علاقه کاربر به فیلم ها را می توان تقریباً با جنبه های d توضیح داد
  • هر فیلم تبدیل به یک نقطه d بعدی می شود که در آن مقدار در بعد d نشان دهنده میزان تناسب فیلم با آن جنبه است.
  • جاسازی ها را می توان از داده ها یاد گرفت
  • هیچ فرآیند آموزشی جداگانه ای لازم نیست -- لایه جاسازی فقط یک لایه پنهان با یک واحد در هر بعد است
  • اطلاعات نظارت شده (مثلاً کاربران همان دو فیلم را تماشا کردند) جاسازی های آموخته شده را برای کار مورد نظر تنظیم می کند.
  • به طور شهودی واحدهای پنهان کشف می کنند که چگونه موارد را در فضای d- بعدی سازماندهی کنند تا به بهترین نحو هدف نهایی را بهینه کنند.
  • هر مثال (یک ردیف در این ماتریس) یک بردار پراکنده از ویژگی ها (فیلم) است که توسط کاربر تماشا شده است.
  • نمایش متراکم این مثال به صورت: (0، 1، 0، 1، 0، 0، 0، 1)

از نظر مکان و زمان کارآمد نیست.

جدولی که در آن هر سرصفحه ستون یک فیلم است و هر ردیف نشان دهنده یک کاربر و فیلم هایی است که تماشا کرده است.
  • یک فرهنگ لغت بسازید که هر ویژگی را به یک عدد صحیح از 0، ...، # فیلم - 1 نگاشت کنید
  • به طور موثر بردار پراکنده را فقط به عنوان فیلم هایی که کاربر تماشا کرده است نشان دهید. این ممکن است به صورت زیر نمایش داده شود: بر اساس موقعیت ستون فیلم‌ها در بردار پراکنده نمایش داده شده در سمت راست، فیلم‌های «سه‌قلوها از بلویل»، «والاس و گرومیت» و «یادگار» را می‌توان به‌طور مؤثر به‌صورت (0،1، 999999) نشان داد.
یک بردار پراکنده که به صورت جدولی با هر ستون نشان دهنده یک فیلم و هر ردیف نشان دهنده یک کاربر است. جدول شامل فیلم های نمودارهای قبلی است و از 1 تا 999999 شماره گذاری شده است. هر خانه جدول بررسی می شود که آیا کاربر فیلمی را تماشا کرده است.

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نمودار یک شبکه عصبی عمیق که برای پیش بینی قیمت فروش خانه استفاده می شود

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی قیمت‌های فروش خانه استفاده می‌شود (کدگذاری بردار پراکنده برجسته شده است)

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نموداری از یک شبکه عصبی عمیق که برای پیش‌بینی قیمت‌های فروش خانه استفاده می‌شود (لایه جاسازی سه بعدی پنهان برجسته شده است)

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی قیمت‌های فروش خانه استفاده می‌شود (ویژگی‌های ورودی طول و عرض جغرافیایی اضافی برجسته شده است)

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نموداری از یک شبکه عصبی عمیق که برای پیش‌بینی قیمت‌های فروش خانه استفاده می‌شود (ویژگی‌های ورودی که به لایه‌های مخفی متعدد برجسته می‌شوند)

مشکل رگرسیون برای پیش بینی قیمت فروش مسکن:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی قیمت‌های فروش خانه استفاده می‌شود (خروجی شبکه عصبی عمیق برجسته شده است)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش بینی ارقام دست نویس استفاده می شود

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی ارقام دست‌نویس استفاده می‌شود (کدگذاری بردار پراکنده ورودی برجسته شده است)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی ارقام دست‌نویس استفاده می‌شود (سایر ویژگی‌های برجسته شده)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش بینی ارقام دست نویس استفاده می شود (جاسازی سه بعدی برجسته شده)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی ارقام دست‌نویس استفاده می‌شود (لایه‌های پنهان برجسته شده‌اند)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش بینی ارقام دست نویس استفاده می شود (لایه لاجیت برجسته شده است)

طبقه بندی چند کلاسه برای پیش بینی یک رقم دست نویس:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی ارقام دست‌نویس استفاده می‌شود (لایه کلاس هدف برجسته شده است)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌هایی که توصیه می‌شود استفاده می‌شود

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌هایی که باید توصیه شوند استفاده می‌شود (لایه کلاس هدف برجسته شده است)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌های پیشنهادی استفاده می‌شود (کدگذاری بردار پراکنده برجسته شده است)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌های پیشنهادی استفاده می‌شود (جاسازی سه بعدی برجسته شده است)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌های پیشنهادی استفاده می‌شود (سایر ویژگی‌های برجسته شده)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌هایی که باید توصیه شوند استفاده می‌شود (لایه‌های پنهان برجسته شده‌اند)

فیلتر مشارکتی برای پیش‌بینی فیلم‌های پیشنهادی:

نمودار یک شبکه عصبی عمیق که برای پیش‌بینی فیلم‌هایی که باید توصیه شوند استفاده می‌شود (لایه لاجیت برجسته شده است)

شبکه عمیق

  • هر یک از واحدهای پنهان مربوط به یک بعد (ویژگی پنهان) است.
  • وزن لبه بین فیلم و لایه پنهان مقادیر مختصاتی هستند
  • یک نمودار درختی از یک شبکه عصبی عمیق با یک گره در پایین ترین لایه متصل به سه نقطه در لایه بالاتر بعدی

نمای هندسی تعبیه یک فیلم واحد

نقطه ای در فضای سه بعدی مربوط به گره لایه پایین در دیاگرام شبکه عصبی عمیق.
  • تعبیه‌های با ابعاد بالاتر می‌توانند روابط بین مقادیر ورودی را با دقت بیشتری نشان دهند
  • اما ابعاد بیشتر، شانس بیش از حد تناسب را افزایش می دهد و منجر به تمرین کندتر می شود
  • قانون تجربی تجربی (نقطه شروع خوبی است اما باید با استفاده از داده های اعتبارسنجی تنظیم شود):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • جاسازی ها آیتم ها (مانند فیلم، متن،...) را به بردارهای واقعی با ابعاد پایین به گونه ای ترسیم می کند که موارد مشابه به یکدیگر نزدیک باشند.
  • تعبیه‌ها همچنین می‌توانند برای داده‌های متراکم (مثلاً صدا) اعمال شوند تا یک معیار تشابه معنی‌دار ایجاد کنند
  • جاسازی مشترک انواع داده ها (مانند متن، تصاویر، صدا، ...) شباهت بین آنها را مشخص می کند.