رتبه بندی مجدد

در مرحله نهایی یک سیستم توصیه، سیستم می تواند نامزدها را مجدداً رتبه بندی کند تا معیارها یا محدودیت های اضافی را در نظر بگیرند. یکی از رویکردهای رتبه بندی مجدد استفاده از فیلترهایی است که برخی از نامزدها را حذف می کند.

یکی دیگر از رویکردهای رتبه‌بندی مجدد، تبدیل دستی امتیازی است که توسط رتبه‌بندی بازگردانده شده است.

این بخش به طور مختصر به تازگی، تنوع و انصاف می پردازد. این عوامل از جمله عواملی هستند که می توانند به بهبود سیستم توصیه شما کمک کنند. برخی از این عوامل اغلب نیازمند اصلاح مراحل مختلف فرآیند هستند. هر بخش راه حل هایی را ارائه می دهد که ممکن است به صورت جداگانه یا جمعی از آنها استفاده کنید.

خنکی

هدف اکثر سیستم‌های توصیه، ترکیب آخرین اطلاعات استفاده، مانند تاریخچه کاربر فعلی و جدیدترین موارد است. تازه نگه داشتن مدل به مدل کمک می کند تا توصیه های خوبی ارائه دهد.

راه حل ها

  • آموزش را تا جایی که ممکن است دوباره اجرا کنید تا از آخرین داده های آموزشی یاد بگیرید. توصیه می کنیم آموزش را گرم شروع کنید تا مدل مجبور به یادگیری مجدد از ابتدا نباشد. شروع گرم می تواند زمان تمرین را به میزان قابل توجهی کاهش دهد. به عنوان مثال، در فاکتورسازی ماتریسی، جاسازی‌ها را برای مواردی که در نمونه قبلی مدل وجود داشتند، گرم شروع کنید.
  • یک کاربر "متوسط" ایجاد کنید تا کاربران جدید را در مدل های فاکتورسازی ماتریسی نشان دهد. شما نیازی به جاسازی یکسان برای هر کاربر ندارید—شما می توانید دسته هایی از کاربران را بر اساس ویژگی های کاربر ایجاد کنید.
  • از یک DNN مانند مدل سافت مکس یا مدل دو برج استفاده کنید. از آنجایی که مدل بردارهای ویژگی را به عنوان ورودی می گیرد، می توان آن را روی یک پرس و جو یا موردی اجرا کرد که در طول آموزش دیده نشد.
  • اضافه کردن سن سند به عنوان یک ویژگی. برای مثال، یوتیوب می‌تواند سن ویدیو یا زمان آخرین مشاهده آن را به عنوان یک ویژگی اضافه کند.

تصویری از چهار ویدیوی توصیه شده درباره جغدها.

تنوع

اگر سیستم همیشه مواردی را توصیه می‌کند که «نزدیک‌ترین» به جاسازی پرس و جو هستند، کاندیداها بسیار شبیه به یکدیگر هستند. این عدم تنوع می تواند باعث ایجاد یک تجربه کاربری بد یا خسته کننده شود. به عنوان مثال، اگر یوتیوب فقط ویدیوهایی بسیار شبیه به ویدیویی که کاربر در حال تماشای آن است توصیه کند، مانند ویدیوهای جغد (همانطور که در تصویر نشان داده شده است)، احتمالاً کاربر به سرعت علاقه خود را از دست خواهد داد.

راه حل ها

  • چندین ژنراتور نامزد را با استفاده از منابع مختلف آموزش دهید.
  • چندین رتبه بندی را با استفاده از توابع هدف مختلف آموزش دهید.
  • برای اطمینان از تنوع، موارد را بر اساس ژانر یا سایر ابرداده‌ها رتبه‌بندی مجدد کنید.

انصاف

مدل شما باید با همه کاربران منصفانه رفتار کند. بنابراین، مطمئن شوید که مدل شما سوگیری های ناخودآگاه را از داده های آموزشی یاد نمی گیرد.

راه حل ها

  • شامل دیدگاه های متنوع در طراحی و توسعه.
  • آموزش مدل های ML بر روی مجموعه داده های جامع. زمانی که داده‌های شما خیلی کم است (مثلاً وقتی دسته‌های خاصی کمتر ارائه می‌شوند) داده‌های کمکی را اضافه کنید.
  • معیارها (به عنوان مثال، دقت و خطای مطلق) را در هر جمعیت ردیابی کنید تا تعصبات را مشاهده کنید.
  • مدل های جداگانه ای برای گروه های محروم بسازید.