با مجموعهها، منظم بمانید
ذخیره و دستهبندی محتوا براساس اولویتهای شما.
فیلتر مشارکتی وظیفه پیشبینی در مورد علایق یک کاربر بر اساس علایق بسیاری از کاربران دیگر است. به عنوان مثال، اجازه دهید به وظیفه توصیه فیلم نگاه کنیم. فرض کنید ما 500000 کاربر داریم و لیستی از فیلم هایی که هر کاربر تماشا کرده است (از کاتالوگ 1,000,000 فیلم). هدف ما توصیه فیلم به کاربران است.
برای حل این مشکل به روشی نیاز است تا مشخص شود کدام فیلم ها شبیه یکدیگر هستند. ما میتوانیم با قرار دادن فیلمها در فضای کمبعدی که فیلمهای مشابه در نزدیکی آن قرار دارند، به این هدف دست یابیم.
قبل از اینکه توضیح دهیم چگونه میتوانیم تعبیه را یاد بگیریم، ابتدا نوع کیفیتهایی را که میخواهیم جاسازی داشته باشد و اینکه چگونه دادههای آموزشی را برای یادگیری جاسازی نشان خواهیم داد، بررسی میکنیم.
ترتیب فیلم ها بر روی یک خط عددی تک بعدی
برای کمک به توسعه شهود در مورد تعبیهها، روی یک تکه کاغذ، سعی کنید فیلمهای زیر را روی یک خط عددی تک بعدی بچینید تا نزدیکترین فیلمها به یکدیگر نزدیکترین ارتباط را داشته باشند:
یک پسر یتیم متوجه می شود که یک جادوگر است و در مدرسه جادوگری و جادوگری هاگوارتز ثبت نام می کند، جایی که اولین نبرد خود را با لرد ولدمورت شرور انجام می دهد.
خانواده ای از ابرقهرمانان که مجبور به زندگی غیرنظامی در حومه شهر می شوند، از دوران بازنشستگی خارج می شوند تا نژاد ابرقهرمانی را از سندروم و ربات قاتل او نجات دهند.
هنگامی که قهرمان دوچرخه سوار حرفه ای در طول تور دو فرانس ربوده می شود، مادربزرگ و سگ چاقش با کمک سه نفر از خوانندگان قدیمی جاز به خارج از کشور سفر می کنند تا او را نجات دهند.
یک فرد مبتلا به فراموشی ناامیدانه به دنبال کشف قتل همسرش با خالکوبی سرنخ هایی بر روی بدنش است.
برای یک راه حل ممکن (بسیار ناقص) روی نماد مثبت کلیک کنید.
شکل 1. چیدمان یک بعدی ممکن
در حالی که این جاسازی کمک می کند تا میزان فیلم را برای کودکان در مقابل بزرگسالان به تصویر بکشید، جنبه های بیشتری از فیلم وجود دارد که می خواهید هنگام ارائه توصیه ها آنها را ضبط کنید. بیایید این مثال را یک قدم جلوتر ببریم و بعد تعبیه دوم را اضافه کنیم.
ترتیب فیلم ها در یک فضای دو بعدی
همان تمرین قبلی را امتحان کنید، اما این بار همان فیلم ها را در فضایی دو بعدی بچینید.
برای راه حل احتمالی دیگر روی نماد مثبت کلیک کنید.
شکل 2. آرایش دو بعدی ممکن
با این تعبیه دو بعدی، فاصله ای را بین فیلم ها تعریف می کنیم به طوری که فیلم ها در نزدیکی (و در نتیجه مشابه استنباط می شوند) اگر هر دو از نظر میزان تطبیق آنها با کودکان در مقابل بزرگسالان یکسان باشند، و همچنین به همان اندازه که آنها فیلم های پرفروش در مقابل فیلم های هنری هستند. البته این ها فقط دو مورد از ویژگی های بسیاری از فیلم ها هستند که ممکن است مهم باشند.
به طور کلی، کاری که ما انجام دادهایم این است که این فیلمها را در یک فضای تعبیهشده نگاشت کردهایم، جایی که هر کلمه با مجموعهای از مختصات دو بعدی توصیف میشود. به عنوان مثال، در این فضا، "شرک" به (-1.0، 0.95) و "Bleu" به (0.65، -0.2) نگاشت می شود. به طور کلی، هنگام یادگیری تعبیه d - بعدی، هر فیلم با d اعداد با ارزش واقعی نشان داده می شود که هر یک مختصات را در یک بعد می دهد.
در این مثال برای هر بعد یک نام گذاشته ایم. هنگام یادگیری تعبیهها، ابعاد فردی با نام یاد نمیشوند. گاهی اوقات میتوانیم به تعبیهها نگاه کنیم و معانی معنایی را به ابعاد اختصاص دهیم و گاهی نمیتوانیم. اغلب، هر یک از این ابعاد را یک بعد پنهان می نامند، زیرا نشان دهنده یک ویژگی است که در داده ها صریح نیست، بلکه از آن استنتاج می شود.
در نهایت، این فاصله بین فیلمها در فضای جاسازی است که معنیدار است، نه مقادیر یک فیلم در هر بعد معین.