এম্বেডিং: একটি নিম্ন-মাত্রিক স্থান অনুবাদ করা

আপনি একটি নিম্ন-মাত্রিক স্থানে আপনার উচ্চ-মাত্রিক ডেটা ম্যাপ করে স্পার্স ইনপুট ডেটার মূল সমস্যাগুলি সমাধান করতে পারেন।

যেমন আপনি আগে মুভি অনুশীলনে দেখেছেন, এমনকি একটি ছোট বহুমাত্রিক স্থান শব্দার্থগতভাবে অনুরূপ আইটেমগুলিকে একসাথে গ্রুপ করার স্বাধীনতা প্রদান করে এবং ভিন্ন ভিন্ন আইটেমগুলিকে দূরে সরিয়ে রাখে। ভেক্টর স্পেসে অবস্থান (দূরত্ব এবং দিক) একটি ভাল এমবেডিংয়ে শব্দার্থবিদ্যা এনকোড করতে পারে। উদাহরণস্বরূপ, বাস্তব এম্বেডিংয়ের নিম্নলিখিত ভিজ্যুয়ালাইজেশনগুলি জ্যামিতিক সম্পর্কগুলি দেখায় যা একটি দেশ এবং এর রাজধানীর মধ্যে সম্পর্কের মতো শব্দার্থিক সম্পর্কগুলিকে ক্যাপচার করে:

শব্দ এম্বেডিংয়ের তিনটি উদাহরণ যা জ্যামিতিকভাবে শব্দ সম্পর্ককে প্রতিনিধিত্ব করে: লিঙ্গ (পুরুষ/মহিলা এবং রাজা/রাণী), ক্রিয়া কাল (হাঁটা/হাঁটা এবং সাঁতার কাটা/সাঁতার কাটা), এবং রাজধানী শহর (তুরস্ক/আঙ্কারা এবং ভিয়েতনাম/হানয়)

চিত্র 4. এমবেডিংগুলি অসাধারণ সাদৃশ্য তৈরি করতে পারে।

এই ধরণের অর্থপূর্ণ স্থান আপনার মেশিন লার্নিং সিস্টেমকে এমন নিদর্শন সনাক্ত করার সুযোগ দেয় যা শেখার কাজে সাহায্য করতে পারে।

নেটওয়ার্ক সঙ্কুচিত হচ্ছে

যদিও আমরা সমৃদ্ধ শব্দার্থিক সম্পর্ক এনকোড করার জন্য যথেষ্ট মাত্রা চাই, আমরা একটি এমবেডিং স্থানও চাই যা আমাদের সিস্টেমকে আরও দ্রুত প্রশিক্ষণ দেওয়ার জন্য যথেষ্ট ছোট। একটি দরকারী এম্বেডিং শত শত মাত্রার অর্ডারে হতে পারে। এটি সম্ভবত একটি প্রাকৃতিক ভাষার কাজের জন্য আপনার শব্দভান্ডারের আকারের চেয়ে ছোট আকারের বেশ কয়েকটি অর্ডার।